반도체

엔비디아, 파스칼 기반 딥러닝 플랫폼 2종 공개

이수환

[전자부품 전문 미디어 인사이트세미콘]

엔비디아(www.nvidia.co.kr 대표 젠슨황)가 13일 중국 베이징에서 열린 그래픽처리장치(GPU) 기술 컨퍼런스 ‘GTC 차이나 2016’에서 파스칼 GPU 아키텍처 기반의 딥러닝 플랫폼 ‘테슬라P4, P40’ 가속기와 함께 인공지능 추론 작업을 가속화하는 새로운 소프트웨어 ‘텐서RT’와 ‘딥스트림’ SDK를 공개했다.

테슬라 P4와 P40은 엔비디아의 최신 GPU 아키텍처인 파스칼을 기반으로 음성, 이미지 또는 텍스트를 인식하기 위해 훈련된 심층 신경망을 구동한다. 특히 8비트(INT8) 기반의 특수 추론 명령을 사용해 중앙처리장치(CPU) 대비 45배, 지난 1년 내 출시된 GPU 솔루션 대비 4배 더 빠른 속도로 추론 작업을 실행하는 등 인공지능 추론에 특화된 성능을 제공한다.

테슬라 P4는 작은 사이즈의 폼팩터와 50와트(W)의 저전력 디자인으로 에너지 효율을 필요로 하는 데이터 센터에 적합하다. CPU 기반의 추론 작업과 비교했을 때 40배 더 높은 에너지 효율을 제공한다.

테슬라 P40은 딥러닝 작업 처리 성능을 높이는데 주력한 제품이다. 8개의 테슬라 P40 가속기를 탑재한 서버는 44 TOPS INT8(새로운 딥 러닝 추론 명령어)의 성능을 갖추게 된다 140대 이상의 CPU 기반 서버를 대체할 수 있다.

테슬라 P4와 P40은 각각 11월과 10월에 제조업자개발생산(ODM), 주문자상표부착(OEM) 및 공식 파트너의 공인된 서버에 탑재돼 출시될 예정이다.

<이수환 기자>shulee@insightsemicon.com

이수환
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널