팻 겔싱어 인텔 CEO "AI 에브리웨어 시대 연다"…마침내 '코어 울트라·5세대 제온' 상륙 [DD전자상가]
[디지털데일리 김문기 기자] “AI 혁신은 전세계 국내 총생산의 3분의 1까지 디지털 경제 영향을 높일 수 있다. 인텔은 고객이 클라우드에서부터 로컬 데이터까지 생성되고 사용되는 PC와 엣지에서 모든 애플리케이션이 AI를 원활하게 통합되고 실행할 수 있도록 하는 기술과 솔루션을 개발하고 있다. 우리의 AI 포트폴리오는 AI PC와 AI 가속 5세대 제온의 시대를 열게 됐다.
팻 겔싱어 인텔 CEO는 14일(현지시간) ‘AI 에브리웨어’ 이벤트를 통해 인텔의 차세대 AI 포트폴리오를 공개했다.
PC 아니다, 이제부터 ‘AI PC’
이날 인텔은 코드명 ‘메테오레이크’인 코어 울트라 프로세서를 정식 출시한다. 앞서 인텔은 코어 울트라 프로세서가 ‘AI PC’ 시대를 여는 시발점이라 소개했다.
인텔은 지난 6월 코어 프로세서를 다시 브랜딩했다. 15년만의 변화다. 인텔은 지난 2008년 45나노미터(nm) 공정의 1세대 코어 프로세서(코드명 네할렘)부터 코어 ‘i’ 브랜드를 사용한 바 있다. 이후 나열되는 숫자 중 첫번째는 세대를 구분하고 그 이후 자리는 모델명을 의미했다. 하지만 이제부터 고성능 프로세서는 ‘울트라’로 통상적인 프로세서는 ‘코어’를 사용한다. 성능 구분용으로 쓴 ‘3/5/7’은 그대로 쓰인다. 다만 가장 최상위 성능을 나타내는 ‘9’의 경우 ‘울트라’만 사용한다.
즉, 14세대 코어 프로세서인 ‘메테오레이크’는 세대를 강조하는 인텔의 기존 기준을 벗어난 첫 제품이자 정식으로 ‘울트라’의 첫 시작을 알리는 모델이기도 하다. 게다가 인텔이 처음으로 극자외선노광장비(EUV) 도입한 ‘인텔4’ 공정 기반으로 생산됐다.
여기에 인텔은 첫 ‘AI PC’라는 점을 강조했다. 코어 울트라 프로세서 내 SoC 타일에 처음으로 신경망프로세서유닛(NPU)가 내장됐기 때문이다. 이같은 설계상 장점으로 네트워크 없이도 온 디바이스 AI 실현이 가능하다.
인텔 코어 울트라는 이전 세대보다 2.5배 더 나은 전력 효율로 AI 가속이 가능하다. 인텔은 100개 이상의 소프트웨어 공급업체와 협력했다. 경쟁 플랫폼에 비해 더 크고 광범위한 AI 강화 애플리케이션 세트가 인텔 코어 울트라에서 실행된다는 의미다.
NPU는 두 개의 신경 컴퓨팅 엔진으로 구성된 다중 엔진 아키텍처를 보유하고 있으며, 해당 두 엔진은 단일 작업에서 함께 작동하거나 독립적으로 자체 작업을 처리한다. 이 신경 컴퓨팅 엔진 내에는 두 개의 주요 컴퓨팅 요소로 구성되어 있다.
데이터 이동을 최소화하고 일반 및 고성능 작업에 대한 고정 함수 연산을 가지고 있는 효율적인 컴퓨팅 핵심 드라이버다. 신경망 실행 과정에서 전력 절약 역할을 담당한다. 대부분의 연산은 추론 파이프라인에서 수행되며, 이는 표준 신경망 연산을 지원하는 고정 함수 하드웨어 파이프라인으로 구성된다. 해당 파이프라인은 곱셈 누산(MAC) 어레이, 활성화 함수 블록 및 데이터 변환 블록으로 구성된다.
AI를 위해 특별히 설계된 고도로 최적화된 매우 긴 명령어 워드/디지털 신호 프로세서(VLIW DSP)이기도 하다. 스트리밍 하이브리드 아키텍처 벡터 엔진(SHAVE)은 추론 파이프라인 및 직접 메모리 액세스(DMA) 엔진과 함께 파이프라인화 될 수 있어, NPU 에서 병렬로 발생하는 이기종 컴퓨팅을 구현, 성능을 극대화할 수 있다.
가령 인텔은 어도비 프리미어 프로에서 작업하는 콘텐츠 제작자는 경쟁사 대비 40% 성능 우위에 있다고 강조했다.
또한 인텔은 코어 울트라는 전 세계 노트북과 PC 제조사 230개 이상의 디자인에 AI를 가져올 것이라고 강조했다. AI PC는 2028년까지 PC 시장의 80%를 차지할 전망이다.
5세대 인텔 제온 정식 출격
5세대 인텔 제온(코드명 에메랄드 래피즈)도 이날 정식으로 출시됐다.
5세대 인텔 제온 스케일러블 프로세서는 이전 세대 대비 일반 컴퓨팅 성능은 21% 향상, 다양한 고객 워크로드에서 와트당 평균 성능이 36% 더 높아졌다. 전형적인 5년 갱신 주기를 따르고 심지어 이전 세대에서 업그레이드하는 고객은 TCO를 최대 77%까지 줄일 수 있다.
제온은 AI 가속이 내장됐다. 200억 개의 매개 변수 모델에 대해 최대 42% 더 높은 추론과 미세 조정을 제공한다. 일관되고 끊임없이 개선되는 MLPerf 훈련 및 추론 벤치마크 결과를 가진 CPU다. 제온 내장 AI 가속기는 최적화된 소프트웨어 및 향상된 원격 측정 기능과 함께 통신 서비스 제공 업체, 콘텐츠 전송 네트워크 및 소매, 의료 및 제조를 포함한 광범위한 수직 시장을 위한 까다로운 네트워크 및 엣지 워크로드의 보다 관리 가능하고 효율적인 배포를 가능하게 해준다.
행사에서 IBM은 5세대 인텔 제온 프로세서가 이전 세대 제온 프로세서에 비해 watsonx.data 플랫폼에서 최대 2.7배 더 나은 쿼리 처리량을 달성했다고 발표했다. 내년에 5세대 제온을 배포할 구글 클라우드는 팔로 알토 네트웍스가 구글 클라우드를 통해 4세대 제온에 내장된 가속을 사용해 위협 탐지 딥 러닝 모델에서 2배의 성능 향상을 경험했다고 언급했다.
인디 게임 스튜디오 갈륨 스튜디오는 GPU 기반 클라우드 인스턴스보다 6.5배의 추론 성능을 향상시키기 위해 제온 프로세서에서 실행되는 누멘타의 AI 플랫폼으로 전환해 AI 기반 게임인 Proxi11의 비용과 대기 시간을 절약했다.
인텔은 이같은 결과를 토대로 데이터 센터와 클라우드뿐만 아니라 전 세계의 네트워크와 엣지 애플리케이션에서 고급 AI의 새로운 가능성을 열어준다고 강조했다.
개발자가 원하는 어디든지 AI 가속화…인텔 가우디3 가속기 내년
인텔은 코어 울트라와 5세대 제온 프로세서를 통해 수많은 문제를 해결할 수 있을 것이라 낙관했다.
엣지와 클라이언트 장치는 데이터 센터보다 1.4배 더 많은 추론 수요를 주도하고 있다. 고객들은 AI 솔루션을 혼합해 사용한다.
가령, 올인원 통신 및 협업 플랫폼 내에서 인텔 코어 기반 클라이언트 시스템과 인텔 제온 기반 클라우드 솔루션에서 AI 워크로드를 실행하는 줌(Zoom)을 사용하면 높은 사용자 경험과 비용을 제공한다. 줌은 AI를 사용해 주변 소음을 제거하고 어수선한 홈오피스를 흐리게 하고, 회의 요약과 이메일을 생성할 수 있다.
AI 하드웨어 기술을 가능한 한 접근 가능하고 사용하기 쉽게 만들기 위해, 인텔은 개발자가 사용하는 AI 프레임워크에 최적화를 구축하고 다양한 유형의 하드웨어에서 소프트웨어를 이식 가능하고 고성능으로 만들기 위해 기본 라이브러리를 제공한다.
인텔의 원API와 오픈비노(OpenVINO) 툴킷을 포함한 고급 개발자 도구는 개발자가 AI 워크로드와 솔루션을 위한 하드웨어 가속을 활용하고 다양한 추론 대상에서 AI 모델을 빠르게 구축, 최적화 및 배포할 수 있도록 도와준다.
한편, 인텔은 가우디3 AI 가속기를 통해 내년 가속기 시장의 더 많은 부분을 점유할 것이라 예상했다.
[2024 IT혁신상품] AI 협업부터 비정형데이터 보호까지…지란지교그룹 '각개약진'
2024-12-19 18:33:01비트코인, 1억5000만원대 유지…RWA NOVA 코인, 비트마트에 신규 상장
2024-12-19 18:06:07'계엄군 점거' 서버 살펴본 선관위 보안자문위…"침입 흔적 없다"
2024-12-19 17:56:25[현장] 티빙·웨이브 합병 두고 CEO별 온도차…"주주 동의 필요 vs 無 관여"
2024-12-19 17:13:57[DD퇴근길] 갈길 먼 AI 기본법…바디프랜드, '가구' 선보인 이유는
2024-12-19 16:52:18