PC/프린팅/디바이스

인텔 루나레이크, NPU 성능 3배↑ '자신만만'…왜? [컴퓨텍스 2024]

타이베이(대만)=김문기 기자

롭 부르크너 인텔 플랫폼 엔지니어링 그룹 최고기술책임자(CTO) 겸 부사장은 5월 30일(현지시간) 대만 타이베이 르 메르디앙 호텔에서 열린 제3회 인텔 테크투어 대만 행사에서 기조연설자로 나서 루나레이크를 손에 들고 있는 모습

[디지털데일리 김문기 기자] “루나레이크(2세대 인텔 코어 울트라)는 타의 추종을 불허하는 성능을 통해 큰 도약을 시작할 것이다. 정말이지 혁명적인 제품이다. 인텔에 대한 여러분의 생각을 바꿀 것이다.”

롭 부르크너 인텔 플랫폼 엔지니어링 그룹 최고기술책임자(CTO) 겸 부사장은 5월 30일(현지시간) 대만 타이베이 르 메르디앙 호텔에서 열린 제3회 인텔 테크투어 대만 행사에서 기조연설자로 나서 AI PC를 선도할 2세대 인텔 코어 울트라 코드명 ‘루나레이크’가 시장에 변곡점을 마련해줄 것이라며 이같이 강조했다.

그는 “AI와 관련한 PC 분야의 첫번째 파도는 PC와 어떻게 상호작용하는지에 대한 경험을 줬다면, 다음 파도는 추론을 통해 생성적 경험의 형태로 나타나는 지원 역할로 한단계 더 나아갔다”라며, “세번째 파도는 사용자를 대신해 PC가 전문가적 역할을 해주는 방식을 고려하고 있으며, 이를 위해 우리는 플랫폼을 통해 AI에 계속해서 활기를 불어 넣고 있다”고 설명했다.

인텔의 이같은 자신감은 루나레이크가 보유하고 있는, 소위 AI PC의 핵심 요소로 분류되는 신경망처리장치(NPU)의 성능에 기인한다. 인텔에 따르면 루나레이크의 NPU4는 48TOPS(초당 테라 연산) 이상을 기록했다.

또한 루나레이크는 전반적인 아키텍처 개선으로 CPU는 5 TOPS, GPU 67 TOPS, NPU 48 TOPS 이상으로 전체 플랫폼을 통해 120 TOPS 이상을 지원할 수 있다는 게 인텔의 설명이다.

전반적으로 인텔 루나 레이크는 ▲ 차세대 아키텍처 기반 신규 P코어와 E코어 ▲ 이전 세대 비해 80% 이상의 게임 성능과 5배 이상의 AI 처리량인 초당 60TOPS 이상, 디스플레이 및 미디어 엔진을 위한 새로운 마이크로 아키텍처를 도입한 Xe2 GPU ▲이전 세대 대비 3배 더 많은 최대 48 TOPS를 제공해 놀라운 저전력으로 AI 계산을 가속화해주는 NPU4가 내장됐다.

또한 ▲ 시스템 보호를 위한 견고한 기반을 구축하도록 설계된 내장 보안 엔진과 함께 강력한 통합 보안 솔루션 ▲ 와이파이7, 블루투스 5.4, PCle 젠5 및 PCle 젠4 포트, 썬더볼트4 포트를 통합해 업그레이드한 연결성 ▲ 데이터에 대한 따른 접근을 가능하게 하고 지연시간을 줄여 시스템 전체 전력 소비를 줄여주는 온 메모리 패키지 ▲ 메모리 측 캐시 및 향상된 E코어 클러스터는 실제 사용에서 배터리 수명을 최대 60%까지 향상 ▲ 새로운 전력 전달 통합 제어, 향상된 스레드 디렉터 등 시스템온칩(SoC) 효율성을 높였다.


야론 알란크리 인텔 디자인 엔지니어링 그룹 부사장

차세대 아키텍처 코어 도입, 향상된 GPU, NPU 비약적 효율↑

루나레이크는 대만 파운드리 기업 TSMC의 3NB 공정으로 생산되는 컴퓨트 타일과 플랫폼 제어 타일을 인텔 3D 패키징 적층 기술인 포베로스로 결합시키고 인텔 22나노 공정 기반의 베이스 타일에 안착시키는 형태로 설계됐다. LPDDR5X D램이 메모리 온 패키지 형태로 상단에 적용됐다.

인텔 루나레이크 설계

상단 2개의 LPDDR5X D램은 국내 삼성전자, SK하이닉스, 미국 마이크론이 공급하는 것으로 추정된다. 온 패키지 형태로 도입되면서 데이터에 빠르게 접근해 지연시간을 줄이고 시스템 과부화를 줄인다. 40% 전력 절감뿐만 아니라 여유 면적도 확보했다.

인텔 루나레이크 온 메모리 패키징

CPU는 8개의 코어가 하이브리드 구성됐다. 차세대 아키텍처인 라이언코브 기반 고성능 P코어 4개와 마찬가지로 신규 아키텍처인 스카이몬드 기반 고효율 E코어 4개다. P코어는 싱글 스레드 성능을 더 높였다. 피크 성능을 기존 대비 50% 더 향상시켰다. E코어는 백터와 AI 처리량을 2배로 증가시켰다. 저전력 아일랜드 코어는 2배 더 전력절감 효과를 나타낸다. 전체적으로 20~80% 전력 대비 성능을 올렸다.

인텔 루나레이크에는 신규 아키텍처 기반의 8개 코어가 도입됐다

신규 Xe2 GPU가 도입됐다. 차세대 Xe 코어 8개와 향상된 레이 트레이싱 유닛 8개가 도입됐다. AI 처리량을 높이기 위한 XMX, 8MB 캐시 메모리로 구성됐다. AV1, VVC를 지원하며, 디스플레이 포트 & HDMI 2.1, eDP 1.5 LP 포트, 3개 디스플레이 파이프가 디자인됐다. 이에 따라 이전 세대 대비 GPU 성능은 1.5배 더 향상됐다. AI 측면에서는 3.5배 가량 성능 증가를 이루면서 67 TOPS 이상을 끌어낼 수 있다.

인텔 루나레이크에는 신규 Xe2 GPU가 결합됐다

NPU 4는 6개 뉴럴 컴퓨팅 엔진으로 늘어났다. 최대 48 TOPS를 제공한다. 저전력으로 AI 계산을 가속화한다.

인텔 루나레이크 AI 성능

야론 알란크리 인텔 디자인 엔지니어링 그룹 부사장은 “CPU와 GPU, NPU를 결합해 최대 120 TOPS 이상을 끌어낼 수 있기 때문에 가장 강력한 AI 사용 사례를 보여줄 수 있는 설계”라며, “광범위한 AI 문제를 효율적으로 해결할 수 있다”고 자신했다.


인텔 루나레이크 요약

와이파이7, 블루투스 5.4, 썬더볼트4 지원

플랫폼 제어 타일에는 강력한 통합 보안 솔루션을 제공하는 3개의 보안 엔진이 위치했다. 우선 인텔 파트너 보안 엔진은 타사 보안 서비스를 위한 하드웨어 기반 신뢰 경로를 제공한다. 인텔의 보안 엔진은 위협범위에 대한 보호를 제공한다. 마지막으로 전력 공급이 중단되면 플랫폼 전체 백업 데이터를 보호하는 통합 보안관리 엔진이 결합됐다.

네트워크 측면에서는 개별적으로 지원됐던 모뎀 일부 기능을 프로세서에 최초로 이식했다. 와이파이7과 블루투스 5.4를 지원한다. PCle 젠5 및 PCle 젠4 포트, 썬더볼트4 포트를 통합했다.

아리크 기혼 인텔 클라이언트 CPU SoC 수석 아키텍트 리더는 “루나레이크는 생산성 측면에서 와트당 성능이 2배 이상 향상됐다”라며, “일상적인 사용을 위한 에너지 효율성의 상당한 향상을 보여주고 있으며, 새로운 시대를 알리는 NPU와 GPU, CPU로 설계됐다”라고 강조했다.

한편, 인텔은 AI에 대한 포괄적 접근 방식으로 하드웨어 혁신과 함께 소프트웨어 지원 인프라의 중요성을 재차 강조했다. 인텔은 AI PC 가속화 프로그램의 일환으로 100개 이상의 독립 소프트웨어 공급업체(ISV)와 협력하여 개인 비서, 오디오 효과, 콘텐츠 제작, 게임, 보안, 스트리밍, 비디오 협업 등을 위한 AI PC 경험을 향상하고 있다.

부르크너 부사장은 “우리가 더 나은 전력 효율을 제공할 수 있도록 기다려줘서 감사하다”라며, “AI PC 여정에서 최고의 파트너가 될 수 있는 창의적 힘을 발휘할 수 있기를 기대하면 인텔 테크투어가 영감을 주기를 바란다”고 마무리했다.

타이베이(대만)=김문기 기자
moon@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널