AMD 신형 APU 카베리 출격… 인텔 칩 대비 성능 높고 가격 저렴
[디지털데일리 한주엽기자] AMD는 14일 중앙처리장치(CPU)와 그래픽처리장치(GPU)를 하나의 다이(Die)에 통합하고 혼합기종시스템아키텍처(HSA Heterogeneous System Architecture) 지원을 통해 성능을 극대화한 신형 APU(Accelerated Processing Unit) ‘카베리(Kaveri)’를 출시한다고 발표했다. 이 제품은 인텔의 경쟁 제품 대비 성능이 좋은데다 가격도 저렴해 경쟁력이 높다고 AMD 측은 강조했다.
카베리는 32나노 공정에서 한 단계 진화한 28나노 공정으로 생산된다. 카베리의 다이 크기는 245mm2로 24억1000만개의 트랜지스터가 내장돼 있다. CPU 코어는 새롭게 개발된 아키텍처인 ‘스팀롤러’ 기반이다. 스팀롤러는 종전 파일드라이버 코어 대비 명령 캐시 미스를 30% 줄이고 분기 예측 실패율을 20% 절감했다. 또한 작업 예약 효율을 높이는 등 구조적 개선을 통해 전반적으로 10%에 이르는 성능 향상이 있었다고 회사 측은 설명했다.
카베리에는 스팀롤러 CPU 코어가 2개에서 4개까지 탑재될 수 있다. GPU 코어는 라데온 R 시리즈의 그래픽코어넥스트(GCN)를 내장했다. 6개에서 8개의 GCN 코어가 탑재될 수 있다. 새로운 GCN 아키텍처의 특징인 다이렉트X 11.2, 맨틀 API, 트루오디오 기능도 지원된다. 카베리 다이에서 GPU가 차지하는 면적 비중은 47%로 인텔 하스웰(31%) 대비 높다. GPU로 성능 향상을 꾀했다는 의미다.
아담 코작 AMD 글로벌 클라이언트 프로세서 마케팅 총괄은 “최대 12개의 컴퓨팅 코어를 내장할 수 있는 카베리는 HSA를 지원하는 첫 APU”라며 “라데온 GPU의 맨틀, 트루오디오는 물론 PCI익스프레스 Gen3, 울트라HD 해상도에 대응하는 고성능 제품”이라고 소개했다. AMD는 우선 데스크톱PC용 카베리(A10-7859K, A10-7700K, A8-7600) APU를 출시한 뒤 추후 노트북용 제품군도 내놓는다는 방침이다.
◆HSA 첫 지원 APU 카베리=카베리는 혼합기종시스템아키텍처(HSA, Heterogeneous System Architecture)를 지원하는 최초의 APU다. CPU와 GPU의 동시 연산 능력을 끌어올리는 hQ(Heterogeneous Queuing)와 CPU와 GPU의 메모리 공유 및 사용 방법을 통일시킨 hUMA(Heterogeneous Unified Memory Architecture) 기술이 카베리에 탑재됐다.
hQ 기술의 요점은 GPU가 일반 연산을 더 수월하게 할 수 있도록 하드웨어 구조를 바꿨다는 것이다. 운영체제(OS) 내에서 GPU 연산을 하려면 애플리케이션이 수행되는 사용자 모드가 아닌, 커널 모드(최고 권한 수준)로의 변환이 필수적이다. 특정 애플리케이션이 GPU의 자원을 꺼내서 사용하려면 OS의 허가를 거쳐 그래픽 드라이버를 구동시켜야 한다는 의미다. 이러한 과정에서 성능 저하가 발생한다. hQ 기술이 적용되면 사용자 모드에서 대기 중인 작업을 GPU로 부여(Queuing)할 수 있다. 다단계의 과정을 거치지 않으므로 GPU 연산을 수행할 때 필연적으로 발생했던 성능 저하도 없다. hUMA는 CPU와 GPU가 메모리 주소를 공유하고 메모리 사용 방법을 통일해 데이터를 저장하고 꺼내오는 데 드는 시간을 최소화하는 기술이다.
AMD는 이처럼 CPU와 GPU의 동시 연산 능력을 향상시킨 덕에 총 12개의 코어(CPU 4개, GPU 8개)를 탑재한 카베리(A10-7859K)의 연산 능력은 856GFLOPS(기가플롭스, 1기가플롭스는 초당 10억회 연산)에 달한다고 강조했다.
◆인텔 코어 i5 보다 성능 높고 가격 저렴=AMD는 이날 자사 카베리 A10-7850K와 인텔 코어 i5 4670K(3.4GHz, 6MB 캐시)의 벤치마크 테스트 결과도 공개했다. 카베리는 종합 성능 테스트(PC마크8)에서 코어 i5보다 24%, 3D 렌더링(3D마크)에선 87%, GPU 컴퓨팅을 포함한 성능 측정(베이스마크CL)에선 61%나 결과 수치가 높았다고 강조했다.
GPU 연산 능력을 활용하는 응용 프로그램에선 차이가 더 벌어졌다. 오픈CL로 개발돼 GPU 연산을 활용하는 포토샵 크리에이티브클라우드(CC)에서 스마트 샤프니스 필터를 적용한 결과 카베리가 인텔 코어 i5보다 속도가 2.3배 빨랐다. 오픈소스 오피스 프로그램인 리브레오피스의 표 계산 속도도 카베리가 4배 이상 빨랐다. AMD 측은 HSA를 활용하면 경쟁사 제품 대비 카베리의 성능이 최대 8배나 높아진다고 설명했다.
독자 GPU API인 ‘맨틀’의 데모도 선보였다. 맨틀로 만들어진 게임은 카베리 시스템 환경에서 30프레임을 유지했지만 맨틀이 적용되지 않았을 때는 20프레임을 밑돌았다. 맨틀은 AMD GCN GPU를 직접 제어할 수 있는 낮은 레벨의 애플리케이션프로그램인터페이스(API)와 드라이버 기술이다. 맨틀 API는 GPU 코어의 병렬 연산을 활용해 그래픽 랜더링 작업을 할 수 있도록 도와 게임 실행 시 CPU로 전가되는 작업량을 크게 줄일 수 있다. 즉, 맨틀로 개발된 PC용 게임은 AMD의 GPU 환경에서 경쟁사(엔비디아) 제품으로 구성된 환경 대비 더 빠르고 원활하게 돌아간다는 설명이다.
코작 총괄은 “카베리에 라데온 그래픽카드를 별도로 장착해 듀얼 그래픽 환경을 구축하면 성능이 95% 향상된다”라며 “인텔 칩 보다 상당히 빠른 시스템 환경을 구축할 수 있다”라고 말했다.
가격 경쟁력도 높다. 카베리 A10-7859K, A10-7700K, A8-7600의 가격은 각각 173달러, 152, 119달러로 경쟁 제품인 인텔 코어 i5 4670K(242달러), 4440S(182달러), 4330(138달러) 대비 저렴하다. AMD는 또 카베리 A10 시리즈를 구입하는 이들에게 4만5000원 상당의 배틀필드4 정품을 무료로 제공키로 했다.
<한주엽 기자>powerusr@ddaily.co.kr
[IT백과] 생성형AI의 진화 ‘AI 에이전트’, 기존 AI 비서와 뭐가 다를까?
2024-12-21 13:27:59[종합] AI 초격차 확보 공고히 한 오픈AI…12일간 여정 끝엔 ‘쩐의전쟁’ 남았다
2024-12-21 11:15:25오픈AI, o1보다 더 강력한 o3 예고…개발자·연구자 대상 사전 테스트 실시
2024-12-21 08:02:48