변화의 물결 시작된 GPU 르네상스
엔비디아 1990년대 말부터 언급되기 시작한 ‘그래픽처리장치(Graphics Processing Unit, GPU)’는 20세기 보편적으로 사용한 ‘중앙처리장치(Central Processing Unit, CPU)’ 못지않은 비중을 차지하고 있다. 단순히 3D 그래픽을 가속화하는데 그치는 것이 아니라 특유의 부동소수점(FP) 연산을 통한 인공지능(AI)에 이르기까지 활용범위가 크게 넓어졌다.
PC가 본격적으로 대중화되기 시작한 1990년대만 하더라도 GPU라는 개념은 존재하지 않았다. 비디오카드라 부르는 장치가 PC의 그래픽 처리를 담당해왔고 색상 수, 해상도를 높이는데 주력했다. 당시만 하더라도 출력장치, 그러니까 모니터 연결은 DAC를 이용해 아날로그로 출력됐고 이에 따라 색감이나 2D 처리가 무척이나 중요했다. 엔비디아가 등장한 이후 PC 그래픽카드는 3D 성능 높이기에 혈안이 됐고 CPU가 아닌 GPU라는 단어가 등장하는데 결정적인 역할을 했다. 그동안 기본적인 3D 처리는 CPU가 담당해왔지만 아무래도 전문분야가 아니다보니 자연스럽게 3D 가속기를 필요로 했고, 3D 가속기는 2D 그래픽 칩을 집어삼키면서 본격적인 GPU 시대가 시작됐다고 봐야 한다.
처음부터 GPU는 게임에 초점을 맞췄다. 이는 PC나 콘솔게임기 역시 마찬가지였다. 게임이 아니라면 굳이 GPU를 장착한 그래픽카드를 구입할 필요가 없어서였다. 문제는 2010년 후반부터 발생하기 시작했다. 스마트폰, 태블릿과 같은 스마트 기기의 등장으로 PC 출하량이 급감하면서부터다. 정확하게 이야기하면 엔비디아, AMD와 같이 전통적으로 PC 기반 GPU 시장에서 치킨게임을 끝낸 업체가 위기라고 봐야 한다. 스마트 기기에서는 ARM과 함께 이매지네이션이 GPU 설계자산(IP)으로 치열한 경쟁을 벌이고 있다.
물론 엔비디아도 ‘테그라’ 시리즈를 통해 스마트 기기 애플리케이션프로세서(AP) 시장에 진출했으나 규모의 경제와 기술력의 한계로 중도에 포기한 상태다. AMD는 처음부터 이 시장에 발을 들여놓지 못했다. 실제로 시장조사업체 존페디리서치(JPR)에 따르면 2000년부터 폭발적으로 성장한 GPU 시장은 2011년을 정점으로 하향곡선을 그리고 있다. 2015년 전 세계 GPU 출하량은 전년 동기 대비 14%가 줄어든 것으로 조사됐다. 데스크톱PC는 9%, 노트북은 17% 역성장했다. GPU는 PC 시장의 성장세와 함께 했다고 해도 과언이 아니다. 1981년부터 2011년까지 연평균성장률이 19.72%로 PC와(18.4%) 비슷한 추이를 보였다.
2015년 GPU 시장에서 눈여겨볼만한 부분은 4분기 출하량 증가다. 전년 동기 대비 2.4% 상승했는데 지난 10년 평균치가 3.4% 역성장이었다는 점을 고려하면 이례적이다. 이는 별도의 그래픽카드를 장착해 사용하는 소비자가 그만큼 늘어났다는 의미이기도 하다. 2015년 4분기 외장형 그래픽카드의 시장점유율은 31.28%로 전년 동기 보다 1.34% 늘었다. HP, 델과 같이 게이머용 PC를 공급하는 업체가 데스크톱PC와 마찬가지로 노트북에서도 외장형 그래픽카드를 장착할 수 있는 제품을 내놓은 것처럼 이 시장은 여전히 높은 성능을 원하는 소비자가 존재한다.
업체별 순위는 여전히 인텔, AMD, 엔비디아 순이다. 중앙처리장치(CPU)에 내장형 그래픽코어를 탑재해 판매하고 있는 인텔은 71.6%로 압도적인 시장점유율을 나타냈다. AMD는 노트북용 APU 30.3%, 외장형 그래픽카드 출하량이 6.69% 늘었다. 노트북용 외장형 그래픽카드 출하량은 1.3% 줄었다. 이와 달리 엔비디아는 노트북용 외장형 그래픽카드 출하량이 34.2%로 전년 동기 대비 8.4%p 세력을 넓혔다. 그만큼 노트북 시장에서 재미를 봤다는 의미다. 업계에서는 고사양 3D 그래픽 성능을 요구하는 게임이 계속해서 출시되고 있고 이에 따라 외장형 그래픽카드 시장은 계속해서 성장할 것으로 예상하고 있다. 데스크톱PC는 기업 수요가 한층 더 강해지고 있으며 노트북의 경우 전체 PC 출하량에서 차지하는 비중이 조금씩이나마 늘어나는 경향을 보이고 있어 이 시장을 두고 업체간 경쟁이 한층 치열해질 것으로 보인다.
GPU 14/16나노 핀펫 공정 본격화
CPU와 마찬가지로 반도체 미세공정의 한계도 GPU 시장의 성장을 가로막는 요소 가운데 하나다. 시스템온칩(SoC) 형태로 구현되어 있는 AP내 GPU IP는 그렇다고 하더라도 PC에서 일반적으로 쓰이는 GPU는 여전히 28나노 공정에 머물러 있다. GPU는 CPU와 달리 수많은 연산코어가 내장되어 있고 그만큼 트랜지스터 수가 많다. 이는 다이 크기가 상당하는 의미로 웬만한 미세공정 전환으로는 소기의 성과(원가절감, 전력소비량↓)를 거두기가 쉽지 않다는 뜻이기도 하다. 예컨대 현재 28나노에서 20나노로 전환한다고 하더라도 다양한 기능이 내장된 SoC가 아니어서 큰 효과를 기대하기 어렵다. 트랜지스터당 비용(Cost Per Transistor, CPT)에서 수지가 안 맞는다.
환경적인 요인도 있다. 세계 최대 GPU 업체인 엔비디아는 대만 TSMC가 주로 위탁생산(파운드리)를 담당하는데 스마트 기기 AP를 생산하기에도 바빠 GPU에 덜 신경을 썼다. 현재 파운드리 공정은 GPU를 위해서라기보다는 AP에 초점이 맞춰져 있다고 봐야 한다. 이런 GPU가 올해부터 14/16나노 핀펫 공정이 본격화된다. 14나노 핀펫은 글로벌파운드리(GF), 16나노 핀펫은 TSMC가 담당한다. 바꿔 말하면 각 파운드리와 밀접한 관련이 있는 업체가 해당 공정을 이용하게 된다. AMD는 14나노 핀펫, 엔비디아는 16나노 핀펫이다. 일각에서는 현재 일부 엔비디아 GPU를 생산하고 있는 삼성전자가 14나노 핀펫 파운드리 수주는 어려울 것으로 보고 있다. AP에서 14나노와 16나노 핀펫의 성능 차이가 거의 발생하지 않았다는 점을 고려하면 엔비디아가 굳이 삼성전자에 파운드리를 맡길 이유가 없다는 것. TSMC가 16나노 핀펫 GPU 생산과정에서 대단한 실수를 저지르지 않는다면 삼성전자가 해당 공정에서 GPU를 생산하기가 쉽지 않아 보인다.
또 다른 이유로는 경험을 꼽을 수 있다. GPU는 높은 부동소수점 성능을 내기 위해 병렬연산에 최적화되어 있다. 따라서 복잡한 배선이 깔릴 수밖에 없고 배선의 간격(피치)에 상당히 공을 들여야 한다. 자세히 들여다보면 주로 쓰이는 노광 장비인 193nm 레이저 파장의 불화아르곤(ArF)에서 발전한 이머전 ArF의 경우 그려 넣을 수 있는 물리적 회로 선폭의 한계치는 38나노에 그친다. 그래서 이머전 ArF로 회로 패턴을 두 번에 나눠 형성시키는 더블패터닝 혹은 쿼드러블패터닝 기술을 도입하고 있다. GPU에서는 가장 아래쪽에 있는 배선 레이어의 상당수에 더블패터닝을 적용시키고 있다. 이후에는 싱글패터닝으로 처리한다. 업체별로 조금씩 차이는 있지만 전체 배선 레이어 가운데 절반 정도에 더블패터닝을 사용하는 셈인데 그만큼 돈이 더 들어가게 된다.
원가절감, 미세공정 개성해도 다이 크기를 그대로일 듯
14/16나노 핀펫 공정에서도 이 문제는 마찬가지여서 가급적 더블패터닝을 줄여야 할 필요가 있다. 여기서 배선의 피치를 눈여겨 볼 필요가 있는데, 배선 피치는 아래쪽이 가장 가깝고 위로 올라올수록 넓어진다. GPU는 가장 좁은 배선 피치를 가능한 많이 써는 설계가 적용되어 있으므로 더블패터닝을 이 부분에 접목시킬 필요가 있다. 쉽게 말해 더블패터닝은 배선의 간격이 오밀조밀한 부분에 집중시켜 전반적인 월가절감과 함께 미세공정의 장점을 최대한으로 이끌어내겠다는 전략이다. 반도체 업체 입장에서 더블, 혹은 쿼드패터닝은 가급적 쓰고 싶지 않다. 비용과 시간이 많이 들어서다.
엔비디아와 같은 팹리스 업체에서도 이 문제를 해결하기 위해 반도체 에뮬레이션에 상당한 공을 들이고 있다. 6개월마다 신제품을 적재적소에 투입하기 위해서이기도 하지만 GPU를 설계하고 칩을 제조하기 이전에 디자인에 문제가 없는지, 소프트웨어는 제대로 작동하는지, 제품으로 만들어졌을 때 문제는 없는지 등을 종합적으로 살펴볼 수 있다는 점이 매력적이다. 엔비디아가 시높시스, 멘토그래픽스와 함께 3대 반도체 전자설계자동화(EDA) 기업인 케이던스가 공급한 에뮬레이션 장비 ‘팔라듐’이 랩을 세계 최대 규모로 운영하고 있는 것도 이 때문이다. 작년 12월 선보인 ‘팔라듐 Z1’도 공급되어 있으며 장비 한대에 모듈을 다 채우면 92억개 트랜지스터 게이트를 검증할 수 있다.
다만 14/16나노 핀펫 공정에서 가장 아래쪽에 있는 배선 레이어에 더블패터닝을 집중할 경우 수율과 비용에서는 효과를 보겠지만 전체적인 다이 크기는 기존과 큰 차이를 보기 어려울 수 있다. 결국 근본적인 해결책은 노광 장비가 극자외선(Extreme Ultra Violet, EUV)으로 진화해야 한다는 것이 업계 전문가들의 조언이다. EUV는 자외선(UV)과 X-선의 중간 영역에 있는 전자기파다. 반도체 공정에서 사용하는 EUV는 13.5nm의 파장을 가지도록 고안됐다. 파장이 짧은 EUV를 활용하면 10나노 미만의 반도체도 멀티패터닝이 아닌, 한 번의 노광으로 만들어낼 수 있다.
<이수환 기자>shulee@insightsemicon.com
오픈AI, o1보다 더 강력한 o3 예고…개발자·연구자 대상 사전 테스트 실시
2024-12-21 08:02:48뒤숭숭한 정국에도 매서운 이복현… "금융지주사 검사 결과 발표, 원칙대로 '매운맛' 유지"
2024-12-20 17:36:50[DD퇴근길] 우티, 티맵 손 떼고 우버 단독체제…넷플릭스에 올라탄 SBS
2024-12-20 17:11:09