아이폰 생산기지 ‘폭스콘’ 마저…엔비디아 기반 中 LLM ‘폭스브레인’ 공개
[디지털데일리 김문기 기자] 아이폰 생산기지로 알려진 폭스콘이 연구소를 통해 중국어 기반 AI 대형언어모델(LLM)을 공개했다. 이번 모델은 불과 4주만에 효율적이고 저비용으로 훈련됐다. 엔비디아 H100 기반의 이번 모델은 대만 AI 기술 발전에 이바지할 것이라는게 폭스콘 측의 입장이다.
10일(현지시간) 폭스콘 연구기관인 홍하이 연구소((Hon Hai Research Institute)는 중국어 기반 대형언어모델(LLM) ‘폭스브레인(FoxBrain)’을 출시했다고 밝혔다.
‘폭스브레인’은 본래 폭스콘의 내부 시스템을 위해 개발됐다. 데이터 분석, 의사결정 지원, 문서 협업, 수학 및 논리적 추론, 문제 해결, 코드 생성 등 다양한 기능을 수행한다. 하지만 폭스콘은 향후 폭스브레인을 오픈소스로 공개하고, 기술 파트너들과 협력해 AI의 제조 및 공급망 관리 활용도를 높일 계획이라고 강조했다.
폭스브레인의 학습 과정에는 엔비디아(NVIDIA) H100 GPU 120개가 사용됐다. 엔비디아 퀀텀-2 인피니밴드 네트워크를 통해 확장됐다.
리융후이(Yung-Hui Li)홍하이 연구소 AI 연구센터장은 “최근 AI 분야에서는 논리적 추론 능력 향상과 GPU 활용 최적화가 핵심 트렌드가 되고 있다. 폭스브레인은 단순히 컴퓨팅 파워를 늘리는 것이 아닌, 훈련 프로세스 자체를 최적화하는 전략을 채택했다”고 설명했다.
폭스브레인은 메타 라마(Meta Llama) 3.1 아키텍처 기반의 700억 파라미터를 보유하고 있으며, 대만 전통 중국어 모델인 ‘라마(Llama)-3-대만(Taiwan)-70B’ 대비 수학 및 논리적 추론 테스트에서 높은 성능을 기록했다. 대만 전통 중국어 기반 LLM인 ‘대만-라마(Taiwan-Llama)’와 비교해 수학적 추론 및 논리적 문제 해결 능력에서 우수한 성능을 보였다는 설명이다.
아울러, 폭스콘은 메타(Meta)의 동급 모델을 뛰어넘는 결과를 기록했으며, 중국 AI 스타트업 딥시크(DeepSeek)의 모델과도 근접한 성능을 달성했다고 자신했다.
한편, 폭스콘의 연구 개발 과정에서는 엔비디아의 타이베이-1(Taipei-1) 슈퍼컴퓨터와 기술 컨설팅이 활용됐다. 엔비디아 네모(NVIDIA NeMo) 플랫폼을 통해 모델 사전 훈련을 완료했다. 폭스콘은 폭스브레인을 기반으로 스마트 제조(Smart Manufacturing), 스마트 전기차(Smart EV), 스마트 시티(Smart City) 등 3대 플랫폼을 AI 기반으로 업그레이드할 계획이다.
카카오페이증권, 테슬라·엔비디아 매수세 지속…기술 성장주 높은 관심 여전
2025-03-11 11:12:18BNK부산은행 차세대시스템 사업, '메머드급' 평가… 경남은행 때문? [DD인사이트]
2025-03-11 11:06:17“병원에서도 QR코드로 간편 본인인증”...이통3사, QR 서비스 확대
2025-03-11 10:35:48