솔루션

[VM익스플로어2023] 엔비디아, 생성형 AI 협력…내년 1H ‘프라이빗 AI 파운데이션’ 출격

김문기 기자
엔비디아-VM웨어
엔비디아-VM웨어

[디지털데일리 김문기 기자] 엔비디아(CEO 젠슨 황)는 지난 21일(현지시간)부터 24일까지 미국 라스베이거스 베네시안 컨벤션 및 엑스포센터에서 개최된 ‘VM웨어 익스플로어 2023’에서 VM웨어와 전략적 파트너십을 확대한다고 발표했다.

이번 협력을 통해 양사는 내년 상반기 VM웨어 프라이빗 AI 파운데이션을 출시할 예정이다. VM웨어 프라이빗 AI 파운데이션(Private AI Foundation)은 기업이 지능형 챗봇, 어시스턴트, 검색과 요약 등 모델을 맞춤화하고 생성형 AI 애플리케이션을 사용할 수 있도록 지원한다. AI에 최적화된 VM웨어 클라우드 파운데이션을 기반으로 구축된 엔비디아 생성형 AI 소프트웨어와 가속 컴퓨팅을 특징으로 한다.

라구 라구람 VM웨어 CEO는 “생성형 AI와 멀티 클라우드는 완벽한 조합이다. 고객 데이터는 데이터센터, 엣지, 클라우드 등 어디에나 존재한다. 엔비디아와 함께 기업이 데이터 프라이버시, 보안과 제어 문제를 해결하며, 데이터에 인접한 생성형 AI 워크로드를 안정적으로 사용할 수 있도록 지원할 것"이라고 말했다.

젠슨 황 엔비디아 창립자 겸 CEO는 “전 세계 모든 기업들이 생성형 AI를 도입하기 위해 경쟁하고 있다. VM웨어와의 파트너십 확대로 금융 서비스, 의료, 제조 등 다양한 분야의 수십만 고객에게 필요한 풀스택 소프트웨어와 컴퓨팅을 제공할 수 있다. 이를 통해 고객은 자체 데이터로 구축된 맞춤형 애플리케이션을 사용해 생성형 AI의 잠재력을 극대화할 수 있다”고 말했다.

기업들은 보다 빠르게 비즈니스 성과를 달성하기 위해 생성형 AI 애플리케이션의 개발, 테스트와 배포를 간소화하고 있다. 맥킨지는 생성형 AI가 전 세계 경제에 연간 최대 4조 4천억 달러를 창출할 것으로 전망한다.1

아울러 기업은 VM웨어 프라이빗 AI 파운데이션을 통해 대규모 언어 모델을 커스터마이징할 수 있다. 이를 통해 내부 사용을 위해 보다 안전한 프라이빗 모델을 생성하고, 사용자에게 서비스형 생성형 AI를 제공한다. 또한 추론 워크로드를 대규모로 더욱 안전하게 실행할 수 있다.

이 플랫폼의 주요 기능에는 통합 AI 툴이 포함된다. 이 통합 AI 툴은 기업이 프라이빗 데이터로 훈련과 검증된 모델을 비용 효율적인 방법으로 실행할 수 있도록 지원한다.

플랫폼에는 엔비디아 네모가 탑재될 예정이다. 엔비디아 네모는 엔비디아 AI 플랫폼의 운영체제인 엔비디아 AI 엔터프라이즈에 포함된 엔드투엔드 클라우드 네이티브 프레임워크이다. 엔비디아 AI 엔터프라이즈는 기업이 거의 모든 곳에서 생성형 AI 모델을 구축, 커스터마이징과 배포할 수 있도록 지원한다. 엔비디아 네모는 커스터마이징 프레임워크, 가드레일 툴킷, 데이터 큐레이션 툴, 사전 훈련된 모델 등 결합한다. 엔비디아 네모는 생산 단계에서 생성형 AI를 배포하기 위해 대규모 언어 모델용 텐서RT(TRT-LLM)을 사용한다.

현장에서는 엔비디아와 VM웨어는 새로운 엔비디아 AI 워크벤치 기능을 소개한다. 기업의 개발자들은 엔비디아 AI 워크벤치를 사용해 허깅 페이스에서 사용할 수 있는 라마2와 같은 커뮤니티 모델을 원격으로 커스터마이징하고 VM웨어 환경에서 프로덕션급 생성형 AI를 배포할 수 있다.

한편, 엔비디아는 세계 주요 시스템 제조업체들이 별도로 발표된 VM웨어 프라이빗 AI 파운데이션을 지원하는 엔비디아 AI 레디 서버를 제공할 예정이라고 발표했다. 이 서버는 기업이 독자적인 비즈니스 데이터를 사용해 생성형 AI 애플리케이션을 맞춤화하고 배포할 수 있도록 지원한다.

엔비디아 AI 레디 서버에는 엔비디아 40S GPU, 엔비디아 블루필드-3 (BlueField-3) DPU, 엔비디아 AI 엔터프라이즈 소프트웨어가 탑재된다. 엔비디아 L40S 기반 서버는 델 테크놀로지스, 휴렛팩커드 엔터프라이즈, 레노버 등 선도적인 글로벌 시스템 제조업체를 통해 연말 출시를 앞두고 있다. 해당 서버는 엔터프라이즈용 생성형 AI 가속화에 활용될 예정이다.

젠슨 황 CEO는 "새로운 컴퓨팅 시대가 시작됐다. 모든 산업 분야의 기업들이 생성형 AI를 도입하기 위해 경쟁하고 있다. 엔비디아는 세계 최고의 소프트웨어와 시스템 파트너 에코시스템을 통해 전 세계 기업들에게 생성형 AI를 제공하고 있다"고 말했다.

L40S GPU와 블루필드 DPU가 탑재된 엔비디아 AI 레디 서버는 연말 출시 예정이며, 향후 몇 달 내 클라우드 서비스 제공업체를 통해 인스턴스를 이용할 수 있다.

김문기 기자
moon@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널