소프트웨어

[OCW 2024] 오라클, 업계 첫 제타스케일 클라우드 컴퓨팅 클러스터 제공

라스베이거스(미국)=이안나 기자
오라클 클라우드 월드 2024 전경
오라클 클라우드 월드 2024 전경

[디지털데일리 이안나기자] 오라클이 미 라스베이거스 베네치안 컨벤션에서 연례 컨퍼런스 ‘오라클 클라우드 월드 2024’ 행사를 진행중인 가운데, 엔비디아 블랙웰 플랫폼으로 가속화된 최초 제타스케일 클라우드 컴퓨팅 클러스터를 발표했다.

11일(현지시간) 오라클은 오라클 클라우드 인프라스트럭처(OCI)가 현재 최대 13만1072개 엔비디아 블랙웰 그래픽처리장치(GPU)를 탑재한 클라우드 최대 규모의 AI 슈퍼컴퓨터를 주문 받고 있다고 밝혔다.

OCI 슈퍼클러스터 최대 규모는 프론티어 슈퍼컴퓨터보다 3배 이상, 다른 하이퍼스케일러보다 6배 이상 많은 GPU를 제공한다. OCI 슈퍼클러스터엔 OCI 컴퓨트 베어 메탈, 커넥트X-7 NIC 및 커넥트X-8 슈퍼NIC 또는 엔비디아 퀀텀-2 인피니밴드 기반 네트워크가 포함된 초저지연 RoCEv2, 그리고 HPC 스토리지 선택이 포함된다.

OCI 슈퍼클러스터는 엔비디아 H100 또는 H200 텐서 코어 GPU, 엔비디아 블랙웰 GPU로 구동되는 OCI 컴퓨팅과 함께 주문 가능하다. H100 GPU가 탑재된 OCI 슈퍼클러스터는 최대 1만6384개 GPU로 확장할 수 있으며 최대 65 엑사플롭스(ExaFLOPS) 성능과 13Pb/s 총 네트워크 처리량을 제공한다.

H200 GPU가 탑재된 OCI 슈퍼클러스터는 최대 6만5536개 GPU로 확장할 수 있고, 최대 260 엑사플롭스 성능과 52Pb/s 총 네트워크 처리량을 올해 말부터 제공할 예정이다.

엔비디아 GB200 NVL72 수냉식 베어메탈 인스턴스를 갖춘 OCI 슈퍼클러스터는 NV링크 및 NV링크 스위치를 사용해 단일 NV링크 도메인에서 최대 72개 블랙웰 GPU가 129.6TB/s 총 대역폭으로 서로 통신할 수 있도록 지원한다.

내년 상반기에 출시될 5세대 NV링크, NV링크 스위치 및 클러스터 네트워킹을 갖춘 엔비디아 블랙웰 GPU는 단일 클러스터에서 원활한 GPU-GPU 통신을 가능하게 만들 예정이다.

이안 벅 엔비디아 하이퍼스케일 및 고성능 컴퓨팅 담당 부사장은 “기업, 연구자, 국가가 AI를 활용해 혁신을 이루기 위해 경쟁하면서 강력한 컴퓨팅 클러스터와 AI 소프트웨어에 대한 액세스가 매우 중요해졌다”며 “분산된 오라클 클라우드에 기반한 엔비디아 풀스택 AI 컴퓨팅 플랫폼은 전례 없는 규모 AI 컴퓨팅 기능을 제공한다"고 말했다.

마헤시 티아가라잔 OCI 총괄 부사장은 “오라클은 가장 광범위한 AI 인프라스트럭처를 제공하고 있으며, 클라우드에서 가장 까다로운 AI 워크로드를 실행하는 고객을 지원하고 있다”고 말했다. 이어 “오라클 분산 클라우드를 통해 고객은 최고 수준 데이터 및 AI 주권을 유지하면서 원하는 곳에 클라우드 및 AI 서비스를 배포할 수 있는 유연성을 확보할 수 있다”고 말했다.

라스베이거스(미국)=이안나 기자
anna@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널