알리바바 클라우드, '70억개 파라미터' LLM 오픈소스 공개
[디지털데일리 김보민 기자] 알리바바 클라우드가 70억개의 파라미터를 갖춘 거대언어모델(LLM) 'Qwen-7B'와 'Qwen-7B-Chat'을 오픈소스로 공개했다고 8일 밝혔다.
해당 LLM은 인공지능(AI) 모델 커뮤니티 '모델스코프'와 협력 플랫폼 '허깅페이스'를 통해 첫선을 보였다.
앞서 알리바바 클라우드는 독자 첨단 LLM '통이치엔원'을 공개한 바 있다. 통이치엔원은 70억개 이상의 파라미터를 포함한 다양한 모델 사이즈를 제공하며, 중국어와 영어를 모두 지원하는 게 특징이다.
Qwen-7B는 2조 개 이상의 토큰에 대해 사전 학습됐고 중국어, 영어, 기타 다국어 자료, 코드, 수학 등 일반 및 전문 분야를 포괄한다. Qwen-7B-챗 모델은 학습 과정에서 인간의 지시 사항에 맞춰 조장됐다.
두 모델 모두 클라우드와 온프레미스 인프라에서 배포될 수 있다.
알리바바 클라우드는 AI 기술 민주화를 위한 노력의 일환으로 이번 오픈소스 공개를 시행했다고 설명했다.
월간 활성 이용자(MAU) 수가 1억 명 이하인 기업들은 이 모델을 상업적 용도로 무상 사용할 수 있다. 1억 명 이상의 사용자를 보유한 프로그램들의 경우, 알리바바 클라우드에 라이선스를 요청할 수 있다.
징런 저우(Jingren Zhou) 알리바바 클라우드 인텔리전스 최고기술책임자(CTO)는 "개방적인 접근 방식을 통해 집단 지성이 발휘되어 오픈소스 커뮤니티의 활성화에 기여할 수 있기를 희망한다"라고 말했다.
[2024 IT혁신상품] AI 협업부터 비정형데이터 보호까지…지란지교그룹 '각개약진'
2024-12-19 18:33:01비트코인, 1억5000만원대 유지…RWA NOVA 코인, 비트마트에 신규 상장
2024-12-19 18:06:07'계엄군 점거' 서버 살펴본 선관위 보안자문위…"침입 흔적 없다"
2024-12-19 17:56:25[현장] 티빙·웨이브 합병 두고 CEO별 온도차…"주주 동의 필요 vs 無 관여"
2024-12-19 17:13:57[DD퇴근길] 갈길 먼 AI 기본법…바디프랜드, '가구' 선보인 이유는
2024-12-19 16:52:18