알리바바 클라우드, '70억개 파라미터' LLM 오픈소스 공개
[디지털데일리 김보민 기자] 알리바바 클라우드가 70억개의 파라미터를 갖춘 거대언어모델(LLM) 'Qwen-7B'와 'Qwen-7B-Chat'을 오픈소스로 공개했다고 8일 밝혔다.
해당 LLM은 인공지능(AI) 모델 커뮤니티 '모델스코프'와 협력 플랫폼 '허깅페이스'를 통해 첫선을 보였다.
앞서 알리바바 클라우드는 독자 첨단 LLM '통이치엔원'을 공개한 바 있다. 통이치엔원은 70억개 이상의 파라미터를 포함한 다양한 모델 사이즈를 제공하며, 중국어와 영어를 모두 지원하는 게 특징이다.
Qwen-7B는 2조 개 이상의 토큰에 대해 사전 학습됐고 중국어, 영어, 기타 다국어 자료, 코드, 수학 등 일반 및 전문 분야를 포괄한다. Qwen-7B-챗 모델은 학습 과정에서 인간의 지시 사항에 맞춰 조장됐다.
두 모델 모두 클라우드와 온프레미스 인프라에서 배포될 수 있다.
알리바바 클라우드는 AI 기술 민주화를 위한 노력의 일환으로 이번 오픈소스 공개를 시행했다고 설명했다.
월간 활성 이용자(MAU) 수가 1억 명 이하인 기업들은 이 모델을 상업적 용도로 무상 사용할 수 있다. 1억 명 이상의 사용자를 보유한 프로그램들의 경우, 알리바바 클라우드에 라이선스를 요청할 수 있다.
징런 저우(Jingren Zhou) 알리바바 클라우드 인텔리전스 최고기술책임자(CTO)는 "개방적인 접근 방식을 통해 집단 지성이 발휘되어 오픈소스 커뮤니티의 활성화에 기여할 수 있기를 희망한다"라고 말했다.
임종훈 대표, 한미사이언스 주식 105만주 매각… 상속세 납부 목적, 이면에 불가피한 속사정?
2024-11-15 18:04:20최윤범 고려아연 회장 “이사회 의장직 내려놓겠다”… 삼성∙보잉 사례 참고했나
2024-11-15 17:19:23[DD퇴근길] 네이버 밴드, 美 MAU 600만 돌파…IT서비스업계, 연말인사 포인트는
2024-11-15 16:53:04비트코인이 불지른 가상화폐 ‘불장’… 금융당국, '이상거래' 모니터링 강화
2024-11-15 16:20:20