알리바바 클라우드, '70억개 파라미터' LLM 오픈소스 공개
[디지털데일리 김보민 기자] 알리바바 클라우드가 70억개의 파라미터를 갖춘 거대언어모델(LLM) 'Qwen-7B'와 'Qwen-7B-Chat'을 오픈소스로 공개했다고 8일 밝혔다.
해당 LLM은 인공지능(AI) 모델 커뮤니티 '모델스코프'와 협력 플랫폼 '허깅페이스'를 통해 첫선을 보였다.
앞서 알리바바 클라우드는 독자 첨단 LLM '통이치엔원'을 공개한 바 있다. 통이치엔원은 70억개 이상의 파라미터를 포함한 다양한 모델 사이즈를 제공하며, 중국어와 영어를 모두 지원하는 게 특징이다.
Qwen-7B는 2조 개 이상의 토큰에 대해 사전 학습됐고 중국어, 영어, 기타 다국어 자료, 코드, 수학 등 일반 및 전문 분야를 포괄한다. Qwen-7B-챗 모델은 학습 과정에서 인간의 지시 사항에 맞춰 조장됐다.
두 모델 모두 클라우드와 온프레미스 인프라에서 배포될 수 있다.
알리바바 클라우드는 AI 기술 민주화를 위한 노력의 일환으로 이번 오픈소스 공개를 시행했다고 설명했다.
월간 활성 이용자(MAU) 수가 1억 명 이하인 기업들은 이 모델을 상업적 용도로 무상 사용할 수 있다. 1억 명 이상의 사용자를 보유한 프로그램들의 경우, 알리바바 클라우드에 라이선스를 요청할 수 있다.
징런 저우(Jingren Zhou) 알리바바 클라우드 인텔리전스 최고기술책임자(CTO)는 "개방적인 접근 방식을 통해 집단 지성이 발휘되어 오픈소스 커뮤니티의 활성화에 기여할 수 있기를 희망한다"라고 말했다.
"틱톡 따라잡기"...인스타그램 피드 비율 개편에 사용자 원성
2025-01-20 21:38:16이재명 대표, 6대 은행장과 간담회… "정치권이 어떤 도움 줄 수 있는지 듣겠다"
2025-01-20 18:25:53트럼프 취임 코 앞… 비트코인, 11만 달러 돌파 목전
2025-01-20 17:40:57소액주주연대, 고려아연 '집중투표제' 도입 필요성 재차 강조… 국민연금 '찬성' 결정 거론
2025-01-20 17:40:18“소형펩리스·헬스케어 사업 강화 집중” 심플랫폼, 3월 상장 목표 공모 절차 시동
2025-01-20 17:09:19