네이버 하이퍼클로바X, 한국판 AI 능력 평가서 오픈AI·구글 제쳐

디지털데일리 발행일 2024-02-27 10:43:50

이나연 기자

[디지털데일리 이나연기자] 네이버클라우드는 하이퍼클로바X가 한국판 인공지능(AI) 성능 평가 체계 ‘KMMLU(Measuring Massive Multitask Language Understanding in Korean)’에서 오픈AI, 구글의 생성형 AI보다 높은 점수를 기록했다고 27일 밝혔다.

KMMLU는 국내의 대표적인 오픈소스 언어모델 연구팀인 ‘해례(HAE-RAE)’가 이끈 AI 성능 평가 지표 구축 프로젝트다. 인문학, 사회학, 과학·기술 등 45개 분야에서 전문가 수준의 지식을 묻는 3만5030개 문항으로 구성돼 있다.

수학적 추론 능력과 같이 전 세계 공통적으로 적용 가능한 광범위한 지식을 묻는 문항 비중이 약 80%, 한반도 지리, 국내법 등 한국 특화 문제 해결 능력을 평가하기 위한 문항은 20%로, AI의 보편적 능력과 로컬 지식을 고르게 측정해 한국 사용자에게 유용한 AI를 종합적으로 판단할 수 있다.

네이버 측은 “오픈AI, 구글 등 북미 테크 기업들이 자사 AI 성능을 확인하기 위해 주로 사용하는 지표인 ‘MMLU’를 한국어로 번역하면 문항의 부정확한 번역과 여러 문제에 내재된 영어권 국가만의 문화적 맥락으로 AI 모델의 한국어 능력을 제대로 가늠하기 어렵다”라고 강조했다.

반면 KMMLU는 한국어 원본의 시험 문제들로 구성돼 국내외 AI의 한국어 이해 역량을 보다 정확하게 평가할 수 있다는 설명이다.

KMMLU 연구 논문에 따르면 하이퍼클로바X는 오픈AI의 GPT-3.5-터보(Turbo)와 구글의 제미나이 프로(Gemini-Pro)보다 높은 점수를 기록했다. 특히 한국 특화 지식 기준으로는 오픈AI의 GPT-4보다도 높은 점수를 받았다.

네이버클라우드는 KMMLU를 통해 입증된 하이퍼클로바X의 성능 경쟁력을 바탕으로, 하이퍼클로바X를 보안과 성능을 모두 갖춘 ‘소버린(Sovereign) AI’ 솔루션으로 발전시킬 계획이다.

성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “자국어 중심 AI에 대한 전 세계적 수요가 관찰되는 만큼, 한국에서 확인한 소버린 AI의 경쟁력을 바탕으로 향후 글로벌 시장 진출에도 속도를 낼 것”이라고 말했다.

이나연 기자

lny@ddaily.co.kr

기자의 전체기사 보기

이 기사와 관련된 기사

당신이 좋아할 만한 뉴스

연재기사

실시간 추천 뉴스

하나은행, 현대자동차와 블루핸즈 가맹점 금융지원 위해 맞손
2025-05-01 11:01:51
하나은행, 은행권 최초 맞춤형 투자 포트폴리오 구독서비스 출시
2025-05-01 11:01:31
KB금융, 소방관에 1억원 상당 방진마스크원
2025-05-01 11:01:18
MS 클라우드, 1분기 33% 고성장…AI 투자 변수 된 트럼프발 관세쇼크
2025-05-01 10:59:44
[대선 2025] 김문수 "과학기술부 신설·총리 임명…위상 강화할 것"
2025-05-01 10:37:02

회사명: ㈜디지털데일리｜제호: 디지털데일리｜등록번호 : 서울아00039｜등록발행연월일: 2005년 9월 6일｜사업자 등록번호: 101-86-13419
주소: (04057)서울특별시 마포구 신촌로14길 24(노고산동 54-46)｜대표전화: 02-334-7781｜Fax: 02-334-7782
대표자: 양경진｜편집국장: 채수웅｜개인정보·청소년보호책임자: 오주엽

뉴스

뉴스

기획/특집

부가서비스

이 기사와 관련된 기사

당신이 좋아할 만한 뉴스

많이 본 기사

연재기사

실시간 추천 뉴스