플리토 벤치마크 데이터셋 `한국형 LLM 리더보드`에 접목..."평가범위 확대"

일반

플리토 벤치마크 데이터셋 '한국형 LLM 리더보드'에 접목..."평가범위 확대"

디지털데일리 발행일 2024-06-12 17:31:42

이건한 기자

플리토가 한국형 AI 성능 평가 'Open Ko-LLM 리더보드'에 제공한 데이터셋 (ⓒ 플리토)

[디지털데일리 이건한 기자] AI 언어 데이터 전문기업 플리토는 12일 한국어 초거대언어모델 성능을 비교·평가하는 'Open Ko-LLM 리더보드'에 벤치마크 데이터셋을 제공했다고 밝혔다.

해당 리더보드는 한국지능정보사회진흥원(NIA)과 업스테이지가 함께 구축하고 운영 중인 한국어 LLM(거대언어모델) 성능평가 플랫폼이다. 국내 기업과 연구기관이 LLM을 등록하고 경쟁할 수 있는 환경을 제공하며 한국형 AI 개발 및 자연어 처리 기술 발전에 기여하고 있다.

플리토는 업스테이지의 파트너사로서 ▲상식 추론과 문맥 이해 능력 ▲수학적 추론과 계산능력 등을 평가할 수 있는 벤치마크 데이터셋을 한국어로 제공했다. 이를 통해 기존 평가 항목인 ▲추론 능력 ▲상식 능력 ▲언어 이해력 ▲환각 방지 능력 ▲한국어 상식 생성 능력 등 뿐만 아니라 더 풍부한 성능 테스트 비교가 가능하게 됐다. 특히 상식 추론과 수학적 추론 항목이 추가됨으로써 국제적 리더보드인 허깅페이스의 'Open LLM 리더보드'와 평가 기준을 맞춘 상징적 의미도 갖게 됐다.

플리토는 이번 데이터셋 구축 참여를 계기로 한국어 LLM의 성능을 평가하고 향상하기 위한 고품질 언어 데이터 구축에 박차를 가할 예정이다. 그 일환으로 상용 분야에 적용된 한국어 언어모델 평가용 벤치마크 데이터 셋을 업스테이지와 함께 구축 중이다. 이는 연내 Open Ko-LLM을 통해 추가로 공개할 계획이다.

플리토와 업스테이지는 지난달 9일 업무협약을 체결하는 등 데이터 부문 협력 관계를 공고히 하고 있다. 당시 양사는 태국어, 일본어, 베트남어, 라오스어, 크메르어 등 상대적으로 언어 데이터가 부족한 아시아 권역에 대한 데이터셋 구축을 중심으로 협업하기로 발표한 바 있다.

플리토 이정수 대표는 "이번 벤치마크 데이터셋 제공을 통해 한국어 LLM 리더보드도 국제적 평가 기준을 갖춘 점은 의미가 크다"며 "다년간 쌓은 언어 데이터 구축 기술 능력을 바탕으로 한국형 AI 생태계 발전에 더욱 힘을 쏟겠다"고 말했다.

이건한 기자

sugyo@ddaily.co.kr

기자의 전체기사 보기

이 기사와 관련된 기사

당신이 좋아할 만한 뉴스

연재기사

플랫폼

구글, 美 ‘반독점’ 재판서 유죄 판결… '사실상 해체' 위기 직면
통신*방송

[DD퇴근길] 이마트 옆 다이소 옆 이케아…서울 '강동' 격전지로
e비즈*솔루션

KT클라우드, 업스테이지·리벨리온 등과 ‘AI파운드리’ 생태계 확장
e비즈*솔루션

메가존클라우드 염동훈 “AI 네이티브, 데이터의 숨은 가치부터 찾아야”

실시간 추천 뉴스

구글, 美 ‘반독점’ 재판서 유죄 판결… '사실상 해체' 위기 직면
2025-04-18 18:04:23
[DD퇴근길] 이마트 옆 다이소 옆 이케아…서울 '강동' 격전지로
2025-04-18 17:48:11
KT클라우드, 업스테이지·리벨리온 등과 ‘AI파운드리’ 생태계 확장
2025-04-18 17:42:17
메가존클라우드 염동훈 “AI 네이티브, 데이터의 숨은 가치부터 찾아야”
2025-04-18 17:42:00
작년 해킹 80%는 '북한발'…"방산의 'ㅂ'만 들어가면 다 턴다"
2025-04-18 17:41:35

회사명: ㈜디지털데일리｜제호: 디지털데일리｜등록번호 : 서울아00039｜등록발행연월일: 2005년 9월 6일｜사업자 등록번호: 101-86-13419
주소: (04057)서울특별시 마포구 신촌로14길 24(노고산동 54-46)｜대표전화: 02-334-7781｜Fax: 02-334-7782
대표자: 양경진｜편집국장: 채수웅｜개인정보·청소년보호책임자: 오주엽

뉴스

뉴스

기획/특집

부가서비스

이 기사와 관련된 기사

당신이 좋아할 만한 뉴스

많이 본 기사

연재기사

실시간 추천 뉴스