플리토 `한국어 LLM 평가 플랫폼` 신규 평가지표용 데이터셋 공급

일반

플리토 '한국어 LLM 평가 플랫폼' 신규 평가지표용 데이터셋 공급

디지털데일리 발행일 2024-07-22 09:14:46

이건한 기자

오픈ko-LLM 리더보드에 플리토가 제공한 데이터셋을 기반으로 신규 평가항목 2종이 추가됐다. (ⓒ 플리토)

[디지털데일리 이건한 기자] AI 언어 데이터 전문기업플리토가 한국형 LLM(거대언어모델) 평가 플랫폼인 '오픈 Ko-LLM 리더보드'에 신규 추가된 평가 지표 구축용 데이터셋을 공급했다고 22일 밝혔다.

오픈 Ko-LLM 리더보드는 한국지능정보사회진흥원(NIA)와 업스테이지가 지난해 9월부터 공동운영 중인 LLM 성능 평가 플랫폼이다. 현재 참여 모델 수는 1500개 이상이며 AI 개발을 추진하는 기업과 연구기관 등의 참여가 지속되고 있다.

플리토가 이번에 제공한 데이터는 신규 평가 항목인 '감성평가(Ko-EQBench)'와 지시준수(Ko-nstruction Following)의 한국어 벤치마크 데이터셋이다. 지난 16일부터 적용된 감성평가 지표는 대화 맥락에서 다양한 감정과 사회적 상호작용을 이해하는 능력을 검증한다. 지시준수 지표는 주어진 지시에 따라 정확히 행동하는지를 평가한다. 플리토는 지시준수 평가의 경우 기업 전용 언어모델의 지시 이해 수준을 확인할 수 있는 가늠자가 될 것으로 기대했다.

플리토는 지난 6월 추가된 '상식 추론'과 '수학적 추론' 지표 구축에도 참여한 바 있다. 한국어 특화 LLM 평가 플랫폼인 오픈 Ko-LLM 리더보드에 지속적으로 고품질 한국어 데이터셋을 제공함으로써 한국어 LLM 신뢰성 검증 향상에 기여하고 있다.

이정수 플리토 대표는 "이번 평가 항목의 추가로 국내 생성형 AI 모델 발전이 더 앞당겨질 것으로 기대한다"며 “앞으로도 한국어 성능이 보다 객관적이고 체계적으로 평가되도록 고품질 언어 데이터 제공에 힘쓰겠다"고 말했다.

이건한 기자

sugyo@ddaily.co.kr

기자의 전체기사 보기

이 기사와 관련된 기사

당신이 좋아할 만한 뉴스

연재기사

실시간 추천 뉴스

6백억 DIP 대출, MBK의 홈플러스 회생 전략 논란…채권단 변제 뒤로 밀릴수도
2025-04-11 21:52:40
카카오 김범수, 재판 불출석…"수술 회복중, 당분간 참석 어려워"
2025-04-11 18:13:14
하나생명- 하나금융티아이, 인천 영종도 해안 플로깅 사회공헌활동
2025-04-11 17:32:03
[딜라이트닷넷] 통신3사, ‘AI 브랜드’ 강화 나섰다…AI 전문기업 전환 속도
2025-04-11 17:31:18
[DD퇴근길] 점유율 높인 '쿠팡이츠서비스', 영업이익률이 1.1% 라고?
2025-04-11 17:14:55

회사명: ㈜디지털데일리｜제호: 디지털데일리｜등록번호 : 서울아00039｜등록발행연월일: 2005년 9월 6일｜사업자 등록번호: 101-86-13419
주소: (04057)서울특별시 마포구 신촌로14길 24(노고산동 54-46)｜대표전화: 02-334-7781｜Fax: 02-334-7782
대표자: 양경진｜편집국장: 채수웅｜개인정보·청소년보호책임자: 오주엽

뉴스

뉴스

기획/특집

부가서비스

이 기사와 관련된 기사

당신이 좋아할 만한 뉴스

많이 본 기사

연재기사

실시간 추천 뉴스