소프트웨어

업스테이지, 컴퓨터 비전 학회 'ECCV 2022'에서 논문 두 편 채택

이상일
[디지털데일리 이상일기자] 업스테이지가 세계 컴퓨터 비전 국제학회에서 논문을 발표, 광학문자 판독(OCR) 기술력을 입증했다.

업스테이지(대표 김성훈)는 유럽컴퓨터비전학술대회(이하 ECCV) 2022에서 두 편의 논문을 게재했다고 11일 밝혔다. ECCV는 표현 학습 국제 학회(ICLR), 국제 컴퓨터 비전 및 패턴인식 학술대회(CVPR)와 함께 세계 최고 권위의 인공지능 학회로 꼽힌다.

2년 주기로 개최되는 ECCV 학회는 논문 채택율이 30%가 채 되지 않는 톱티어 학회로 지난 2020년 개최된 ECCV 2020에서는 총 5150편의 논문이 제출 되었으며 그 중 26%인 1360편의 논문만이 채택되었다. 업스테이지는 올해 있었던 3대 AI 학회에서 모두 논문을 발표했다.

업스테이지가 발표한 두 편의 논문은 광학문자 판독(OCR) 문자 인식 모델에 대한 연구와 머신러닝의 기반이 되는 학습전략에 대한 논문이다.

첫번째 논문은 AI가 사진에서 문자를 인식 할 때 언어적, 시각적 요소를 모두 한번에 인식하는 멀티 모달 기술을 적용, 시각적 요소를 주로 활용하던 기존 문자 인식모델 대비 높은 성능을 달성한 연구 결과를 달성했다.

두번째는 사전 학습된 모델을 활용, 특정 분야 적용 시 발생하는 문제점을 해결하는 맞춤 학습 전략에 대한 연구 논문으로 이 기술을 통해 여러 형태의 모델에 쉽게 적용해 모델 학습 당시 살펴보지 못한 분야 데이터의 성능을 확보 할 수 있다.

즉 AI가 사진의 데이터를 인식할 때 시각적, 언어적 요소가 서로 상호작용 하도록 디자인 해 성능을 높이고, 이를 여러 형태의 문서 등 다양한 분야에서 활용할 때도 좋은 성능을 얻어 낼 수 있는 기술을 선보인 이번 논문 성과들은 특히 OCR 성능 개선에 큰 기여를 할 수 있을 것으로 전망된다.

업스테이지는 논문을 통해 인정받은 AI를 활용, 이미지에서 원하는 정보를 추출해 이용할 수 있는 ‘Upstage OCR Pack’ 개발에 더욱 박차를 가할 계획이다.

해당 논문이 발표될 올해 ECCV는 10월 23일부터 27일까지 이스라엘 텔아비브에서 개최될 예정이다. 업스테이지의 논문 두 편은 연구 트랙에 전문 게재된다.

업스테이지 김성훈 대표는 “학술적 연구에서 그치지 않고 최고 성능의 서비스를 만드는데 주요한 기반으로 활용, 고객들이 최고 성능의 AI를 현업에서 노코드로 활용 할 수 있도록 최선을 다 할 것” 의의를 밝혔다.

한편 업스테이지는 최신 AI 기술을 다양한 업종에 손쉽게 적용할 수 있는 노코드-로코드 솔루션 ‘Upstage AI Pack’을 올 하반기 출시할 예정이다.
이상일
2401@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널