e비즈*솔루션

[종합] AI 초격차 확보 공고히 한 오픈AI…12일간 여정 끝엔 ‘쩐의전쟁’ 남았다

오병훈 기자
[ⓒ오픈AI 12 Days of OpenAI 영상 갈무리]
[ⓒ오픈AI 12 Days of OpenAI 영상 갈무리]

[디지털데일리 오병훈기자] 오픈AI가 12일에 걸친 연말 행사 ‘오픈AI의 12일(12 Days of OpenAI)’를 마무리 지었다. 기존 ‘오원-프리뷰(o1-Preview)’모델을 정식으로 선보인 데 이어 더 강력한 성능을 갖춘 대형언어모델(LLM) ‘오쓰리(o3)’ 테스트 소식까지 연이어 전하면서 오는 2025년에도 AI 시장 내 선두주자로 자리매김하겠다는 의지를 보였다.

12 Days of OpenAI 마지막 날인 20일(현지시간) 오픈AI는 ‘오원(o1)’과 ‘오원-미니(o1-mini)’를 이을 신규 모델 ‘o3’와 ‘오쓰리-미니(o3-mini)’를 공개했다. 당장 정식 출시되지는 않지만, 안전성 및 지속 가능성을 시험해보기 위해 개발자 및 연구자를 대상으로 신청을 받아 사전 테스트를 진행한다. 해당 모델은 내년 초 일반 이용자에게 공개된다.

AGI 향한 여정에 속도 내는 오픈AI…추론 모델 개발에도 ‘온힘’

많은 AI 기업들이 범용인공지능(AGI)이나 AI비서(AI에이전트) 등 AI 서비스 준비에 속도를 내고 있는 상황이다. 오픈AI의 이번 o3 공개 또한 통해 추론AI 영역을 더욱 강화하고, 차세대 AI 경쟁에서 선두그룹을 유지하고자 하는 의지로 풀이된다.

오픈AI는 오픈AI는 o3 모델을 선보이면서 o1보다 더 강화된 모델임을 강조하기 위해 각종 벤치마크를 공개하는데 집중했다. 오픈AI에 따르면, o3는 소프트웨어(SW) 분석 벤치마크 중 하나인 ‘SWE-벤치마크 베리파이드(SWE-bench Verified)에서 직전 모델인 o1보다 20% 향상된 71.7% 정확도를 기록했다. 수학 능력에서도 뛰어난 성과를 보였다. 경쟁 수학 벤치마크에서는 o3가 약 96.7% 정확도를 기록하며, o1의 83.3%보다 높다는 것이 회사 측 설명이다.

샘 알트먼 오픈AI 최고경영자(CEO)가 가장 강조한 벤치마크는 사고 및 추론 능력을 측정하는 ‘ARC-AGI’였다. 알트먼 CEO는 “o3는 ARC-AGI 벤치마크에서 75.7%라는 새로운 1위 기록을 세웠다”며 “추가적으로, 높은 연산 자원을 활용한 벤치마크에 대입하면 o3는 동일한 데이터셋에서 85.7% 정확도를 달성했다”고 강조했다. 또 “이는 인간 평균 성능(85%)을 넘어서며, 이는 우리가 이전에는 본 적 없었던 수준”이라고 덧붙였다.

o1 출시 당시와 마찬가지로 크기가 작은 o3-mini 모델도 공개했다. mini 모델은 이름에서 알 수 있듯 기본 모델에 비해 크기 자체가 작아 적은 비용으로 효율적인 연산이 가능하다. o3-Mini에는 추론 시간 조정 기능 ‘적응적 추론 시간(adaptive thinking time)’도 추가된다. 이미 mini 모델 자체가 효율을 목표로 만들어졌지만, 한번 더 효율성을 높일 수 있는 추가 장치를 마련한 셈이다. 이용자 입장에서 간단한 연산이 필요하다 생각하면 짧은 추론시간을 선택하는 식으로 토큰 비용 등을 절감할 수 있을 것으로 보인다.

알트먼 CEO는 ‘12 Days of OpenAI’ 프로젝트 관련 영상에 출연해 “현재 시장은 더 복잡한 추론 작업을 수행할 수 있는 AI를 선보이는 시대로 진입했다”며 “오픈AI 모델이 점점 더 강력해지면서 안전 테스트를 더욱 중요시 하게 됐다. 새로운 모델을 공개할 때는 연구자들이 테스트에 참여할 수 있도록 접근 권한을 제공하는 새로운 절차를 추가하고자 한다”고 전했다.

12일 간 릴레이 쇼 마친 오픈AI…무엇을 말하고자 했나

업계에서는 올해부터 시작된 AI 기업 ‘옥석가리기’ 작업이 오는 2025년부터 가속화될 것이라고 전망하고 있다. 오픈AI 또한 스스로 가치를 증명하기 위해 이번 12 Days of OpenAI 행사를 준비한 모습이다. 각종 기술력과 새로운 수익 모델을 공격적으로 선보여 투자자는 물론, 글로벌 이용자에게 AI 선두그룹으로서 브랜드 이미지 각인시키기 위한 전략인 셈이다.

굵직한 소식을 먼저 살펴보면, ▲o1 정식버전 공개 ▲새 과금 모델 ‘챗GPT-프로’ 플랜 출시 ▲동영상 생성 AI 서비스 ‘소라(Sora)’ 정식 버전 공개 등을 들 수 있다. 기존에 선보인 모델과 기능들이 각종 테스트 및 보완을 거쳐 정식으로 이용자들 앞에 등장한 순간이다. 오픈AI가 o1-preview형태로 처음 o1을 선보였을 당시, 추론 특화라는 타이틀답게 개발자는 물론, 일반 이용자들의 많은 관심을 모았다. 소라는 텍스트를 통한 자연스러운 영상 제작 등으로 다양한 콘텐츠 분야 산업 게임체인저가 될 수 있을 것이란 평가를 받았다.

복잡하고 심도 있는 연산이 필요한 학계 및 개발 관계자를 위한 챗GPT-프로 요금제도 출시했다. 해당 플랜을 이용하면, o1보다 고도화된 o1 프로 모델을 사용할 수 있다. 요금은 월 200달러, 한화로 약 28만원이다. 이용자 입장에서는 적지 않은 돈이지만, 그에 준하는 수준 높은 성능을 제공하겠다는 자심감도 함께 보여준 셈이다.

챗GPT 웹검색 기능 무료화 선언도 의미가 있다. 구글 등 기성 빅테크 기업은 물론, 퍼플렉시티 등 스타트업까지 검색 시장 강자들과 본격적인 전쟁을 선포하고, 검색 시장 자리 싸움을 본격화할 전망이다.

이 외에도 오픈AI는 ▲고급음성모드 및 영상 인식 기능 ▲애플 인텔리전스용 챗GPT 애플리케이션 소개 ▲프로젝트 관리 도구 ▲챗GPT 캔버스 기능 등 다양한 추가 사항 업데이트 소식을 연일 전했다.

[ⓒ오픈AI 챗GPT-4o가 생성한 이미지]
[ⓒ오픈AI 챗GPT-4o가 생성한 이미지]

“쩐의전쟁은 본격 시작”...멈출 수 없는 치킨게임 양상

이미 치열한 AI LLM 전쟁이 한창이지만, 오픈AI 12 Days of OpenAI를 기점으로 전쟁 양상이 난전으로 이어지고 있는 상황이다. 구글에서는 지난 11일 ‘제미나이 2.0’을 출시하며 본격적인 추격에 나선 모습이다. 지난 5일에는 기상 예측 특화 인공지능(AI)모델 젠캐스트를 공개하기도 했으며, 이미지나 사진상 문자를 해석하는데 특화된 모델 ‘팔리젬마2’도 공개했다.

메타에서도 최근 오픈소스 모델 ‘라마 3.3 70B(Llama 3.3 70B)’를 출시했으며, 오는 2025년 중으로 ‘라마4’시리즈를 선보이겠다고 선언했다. 라마 3.3 70B는 기존 라마 3.1 405B와 유사한 성능을 유지하면서도, 매개변수는 줄이는 등 비용 효율성을 높였다.

추론 모델 출현과 비용 효율 중심 모델 등장은 주요 AI 기업들의 ‘쩐의전쟁’이 심화되고 있음을 의미한다. 새로운 모델을 개발하기 위해서는 이를 테스트 하기 위해 대규모 데이터 연산이 반복적으로 필요하다. 업계 관계자 표현을 통해 단적으로 표현하면, “모델 개발 테스트 클릭 한번에 한화로 수십억원에 달하는 비용이 발생”하게 되는 셈이다.

추론 모델 개발에 지속적으로 투자를 한다는 것은 앞으로 비용 측면에서 지속적인 출혈을 감수하겠다는 의미이기도 하다. 이 같은 상황에 대해 한 업계 관계자는 “추론모델 개발이 가속화되고 있다는 것은 초기학습에 매우 많은 비용을 투자한 뒤, 추론엔 큰 비용을 들이지 않아도 된다는 이전 AI 개발 패러다임을 깨는 것”이라고 분석하기도 했다.

비용 문제는 비단 모델 개발에서 끝나지 않는다. 개발 이후로는 다수 이용자에게 안정적인 AI 서비스를 제공하기 위한 비용이 발생한다. 전세계 이용자를 대상으로 서비스하기 위해서는 그에 응하는 서버 인프라 비용도 감당해야 하기 때문이다.

그렇다고 이용 가격을 급하게 올려 비용을 메꾸는 전략은 위험하다. 빅테크사들이 신규 모델을 연달아 선보인 덕에 이용자들의 선택 폭은 넓어졌으며, 주로 사용하고 있는 LLM 모델 가격이 오를 경우 옆 경쟁사 모델로 대체할 수 있기 때문이다.

결과적으로 현재 AI 기업 입장에서는 누군가 포기하기 전까지 가속 페달을 밟는 ‘치킨게임’을 이어갈 수밖에 없는 상황이 됐다. 2025년에도 AI 시장에서는 경쟁사와 기술 격차를 벌리고, 안정적인 비용 관리 방법을 찾는 등 지속적인 전략 탐색이 이어질 전망이다.

오병훈 기자
digimon@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널