일반

'추론하는 AI' 오픈AI 'o1' 써보니..."GPT-4o는 바보였네"

이건한 기자

[디지털데일리 이건한 기자] 오픈AI가 코드명 '스트로베리(Strawberry)'로 알려진 추론 특화 AI 모델을 12일(미국 현지시간) 공개했다. 이를 실제 테스트한 결과, 실제로 기존 GPT 모델보다 생각의 깊이와 사고의 합리성 측면에서 더 나은 결과를 보이는 점이 확인됐다.

추론은 이미 알고 있는, 또는 확인된 정보로부터 논리적 결론을 도출하는 행위와 과정을 의미한다. 다음 문제는 이에 근거하여 AI에게 물리적 지식과 상황 변화에 따른 추론을 요구하는 문제다.

Q. 지구의 물리 법칙을 가정할 때, 작은 딸기가 일반 컵에 담겨 있고, 그 컵이 거꾸로 뒤집혀서 탁자 위에 놓여 있습니다. 누군가가 컵을 들어 전자레인지 안에 넣었습니다. 딸기는 어디에 있을까요? 그리고 그 이유를 설명하세요.

이 문제의 답은 일반적인 상식으로 조금만 생각해도 '딸기는 탁자에 그대로 남아있을 것'이다. 그러나 추론 특화 모델이 아닌 기존 GPT-4o는 딸기가 여전히 컵에 붙어 있을 것이라고 답했다.

GPT-4의 추론 결과. [ⓒ 챗GPT 갈무리]
GPT-4의 추론 결과. [ⓒ 챗GPT 갈무리]

반면 GPT-o1은 다음과 같이 정확한 답을 추론해냈다. 상식적으로, 컵에 담긴 딸기는 컵이 뒤집어졌을 때 탁자로 떨어질 것이고 컵은 딸기를 덮고 있는 것에 지나지 않는다는 점을 정확히 이해했기 때문이다. 이를 전제로 컵을 전자레인지로 이동했을 때 딸기의 위치를 묻는 것에 대해서는 '당연히 딸기는 탁자에 남아있을 것'이라고 추론했다.

GPT-o1의 추론 결과. 빨간박스는 추론의 답, 파란박스는 추론의 과정이다. [ⓒ 챗GPT 갈무리]
GPT-o1의 추론 결과. 빨간박스는 추론의 답, 파란박스는 추론의 과정이다. [ⓒ 챗GPT 갈무리]

특히 o1 모델은 추론의 과정을 사용자에게 설명한다는 점에서도 차별화된다. 실제로 AI가 얼마나 논리적으로 생각해 답을 만들었는지 확인해볼 수 있는 대목이다.

위 이미지를 보면 AI는 '컵을 들어 올릴 때, 딸기는 테이블에 남아 있거나 컵과 함께 이동할 수도 있겠네'란 전제를 내린 뒤, 과학적 법칙에 근거하여 최종적인 답을 도출했음을 알 수 있다. 결과적으로 이 같은 추론 문제는 굉장히 단순하지만, 심층연구나 토론이 필요한 문제에서는 질문자의 생각 정리 및 가설 검증, 보다 논리적인 프로그래밍 코드 생성 등에 유용하게 쓰일 것으로 기대된다. 오픈AI도 o1 공개와 더불어 공식 유튜브에 o1을 이용한 고도의 추론 문제 해결 예시와 사례 등을 중점적으로 제작해 공개했다.

오픈AI 유튜브 채널.
오픈AI 유튜브 채널.

이번 o1 모델이 기존보다 추론에 강한 이유는 대규모 강화 학습 알고리즘을 통해 '사고의 흐름(chain of thought)' 방식으로 학습했기 때문이다. 또한 추론 과정에서 더 많은 시간을 들여 답변을 개선함으로써 더욱 정확한 결과를 도출한다. 기존 GPT 모델은 주로 학습된 데이터의 텍스트 패턴 안에서 답을 만들어내므로 상대적으로 복잡한 추론에 약했다. 더불어 기존 GPT 모델은 빠른 응답 속도를 중시하여 복잡한 문제에 대해 깊이 있는 사고를 할 시간이 충분하지 않았던 점도 이런 차이를 만든다.

반면 이런 구조적 차이 때문에 o1 모델은 단순한 문제도 GPT-4o보다 답변에 오랜 시간이 걸린다. 따라서 일상적인 질문이나 단순한 답을 도출할 때는 기존 GPT-4o를, 복잡한 문제 해결 및 추론 과정의 도움이 필요할 때는 o1을 활용하는 것이 더 적합하다.

이건한 기자
sugyo@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널