클로드 3.5, 캡처 이미지로 웹페이지 코드 뚝딱..."품질은 글쎄"
[디지털데일리 이건한 기자] 앤스로픽이 최신 LLM(거대언어모델) '클로드 3.5 소네트(Claude 3.5 Sonnet)'에 신기능 '아티팩트(Artifacts)'를 탑재하며 멀티모달 생산성을 강조했지만 GPT-4o를 압도하진 못했다.
앤스로픽은 지난 20일(미국 현지시간) 자사의 기존 모델보다 크게 개선된 클로드 3.5 소네트 버전을 공개했다. 앤스로픽은 "클로드의 3가지 모델 중 중급 모델인 소네트 신버전이 기존 클로드 3.0 오푸스(고급모델)보다 적은 비용으로 더 높은 성능을 보였다"며 신모델 성능에 자신감을 내비쳤다. 또한 오픈AI의 GPT-4o, 구글의 제미나이 1.5 Pro, 메타의 라마-400b 등 경쟁사 모델들과의 비교 결과도 공개하며 성능 우위를 과시했다.
더불어 '아티팩트'로 명명한 신기능을 공개하며 개발자를 위한 전문 생산성 도구로의 확장 가능성도 내비쳤다. 앤스로픽에 따르면 아티팩트는 '사용자가 요청해 생성된 콘텐츠를 실시간으로 보고 편집하며 발전시킬 수 있는 동적 공간'이다. 지원하는 포맷은 '코드 스니펫(재사용 가능한 소스코드 조각)', '텍스트 문서', '웹페이지 디자인' 등이다. 결과물은 대화창 옆 전용창에 생성되며 코드의 결과물을 미리 확인 가능한 '프리뷰' 기능을 지원한다.
기자는 이 중 웹페이지 디자인 기능을 테스트해봤다. <디지털데일리>의 뉴스 페이지를 캡처한 뒤 클로드 3.5 소네트에 업로드하고 '이미지와 같은 웹페이지 디자인 코드를 만들어 달라'고 요청하는 방식이었다. 제시된 이미지를 분석해 코드를 생성하는 기능은 GPT-4o도 지원하기 때문에 챗GPT에도 동일한 명령을 내리고 결과물을 비교했다.
두 서비스 모두 품질이 만족스러운 편은 아니었다. 모바일 페이지의 경우 상대적으로 단순한 레이아웃임에도 불구하고 모두 일부 요소를 구현하는 데 그쳤기 때문이다. 그보다 단순한 PC 페이지의 '연재목록' 파트에 대한 코드 생성을 요청했을 땐 그나마 나은 결과물을 보였다. 그러나 어느 쪽에서도 클로드가 생성한 결과물이 GPT-4o보다 두드러지게 나은 점은 없었다. 또한 두 AI 모두 '게임찍먹'을 '게임줌멈'이나 '게임찜멈'으로 표기하는 등 일부 한글을 오인식하기도 했다.
다만 클로드는 제시한 코드에 '한국 뉴스 웹페이지', '한국 뉴스 웹사이트 카드섹션' 같은 제목을 자동으로 매기며 인식 대상의 성격과 특징은 정확히 인지한 모습을 보였다. 프리뷰 기능 덕분에 결과물을 확인하려면 코드를 복사한 뒤 직접 html 파일을 생성해야 하는 챗GPT보단 편의성 측면에서도 나았다.
앞으로 주목할 부분은 '협업 기능'으로서의 확장이다. 앤스로픽은 아티팩트를 통해 "클로드가 대화형 AI에서 협업 작업 환경으로 진화하고 있음을 보여준다"며 "앞으로 팀 협업을 지원하도록 확장될 예정"이라고 설명했다. 또 "가까운 미래엔 팀, 나아가 조직 전체가 하나의 공간에서 작업을 공유하고 안전하게 집중화할 수 있게 될 것이며 클로드가 온디맨드 팀원 역할을 하게 될 것"이라고 덧붙였다.
이는 클로드의 생성형 AI 기능을 활용하는 각종 작업이 개인에서 팀 단위 작업으로 확장될 수 있으며 클로드가 생산성을 강조하는 플랫폼으로 차별화될 가능성을 내비친 것으로 풀이된다. 이런 구상은 앤스로픽이 클로드 3.5 소네트 소개 자료 말미에 붙인 '다음 계획' 섹션에서도 드러난다.
해당 문서에 따르면 앤스로픽은 현재 차세대 모델 제품군 개발 외에도 '기업용 애플리케이션과의 통합을 포함한 더 많은 비즈니스 사용 사례 지원을 위한 기능과 양식'을 개발 중이다. 또한 사용자의 선호도와 상호작용 이력을 기억해 더욱 개인화된 사용 경험을 제공할 수 있는 메모리 기능의 연구도 진행되고 있다.
[인터뷰] 돈 되는 렌탈 데이터?...신상용 프리핀스 대표 “렌탈 창업부터 금융 솔루션까지 함께할 플랫폼”
2024-11-23 12:05:50행안부, 클라우드 네이티브 제도개선 착수…“공공SW 전반 변화해야”
2024-11-23 09:39:29주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52