"딥시크보다 저렴해"… 베일 벗은 솔트룩스 '루시아 2.5'
[디지털데일리 이건한 기자] "오늘 특히 강조하고 싶은 건 루시아 LLM(대형언어모델)의 극단적인 경제성입니다. 통상적으로 오픈AI GPT-4o보다 운영비가 20분의 1 이상 저렴하고 딥시크 모델 대비로도 10분의 1 수준입니다."
국내 1세대 AI 기업 솔트룩스의 이경일 대표는 13일 서울 광고문화회관에서 진행된 'GenAI Hands-On, 루시아&구버 에이전트 플랫폼' 행사에서 이렇게 말했다. 본 행사는 기업 관계자들을 대상으로 솔트룩스가 개발한 차세대 LLM 루시아 2.5(Luxia 2.5)를 소개 및 시연하는 자리였다.
루시아는 솔트룩스가 2023년에 첫선을 보인 LLM이다. 지난해 공개한 '루시아 2.0'은 당시 AI 환각 발생률을 낮추는 데 집중한 업계 트렌드에 따라 RAG(검색증강생성) 품질 향상에 '올인'한 결과, 환각 발생률이 0%에 가까운 것이 특징이었다. 솔트룩스에 따르면 성능 역시 당시 벤치마크 기준 GPT-4, 앤트로픽 클로드 3.5 소네트 등과 비교해 글쓰기, 수학, 이해도, 추론, 코딩 영역 등에서 루시아가 대등하거나 더 좋은 지표를 보인 바 있다.
이번에 공개한 2.5 버전은 AI 업계의 차세대 트렌드인 '추론'에도 집중해 환각 감소와 추론 성능 조화에 힘을 준 모델이다. 또한 서비스 사용료 절감을 위해 수년에 걸쳐 오픈AI나 딥시크보다 저렴하게 모델 API 제공이 가능한 자체 인프라도 완성했다. 이 대표에 따르면 이를 위해 '양자화(AI 연산단위 최적화)'를 비롯한 보편적인 비용 절감 기법은 물론, 고가의 GPU를 클라우드 환경과 연결해 동적으로 확장하거나 축소하는 기법, 또는 GPU 하나를 여러 개로 쪼개서 사용하는 슬라이싱 기법 등 자체 노하우가 다수 적용됐다.
실제로 이날 공개된 루시아 데모 자료에 따르면 유사한 모델 사이즈, 품질 기준으로 루시아 LLM이 토큰(데이터 처리 단위) 1000개를 사용하는 비용은 0.0007달러에 불과하다. 이 대표는 이를 통해 "기업 고객들이 엔터프라이즈 환경에 AI 접목 비용을 최소 10분의 1 이하로 낮춰 도입 속도를 가속하고, 더욱 다양한 도전이 가능하게 함으로써 '서비스 다양성의 폭발적인 확보 가능성'을 제공하겠다"는 비전을 제시했다.
성능 및 비용만큼 중요한 건 기업 환경에서의 실제 접근성과 사용성이다. 솔트룩스는 이를 '루시아 플랫폼'으로 통합했다. 특히 외산 AI 대비 서비스 경쟁력 확보 측면에서 지난 몇년 간 한국어 데이터, 전문 도메인 처리 능력 향상에 집중한 결과 법률과 같은 전문 분야에서의 신뢰성은 외산을 크게 앞질렀단 설명이다.
루시아 플랫폼은 크게 ▲검색 서비스 ▲분석 ▲생성 영역 서비스로 나뉜다. 법률 분야를 예시로 검색 기능은 판례 검색과 요약 등을, 분석 기능은 질문에 대한 답변 생성뿐 아니라 제시된 문제 해결을 위해 무엇이 필요한지, 리스크 회피 방안 등은 무엇인지 제시할 수 있다. 변호사 업무일 경우 생성 영역은 기존 변호사들이 의뢰인과의 상담 내용을 '녹취-텍스트 변환-쟁점 확인-질문지 작성-인터뷰' 등으로 연결했던 복잡한 과정을 AI가 모두 대신하고, 사건에 대한 후속 체크리스트까지 제공해 업무 생산성을 높여줄 수 있다. 이들 모두 주어진 데이터(사전학습, 검색, RAG 등)에 대한 기본적인 분석 수준에서 나아가 의미와 해법에 대한 고도의 추론 능력을 요구하는 서비스들이다.
솔트룩스 노하우 집약된 '구버'... 올해 진면목 드러낼까
현재 솔트룩스가 위와 같은 루시아의 강점을 십분 적용 중인 서비스는 '구버(Goover)'다. 지난해 미국 실리콘밸리에서 스핀오프로 설립된 구버와 동명인 본 서비스는 '자동화된 리서치 에이전트'로 정의된다.
구버는 챗GPT처럼 루시아 LLM을 기반으로 일반 질의에 답변할 수 있다. 특징은 사용자 요청과 관심 데이터를 바탕으로 심도 있는 내용의 '전문 보고서'도 자동 생성해 제공하는 점이다. 다른 사용자를 통해 생성된 보고서도 검색 결과로 제공될 수 있다. 회사에 따르면 현재 약 10만명의 사용자를 확보하고 매일 2만번 이상의 LLM 호출을 통해 총 25만개 이상의 AI 리포트가 생성되어 있다. 올해 상반기에는 사용자를 100만명까지 공격적으로 늘리겠단 방침이다.
이 대표는 "구버의 제작 비용도 오픈AI나 앤트로픽의 클로드 API를 사용하는 기준 대비 단 5% 정도였다"며 "구버의 인프라 아키텍처를 목적에 따라 CPU, GPU, 클라우드(서비스) 단으로 나누고 자체 노하우로 최적화한 덕분"이라고 말했다.
또한 오는 4월부터 루시아 2.5 기술이 적용되는 구버는 본격적인 상용화도 시작된다. 동시에 제공될 여러 신기능 중 '딥리서치'는 검색 시 기존에는 AI가 약 10개의 레퍼런스를 참고했다면 이제 구글검색 10페이지 분량 이상인 200개 이상의 데이터를 활용한 심층답변을 제공하게 된다. 기존 보고서도 평균 4~5페이지 분량이었다면 이제는 최대 100페이지에 이를 수 있게 된다. 보고서 내 각 문단도 기존처럼 레퍼런스 데이터의 출처와 근거가 제시된다.
기업 분석에 관심이 많은 사용자 타깃의 서비스도 제공될 예정이다. '컴퍼니 브리프 에이전트(Company Briefe Agent)'는 2000개 이상의 기업 데이터를 구버 AI가 실시간으로 모니터링한 결과물을 보고서 형태로 지속 제공해주는 서비스다. 이들 심층 서비스를 위해 구버에는 표준 RAG보다 구조적으로 다단계 검색과 결과물 검증 절차를 거쳐 신뢰성을 높이는 '어드밴스드 RAG'도 적용됐다.
초기 투자 마무리... "업계와 나누며 이익도 실현될 시기"
솔트룩스는 올해 루시아 2.5 확산과 구버 상용화에 총력을 기울일 예정이다. 이날 100여명 이상의 기업 관계자들 대상으로 진행된 행사에서 이 대표는 다양한 참석 기업 특혜를 발표하기도 했다. 루시아 2.5를 이용한 서비스 개발 및 테스트 기업에게 하나당 ▲약 2000만원 상당의 토큰 비용이 포함된 계정 지원 ▲최대 3개 고객사 대상 LLM 및 토큰 비용을 지원하는 파일럿 프로젝트 프로모션 ▲솔트룩스와 협력 사업 시 고객사의 전문 도메인 최적화 지원 및 파트너 제공 등이다. 오는 5월 개최될 솔트룩스의 연례행사에서의 마케팅 협업도 약속했다. 이밖에 솔트룩스는 지난 5일에도 국내 소프트웨어 기업과 개발자들에게 루시아 2.5 무상제공 계획을 밝힌 바 있다.
다만 이 같은 전략은 솔트룩스의 이익 등 실적에 영향을 미치지 않을까? 이 대표는 기자와 만난 자리에서 "지난 3년간 적자를 내면서까지 매년 GPU 구매를 포함한 대단위 투자를 집행했다"며 "이제 흑자전환이 이뤄졌고, GPU를 이용한 모델 학습도 거의 마무리됐다. 그 자산을 앞으로는 업계와 공유하며 서비스 운영에도 쓸 수 있게 된 것"이라고 설명했다. 큰 비용이 드는 초기 AI 투자가 마무리 단계에 접어들며 이를 이용해 이익 실현이 가능한 단계에 이르렀단 의미다.
이 대표는 이날 발표 말미에도 "딥시크보다 똑똑하고 저렴한 모델을 적어도 솔트룩스의 고객사들은 무상으로 활용해 제품을 만들 기회를 제공하고자 한다"며 "이 과정에서 부족한 부분은 서로 채우고 투자하며 발전하길 바란다"고 강조했다.
"올해 매출 목표 28조원"…KT, MS 손 잡고 선보일 AX는? (컨콜 종합)
2025-02-13 19:22:41올해는 어쩌나…통신3사, 2024년 합산 영업익 20% 뚝
2025-02-13 18:33:10고려아연 경영문제 직격했던 영풍, 실적 발표 눈앞… 경영능력 비교될까 '촉각'
2025-02-13 17:59:52KAIT, 제6차 '디지털 인사이트 포럼' 개최…AI 로봇의 현재와 미래는?
2025-02-13 17:51:28[컨콜] "통신보단 AI"…KT "6G 설비투자, 표준 제정 이후에나"
2025-02-13 17:44:51