질의 의도 파악·출처 신뢰도↑…네이버, 5월 웹 검색 업데이트
[디지털데일리 이나연기자] 네이버가 이달 웹 검색에서 다양한 검색 기술 업데이트를 진행한다. 웹 내 적용된 인공지능(AI) 기반 뉴럴 매칭 기술과 신뢰도 높은 출처 노출 강화를 위한 모델을 개선하는 것이 골자다.
5일 네이버에 따르면 웹 검색 랭킹에 적용돼있는 ‘뉴럴 매칭’ 기술이 고도화된다. 뉴럴 매칭이란 수억에서 수백억에 이르는 방대한 문서들 안에서 순식간에 벡터 기반으로 관련 문서를 찾아내는 알고리즘이다.
네이버 측은 “회사를 포함한 극소수의 글로벌 빅테크 기업들만이 웹 스케일의 검색 서비스에 뉴럴 매칭을 적용할 정도로, 이 기술은 현대적 검색 엔진의 가장 중요한 기능 요소로서 AI 검색 컴퓨팅 기술의 집약체라고 할 수 있다”라고 강조했다.
사용자가 입력한 키워드와 많은 부분이 일치하는 문서를 찾는 것에서 시작한 검색 서비스는 키워드를 단순 글자로 보는 것이 아니라, 키워드를 입력한 사용자의 핵심 의도를 분석해 이 의도에 가장 일치하는 문서를 찾는 방향으로 발전하고 있다.
기존에 적용한 뉴럴 매칭이 서로 다른 단어 간의 의미적 연관성에 집중했다면, 이번 업데이트에선 문서 전체의 주제까지 고려할 수 있도록 개선했다. 검색어 일치성이 높은 결과가 아닌 문서 전체가 질의 의도에 부합하는 내용에 집중했다는 게 네이버 측 설명이다.
예를 들어, 이용자가 “아이가 밤새 열이 날 때”를 검색했을 때 ‘밤새’ ‘아이’가 ‘고열’에 시달려 가족 돌봄 휴가 제도를 사용했다는 문서보다 ‘야간’의 ‘소아’ ‘발열’에 대한 증상과 해결 방안을 다루는 문서를 보여 주는 식이다.
또한 이번 업데이트에선 웹 검색 플랫폼의 성능 강화를 통해 뉴럴 매칭의 품질과 속도가 모두 개선됐다. 네이버 자체 실험 결과, 내용 적합성 판단에선 기존 대비 10%, 웹 검색 수행 속도는 기존 대비 약 150% 보완됐다.
네이버는 전반적인 웹 검색 상위 노출 문서에 대한 출처 신뢰도도 강화할 예정이다.
네이버 측은 “출처의 신뢰도 추정 정확도를 높이기 위해 다양한 문서 분석 기술의 개발과 신규 랭킹 시그널 발굴이 있었고, 신뢰성 높은 문서의 강조를 위해 랭킹 모형의 학습 방법도 개선했다”며 “사용자들의 주관적 의견뿐 아니라 신뢰할 만한 전문기관의 콘텐츠가 발견될 확률을 높이기 위해 노력했다”라고 설명했다.
학습 데이터 가공 프로세스도 개선해 알고리즘이 신뢰도를 강조하는 능력을 학습할 수 있도록 했다.
한편, 이번 업데이트는 이달 초부터 단계적으로 배포 및 성능 확인이 이뤄져 완료까지 1~2주 정도가 소요된다.
[인터뷰] 돈 되는 렌탈 데이터?...신상용 프리핀스 대표 “렌탈 창업부터 금융 솔루션까지 함께할 플랫폼”
2024-11-23 12:05:50행안부, 클라우드 네이티브 제도개선 착수…“공공SW 전반 변화해야”
2024-11-23 09:39:29주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52