네이버 검색 서비스에 고도화된 인공지능(AI)이 탑재된다. 단순한 키워드 검색에서 벗어나 질문자의 의도까지 파악, 최적화된 정보 제공이 가능해질 전망이다. 이에 따라 내년부턴 이용자 맞춤형 사진이나 동영상 검색도 할 수 있게 될 것으로 보인다.
8일 업계에 따르면 네이버는 최근 검색 서비스 '지식스니펫'에 적용된 AI 엔진을 개선하면서 어휘 중심의 추출 기술을 문장 중심으로 확장했다. 지식스니펫은 수많은 문서 중 사용자가 검색한 의도에 부합한 정보를 자동으로 추출해 최상단에 보여주는 기능이다. 네이버는 가장 빠른 검색 결과를 보여주기 위해 지난해 5월 이 서비스를 시작했다.
사실 네이버 검색은 지식인, 블로그, 카페, 쇼핑 등 다양한 정보를 통합적으로 보여준다는 장점이 있는 반면 구글에 비해 상대적으로 빠르고 정확한 정보 제공 부문에선 낮은 점수를 받아 온 게 사실이다. 특히 기업들이 네이버 블로그나 카페를 마케팅 채널로 활용하다보니, 포장된 제목으로 올려진 일부 게시글로 인해 전체 네이버 검색의 신뢰도가 떨어지고 있다는 평가도 나온다. KT그룹의 디지털 미디어렙 나스미디어가 발표한 2021 인터넷 이용자 조사에 따르면, 정보검색 서비스 점유율에서 네이버는 88.1%로 전체 1위 자리를 지켰지만, 57.4%를 가져간 유튜브나 48.6%를 기록한 구글의 추격도 만만치 않은 형세다.
그동안 네이버 지식스니펫에선 질의에 포함된 어휘에 집중해왔다. 하지만 이 방식만에선 이용자에게 실제 원하는 정보를 보여주는데 한계도 노출됐다. 이에 네이버는 이번 개편을 통해 AI가 문장을 분석해 맥락을 이해하고, 사용자가 찾는 최적의 답을 찾을 수 있도록 발전시켰다.
가령 '강아지 중성화 수술 비용'을 검색할 경우 개선될 AI 시스템에선 '비용'을 사용자에게 가장 필요한 정보로 인식, 게시글 가운데 암컷과 수컷 가격이 포함된 정보를 한눈에 보여준다. 또 '갑상선 통증'이란 키워드로 검색할 경우 통증의 유형을 설명하는 동시에 갑상선암 원인, 갑상선암 치료법 등 사용자가 관심을 가질 만한 질의를 선별하고, 의문문 형식의 문장으로 제시한다.
이를 위해 네이버는 한 개의 질의에 대해 실제 의미가 유사한 문장과 관련성이 떨어진 문장을 구분해 AI를 학습시켰다. 이렇게 수많은 문서 중 정답에 가까운 문장을 추출하는 AI 모델을 구현, 94만 개 이상의 데이터쌍(질문-답)을 구축했다. 이현구 네이버 서치 사내독립기업(CIC) 연구원은 "AI가 추출한 데이터쌍의 의미적 유사성은 80%대 후반 정도"라며 "이 중 90%를 넘어서는 정보만을 실제 검색 결과에 노출하고 있다"고 말했다.
네이버에선 또 최근 검색 경향이 동영상으로 전환되고 있다는 점에 주목, 이미지까지 분석 가능한 AI 개발에 매진하고 있다. 김이슬 서치 CIC 프로젝트 매니저는 "창작자가 노력하는 만큼 수혜를 가질 수 있도록 잘 관리된 게시글들이 지식스니펫으로 뽑힐 수 있도록 AI를 고도화할 예정"이라며 "여기에 텍스트보다 동영상을 통해 정보를 습득하는 사용자가 늘어나는 만큼, 이 부분에 데한 성능 개선에도 주력해 나갈 것"이라고 강조했다.