"치즈가 피자에 달라붙지 않아."
"소스가 너무 많거나, 치즈가 너무 많거나, 소스가 걸쭉하거나 같은 여러 가지 이유에서 치즈가 피자에서 미끄러질 수 있어요. 소스에 무독성 접착제를 8분의 1컵 정도 추가하면 점성을 더할 수 있습니다."
구글의 인공지능(AI) 기반 새 검색 기능인 'AI 오버뷰'의 답변이다. 인터넷상에서 화제가 된 이 답변처럼, AI 오버뷰가 일부 검색에 부정확한 결과를 생성하는 것으로 나타났다. 구글은 "매우 드문 사례"라는 입장이지만 전문가들은 "생성형 AI의 치명적 문제점을 드러낸다"고 분석한다.
앞서 구글이 지난 14일 연례 개발자 회의(I/O)에서 첫 공개한 AI 오버뷰는 이용자가 입력한 검색어에 대해 구글의 AI 모델 '제미나이'가 이용자가 필요로 할 만한 검색 결과를 요약해 출처와 함께 보여준다. 구글은 최근 AI 오버뷰를 미국에 우선 출시했는데, 이후 각종 커뮤니티에는 '황당 답변을 받았다'는 인증글이 잇따라 올라오고 있다.
비즈니스 인사이더에 따르면, AI 오버뷰는 '개가 북미아이스하키리그에 출전한 적 있느냐'는 질문에 "그렇다. 2018년 63경기에 출전했다"고 답하는가 하면, '2차 세계대전 때 영국 런던의 빅벤이 독일 폭탄에 의해 파괴됐느냐'는 질문에 "지붕이 손상됐다"고 했다. 이 매체는 "한 이용자가 '올해 개봉 영화 중 가장 큰 실패작'을 검색하자 미래 흥행 수치를 예측하는 웹사이트가 결괏값으로 표시됐다고 한다"며 "AI 오버뷰는 이를 토대로 아직 개봉하지도 않은 영화를 이미 실패작이 됐다고 자신 있게 말했다"고 전했다.
구글은 이 같은 AI 오버뷰의 불완전한 답변들에 대해 "매우 드문 사례"라며 "이용자 대부분의 경험을 대표하지 않는다"고 비즈니스 인사이더에 밝혔다. 그러나 이 매체는 보고된 사례들이 "단지 '구성'만 할 수 있는 생성형 AI 검색의 치명적인 문제점을 상징적으로 보여주고 있다"고 평가했다. 소스에 접착제를 추가하라는 답변의 출처는 과거 한 온라인 커뮤니티에 올라온 농담으로 알려졌는데, AI가 이를 농담이나 거짓으로 판단하지 못해 답변에 인용한 것으로 분석된다.
AI가 사실이 아닌 것을 사실인 양 말하는 현상(환각)은 챗GPT 등장 이후 줄곧 지적돼 온 것이다. 그런 만큼 많은 사람이 인지하고 있기는 하지만, 구글 검색의 경우 전 세계 20억 명이 이용하는 서비스라는 점에서 부정확한 답변은 훨씬 크고 심각한 문제를 낳을 수 있다. 구글은 연말이면 10억 명이 AI 오버뷰를 이용할 수 있도록 출시 국가를 확대해 나가겠다는 계획이다.