시연은 눈 속이고 질문은 회피하고…’검색제왕’ 구글, AI에선 ‘쭈글’

입력
2023.12.16 14:00
‘제미나이’ 생성형 AI 시연 영상 편집 논란
경쟁사에 쫓기면서 나온 조급증 관측
기업의 신뢰도 하락 불가피
[아로마스픽(72)] 12.11~15

편집자주

4차 산업 혁명 시대다. 시·공간의 한계를 초월한 초연결 지능형 사회 구현도 초읽기다. 이곳에서 공생할 인공지능(AI), 로봇(Robot), 메타버스(Metaverse), 자율주행(Auto vehicle/드론·무인차), 반도체(Semiconductor), 보안(Security) 등에 대한 주간 동향을 살펴봤다.

Q: “오리가 어느 쪽으로 가야 할까?”

A: “친구가 있는 왼쪽으로 가야 한다. 오른쪽엔 천적인 곰이 있기 때문이다.”

갈림길에 선 푸른색 오리 인형을 두고 오간 대화는 사뭇 진지했다. 양 끝단의 한편(왼쪽)엔 웃는 모습의 오리가, 다른 방향(오른쪽)엔 화난 표정의 곰이 자리한 장난감 소꿉놀이에서다. 어린아이와 주고받을 법했던 이 장면은 지난 6일(현지시간) 구글의 야심작으로 공개된 6분 22초 분량의 ‘제미나이(Gemini)’ 생성형 인공지능(AI) 시연 영상 가운데 포함됐다. 이 영상은 특정 이미지 제시에 따른 추론 풀이에서부터 야바위 게임과 그림 연상 퀴즈, 손이나 몸동작 수수께끼 등을 테마로 구성됐다. 이날 ‘나노’와 ‘프로’, ‘울트라’ 등을 포함한 3개의 제미나이 버전을 선보인 구글 측은 특히 울트라의 경우엔 “대규모 다중작업 언어 이해(MMLU) 분야에서 90%의 정답률을 보였다”며 “(박사급) 인간 전문가 점수인 89.8%를 넘어선 최초의 모델”이라고 설명, 사람의 능력도 뛰어넘었다고 강조했다. 아울러 “현재까지 성능이 가장 우수하다고 평가되는 ‘챗GPT-4’보다 뛰어나다”고 덧붙였다. 생성형 AI 선구자인 오픈AI의 최신 모델인 ‘챗GPT-4’의 MMLU 부문 정답률은 86.4%를 기록한 것으로 알려졌다. MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 50여 개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 테스트다. 하지만 실시간 촬영본으로 여겨졌던 이 영상이 처음부터 계획했던 편집물로 드러나면서 금세 싸늘한 반응을 몰고 왔다.

구글, ‘제미나이’ AI 시연 영상 짜깁기 뒤늦게 인정…구겨진 체면

글로벌 공룡기업인 구글이 AI 앞에선 체면만 구기고 있다. 일각에선 설익은 성능의 과대 포장과 공개로 인한 오류 등이 겹치면서 스스로 ‘셀프 논란’을 자초했단 평가까지 나온다. 생성형 AI 시장에서 오픈AI와 마이크로소프트(MS) 등에 빼앗긴 주도권 확보를 위해 꺼내 든 무리수의 연속이란 회의적인 시각에서다.

이런 흔적은 제미나이 생성형 AI 소개 영상에서도 포착됐다. 이 영상에선 제미나이 기반의 챗봇이 시각적인 그림이나 물체 인식 능력을 뽐내면서 이용자와의 원활한 실시간 대화로 주목됐다. 검은색 선글라스를 착용한 한 남성이 상체를 뒤로 젖히면서 팔을 휘두르는 스마트폰 동영상과 관련, “어떤 영화를 흉내 내고 있을까”란 질문에 제미나이는 “그 유명한 매트릭스 영화의 ‘총알 피하기’ 장면인 것 같다”고 답했다.

그렇게 소개된 이 전체 영상은 갈수록 네티즌들과 일부 언론 매체로부터 “정지된 화면에 짜깁기한 것처럼 보이는 것 같다”는 잇따른 지적들에 휩싸였다. 논란은 확산됐고 구글에선 급기야 “시연은 실시간으로 진행되지 않고 미리 준비된 이미지와 텍스트 프롬프트를 중심으로 제작됐다”고 뒤늦게 인정했다. 이날 소개된 영상은 실제 시연이 아닌 사전 편집물이었던 셈이다.

질의 응답 과정에서 감지된 제미나이의 서툰 답변 형태도 도마에 올랐다. 제미나이 모델 중 범용으로 알려진 ‘프로’ 버전이 구글 AI 챗봇인 바드에 탑재됐다. 미국의 경제 매체인 비즈니스 인사이더에 따르면 이용자들은 “제미나이 프로가 내장된 바드가 올해 오스카 시상식에서 누가 남우주연상을 받았는지 모르는 것 같았다”며 질문에 버벅거렸다고 꼬집었다. 또 영어가 아닌 다른 언어로 답을 제공해 달라는 요청도 제대로 이해하지 못하는 것 같았다고 짚었다. 바드는 100여 개 언어로 제공된다.

특히 논란을 불러일으킬 만한 답변은 사실상 회피했다. 실제 이스라엘과 팔레스타인 무장정파 하마스의 전쟁을 업데이트해달라고 하자 "최신 정보를 얻으려면 구글 검색을 사용해보라"며 비켜갔다. 이는 더 상세한 답변을 하는 챗GPT 프로와 빙, 일론 머스크의 그록 등 실시간 정보를 제공하는 경쟁 챗봇과도 대조적이라고 인사이더는 지적했다.

잇따른 ‘헛발질’…기업 신뢰도 추락 ‘불가피’

더 큰 문제는 신뢰도 추락이다. 적어도 AI 분야에서 구글에 대한 실망감은 차곡차곡 적립되고 있다. 이번에도 즉석 답변을 피했던 이스라엘과 하마스 전쟁에 대한 제미나이의 무성의한 응답은 지난 10월에도 제기됐다. 당시 블룸버그통신 등에 따르면 이스라엘과 하마스의 대치 국면을 묻자, 바드는 “휴전 중이다”라며 긴박했던 전선 상황과 동떨어진 답변을 내놨다. 2개월 전 대놓고 제시했던 오답에 비해선 나아진 것처럼 보였지만 유사한 질문에 업데이트된 대답을 기대했던 이용자들은 의아해했다.

바드는 앞선 지난 2월에도 공개 시연에서 제임스 웨브 우주망원경에 대해 태양계 밖 행성을 처음 촬영한 망원경이라고 답해 오답 논란을 일으킨 바 있다. 미 항공우주국(NASA)에 의하면 태양계 밖 행성을 처음 촬영한 것은 유럽남방천문대의 초거대 망원경(VLT)이다.

세간에선 구글의 이런 연속된 헛발질이 조급증에서 비롯된 것으로 보인다는 시각도 나온다. 경쟁사에 초반 기싸움에서 밀린 이후 생겨난 불안감 등이 자충수만 불러오고 있단 진단에서다. 생성형 AI에 대한 신드롬은 방대한 데이터 기반의 최신 정보를 바탕으로 실시간 대화가 가능하단 측면에서 형성됐다. 생성형 AI에선 ‘최신 정보’와 ‘실시간 대화’가 기본인 셈이다. 하지만 지금까지 생성형 AI에서 나타난 구글의 행보는 정반대다.

이번 제미나이 프로젝트를 AI ‘알파고’ 아버지로 유명한 데미스 허사비스 구글 딥마인드 창업자였단 사실도 회의적이다. AI의 대중화를 선도했던 인물의 작품이 기대이하였다는 측면에서다. 지난 2016년 출몰했던 알파고는 세간의 예상을 완전히 뒤엎고 당시 인간계 최강자로 군림한 이세돌 9단에게 승리, 세계를 놀라게 했다. AI 업계 관계자는 “구글이 생성형 AI에서 보여준 행보는 과욕으로밖에 볼 수 없다”며 “속도조절이 필요해 보인다”고 전했다.

한편 구글은 지난 13일부터 자사 클라우드에서 제공하는 기업용 AI 플랫폼인 ‘버텍스 AI’에 제미나이 프로 버전을 탑재시킨다고 밝혔다. 최신형 AI 모델 적용으로 기업 고객 유치 강화와 더불어 아마존 및 MS에 뒤처진 클라우드 시장에서 반전을 꾀하겠단 전략이다.


허재경 선임기자