한국일보

“음성지원 신모델 출시, 한 달 연기합니다”…체면 구긴 오픈AI

입력: 2024.06.29 14:00

실시간 음성 대화 기능 탑재한 ‘GPT-4o’ 차질
기술적인 오류 인정, 기업 신뢰도 추락
앤스로픽 등 경쟁사 추격전에도 긴장
[아로마스픽(99)]6.24~28

편집자주

4차 산업 혁명 시대다. 시·공간의 한계를 초월한 초연결 지능형 사회 구현도 초읽기다. 이곳에서 공생할 인공지능(AI), 로봇(Robot), 메타버스(Metaverse), 자율주행(Auto vehicle/드론·무인차), 반도체(Semiconductor), 보안(Security) 등에 대한 주간 동향을 살펴봤다.

“자체 출시 기준에 도달하기 위해선 1개월 더 필요하다는 결정을 내렸다.”

이례적인 소식으로 들렸다. 앞선 기술력과 더불어 신시장을 개척해온 만큼, 해당 기업에 대한 기대감도 상당했던 터여서다. 대대적인 홍보의 장까지 마련, 자신감을 피력했던 불과 1개월여 전에 비하면 선뜻 납득하긴 어려운 얘기였다. ‘챗GPT’로 생성형 인공지능(AI) 신드롬을 불러온 오픈AI의 행보였기에 관심은 더 쏠렸다. 미 블룸버그통신이 지난 25일(현지시간) “당초 이달 말 유료서비스인 ‘챗GPT 플러스’ 구독자들에게 제공할 ‘GPT-4o’ 모델 이용 계획이 연기됐다”며 전한 오픈AI의 내부 동향에서다. ‘GPT-4o’ 모델은 그동안 텍스트 입력으로 대화가 가능했던 기존 모델에 실시간 음성 대화 기능을 탑재, 질의응답도 할 수 있게 설계한 버전이다. ‘GPT-4o’는 지난달 13일 유튜브를 통해 실시간 시연까지 공개됐고 이달 말로 출시 시점도 알렸다.

‘챗GPT’로 생성형 AI 시대 개막과 함께 수직 상승세를 이어왔던 오픈AI 체면이 구겨졌다. 특히 그동안 핵심 경쟁력으로 내세웠던 생성형 AI의 기술적인 오류가 발목을 잡았단 측면에서 오픈AI 신뢰도엔 흠집까지 생겨난 모습이다. 이 가운데 ‘챗GPT’ 보다 향상된 생성형 AI 성능 모델과 함께 등장한 경쟁사 등이 출현하면서 오픈AI를 둘러싼 대내·외 환경도 녹록지 않은 형국이다.

생성형 AI 기술적 리더십에 손상…기업 신뢰도 하락 불가피

블룸버그통신 보도와 관련, 오픈AI도 내부 상황을 인정했다. 오픈AI는 성명을 통해 “특정 내용을 감지해 거부하는 기능을 개선하고 있다”며 “또한 사용자 경험을 개선하고 인프라(기반) 확장을 위해 노력하고 있다”고 전했다. 이어 “올가을엔 새 AI 모델을 모든 유료 구독자에게 제공할 계획이다”고 덧붙였다. 결과적으로 당초 예정됐던 서비스 출시 시점보단 1개월이 지연된 다음 달에 유료 사용자를 대상으로 음성 지원이 제공될 것으로 점쳐진다. 해당 기능 역시 지난달 행사에서 보여줬던 시연보단 더 제한적인 상태에서 지원될 가능성도 더 높아졌다.

또 다른 기능의 기술적 차질 과정도 내비쳤다. 오픈AI는 “지난달 시연한 동영상과 화면 공유 기능을 출시하기 위해 작업 중이다”고 설명했지만 “이 기능의 출시 시기는 향후 이용자들에게 알려줄 것”이라고 말했다.

사실, 이 모델은 출시 전부터 구설에 올랐던 버전이기도 하다. 당시 이 모델에 사용된 음성이 미국 유명 여배우인 스칼릿 조핸슨의 목소리와 비슷하단 논란에 휘말렸고, 이후 조핸슨도 이 음성을 삭제해달라고 요구하면서 마찰도 빚어졌다.

그럼에도 불구하고 ‘GPT-4o’ 모델에 대한 오픈AI 내부의 기대는 상당했다. 지난달 26분 12초 분량으로 유튜브에 소개된 ‘GPT-4o’ 소개 영상에 직접 출현한 미라 무라티 오픈AI 최고기술책임자(CTO)는 “사용 편의성에 관해 우리가 정말로 큰 진전을 이뤘다고 생각하는 것은 이번이 처음이다”고 자평한 바 있다. 이 시연 영상에서 ‘GPT-4o’는 스마트폰 앞의 A4 용지에 간단한 수학 문제로 제시된 ‘3X+1=4’에서 X값을 ‘1로’ 찾아주는 도우미 역할까지 매끄럽게 수행하면서 이목을 집중시켰다. 특히 시각 기능을 통해 풀이 과정까지 단계적으로 제시, 시청자들의 눈과 귀를 사로잡았다. 오픈AI측에선 “새 모델이 기존 최신 버전인 ‘GPT-4 터보’보다 두 배 더 빠르고 비용은 2분의 1 수준이며, 한국어를 포함한 50개 언어에 대한 챗GPT의 품질과 속도가 향상됐다”고 강조하면서 기대감도 끌어올렸다. 하지만 이렇게 야심작으로 내비쳤던 ‘GPT-4o’의 출시 연기는 오픈AI의 위상에도 부정적인 영향을 가져올 전망이다. 블룸버그통신은 이번 연기에 대해 “AI 분야의 경쟁 격화 속에서 우위 유지를 위한 오픈AI의 계획에 차질이 빚어질 가능성을 드러내고 있다”고 짚었다.

앤스로픽 등 강력한 경쟁사 출현 등도 위협…내부 고발자 등장도 악재

일각에선 오픈AI의 이런 시행착오에 대해 경쟁사 출현 등에도 무관치 않을 것이란 시각도 내놓고 있다. 오픈AI의 강력한 경쟁사인 앤스로픽은 20일 업계 최고 수준의 최신 AI 모델 ‘클로드 3.5 소네트’를 출시했다고 밝혔다. ‘클로드 3.5 소네트’는 이전 버전보단 2배 빠른 처리 속도에 차트나 그래프 해석과 같은 시각적 추론 능력에서 월등하다는 게 회사 측 설명이다. 앤스로픽이 공개한 자체 평가 자료에 따르면 ‘클로드 3.5 소네트’는 멀티모달(복합정보처리) 과제 수행 결과, 차트 이해도와 문서 이해도 부문에서 각각 90.8%, 95.2% 점수를 획득하면서 오픈AI의 ‘GPT-4o’(차트 이해도 85.7%, 문서 이해도 92.8%)를 제쳤다.

앤스로픽에선 또 클로드 챗봇이 생성한 코딩이나 문서, 다른 콘텐츠를 바탕으로 실시간 다자 협업이 가능한 ‘아티팩트’ 기능도 선보인다고 덧붙였다. 앤스로픽의 공동 창업자이자 사장인 대니엘라 애머데이는 "자체 평가에 따르면 ‘클로드 3.5 소네트’는 업계에서 가장 지능적인 모델이다"고 강조했다. 앤스로픽은 오픈 AI의 창립자 그룹 일원이었던 대니엘라와 다리오 애머데이 남매가 2021년 설립한 스타트업이다. 엔스로픽은 지난해에만 구글과 아마존 등에서 총 73억 달러(10조1,207억 원) 규모의 실탄도 확보했다.

최근 터져나온 내부 폭로도 오픈AI에겐 부정적이다. 13명의 전현직 오픈AI와 구글 딥마인드 직원들은 지난 4일 발표한 공동 성명에서 “AI 기술이 인류에 전례 없는 혜택을 제공할 수 있는 잠재력을 믿는다”면서도 "이런 기술에 의해 야기되는 심각한 위험 또한 알고 있다"고 경고했다. 이들은 “이런 위험은 기존의 불평등 심화에서부터 조작과 잘못된 정보, 잠재적으로 인간의 멸종을 초래하는 자율적인 AI 시스템의 통제 상실까지 다양하다”고 설명했다. 아울러 “이윤 추구가 목적인 AI 기업에 제대로 된 감독은 기대하기 어렵고 (이런 AI 기업의) 내부 시스템만으로 문제 해결도 불가능하다”고 지적했다. 현재 생성형 AI에 올인 중인 기업들의 윤리 경영에 심각한 결함이 존재한단 폭로였다.

이들은 또 “AI 기업은 다양한 종류의 위험 수준에 대한 상당한 비공개 정보를 보유하고 있지만 이런 정보 중 일부를 정부나 시민사회와 공유할 의무가 약하고, 자발적으로 공유할 것이라고 생각하지 않는다”고 말했다.

허재경 선임기자