'목소리 15초 듣고 모방' AI 공개한 오픈AI... "감당 가능한가" 질문 남겼다

입력
2024.04.01 04:30
1면
오픈AI "음성 생성 AI '보이스 엔진' 개발" 발표
"출시 미정... 오용 대비 안전망 먼저 강화해야"


챗GPT 개발사 오픈AI가 목소리를 15초만 들려줘도 그대로 모방해 내는 인공지능(AI) 도구를 개발했다고 깜짝 공개했다. 목소리를 잃은 사람에게 본래 목소리를 되찾게 해주는 등 실제 활용 사례를 소개하면서다. 다만 이 도구의 출시 여부는 "신중히 결정하겠다"고 오픈AI는 밝혔다.

개발사가 출시 여부도 정해지지 않은 신제품을 외부에 미리 꺼내 보이는 것은 흔치 않은 일이다. 속도 경쟁이 치열한 AI 업계에서는 특히 이례적이다. 오픈AI는 "사회가 이런 새로운 기능에 어떻게 적응할 수 있는지에 대한 대화를 시작하기를 희망한다"고 밝혔다. AI를 이용해 음성을 자유자재로 복제할 수 있는 시대가 이미 와있는 만큼 개인정보 보호와 윤리 논란 등 AI 오용 대비책도 함께 생각해야 한다는 것이다.

배우 목소리 그대로 번역 더빙

오픈AI는 지난달 29일(현지시간) 자사 블로그에 '합성 음성의 도전과 기회 탐색하기'라는 제목의 글을 올려 AI 기반 음성 합성 도구 '보이스 엔진' 개발 사실을 공개했다. "15초짜리 단일 샘플(표본)로도 감성적이고 사실적인 목소리를 만들어낼 수 있다"고 오픈AI는 설명했다. 보이스 엔진은 억양, 말투 등 목소리 특성을 복제할 뿐 아니라, 주어진 글을 다양한 언어로 번역해 읽을 수도 있다고 한다. 오픈AI는 지난달 초 일부 현지 언론을 대상으로 보이스 엔진을 시연했는데, '복제된 샘 올트먼 오픈AI 최고경영자(CEO)의 연설이 실제와 구별할 수 없을 만큼 정교했다'고 블룸버그통신은 전했다.

오픈AI는 "이 도구의 잠재적 용도를 알아보기 위해 지난해 말 신뢰할 수 있는 소규모 협력자들과 함께 비공개 시험을 시작했다"며 초기 시험을 통해 확인한 용례도 공개했다. 오픈AI는 보이스 엔진이 △글을 익히지 못한 어린이 등에게 자연스러운 음성으로 책을 읽어주고 △사고나 장애로 목소리를 잃은 사람이 원래 자신의 목소리로 소통할 수 있도록 하는 데 활용될 수 있다고 밝혔다. 또 △영상이나 팟캐스트 번역에도 쓰일 수 있을 것이라고 했다. 이 경우 현지 성우의 목소리를 덧입히는 기존 더빙과는 달리 배우의 목소리 그대로 번역되기 때문에 훨씬 자연스럽다는 게 오픈AI의 설명이다.


"음성 AI 복제 등 오용 대비책 필요"

블룸버그에 따르면 오픈AI는 당초 보이스 엔진을 최대 100명의 개발자에게 배포할 계획이었다. 개발자 대상 공개는 정식 출시를 위한 수순이다. 그러나 정책 입안자, 업계 전문가, 교육계 등으로부터 의견을 수렴한 뒤 이 같은 계획을 취소한 것으로 알려졌다.

오픈AI는 "사람의 목소리를 닮은 음성을 생성하는 것은 심각한 위험을 야기하며, 선거가 있는 해에는 더 그렇다는 것을 인지하고 있다"고 밝혔다. 올해 초 조 바이든 미국 대통령의 목소리를 복제한 가짜 음성이 유권자들에게 '로보콜(자동녹음전화)'을 걸면서 혼란이 일었는데, 보이스 엔진이 출시되면 더 큰 혼란이 잇따를 수 있음을 우려한 것으로 풀이된다.

출시 계획을 잠정 연기했음에도 보이스 엔진을 공개한 이유는 AI의 잠재력을 보여줌으로써 AI 오용에 대한 사회안전망 강화의 필요성을 일깨우기 위해서라고 오픈AI는 밝혔다. 구체적으로 오픈AI는 △음성 기반 인증 보안 방식을 단계적으로 폐지하고 △AI 복제로부터 개인을 보호하기 위한 정책을 마련하고 △AI 활용 여부 추적 기술을 신속히 개발·채택할 것을 권고했다. 오픈AI는 "우리가 이 기술(보이스 엔진)을 배포하든 안 하든 이 기술이 어디로 향할지 이해하는 것은 매우 중요하다"며 "다양한 이해관계자가 대화에 참여해야 한다"고 주장했다.



실리콘밸리= 이서희 특파원
세상을 보는 균형, 한국일보 Copyright © Hankookilbo