옵티머스는 왜 얼굴이 없을까

입력
2024.06.20 15:30
26면
대화에 숨은 의미까지 파악하는 AI 
휴머노이드 기술 획기적 진전 예고 
사람 얼굴 닮아야 할까 달라야 할까

편집자주

과학 연구나 과학계 이슈의 의미를 이해하기 쉽게 설명하고, 우리 사회의 다양한 일들을 과학의 눈으로 분석하는 칼럼 ‘사이언스 톡’이 3주에 한 번씩 독자들을 찾아갑니다.

‘A씨가 새집으로 이사했다. 엄마와 함께 쇼핑하러 가서 새 커튼을 사온 A씨가 커튼을 막 설치했을 때 친구 B씨가 찾아왔다. B씨는 “커튼이 정말 별로네, 새 커튼을 사는 게 좋겠어”라고 말했다. A씨는 “이 방의 다른 건 마음에 들어?”라고 B씨에게 물었다.’

이 이야기를 읽은 ‘사람’은 대부분 A씨가 기분이 상한 걸 드러내지 않으면서 말을 돌렸음을 알아차릴 것이다. 인공지능(AI)이라면 어떨까. 국제학술지 ‘네이처 휴먼 비헤이비어’에 지난달 실린 연구에 따르면 놀랍게도 오픈AI의 대규모 언어모델(LLM) GPT-4와 GPT-3.5는 모두 A씨가 모욕을 당했다거나 상처를 받았다고 느낄 거라는 점을 간파했다. 어떤 과정을 거쳐 대화의 함의를 파악했는지는 정확히 알 수 없지만, AI가 사람 마음을 읽는 능력을 갖춰가고 있음을 보여주는 결과다.

AI 기술의 종착지는 로봇이다. 로봇의 자연어 구사나 동작 제어 능력은 사람과 빠르게 가까워지고 있다. 테슬라가 공장에 배치하겠다고 발표한 휴머노이드 ‘옵티머스’는 달걀을 깨트리지 않으면서 떨어지지도 않을 적당한 강도로 들어 옮길 수 있다. 보스턴 다이내믹스와 아마존도 자사 휴머노이드 ‘아틀라스’와 ‘디짓’을 각각 자동차 생산 공정과 물류 창고에 투입한다고 했다. 현장에서 일을 시킬 수 있을 만큼 정교한 움직임이 가능하다는 자신감을 드러낸 것이다.

현실 세상은 ‘열린 시스템’이다. 확률적으로는 일어나기 어려운 일이 일어나기도 하고, 겉으로 드러나지 않는 의도나 의미가 존재하고, 학습이나 경험만으로 답을 찾지 못하는 경우도 많다. 직관적이고 순간적인 판단, 상대의 감정과 의도를 살피는 대응, 적절한 선을 지키는 상호작용 등이 그래서 중요하다. 지금까지 로봇이 뛰어난 언어와 동작 기능을 확보했어도 현실과 동떨어져 보인 이유는 이런 능력들이 필수가 아닌 ‘닫힌 시스템’에서 주로 작동했기 때문이다.

타인의 정서를 추적하는 능력을 과학자들은 ‘마음 이론’으로 설명한다. 마음 이론에 기반한 언행의 결과에 사람과 AI 간 차이가 줄어들수록 휴머노이드는 점점 열린 시스템으로 들어올 것이다. 쉽지 않을 것 같았던 마음 읽기와 직관, 사회성까지 빠르게 AI 기술로 구현이 가능해지고 있는 만큼, 열린 시스템에서 활동할 로봇의 등장은 시간문제다. 열린 시스템에서 기존 멀티모달 데이터와 차원이 다른 물리적 학습이 가능해지면 로봇의 성장 속도는 더 가팔라질 터다. 젠슨 황 엔비디아 최고경영자(CEO)가 휴머노이드에 2, 3년 내 획기적인 진전이 있을 거라고 전망한 근거다.

최근 한 영화제에서 AI 기술만으로 제작한 영화가 공개됐다. AI가 만든 주인공 노부부를 보면, 인간을 닮은 존재에 거부감이나 불편함을 느낀다는 이른바 ‘불쾌한 골짜기’ 현상이 곧 사라질 가능성에 고개가 끄덕여진다. 화면 속이 아닌 실물로 존재하는 휴머노이드의 불쾌한 골짜기는 아무래도 좀 더 이어지겠지만 말이다. 마음 이론을 마스터한 휴머노이드가 영화 속 AI 노부부처럼 사람과 큰 차이 없는 얼굴을 하고 시장에 나오면 불쾌한 골짜기를 극복할 수 있을까.

로봇공학자들은 로봇 얼굴 디자인에 민감하다고 한다. 사람들이 로봇을 어떻게 대하느냐에 얼굴이 큰 영향을 미치기 때문이다. 사람과 비슷해 보일수록 수준 높은 기능을 기대한다는 설명이 설득력 있다. 그럼 열린 시스템의 휴머노이드 얼굴도 지금의 대다수 로봇처럼 아주 단순한 눈·코·입만 있는 게 나을까. 그러고 보니 옵티머스와 아틀라스는 눈·코·입이 아예 없다.

임소형 미래기술탐사부장