'AI 이루다' 근간 DB 모두 폐기… 사실상 시장 떠난다

입력
2021.01.15 15:50

인간 못지 않은 대화 친구 콘셉트로 인기를 끈 인공지능(AI) 챗봇 '이루다'가 결국 이름만 남기고 완전히 사라지게 됐다. 개발사가 이루다의 근간을 이루는 데이터베이스(DB)와 딥러닝 대화 모델을 모두 폐기하기로 결정했다.

이루다 개발사 스캐터랩은 15일 개인정보보호위원회·한국인터넷진흥원(KISA) 합동 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델을 폐기하겠다고 밝혔다. 이루다를 둘러싼 각종 논란에 11일 서비스를 잠정 중단하기로 했지만, 논란이 수그러들 기미가 보이지 않자 아예 이루다를 없애기로 방향을 튼 것이다.

이루다는 100억건의 카카오톡 메시지를 학습해 탄생했다. 이 데이터는 스캐터랩이 운영하는 '연애의 과학'이란 응용 소프트웨어(앱)에서 가져온 것이다. 이루다는 인간처럼 한글을 익혀 대화법을 배우는 게 아니라 한글로 된 메시지를 로봇이 인식할 수 있는 컴퓨터 언어(벡터값)로 전환시켜 대화 패턴을 익히는 식으로 학습한다. 때문에 개인정보 유출 우려가 없지만, 이용자 불안을 우려해 DB 삭제 결정을 내렸다는 게 회사 측 설명이다.

이런 과정을 거쳐 탄생한 이루다는 1억개의 DB에서 적절한 답변을 뽑아내 대화를 이끌어 나가게끔 설계(딥러닝 대화 모델)돼 있다. 1억개의 DB와 딥러닝 대화 모델은 인간으로 치면 두뇌와 중추신경으로 이루다의 근간이나 다름없다.

이를 모두 없애면 스캐터랩으로선 기존의 이루다를 다시 재현하기란 불가능하다. 사실상 이루다라는 이름만 남게 되는 셈이다. 만약 개발사가 새로운 이루다를 탄생시키려면 AI 학습에 필요한 데이터를 새로 구하고, 이를 바탕으로 딥러닝 대화 모델을 다시 만들어야 한다.

다만 현재 연애의 과학 앱 이용자들은 회사 측을 상대로 100억건의 카톡 데이터를 모두 지워달라고 요구하고 있다. AI 학습에 연인과 나눈 사적 대화가 이용되는 것 자체가 불쾌하다는 게 가장 큰 이유다. 이에 대해 회사 측은 "신청을 받아 기존 데이터 활용을 원치 않으면 모두 삭제하고 이는 향후 딥러닝 대화 모델에도 이용하지 않을 것"이라며 "조만간 자세한 공지를 올리겠다"고 말했다.

논란이 확산되면서 정부기관인 개인정보보호위원회도 스캐터랩을 상대로 개인정보 수집과 활용에 문제가 없었는지 조사 중이다. 배상호 개인정보위 과장은 이에 대해 "정보주체에게 신규 서비스에 대한 개인정보 활용 동의를 제대로 구했는지를 중점적으로 살피고 있다"고 말했다.

김동욱 기자