지난달 중순 국내 대표 중고거래 앱 '당근마켓'을 발칵 뒤집어놓는 사건이 발생했다. 한 이용자가 신생아 사진을 올리며 아이를 20만원에 입양 보내겠다는 취지의 글을 올린 것이다. 원래 당근마켓은 머신러닝 기반 탐지 기술로 규정에 어긋나는 게시물을 24시간 잡아내고 있었지만, 차마 사람이 판매 대상으로 업로드되리라고는 예상하지 못한 탓에 이 게시물은 이용자 신고 후 삭제조치될 때까지 약 8분여간 불특정 다수에게 노출돼 있었다.
세계 최고 수준의 인공지능(AI) 기술을 가지고 있는 페이스북이었다면 피드에 올라온 신생아 판매글을 미리 잡아낼 수 있었을까? 페이스북은 17일 아시아태평양 지역 온라인 간담회를 열고 AI를 활용한 콘텐츠 관리 현황을 공유했다. 이날 발표의 핵심은 '페이스북은 유해 콘텐츠 필터링에 AI를 어떻게 활용하느냐'에 있었다.
페이스북이 여전히 가장 중요시하는 것은 '인력을 활용한 검토'다. 크리스 팔로우 페이스북 무결성팀 엔지니어는 "아직 AI는 완벽하지 않기 때문에 누락하는 부분이 생기기 마련"이라며 "복잡한 결정일수록 사람의 힘이 필요하다"고 설명했다. AI는 바로 여기서 힘을 발휘한다. 단순한 노출이나 폭력적 콘텐츠를 걸러내는 것 외에도, 애매하고 이상한 게시물을 전문 검토 인력에게 '데려다 주는' 역할을 착실히 수행하는 것이다.
때문에 만약 신생아를 판매한다는 글이 올라온다면, AI는 이를 바로 삭제하진 못하겠지만 이 글이 이상하다고 판단해 검토 목록에 바로 올려둘 수는 있다. 다른 이용자 신고가 없더라도 게시물이 금세 삭제됐을 가능성이 높은 셈이다. 라이언 반스 페이스북 무결성팀 프로덕트 매니저는 "AI는 검토 대상 콘텐츠가 얼마나 시급한 사안인지도 스스로 판단해 우선 순위를 매겨 리뷰어에게 전달한다"면서 "한정된 리뷰 인원이 더 시급하고 심각한 사안을 먼저 처리할 수 있도록 효율화할 수 있다는 점에서 중요한 지점"이라고 강조했다.
이용자들의 신고도 중요한 역할을 한다. 실제로 올해 2분기 페이스북이 발간한 커뮤니티 규정 집행 보고서에 따르면, AI는 대부분의 유해 콘텐츠를 100% 가깝게 사전 감지해냈으나 유독 '괴롭힘과 따돌림' 항목에선 13.3%라는 터무니없이 낮은 탐지율을 기록했다. AI가 아직 읽을 수 없는 '맥락'이 중요한 작용을 하는 영역이기 때문이다. 다만 AI도 점점 맥락을 읽을 수 있도록 진화하고 있다. 예를 들어 시리얼 사진을 올리면서 마리화나 판매를 암시하는 내용의 글이 올라온 경우, AI가 '시리얼 치고는 터무니없이 비싼 가격'과 이를 본 이용자들의 반응 등을 조합해 이 게시물을 부적절 콘텐츠로 걸러내기도 한다.
페이스북 측은 유해 콘텐츠 처리에 AI를 활용함으로써 과거에 비해 빠르고 효율적인 대응이 가능해졌다고 보고 있다. 현재 전세계 모든 시간대에 50여개의 언어를 구사할 수 있는 1만5,000여명의 리뷰 인력을 운영하고 있는데, AI 덕분에 운영 효율성이 크게 증가한 셈이다. 반즈 프로덕트 매니저는 "과거 10년 동안은 이용자 신고에만 의지했지만, 앞으로는 AI를 적극적으로 활용해 커뮤니티 규정 집행을 정교하게 진행해갈 것"이라고 말했다.