유명인들의 논문 표절 사태가 터질 때마다 등장하는 소프트웨어가 있다. 바로 귀신같이 표절을 잡아내는 '카피킬러'다. 국회의원을 지낸 전 태권도 국가대표 선수 문대성, 스타 강사 설민석과 가수 홍진영 등 유명인들의 박사 및 석사 학위 논문 표절을 잡아냈다. 2021년 JTBC가 보도한 영부인 김건희 여사의 숙명여대 석사 학위 논문 표절 의혹, 여당인 국민의힘이 제기한 이재명 더불어민주당 대표의 가천대 석사 학위 논문 표절 의혹에도 카피킬러가 거론됐다.
사건 당사자 못지않게 명성을 떨친 카피킬러는 2011년 신동호(50) 대표가 세운 신생기업(스타트업) 무하유의 작품이다. 카피킬러 때문에 모든 것이 가려졌지만 원래 이곳은 인공지능(AI) 개발업체다. 카피킬러 외 AI로 작성한 글을 찾아내는 'GPT킬러', 채용을 돕는 AI 서비스 '프리즘'과 '몬스터' 등을 개발했다. 서울 세종대로 한국일보사에서 신 대표를 만나 킬러 소프트웨어의 개발 배경과 향후 계획을 들어 봤다.
카피킬러 AI는 비교와 배제라는 두 가지 원칙에 따라 표절을 찾아낸다. 우선 검토 대상인 글을 논문 등 무려 100억 건의 자료가 쌓인 방대한 자체 데이터베이스(DB)와 비교한다. 엄청난 분량의 DB이지만 표절 검사에 1분이 채 걸리지 않는다. "방대한 DB 때문에 서버 비용이 많이 들어요. 외부 저장장치에 해당하는 클라우드를 이용하면 빠르게 표절 검사를 하기 힘들어 수십억 원을 들여 자체 DB를 구축했죠. 또 외부 DB를 일일이 뒤지면 그쪽에서 디도스 공격처럼 인식할 수 있어요. 그래서 자체 DB가 필요하죠."
언뜻 보면 검색과 비슷하지만 표절 검사가 더 복잡하다. "포털 검색은 보통 두 단어를 넘는 경우가 적어요. 대부분 1, 2개 단어 입력으로 끝나죠. 하지만 표절 검사는 100매 이상의 글을 통째로 검색해요. 따라서 포털 검색을 그대로 쓰면 1만 배 이상의 컴퓨팅 파워가 필요해요."
DB와 일치하는 영역이 발견되면 정식 인용에 해당하는 부분과 법령, 속담 등 일상에서 흔히 쓰는 표현을 골라내 배제한다. 그렇게 제외하면 남는 부분이 표절에 해당한다.
놀랍게도 카피킬러는 표절을 피하기 위한 부분까지 찾아낸다. "작성자가 표절 탐지를 피하려고 조치한 것들을 찾아내요. 예를 들어 한자를 한글로 바꾸거나 띄어쓰기를 일부러 다르게 한 것들이죠. 옛날 논문은 한자가 많은데 이를 한글로 고쳐 표절 탐지를 피하려는 경우가 많아요."
카피킬러의 정확도는 DB에 원문 자료가 있는 경우 100%다. "DB에 저장된 글과 동일한 내용을 100% 잡아요. 하지만 DB에 원문이 저장돼 있지 않으면 누락되죠."
특히 카피킬러는 해외보다 엄격한 국내 표절 기준에 부합했다. "예전 국내에서는 표절률 1%도 문제 삼았어요. 해외에서는 1% 정도의 표절은 문제 삼지 않아요. 지금은 조금 완화돼 석사 학위 논문의 경우 표절률 5% 이하면 통과로 보죠."
이제 카피킬러는 논문 심사를 위한 통과의례가 됐다. 심사 측은 물론이고 작성자가 자기 검증을 위해 먼저 돌려본다. 덕분에 표절 시도가 많이 줄어든 것은 카피킬러의 긍정적 효과다. "카피킬러가 예전에는 범죄 단서를 찾는 탐정 느낌이 강했으나 요즘은 표절 방지에 도움을 주는 비서 역할을 해요. 논문 작성자는 마지막에 카피킬러 확인서를 제출하죠."
덕분에 카피킬러는 전 세계적으로 유명한 표절 확인 서비스 '턴 잇 인'을 국내에서 밀어냈다. "카피킬러가 이용자 환경(UI) 등이 편리하다 보니 국내에서는 더 많이 써요."
현재 카피킬러는 공공기관, 학교, 기업 등 3,000곳 이상에서 1,000만 명이 사용한다. "대부분 대학은 교육관리시스템(LMS)에 카피킬러가 연동돼 있어요."
이용료는 개인이 따로 사용 시 표절 확인 1건당 9,900원을 받는다. LMS에 연동된 구독 서비스(Saas)의 경우 학교에서 사용 인원에 맞춰 연간 비용을 낸다. "카피킬러가 매출의 50% 이상을 차지해요."
서울대 컴퓨터공학과를 졸업하고 같은 대학원에서 인지과학을 전공한 신 대표는 중고생 때부터 컴퓨터와 인공지능에 관심을 가졌다. "고교 시절 TV 뉴스에서 기상청의 슈퍼컴퓨터 도입 보도를 봤어요. 슈퍼컴퓨터가 초당 몇 번 계산할 수 있는지 언급하는 것을 보고 그 숫자로 컴퓨터가 똑똑하다고 할 수 있는지 의문이 들었죠. 그때부터 컴퓨터의 지능에 관심을 가졌어요."
그런데 막상 공대에 입학해 보니 AI는 찬밥이었다. "공대생들은 모두 프로그래밍에만 관심이 있었어요. 너무 AI를 하고 싶어 대학원에 갔죠."
대학원을 다니던 시기는 AI 빙하기였다. "주변에서 밥 먹고 살기 힘들다며 다들 AI 연구를 말렸어요. 1960년대 등장한 AI는 얼마 전까지 침체기였죠. 아무도 AI 얘기를 하지 않았고 AI를 개발한다고 하면 사기꾼으로 봤어요. 심지어 교수가 연구과제 계획서 제목에서 AI를 빼라고 했어요."
대학원을 마친 뒤 2000년 처음 취직한 곳은 AI를 개발하는 코난테크놀로지다. 그곳에서 그는 10년간 검색기술을 개발했다. 그에게 검색은 AI를 활용하기 위한 첫 관문이었다. "기업과 기관들이 많은 자료를 디지털로 만들어 보관했어요. 이렇게 쌓아둔 데이터를 활용하려면 검색이 중요하죠."
그런데 검색시장에서 구글과 네이버가 득세하자 다음 단계를 고민한 끝에 2011년 무하유를 창업했다. 꼼꼼하게 확인하기 힘들 정도로 넘쳐 나는 정보의 홍수가 그해 등장한 카피킬러의 출발점이었다. "검색이 발달해 누구나 쉽게 자료를 찾게 되면 표절 문제가 불거질 것으로 생각했어요. 사람들이 넘쳐 나는 정보를 제대로 보지 않거든요. 그래서 카피킬러 개발에 뛰어들었죠."
카피킬러는 지난해 9월 'GPT킬러'로 진화했다. GPT킬러는 사람이 아닌 AI가 작성한 글을 찾아내는 소프트웨어다. "오픈AI에서 대화형 AI '챗GPT'를 내놓은 뒤 고객센터에 전화가 빗발쳤어요. 학생들이 과제물에 챗GPT를 사용하는데 이를 알아낼 수 없냐는 문의가 쏟아져 GPT킬러를 개발했죠."
GPT킬러의 핵심은 완벽성의 배제다. "사람이 쓴 글은 완벽성이 떨어지고 부자연스럽죠. 반면 AI는 확률에 따라 이전에 나온 단어를 보고 다음에 나올 단어를 예측해 배치하기 때문에 부자연스러운 부분이 적어요. 따라서 확률값이 높은 단어의 사용 빈도를 보고 AI 작성 여부를 판단하죠."
GPT킬러의 정확도는 내부 시험 결과 95%다. "특히 자기소개서의 AI 작성 여부를 99% 잡아내요. 자기소개서는 사용하는 단어와 주제가 제한적이어서 AI 작성 여부를 가리는 정확도가 높아요."
약 300곳의 기업과 학교가 GPT킬러를 사용한다. 모두 연간 이용료를 내는 구독형 서비스로 사용한다.
이력서, 자기소개서, 지원서의 표절 여부를 가리는 '프리즘' 서비스는 채용을 돕기 위해 개발했다. "기업의 인사담당자들이 수만 건의 지원서류를 일일이 검토하기 힘들다고 하소연해 프리즘을 개발했어요. 회사명 오기, 자신을 드러내면 안 되는 면접인데도 인적 사항을 암시하는 자기소개서 등을 예리하게 잡아내죠."
이를 위해 신 대표는 특별 과외를 받았다. "여러 기업의 인사 담당자들에게 무엇을 찾아내야 하는지 집중과외를 받았죠. 이렇게 시장이 원하는 것을 확실하게 알고 개발해야 실패하지 않아요. 스타트업 가운데 대표가 이런 것을 만들면 시장이 좋아할 것이라고 착각해 개발했다가 실패한 경우가 많아요. 이런 오류를 범하지 않으려고 과외를 받았죠."
면접 과정을 AI가 대신하는 '몬스터'도 선보였다. 몬스터 AI는 지원자의 자기소개서에서 중요한 부분을 분석해 질문을 던진다. "AI가 가상 면접관이 돼서 영상으로 면접을 봐요. 굳이 지원자를 회사로 부르지 않고 인터넷으로 영상 면접을 진행할 수 있어 회사와 구직자 모두 시간과 비용을 절약할 수 있어요. 강원랜드, 한국항공우주산업, 명랑핫도그 등이 채용에 몬스터를 사용했죠."
놀랍게도 무하유는 창사 이래 한 번도 적자를 낸 적이 없고 매출이 줄어든 적도 없다. "지난해 매출은 90억 원, 영업이익이 22억 원입니다. 올해 매출 목표는 120억 원을 겨냥해요."
신 대표는 2026년 코스닥 상장이 목표다. 이를 위해 지난해 11월 150억 원을 투자받았다. "상장 심사할 때 누가 투자했는지 살펴보기 때문에 투자받았어요. DSC인베스트먼트와 데브시스터즈벤처스, 스틱벤처스에서 투자했죠."
앞으로 그는 해외에 적극 진출할 계획이다. 이미 일본과 중국에는 진출했다. "일본 기업과 합작 법인을 세워 '카피모니터'라는 이름으로 일본에서 표절 검사 서비스를 하고 있어요. 중국에서도 '카피킬러차이나' 서비스를 시작했죠."
AI 전문가인 그는 AI에 경외감을 갖고 있다. "AI는 챗GPT 이전과 이후로 나뉘어요. 지금까지 AI가 사람을 뛰어넘기 힘들 것이라는 예측이 많았는데 챗GPT 등장으로 바뀌었죠. 신이 내린 인간의 도구인 언어를 챗GPT가 이해하기 시작했어요. 어떻게 챗GPT가 인간의 언어를 이해했는지 아직도 명확하게 규명되지 않았어요. 그래서 창발(創發)이라는 표현을 쓰죠. 어느 날 갑자기 챗GPT는 인간의 언어를 이해하기 시작했는데 개발사인 오픈AI도 정확한 이유를 몰라요. 앞으로 AI가 전문가의 일을 많이 흉내 내 대체할 겁니다."