"AI업체가 치킨집이라구요? 치킨집도 치킨집 나름이죠"

입력
2020.12.14 14:00
AI 데이터 관리 기술 개발한 김현수 슈퍼브에이아이 대표
“AI 기업의 경쟁력은 데이터 관리에서 갈린다”

“AI의 시작은 데이터” AI 데이터 관리 기술 개발한 슈퍼브에이아이 김현수 대표

요즘 정보기술(IT) 업계에서는 인공지능(AI) 업체들을 통닭(치킨)집에 비유한다. 동네마다 여러 곳인 통닭집 만큼 많다는 얘기다. AI가 4차 산업혁명시대의 핵심으로 떠오르며 AI 개발을 선언한 기업들이 부쩍 늘었기 때문이다.

문제는 너도나도 AI 업체를 표방하다 보니 차별점이 제대로 보이지 않는다. 그만큼 AI 업체들은 숱한 기업들 사이에 묻혀 사라지지 않으려면 존재감을 드러내는 차별화 요소가 중요하다. AI 전문업체 슈퍼브에이아이는 차별화에 성공해 주목 받는 AI 신생기업(스타트업)으로 떠오르고 있다.

김현수 슈퍼브에이아이 대표가 AI 개발을 위해 반드시 필요한 데이터 관리 플랫폼에 대해 설명하고 있다. 배우한 기자


서부 개척시대의 청바지 같은 AI 관리 도구 개발

김현수(30) 대표가 2018년에 창업한 슈퍼브에이아이는 AI 업계에서 독특한 위치를 차지하고 있다. 이 업체는 AI에 필요한 데이터 관리 도구를 개발해 주목을 받았다. 미국의 서부 개척시대에 금광이 뜨면서 다들 금을 캐기 위해 혈안이 돼 있을 때 작업복인 청바지와 채굴 도구를 개발해 돈을 번 기업들처럼 슈퍼브에이아이는 AI 업체들에게 꼭 필요한 도구를 개발했다.

데이터는 AI의 연료다. 아무리 좋은 성능의 자동차라도 연료가 없으면 달릴 수 없는 것처럼 뛰어난 성능의 AI를 갖고 있어도 데이터가 없으면 기계 학습(머신 러닝)을 통해 발전할 수 없다. 결국 AI 활용은 데이터에 달린 셈이다. “AI와 머신 러닝이 등장하던 초창기에는 더 좋은 구조(알고리즘)를 개발하기 위한 경쟁을 벌였죠. 그러나 지금은 더 좋은 데이터를 확보하는 싸움이 중요해 졌습니다.”

AI 경쟁이 데이터 싸움으로 넘어가면서 데이터를 다루는 일이 중요해졌다. “AI 분야에서 가장 중요하고 기본적인 일이 AI 학습을 위한 데이터 관리입니다. AI 데이터 관리는 개발자들이 AI 개발보다 더 어렵고 힘든 일로 꼽아요.”

그 바람에 AI를 위한 데이터 관리 도구(플랫폼)가 있는 기업과 없는 기업 사이에 기술 격차가 벌어지고 있다. 즉 데이터 관리 도구가 AI 업체들의 경쟁력을 가르는 중요한 요소가 됐다. “구글 페이스북 같은 세계적 기업들은 별도로 데이터 관리 플랫폼을 각각 개발해 사용합니다. 하지만 많은 AI 기업들이 인력과 기술 부족 때문에 데이터 관리 플랫폼을 개발하지 못하고 있죠. 따라서 5년 뒤 데이터 관리 플랫폼이 AI 업체들의 승부를 가를 겁니다. AI 후발 주자들은 이런 사실을 이제 발견하고 있어요.”

데이터 관리 플랫폼이란 AI 발전을 위해 필요한 학습용 데이터를 관리하는 도구다. 컴퓨터(PC)에 들어 있는 각종 자료를 일목요연하게 관리하는 ‘윈도’의 파일 탐색기 같은 역할을 한다. 언뜻 들으면 쉬워 보이지만 실상은 그렇지 않다. AI가 학습하는 데이터는 숫자나 문자 등의 정형 데이터 뿐만 아니라 영상과 사진, 소리 같은 비정형 데이터들이 많기 때문이다. “AI의 데이터 관리 플랫폼은 비정형 데이터까지 관리하는 고도화된 도구 모음이라고 보면 됩니다.”

AI의 학습 과정을 보면 데이터 관리 플랫폼의 중요성을 이해할 수 있다. 데이터를 이용한 AI의 학습은 데이터 라벨링에서 시작된다. 데이터 라벨링이란 해당 데이터에 이름표를 달아주는 일이다. 즉 꽃 사진에 장미꽃인지, 백합인지 지정해 줘야 AI가 인식하고 가려낼 수 있다.

AI는 이름표가 붙은 데이터를 학습한 뒤 분석해서 부족한 부분의 데이터를 추가로 요구한다. 예를 들어 AI가 이름표와 다른 꽃 사진을 발견하면 무슨 꽃인지 알려달라고 요구한다. 그러면 다시 사람이 꽃 사진을 보고 이름표를 달아서 데이터를 입력해야 AI가 학습할 수 있다. 이때 AI가 학습하는 자료들이 정확한지 사람이 다시 확인하는 검수작업을 거친다. AI의 학습은 이 과정을 무한 반복하는 것이다. “AI를 처음 개발하는 업체는 데이터 수집부터 알고리즘 개발까지 6개월 이상 걸려요. 처음 개발한 AI는 데이터 부족으로 성능이 좋지 않을 테니 학습 과정을 수백 번 되풀이 해야 하죠.”

이때 데이터 관리 플랫폼이 있으면 수 많은 반복 학습 과정에서 간격을 줄일 수 있다. “반복 학습 과정의 간격을 최대한 짧게 줄여야 AI의 능력을 빨리 높일 수 있습니다. 한국이 미국보다 AI 경쟁력에서 뒤쳐지는 이유가 바로 반복 학습의 간격 차이에 있습니다. 이 말은 데이터 관리 능력이 떨어진다는 뜻이죠.”

김현수(왼쪽에서 두번째) 슈퍼브에이아이 대표가 직원들과 개발 계획을 논의하고 있다. 배우한 기자


미국에도 없는 자동 데이터 라벨링 기술 개발

이를 눈 여겨 본 김 대표가 개발한 것이 AI 데이터 관리 플랫폼 ‘스위트’다. 지난 8월 정식 출시된 스위트는 자동 데이터 라벨링 기술이 탑재 된 점이 중요한 특징이다. “자동 데이터 라벨링은 데이터에 이름표를 달아주는 작업과 데이터 검수 과정 두 가지를 자동화 했습니다. 사람이 작업하는 것보다 6배 빠릅니다. AI가 자동 검수하기 어려운 데이터에 대해 사람에게 재확인을 요청해요. 전체 데이터의 10~30% 정도만 사람이 재검수하죠. 이 기능은 미국업체들도 개발하지 못했습니다. 그래서 관련 특허 5건을 최근 미국에 출원했죠.”

김 대표는 자동 데이터 라벨링 기술이 정부의 디지털 뉴딜 정책에도 도움이 될 것으로 보고 문재인 대통령에게 직접 설명한 적이 있다. “지난 6월 18일 대통령께서 춘천에 들려 디지털 뉴딜 관련 기업을 만났을 때 데이터 관리 도구의 자동 라벨링 기술을 활용하면 생산성이 향상돼 디지털 뉴딜 정책을 고도화할 수 있다고 설명했습니다.”

김 대표는 스위트를 AI 학습에 필요한 데이터를 효율적으로 만드는 생산성 도구라고 표현했다. 스위트는 사람이 일일이 데이터를 수집해 저장하지 않아도 되도록 자동 수집해 보관하는 기능도 있다. 그만큼 사람 손을 줄여준다. 또 데이터 라벨링에 부정확한 부분이 있으면 서로 의논해 수정할 수 있도록 소통 도구까지 들어 있다.

만약 시중에서 구할 수 없는 특수한 데이터가 필요하다면 어떻게 할까. 스위트는 이를 이용자가 만들어 제공하도록 했다. “특정 기업의 제품이 불량품인지 판별할 수 있는 기준 데이터는 시중에서 구할 수 없죠. 이런 경우 해당 기업이 기준 데이터를 제작해 AI 학습에 활용할 수 있어요.”

김 대표는 스위트를 인터넷에 접속해 이용할 수 있도록 클라우드 서비스로 제공한다. 1년 단위로 이용료를 내고 사용하면 된다. 이용료는 연간 1,500만원이나 사용 목적과 데이터 량에 따라 요금이 변동된다. 클라우드 서비스를 이용할 수 없는 곳에서도 서버에 설치해 활용할 수 있도록 개발하는 제품은 내년 1분기에 나온다. “금융기관이나 특수 공장처럼 폐쇄망을 사용해 인터넷 연결이 되지 않는 곳에서도 사용할 수 있는 서비스를 개발 중입니다.”

뛰어난 기능 덕분에 스위트를 사용하는 기업들이 늘고 있다. 현재 약 70개사가 스위트 서비스를 이용하고 있다. “미국의 게임개발업체, 자율주행 자동차업체, 국내 대학 연구실, 의료기관, 항공 데이터 관리업체, 대기업 등 다양한 기업들이 스위트를 이용합니다.”

김 대표는 개인 이용자를 위한 부가 서비스 제공도 검토하고 있다. “개인도 연구실에서 논문을 쓰거나 프로그램 개발자의 경우 데이터 관리 플랫폼이 필요합니다. 이들을 위해 무료 체험판을 제공하고 있는데 유료로 부가 기능을 사용할 수 있는 방안도 검토 중입니다.”

김현수 슈퍼브에이아이 대표는 "데이터 관리 도구가 AI의 경쟁력을 가를 것"이라며 자체 개발한 데이터 관리 도구의 특징을 설명하고 있다. 배우한 기자


SK텔레콤에서 AI 연구하다가 창업

원래 김 대표는 대기업인 SK텔레콤에서 AI를 연구했다. 기업의 해외 주재원이었던 아버지를 따라 싱가포르로 건너가 중,고교를 나온 그는 미국 듀크대에서 전자공학과 생명공학을 전공하고 같은 대학원에 진학해 AI와 로보틱스로 박사 과정을 밟았다. 그때 SK텔레콤의 제의를 받고 입사하게 됐다. “듀크대 지도교수가 SK텔레콤의 기술 자문이었어요. 그 인연으로 4명이 근무한 SK텔레콤의 티브레인이라는 AI 연구소에 들어갔죠.”

처음에는 1년만 경험해 볼 생각으로 입사한 SK텔레콤에서 2년을 일했다. 그때 김 대표는 데이터 관리의 중요성을 깨닫게 됐다. “데이터는 계속 쌓이는데 관리 도구가 없다 보니 너무 비효율적으로 일한다는 생각을 했어요. 이 문제를 해결해보자는 생각에 창업을 했죠.

그는 처음부터 미국 시장을 겨냥해 국내와 실리콘밸리에 각각 사무실을 마련했다. 국내 사무실이 개발과 아시아 시장을 담당하고 실리콘밸리 사무실을 통해 미국 시장을 공략하기 위해서였다. 현재 양쪽 사무실에서 약 30명의 직원이 일하고 있다. “미국이 AI 기술에서 앞선 만큼 관련 동향을 파악하고 관계를 유지하기 위한 조치입니다.” 이를 통해 그는 미국 Y콤비네이터 등 국내외 투자업체로부터 지난해 24억원의 투자를 받았다.

대기업과 스타트업을 모두 경험한 김 대표는 스타트업의 장점으로 일하는 속도를 들었다. “스타트업의 일하는 속도가 비교할 수 없을 만큼 빨라요. 스타트업은 시장의 작은 변화도 바로 파악해서 빠르게 반영하고 대처하는데 대기업은 위험 부담을 줄이기 위한 여러 단계의 절차를 밟다 보니 시장의 변화 속도를 미처 따라가지 못하죠. 그래서 뒤늦게 쫓아가는 경우가 많습니다.”

김 대표는 숱한 AI 업체들이 치킨집에 비유되는 것도 패스트 팔로어 전략 때문이라고 본다. “AI 스타트업들도 선도 기업을 쫓아가는 패스트 팔로어 전략을 많이 추구합니다. 구글 등 선도기업이 새로운 기술이나 서비스를 내놓으면 이를 따라가죠. 몇 년 전 챗봇이 해외에서 뜨자 국내에도 관련 기업들이 마구 생겼습니다. 문제는 차별성이 없다는 것입니다. 치킨집도 치킨집 나름이죠. 차별성이 있다면 치킨집이 많아도 두각을 나타낼 겁니다.”

앞으로 김 대표의 목표는 AI 분야의 병목 현상을 해결하는 기업을 만드는 것이다. “AI 분야에서 가장 큰 병목 현상이 발생하는 곳이 데이터 라벨링입니다. 우선 데이터 라벨링의 병목 현상을 해결하고 누구나 AI를 활용할 수 있도록 그 다음 병목현상을 해결하는 기업을 만들고 싶어요.”

최연진 IT전문기자
세상을 보는 균형, 한국일보 Copyright © Hankookilbo

당신이 관심 있을만한 이슈

댓글 1,324

0 / 250
첫번째 댓글을 남겨주세요.

중복 선택 불가 안내

이미 공감 표현을 선택하신
기사입니다. 변경을 원하시면 취소
후 다시 선택해주세요.

기사가 저장 되었습니다.
기사 저장이 취소되었습니다.