속보

단독

사람 손 거쳐야 똑똑해지는 AI... 학습 데이터 수작업 일자리도 고도화

입력
2024.02.19 08:00
수정
2024.02.22 13:50
2면
구독

AI 학습자료 만들어주는 AI 등장해도
인간 수작업 필요... 첨단 기술의 역설
신생 노동시장 라벨링 업계에도 변화
숙련도와 전문성 요구 증가하는 추세

편집자주

인공지능(AI)은 인간 노동자를 돕게 될까요, 아니면 대체하게 될까요. AI로 인해 새로운 직업이 생기기도 했고, AI와 인간의 경쟁이 촉발되기도 했습니다. 이미 시작된 노동시장의 '지각변동'을 심층취재했습니다.

게티이미지뱅크

게티이미지뱅크

인공지능(AI)을 학습시키기 위해 자료를 수집·가공하는 데이터 라벨링1은 AI의 등장과 함께 가장 먼저 생겨난 일 중 하나다. 시장에선 AI가 고도화, 세분화할수록 학습량이 늘고 난도가 올라가면서 라벨링 작업의 중요성이 더 커지고, 숙련도와 전문성까지 요구받게 될 거라는 예측이 나온다. 첨단 AI 기술 발달이 역설적이게도 인간의 수작업 필요성을 키우는 결과를 낳는다는 얘기다.

데이터 라벨링 노동시장은 이미 이 같은 변화의 흐름에 올라탔다. 살아남기 위해 자신만의 '무기'를 찾는 절박한 움직임이 라벨러들 사이에서 시작됐다.

데이터 라벨러 58만 명 이상

AI는 자신의 등장으로 만들어진 데이터 라벨링 일자리에까지 침입하기 시작했다. 학습 자료를 AI가 만들어내는 '오토 라벨링'이 가능해진 것이다. 그럼 오토 라벨링이 늘면 사람 라벨러는 사라지게 될까. 업계에선 그렇지 않을 거라는 시각이 지배적이다. AI에 생소한 분야를 학습시켜야 할 때, 학습 자료 중 특이 데이터의 의미를 판단해야 할 때 등은 라벨링 작업을 AI에만 맡겨두기 어려워 결국 사람의 손길이 필요하다는 것이다.

김혜수 크라우드웍스 전략기획실장이 1월 17일 서울 강남구 역삼동 크라우드웍스 본사에서 한국일보와 인터뷰하고 있다. 이현주 기자

김혜수 크라우드웍스 전략기획실장이 1월 17일 서울 강남구 역삼동 크라우드웍스 본사에서 한국일보와 인터뷰하고 있다. 이현주 기자

실제로 데이터 라벨러 수는 계속 증가하는 추세다. 국내 데이터 라벨링 플랫폼 업체 크라우드웍스에 따르면 이곳에 등록된 데이터 라벨러 회원은 이달 18일 기준 약 58만6,000명을 넘었다. 10만 명 정도였던 2020년에 비해 6배 가까이 늘었다. 2017년부터 이 회사의 라벨러들이 제작한 데이터는 총 2억5,680만여 개에 달한다. 이 회사는 지난해 업계 최초로 코스닥 시장에 상장했다.

글로벌 시장의 예측도 비슷하다. 미국 기업 그랜드 뷰 리서치는 2023년부터 2030년까지 라벨링 시장은 연간 28.9% 성장하지만, 라벨링의 완전 자동화는 9.38%, 반자동화는 20.78% 정도만 가능해질 것으로 추정하기도 했다. AI 개발이 활발해지면서 데이터 라벨링 시장 규모가 빠르게 커지는 데 비해 자동화 속도는 한계가 있기 때문에 사람 라벨러가 쉽게 사라지지 않는다는 뜻이다.

데이터 라벨링 시장 현황 및 전망. 그래픽=강준구 기자

데이터 라벨링 시장 현황 및 전망. 그래픽=강준구 기자


'스펙' 있어야 유리... 문턱 높아지는 수작업

데이터 라벨링 플랫폼 크라우드웍스 홈페이지에서 간단한 데이터 라벨링 기법인 '바운딩'을 시연하고 있다. 크라우드웍스 홈페이지 캡처

데이터 라벨링 플랫폼 크라우드웍스 홈페이지에서 간단한 데이터 라벨링 기법인 '바운딩'을 시연하고 있다. 크라우드웍스 홈페이지 캡처

이에 따라 라벨링 노동시장 내부에서도 이미 변화가 나타나고 있다. AI 학습용 데이터의 난이도나 전문성에 맞춰 라벨러의 '자격요건'을 따지기 시작했다. 요즘 데이터 라벨링 플랫폼들은 난도가 낮은 작업은 비용 절감을 위해 동남아시아나 아프리카의 저임금 국가에 진출해 현지 라벨러에게 맡긴다. 업계 관계자는 "베트남은 한국에 비해 20~25% 정도 단가가 차이 나는 편"이라며 "유럽 회사들은 아프리카에 지사를 많이 차린다"고 했다.

결과적으로 국내 데이터 라벨러들은 경험이 많고 숙련도가 높아야 일감을 따낼 가능성이 커지고 있다. 작업 시작 전 사전 테스트 같은 까다로운 선발 절차를 거치는 경우도 늘었다. 한 30대 전업 라벨러는 "작업을 많이 하려면 1초라도 아껴야 하는데, 키보드와 마우스를 오가며 일하기란 비효율적이라 컴퓨터에 코드를 입력해 키보드 배열을 일하기 편하게 바꿔 쓴다"며 "1, 2년 뒤에는 이런 식으로 자신만의 경쟁력을 갖춘 사람만 라벨링 노동시장에서 살아남을 것 같다"고 내다봤다.

크라우드웍스에서 공개모집 중인 데이터 라벨러 지원 요건. 한국어 관련 전문 지식이나 학위를 요구하고 있다. 크라우드웍스 홈페이지 캡처

크라우드웍스에서 공개모집 중인 데이터 라벨러 지원 요건. 한국어 관련 전문 지식이나 학위를 요구하고 있다. 크라우드웍스 홈페이지 캡처

AI 기술이 산업 전반으로 파고들면서 아예 전문성을 갖춘 데이터 라벨러에 대한 수요도 증가하고 있다. 예를 들어 의료 진단용 AI를 개발하기 위해 의사 면허가 있는 라벨러를 구하거나, 한글 관련 AI 개발에 필요한 데이터 라벨링 작업을 할 사람으로 한국어학이나 국문학 전공자를 모집하는 식이다. 데이터 라벨러의 최대 장점이 진입 문턱이 낮다는 것이었는데, 그 문턱이 점점 높아지고 있는 셈이다.

데이터 라벨링 플랫폼들은 지속가능한 일자리를 위해 라벨링 교육 프로그램을 만드는 등 다양한 시도에 나서고 있다. 김혜수 크라우드웍스 전략기획실장은 "한국어 데이터가 필요한 외국 기업들의 일감을 국내 라벨러에게 제공하는 방식으로 글로벌 확장을 고민 중"이라며 "기업의 사회적 책임(CSR)을 중시하는 회사와 연계해 장애인 라벨러 일자리를 창출하는 것도 가능해 보인다"고 설명했다.


1 데이터 라벨링
AI를 학습시키기 위해 데이터를 수집·가공하는 일. 예를 들어 AI가 바나나를 식별하기 위해서는 사진 속에서 무엇이 바나나라고 알려주는 작업을 수없이 반복해야 한다. 이때 사진에서 바나나를 찾아 표시해 AI가 학습할 수 있게 자료를 만드는 것을 '데이터 라벨링'이라고 하며, 이 일을 하는 사람을 '데이터 라벨러'라고 부른다.
오지혜 기자
이현주 기자
윤현종 기자
문예찬 인턴 기자

댓글 0

0 / 250
첫번째 댓글을 남겨주세요.
중복 선택 불가 안내

이미 공감 표현을 선택하신
기사입니다. 변경을 원하시면 취소
후 다시 선택해주세요.

기사가 저장 되었습니다.
기사 저장이 취소되었습니다.