실신·폭행 감지하는 'AI CCTV' 어떻게 만들까…"제일 어려운 건 실신 영상 구하기"

입력
2021.07.14 20:00
17면
디지털 뉴딜 핵심, AI데이터댐 열린다
정부 주도 AI학습용 데이터 개방
업계선 신기술 개발 기대감 부풀어

폐쇄회로(CC)TV의 진화에 가속도가 붙고 있다. 과거만 해도 '감시 카메라' 정도로 여겨졌던 CCTV에 인공지능(AI) 기술이 접목, '지능형 CCTV'로 거듭나면서다. 도로 위에서 막대한 배기가스를 내뿜는 노후차량 적발은 기본이고 요양원 내 쓰러진 환자 발견 시 감시자에게 통보하는 역할도 지능형 CCTV에겐 일상이다.

물론, 지능형 CCTV의 탄생까진 쉽지 않았다. 무엇보다 AI 학습에 필요한 양질의 영상 데이터 확보에 어려움이 많았다. 하지만 최근 정부가 민간기업과 함께 다양한 AI 학습용 데이터 구축과 함께 무료로 개방하면서 관련 업계에선 신기술 개발에 대한 기대감도 높이고 있다.

이상행동 데이터 구축 방식은?…"연기자가 직접 시연"

14일 관련 업계에 따르면 이런 분위기는 당장 스타트업에서 감지되고 있다. AI전문기업 마인즈랩 이종미 전무는 "25종 이상의 지능형 CCTV 서비스가 개발된 일본과 달리 우리나라는 아직 초기 수준"이라며 "정부 주도의 데이터 확보와 실증 연구 사업으로 우리 역시 개발속도를 높일 수 있게 됐다"고 말했다. 2014년 1월 문을 연 마인즈랩은 미국 경제전문지 포브스가 선정한 ‘주목해야 할 한국 10대 스타트업’에 이름을 올린 바 있다.

현재 이 회사는 다양한 지능형 CCTV 서비스를 개발, 성능 검증까지 마쳤다. 폭행, 쓰레기 투기, 납치 등 거리에서 이상행동을 실시간으로 탐지하는 AI 스트리트, 집이나 요양원의 노부모가 실신하면 이를 가족 구성원에게 바로 알려주는 AI 홈 서비스가 대표적이다. CCTV가 24시간 감시하다가 위험한 상황을 알아서 인식하고 사람에게 경고해주는 방식인데, 이런 기술의 난도는 상당히 높다.

가령 CCTV에서 사람의 실신 여부를 정확하게 인식하기 위해선 가장 먼저 AI에 학습시킬 실신과 관련된 영상 데이터를 구해야 한다. 하지만 평소에도 접하기 힘든 실신 장면 데이터를 시중에서 구하기란 불가능에 가깝다.

폭력이나 배회, 강도 등의 영상 데이터도 마찬가지다. 결국 연기자가 직접 시연하는 방식으로 AI 학습용 데이터를 구축해야 하는데, 이는 엄청난 시간과 비용이 뒤따른다. 마인즈랩이 정부의 데이터 구축 사업에 뛰어든 배경이다. 정부는 최근 AI허브(공공이 만든 포털)에다 CCTV 영상, 이상행동 데이터 등 19종의 AI 학습용 데이터를 개방했다. 여기엔 실신, 배회 등 총 8,000여 개의 시나리오가 담겼다.

업계에선 이를 토대로 향후 다양한 서비스가 개발될 것으로 기대한다. 이 전무는 "지능형 CCTV는 실신 등 감지가 필요한 특정 정보만 탐지하는 선별관제가 핵심 기능인데 앞으로 이 방식 중심으로 진화를 거듭할 것"이라고 말했다.

사람 말 알아듣는 스마트글래스도 등장

최근 '스마트글래스'로 주목된 국내 스타트업 디파인도 AI허브 덕을 톡톡히 봤다. 스마트글래스는 안경에 AI를 접목한 제품이다. 공상영화에 나온 것처럼 사람의 음성 명령에 따라 각종 정보를 디스플레이 화면에 보여주거나 다른 사람과 통신 연결을 해주기도 한다. 양손을 쓰기 어려운 위험한 산업현장에선 유용하다.

관건은 시끄러운 현장에서 사람의 말을 얼마나 인식할 수 있느냐에 있다. 소음과 한국어 음성 데이터를 합성시킨 뒤 소음만 걸러내도록 AI 엔진을 학습시키는 과정이 필요한데, 이때 양질의 한국어 음성 데이터가 필수다.

김현배 디파인 대표는 "공공이 기본 데이터를 구축한 덕분에 개발기간을 줄이고 기능도 고도화시켜 지난해 말 상용화했다"며 "AI 엔진에 올해 개방된 음성 데이터도 추가했는데 기능이 더 고도화될 걸로 기대한다"고 말했다.

김동욱 기자
세상을 보는 균형, 한국일보 Copyright © Hankookilbo