속보

단독

[단독] 오늘밤 당신 동네 범죄… AI는 이미 알고 있다

입력
2021.09.18 04:30
1면
구독

[영화가 현실로, 프리카스]
전국 100㎡? 단위로 2시간마다 위험등급 계산
9월 예측 자료 입수… 시·군·구 단위 위험도 분석
마포구 '서교동', 부산진구 '부전동'… 특성별 영향
서범수 의원 "아직 지역 분석, 경찰 인력 엇박자"
경찰 "'마이너리티 리포트' 목표… 맞춤 개선 노력"

범죄 발생 가능성을 예측하고 선제적으로 대응하는 미래를 그린 영화 '마이너리티 리포트'가 현실로 성큼 다가오고 있다. 경찰청이 올해 5월부터 도입한 인공지능(AI) 범죄위험도 예측분석시스템 '프리카스(Pre-CAS·Predictive Crime Risk Analysis System)'가 그 첫걸음이다. 자치경찰제 시행으로 지역 특성을 감안한 맞춤형 치안정책이 중요 과제로 떠오르면서, 프리카스의 활용도는 커질 전망이다.

한국일보는 서범수 국민의힘 의원실이 경찰청에서 제출받은 '올해 9월 1일 전국 범죄위험도 예측 자료'를 입수해 각 시·군·구 내 고위험등급 지역을 분석했다. 경찰은 지난해 8월부터 1년 치의 치안·공공 분야 빅데이터를 분석해 프리카스 기준 전국 4,970개 읍·면·동의 시간대별 위험등급 예측치를 도출했다.

인공지능(AI) 분석을 통한 전국 범죄위험도 예측 분석 결과. 그래픽=김문중 기자

인공지능(AI) 분석을 통한 전국 범죄위험도 예측 분석 결과. 그래픽=김문중 기자


고위험등급 지역… 유흥시설·1인가구 많은 특징

프리카스는 도시형·산업형·주거형·도농복합형·농림수산형·관광형 등 6개 지역 특성에 따라 도시별로 데이터를 달리 입력하고, 100㎡ 격자 단위로 해당 구역의 범죄 위험도를 250개로 분류한 시·군·구 단위 내에서 1등급에서 10등급으로 구분한다. 1등급에 가까울수록 위험도가 높고, 10등급은 사실상 사람이 살지 않는 산간지역 등이다.

경찰은 1등급부터 3등급까지를 '고위험등급'으로 판단하고, 현장에선 2시간 단위로 변화하는 범죄위험도에 따라 높은 등급 위주로 우선적으로 순찰 경로를 설정하게 된다.

경찰청이 도입한 인공지능(AI) 범죄위험도 예측분석시스템 '프리카스(Pre-CAS)'에 서울 강동구 지역의 100㎡ 면적당 1~10등급까지 상대적 위험도가 나타나 있다. 1등급에 가까울수록 위험도가 높으며, 보다 붉게 표시된다. 경찰청 제공

경찰청이 도입한 인공지능(AI) 범죄위험도 예측분석시스템 '프리카스(Pre-CAS)'에 서울 강동구 지역의 100㎡ 면적당 1~10등급까지 상대적 위험도가 나타나 있다. 1등급에 가까울수록 위험도가 높으며, 보다 붉게 표시된다. 경찰청 제공

과거 범죄발생률이 높았던 시·군·구 5곳에 속한 일부 읍·면·동의 경우 프리카스가 예측한 9월 1일 범죄발생 위험도도 높게 나타났다. 해당 지역은 강도·절도·폭력·성범죄·무질서 등의 주요 범죄 유형별 발생 위험도 또한 대부분 높게 예측됐다.

우선 서울 강남구에선 14개 동 중 역삼동의 고위험등급 격자가 151개로 가장 많았다. 역삼동 전체 격자 중 고위험등급 격자가 차지하는 비율은 동 면적의 절반 가까이(40.3%)에 달했다. 논현동도 전체 지역의 29.7%가 고위험등급 격자(69개)로 분류됐다.

범죄위험도는 대체로 총 인구와 1인 가구 수, 유흥주점 수 등이 연관이 높은 것으로 나타났다. 역삼동은 강남구에서도 인구가 가장 많은 동으로, 1인 가구 수는 강남구 전체의 25%나 차지한다. 강남구에서 영업 중인 유흥주점 182곳 중 80곳(44%)이 역삼동에 몰려 있다.

서울 마포구도 사정이 다르지 않았다. 서교동은 마포구 내 26개 동 중 고위험등급 지역이 전체면적의 41.9%(57개)로 가장 넓었다. 서교동은 이른바 '홍대 클럽 거리'가 대부분을 차지하는 번화가로, 유동인구가 많다는 점이 영향을 미친 것으로 보인다. 전체 가구 중 1인 가구가 많은 곳이기도 하다.

인공지능(AI) ‘프리카스’로 분석한 지역별 범죄발생 고위험도 섹터 수. 그래픽=김문중 기자

인공지능(AI) ‘프리카스’로 분석한 지역별 범죄발생 고위험도 섹터 수. 그래픽=김문중 기자


건물유형ㆍ노후도 등 공공데이터도 범죄 예측에 활용

위험도 예측 분석에는 과거 범죄 발생 및 112 신고건수, 유흥시설 수, 교통사고 수, 경찰관 수 등 치안데이터와 인구, 기상, 요일, 면적, 실업·고용률, 건물 유형과 노후도, 공시지가 등의 공공데이터가 종합적으로 활용된다.

실제 주거환경이 중요한 변수로 작용한 것으로 보인다. 인천 서구는 21개 동 가운데 석남동의 고위험지역이 전체의 17.8%(93개)로 상대적으로 위험도가 높았다. 가좌동(14.1%·108개)이 뒤를 따랐다. 가좌동과 석남동에선 현재 구도심 재개발·재건축이 진행되고 있다. 가좌동은 대규모 공장단지가, 석남동은 상업지구가 밀집한 구역이기도 하다.

부산 부산진구는 11개 동 중 부전동(52.1%·73개)이 고위험등급으로 분류된 면적이 가장 많았다. 부전동의 경우 공시지가 평균(5월 기준)이 부산진구 내에서 가장 높은데, 공시지가 2위인 양정동(16.1%·37개)과는 범죄위험도 측면에서 대비됐다. 부전동은 부산의 지리적 중심에 자리한 교통 요충지로 '서면'으로 통칭되는 번화가다. 시장과 백화점 등이 위치한 상업중심지역으로 유흥업소 밀집도가 높다는 게 영향을 미친 것으로 보인다.

광주 북구에선 41개 동 중 용봉동(20.0%ㆍ65개)에 고위험지가 밀집해 있었다. 인근의 운암동(12.0%ㆍ38개)과 차이가 컸다. 용봉동 또한 유흥업소와 유동인구가 많은 곳이다. 특히 대학 주변 지역이라 원룸 및 1인 가구가 밀집돼 있다는 특성도 있다. 광주여성가족재단은 올해 초 해당 지역의 환경적 특성으로 인해 강간 및 강제추행 범죄가 많이 발생한다고 진단하면서 "특별 안전점검과 대책 마련이 필요하다"고 강조했다.

전국 4,970개 읍·면·동 가운데 지역 전체가 고위험지역으로 분석된 곳도 84곳에 달했다. 경북(13개) 경남(11개) 인천(10개) 전북(8개) 경기(8개) 순으로 많았다. 영남과 전북 등이 인구 수나 경제활동 면에서 범죄 발생요인이 상대적으로 작을 수 있다는 점을 감안하면 이례적 결과로도 볼 수 있다. 반면 고위험지역이 하나도 없는 '범죄 청정 지역'도 1,990개나 됐다.

서범수 국민의힘 의원. 한국일보 자료사진

서범수 국민의힘 의원. 한국일보 자료사진


경찰 출신 서범수 의원 "지역 맞춤형 치안정책 시급"

프리카스의 예측 정확도는 높은 것으로 나타났다. 경찰청은 "프리카스에 나타난 범죄 예측 건수와 실제 발생 건수를 비교한 결과 정확도가 평균 83.1%로 나타났다"며 "위험도가 높게 예측된 지역이 실제로도 범죄와 112 신고가 많은 지역으로 확인됐다"고 밝혔다.

위험도 예측이 가능해진 만큼 치안 인력을 좀 더 섬세하게 운영해야 한다는 목소리가 높다. 경찰 출신의 서범수 의원은 "지금은 범죄 위험지역에 경찰 인력이 효율적으로 투입되지 못하는 등 엇박자가 생기고 있다"고 지적했다. 그러면서 "중앙집권적 치안행정을 탈피하고자 도입한 자치경찰제도 본래 취지에 맞게 경찰인력과 예산을 시도경찰청으로 과감하게 이관하는 등 전면적인 재조정이 필요하다"고 강조했다.

경찰은 지역 특성과 위험도 분석을 고려한 현장 대응으로 범죄 예방률을 높여 나가겠다는 입장이다. 김재영 경찰청 범죄예방운영계장은 "그동안은 경찰관이 자신의 직관과 경험으로 움직였지만 빅데이터로 객관적 판단이 가능해졌다"며 "현장에서도 위험도가 높지만 방범시설이 부족한 곳이 실제 발견되고 있어 맞춤 치안을 할 수 있도록 개선해나갈 것"이라고 밝혔다.

아울러 프리카스 또한 지속적으로 개발해 나간다는 방침이다. 김 계장은 "프리카스의 목적은 고도의 예측을 통해 현장 활동을 정교화하고 체계화하는 것으로, 궁극적 목표는 '마이너리티 리포트'의 현실화"라며 "현재 분석 면적 단위인 100㎡를 50㎡ 또는 10㎡로 좁히고 시간대를 세분화해 좀 더 정밀하게 범죄위험을 예측할 수 있도록 하겠다"고 설명했다.


프리카스(Pre-CAS)는

프리카스(Pre-CAS·Predictive Crime Risk Analysis System)는 경찰청이 올해 5월부터 도입한 인공지능(AI) 범죄 발생 위험도 예측분석 시스템이다. 프리카스는 읍·면·동 4,970개를 도시형·산업형·주거형·도농복합형·농림수산형·관광형 등 6개 특성으로 나눈 다음 해당 구역의 치안·공공데이터를 분석해 100㎡ 면적 단위로 범죄 발생 위험도를 예측한다. 위험도는 1등급에서 10등급까지 상대적으로 분류한다. 1등급에 가까울수록 위험도가 높다. 10등급은 자연지형으로 사람이 사실상 거주하지 않는 지역이다. 과거 범죄 발생 및 112 신고 건수 등 치안데이터뿐 아니라 인구 수, 실업·고용률, 공시지가 등의 공공 빅데이터까지 분석에 활용해 예측 정확도를 높였다.

이유지 기자
박준규 견습기자
세상을 보는 균형, 한국일보 Copyright © Hankookilbo

댓글 0

0 / 250
첫번째 댓글을 남겨주세요.
중복 선택 불가 안내

이미 공감 표현을 선택하신
기사입니다. 변경을 원하시면 취소
후 다시 선택해주세요.

기사가 저장 되었습니다.
기사 저장이 취소되었습니다.