행안부 세계 최초로 모델 개발<br/>이달말부터 목소리 감정 활용
행정안전부는 보이스피싱 사기범 검거에 활용할 수 있는 ‘보이스피싱 음성분석 모델’을 개발하고, 이달 말 음성 감정 등 사기범 수사 과정에 활용한다고 23일 밝혔다.
그동안 국내에서는 러시아와 영국에서 개발한 음성분석 모델을 활용해 보이스피싱 수사를 진행했으나 외국어로 학습된 음성분석 모델 특성상, 한국어를 사용하는 범죄자의 동일인 여부를 판별하는 정확도에 한계가 있었다. 특히, 보이스피싱 범죄조직의 특성상 역할(수사관, 검사 등)을 나눠 그룹별로 활동하고 있어 범죄에 연루된 범죄자들을 군집화하는 기능이 반드시 필요했다.
이에 행안부 통합데이터분석센터는 국립과학수사연구원과 함께 지난해부터 보이스피싱 범죄자 검거에 초점을 두고 화자(話者) 구분 정확도 개선과 범죄연루자 그룹화가 가능한 모델 개발을 추진, 최신 인공지능학습(AI 딥러닝) 기술을 활용해 국내외 약 6천여 명으로부터 추출한 100만 개 이상의 외국어와 한국어 음성데이터를 활용한 알고리즘을 만들었다.
이 알고리즘은 한국어의 경우, 약 10만 개 이상의 일반인 음성데이터와 국과수가 보유 중인 실제 보이스피싱 사기범 음성데이터를 함께 사용해 다양한 학습 과정과 성능 검증과정을 반복 시행, 보이스피싱 화자 구분 등에 필요한 최적의 시스템을 구축했다. 특히 1차 150명 660여 개, 2차 200명 1만2천여 개의 별도 음성데이터를 사용한 정확도 검증에서 범죄자의 음성을 정확하게 판별해내는 판독률이 약 77% 향상된 것이 확인됐다. 또한, 범죄가담자 그룹화 기능도 세계 최초로 구현했다.
행안부는 이를 통해 이달 말부터 보이스피싱 사기범 목소리 감정에 활용, 보유 중인 약 1만 개의 보이스피싱범 음성데이터를 분석해 범죄조직 그룹화와 이미 검거된 범죄자의 여죄 추궁 등에 사용하고, 경찰청과도 모델을 공유해 보이스피싱 범죄 초동수사의 속도와 검거율을 높이는데 활용한다.
/피현진기자 phj@kbmaeil.com