[대학생 이슈 리포트] 범죄 수사에 AI기술의 적용

  • 이혜원·탁현지 연세대 IT경영전략 학회원
    입력 2018.12.28 11:16 | 수정 2018.12.29 07:21

    연세대학교 IT경영전략 학회(ISSU) 소속 학생이 연말 기획으로 이슈 리포트를 진행했습니다. 이번 이슈 리포트는 주목받는 기술 이슈인 블록체인, AR/VR, 인공지능(AI)을 주제로, 2인1조 5개팀이 참여했습니다. IT스페셜리스트 양성을 목표로 하는 ISSU 학생들은 어떤 시각으로 이들 기술 이슈를 풀어냈는지 살펴보겠습니다. [편집자주]

    늦은 밤, 일본의 한적한 동네에서 한 남성이 현금자동지급기(ATM)를 조작하고 있다. 몇 분 후 남성은 양 옆을 둘러보더니 빠른 걸음으로 밖을 나선다. 밖에 나서자마자 경찰관이 이 남성의 앞을 막는다. ATM의 신용카드 투입구를 조작하던 범죄자를 잡은 것이다.

    경찰은 어떻게 범인이 도망치기도 전에 바로 검거했을까? 바로 일본 ‘오키(OKI)’사가 개발한 인공지능 시스템 덕분이다. 이는 ATM 감시카메라를 통해 ATM 조작 과정에서 수상한 행동을 하는 사람을 찾아내는 시스템이다. 이는 이미 개발이 완료됐으며 머지않아 상용화되어 일본의 ATM 범죄율을 낮출 것으로 기대되고 있다.

    전 세계적으로 인공지능(AI) 기반의 최첨단 수사기법과 범죄 예측기법이 개발 및 사용되고 있다. 국내 현황은 어떠한지 살펴봤다.

    동일범 여죄 추적 모델

    현재 국내에서 범죄 수사에 활발히 활용되는 인공지능 시스템은 ‘동일범 여죄 추적 모델’이다. 이 모델은 피의자 검거 후, 피의자가 과거에 추가로 저지른 범죄가 있는지 유사도가 높은 순으로 다른 사건의 데이터를 보여준다. 이전에는 여죄 추적을 위해 피의자의 범행 수법과 유사한 이전의 임장일지 데이터를 일일이 수작업으로 검토하던 것을 인공지능이 대신하게 된 것이다.


    그림1. 임장일지 분석 개요. / 출처: 국가정보자원관리원
    이 모델은 국가정보관리원과 경찰청이 최근 2년(2016년~2017년) 간의 임장일지에 포함된 장소, 시간, 범행 수법과 같은 텍스트 데이터를 기계학습해 구현했다. TF-IDF, Doc2Vec, Binary, 토픽모델링(LDA,LSA) 총 4종의 문서 유사도 측정 알고리즘으로 3개월에 거쳐 기계학습 테스트를 진행했다.

    결과적으로 임장일지 적중률이 높은 2개의 알고리즘(TF-IDF, Doc2Vec)을 도출했다. 추가적으로 TF-IDF 적중률 향상을 위해 동의어 및 불용어 사전을 자체 개발했고, Doc2Vec 적중률 향상을 위해 설정값(window_size, vector_size) 최적화 및 품사별 형태소 분석 최적 조건을 적용하면서 알고리즘 최적화를 위해 노력했다.

    그림2. 알고리즘 결합. / 출처: 행정안정부 국가정보자원관리원
    이 모델에 적용된 알고리즘 중 하나인 TF-IDF의 작동원리에 대해 자세히 알아보면 다음과 같다. TF-IDF는 ‘Term Frequency(단어 빈도)’와 ‘Inverse Document Frequency(역문서 빈도)’가 결합된 알고리즘 명이다. TF-IDF는 특정 문장 혹은 문서에 사용된 모든 단어에 점수를 부여하며 단어를 통계적으로 가려내 중요한 키워드를 감별해낸다. 그 결과를 바탕으로 문서 내 비중 있는 단어 또는 단어 묶음을 추출한다.


    그림3. TF-IDF 가중치 계산 수식 / 출처: 블로터
    ‘동일범 여죄 추적 모델’은 부산지방경찰청의 범죄 피의자 여죄추적에 즉시 활용되어 3건의 추가 여죄 입증에 성공했다. 피의자의 범행 수법은 피해자가 잠시 자리를 비운 사이에 신용카드 등을 몰래 훔쳐 현금을 인출하는 방법으로 수천만원 상당을 훔친 것이었다. 경찰청은 여죄 추적 모델을 활용해 비슷한 범행 수업으로 이뤄졌던 피의자의 추가 여죄 3건을 입증했다.

    이번 성과를 바탕으로 국가정보관리원은 사회 현안 해결을 위해 빅데이터를 적극적으로 활용하고 경찰청과 업무협력을 지속할 예정이라고 밝혔다. 또한 경찰청은 자체 운영하는 한국형 지리적 프로파일링 시스템(GeoPros)과 범죄분석시스템(Holmes)에도 이 모델을 반영해 여죄 추적에 지속해서 활용할 예정이다.

    ◇ 범죄 예측을 위한 AI, 클루

    인공지능은 범죄 수사를 도울 뿐만 아니라 패턴을 파악해 범죄를 예측해서 예방을 돕기도 한다. 경찰 내부망 킥스(KICS)는 범죄 발생 가능성을 예측하는 AI 시스템 ‘클루’를 내년 초 시범 운영을 목표로 개발 중
    다. 클루는 범죄 분포 이해 도구(Crime Layout Understanding Engine)의 축약 표현이다. 기존의 범죄 예측 시스템이 지역별로 범죄의 빈도를 모아보는데 그쳤다면, 클루는 더 다양한 지표로 범죄를 예측한다. 기존의 범죄 데이터에 공공 데이터를 더 날씨, 지역의 인구 특징, 공시지가 등을 복합적으로 고려한, 더 정확한 예측을 할 수 있게 된 것이다.

    그렇다면 클루는 어떤 원리로 작용하는 것일까? 클루는 범죄 관련 데이터와 공공 데이터를 실시간으로 학습한다. 범죄 기록 데이터와 52종의 공공 데이터의 방대한 데이터에 여러 가지 알고리즘을 복합적으로 적용, 분석함으로써 예측의 정확성을 높이는 것이 특징이다. 그렇게 분석한 범죄 발생 가능성이 높은 지역을 찾아내서 지도에 표시해주는 것이다.

    클루의 범죄 예측은 특히 상습성 범죄에서 큰 역할을 할 것으로 예상다. 경찰 데이터에 따르면 2016년 기준 재범률은 살인미수등 64.7%, 강도 72.4%, 강제추행 51.1%, 절도 범죄 53.9% 등으로 상당히 높은 비율을 보인다. 이러한 재범과 상습범의 경우에는 비슷한 패턴과 상황에서 범죄가 다시 일어날 확률이 높기 때문에 사전에 범죄를 예방하는 데에 클루가 큰 기여를 할 것이다.

    범죄 분야에의 AI 적용, 괜찮을까

    하지만 범죄 분야인 만큼 AI 기술의 적용은 더욱 조심스러워야 한다.

    미국시민자유연맹은 아마존의 AI 기반 안면 인식 기술인 ‘아마존 레코그니션(Rekognition)’이 미국 상하원 의원 중 28명을 범죄자로 잘못 식별했으며, 따라서 이 시스템이 결함이 있는 위험한 기술임을 밝혔다. 게다가 잘못 식별한 사람의 39%가 유색인종임을 고려을 때, 인종에 대한 편견을 더 높일 수 있는 편향된 기술임을 비판했다.

    AI가 데이터를 학습하는 만큼, 데이터를 모으고 처리하는 데도 문제가 불거질 수 있다. 2015년 중국 정부는 AI 감시카메라를 통해 범죄 용의자를 추적하고 관리하는 ‘톈왕’을 구축했는데, 이 시스템은 범죄용의자 데이터를 이용해 움직이는 사람을 판별하고 범죄자를 추적한다. 또한 중국 공안은 안면인식 기능이 탑재된 스마트 안경을 이용해 범죄자를 수색하기도 한다. 이는 분명히 감시사회로 연결될 수 있다는 위험성과 시민들의 사생활 침해로 이어질 수 있는 문제이다.

    국가기관이 보유 공공데이터라 하더라도 활용하는 데에는 법적 근거가 필요한 경우가 있다. 이는 데이터가 어떤 방식으로 활용되는지에 따라 다르게 나타나는데, 개인 식별이 가능한 개인정보의 경우에는 특히 그 활용범위가 제한된다. 또한 범죄예방 활동을 위한 빅데이터 분석 시스템은 개인정보보호법 등을 준수해야 하는데, 이를 지키지 않을 경우에는 위법한 경찰 활동에 해당며 분석 결과가 유의미하다고 하더라도 증거능력이 부정된다.

    또한 빅데이터 분석 시스템을 활용 데이터를 분석하는 행위는 강제처분적 성격을 가는지에 따라 수사에 활용될 수 있는지가 결정되는데, 강제처분적 성격을 가지고 있지 않아야 충분한 법적 근거를 가지고 수사방법으로 활용할 수 있다. 하지만 현재 빅데이터 분석 행위가 강제수사에 해당되는지의 여부는 다양한 학설을 바탕으로 기준이 불확실하다. 따라서 범죄 분야에 AI 기술을 활용하기 위해서는 명확한 법적 기틀을 마련하고, 적합한 통제장치 등이 논의되어야 한다.

    새로운 기술에 위험이 따르는 것은 당연하다. 따라서 기술이 개발되고 적용되는 과정 부작용을 하나하나 줄여나가는 방법으로 발전시켜 나가는 것만이 기술이 야기하는 문제를 최소화할 방법이다.

    하지만 무엇보다 기술을 개발하고 운용하는 정부 및 IT 기업들이 AI 기술이 편견을 만들거나 지나친 감시로 이어지지 않도록 주의해야 한다. 구글은 지난 6월 7대 AI 윤리지침을 발표했다. 윤리지침에는 AI 기술을 무기를 개발하거나 감시 도구로 사용해 인권을 침해하는 일, 인종과 성적, 정치적 차별을 위해 사용하지 않을 것이라는 내용이 담다. 특히 범죄 분야의 특성상, 판결이 잘못을 때 되돌리기 쉽지 않으므로 AI 기술이 올바르게 사용되도록 AI 개발자와 기술을 적용하는 전문가들은 책임감과 윤리 의식을 가지고 충분히 고민해야 한다.

    ※ 외부필자의 원고는 IT조선의 편집방향과 일치하지 않을 수 있습니다.


    ISSU 학회원. / ISSU 제공
    이슈(ISSU)는 1997년 설립되어 올해 설립 21주년을 맞은 연세대학교 유일의 IT경영전략 학회입니다. ISSU는 IT라는 공통의 관심사를 가진 다양한 전공과 학년의 연세인으로 구성됐습니다. 논리적 사고를 통해 문제를 해결하는 능력을 배양하고, IT 지식 공유와 현장경험에 기반한 전문성을 확보해, 급변하는 IT환경에 적응할 수 있는 IT스페셜리스트 양성을 목표로 합니다.
    이슈는 매학기 다양한 IT기업들과 산학협력을 추진함으로써 IT기업들이 현업에서 직면하는 문제점들을 해결하는 능력을 배양하고자 합니다. 현재까지 라인프렌즈, 리디북스, 네이버 호텔&항공권, SKT누구, 플레이윙즈 등 여러 IT기업 및 IT서비스들이 가지는 고민거리에 대한 해결책을 모색하는 기회를 가져왔습니다. 이번 2018년에는 아만다, 네이버 파파고와 함께 산학협력을 진행했습니다.
    이슈는 이러한 콜라보레이션 외에도 스터디 세션, 알럼나이 및 외부 인사 초청 세션, IT기업과의 콜라보 세션을 통해 IT스페셜리스트로서의 역량을 강화합니다. 또한 기업탐방, 멘토링 및 홈커밍 등의 네트워킹 활동을 병행해 IT커리어 등의 관심사를 공유합니다.



    키워드