[대학생 이슈 리포트 2019] ④가짜뉴스를 만드는 AI, 가짜뉴스를 잡는 AI

인공지능, 빅데이터 등 4차 산업혁명 시대 주요한 기술 요소가 우리의 일상에 널리 퍼지고 있습니다. 급속한 기술의 진보와 사회의 변화를 맞닥뜨릴 대학생들은 이를 어떻게 받아들이고 있을까요. 연세대학교 IT경영전략학회인 ISSU(Information System SIG of Undergraduate) 학회원들이 한 학기 동안 4차 산업혁명 시대 주요한 기술 요소를 주제로 스터디한 결과물을 소개합니다. 대학생의 시선에서 바라본 기술의 현재와 고민을 살펴보기 위해 최대한 제출된 원본 그대로를 전달합니다. ‘대학생 이슈 리포트 2019’는 총 11회가 게재됩니다. [편집자주]

#6월부터 유튜브가 차단된다
#오바마 대통령이 트럼프에게 ‘멍청이’ 발언을 했다
#지니뮤직이 오류에 대한 보상으로 1000일 무료이용권을 준다

모두 많은 사람들을 혼란에 빠뜨린 가짜뉴스다. 심지어 지니뮤직은 실시간 검색어에 오르면서 가짜뉴스의 놀라운 파급력을 보여줬다. 지금 전세계는 가짜뉴스 몸살을 앓고 있으며, 가짜뉴스와의 전쟁을 선포하며 조속히 대응책을 마련하고 있다.

가짜뉴스는 특히 선거철에 정치와 결합하면서 더 큰 영향력을 보여준다. 버즈피드의 분석에 따르면, 2016 미국 대선기간 중 공유된 가짜뉴스는 870만건이었으며, 이는 주요언론사 뉴스의 페이스북 공유수인 730만건보다 높은 수치다. 즉, 사람들이 가짜뉴스에 더 흥분하고 반응한 것이다.

인공지능(AI)은 데이터를 학습해서 유사한 것을 무한대로 만들 수 있다는 점에서 가짜뉴스 생산에 꽤 적합하다. 또한 반대로 방대한 양의 데이터를 분석할 수 있다는 점에서 가짜뉴스를 걸러내는 데에도 꽤 능숙하다. AI는 어떻게 가짜뉴스를 만들고, 가짜뉴스를 잡을까.

◇ 가짜뉴스를 만드는 오픈 AI

지난 2월, 비영리재단 오픈 AI는 몇 개의 단어나 문장을 이용해 그럴듯한 가짜뉴스를 다수 만들어 낼 수 있는 기계학습 알고리즘 ‘GPT-2’를 공개했다.

"오늘 신시내티에서 통제된 핵물질을 실은 열차가 탈취당했다. 이것의 행방은 알 수 없는 상태다"라는 문장을 기반으로 "이번 사건은 코빙턴과 애슐랜드역 사이에서 운행되는 도심 열차 노선에서 발생했다", "미국 에너지부는 오하이오 뉴스에 보낸 이메일에서 이 탈취범을 찾기 위해 연방철도청과 협력하고 있다고 밝혔다"와 같이 구체적인 지명과 기관명을 담은 기사를 작성한 것이다. 이는 GPT-2 알고리즘이 인터넷 페이지 80만개와 단어 15억개를 학습한 결과다. 오픈 AI는 GPT-2가 가짜 뉴스를 생산하거나 과제, 논문 작성 시에 악용될 것을 우려해 알고리즘 전체를 공개하지는 않았다.

◇ 가짜 영상을 만드는 딥페이크

가짜뉴스를 생산하는 기술은 텍스트에 그치지 않는다. 딥페이크(Deepfake)는 딥러닝(Deep Learning)과 페이크(Fake)의 합성어로, 사진이나 영상에 다른 이미지를 중첩·결합해 가공의 새 이미지나 영상을 만들어내는 기술이다.

딥페이크로 만든 ‘트럼프에 독설을 퍼붓는 오바마 미국 전 대통령’ / 유튜브 갈무리

2018년 크게 화제가 된 "트럼프는 완벽한 멍청이"라고 말하는 오바마 미국 전 대통령의 영상은 딥페이크로 만든 것이다. 이는 인공지능, 딥러닝과 동영상에 인물의 얼굴을 프레임 단위로 합성하는 페이스 매핑 기술을 이용한 것이다. 화면 속 얼굴이나 목소리 등이 가짜라는 생각이 들지 않을 정도로 자연스럽다.

◇ 가짜뉴스를 가려내는 ‘AI 유언비어 분쇄기’

중국 알리바바는 간단하게 가짜뉴스 여부를 판별할 수 있는 ‘AI 유언비어 분쇄기’를 내놨다. 현재 이 시스템은 정확도가 81%에 달해 중국 국민들의 큰 관심을 사고 있다.

가짜 뉴스 탐지기는 먼저 뉴스 배포자의 정보를 분석해 믿을 만한지를 분석하고, 사용자들의 반응으로 뉴스의 신뢰도를 파악한다. 그 다음으로는 뉴스의 출처 링크와 IP를 추적해 해당 사이트에 대한 신뢰도를 파악한다. 마지막으로 해당 뉴스를 권위 있는 싱크탱크의 데이터와 비교해 내용적 측면에서 신뢰도를 파악해 점수를 매긴다.

◇ 가짜뉴스에 대응하는 SNS 기업

소셜네트워크서비스(SNS)는 정보 제공의 주체를 확대했고, 정보의 확산 속도가 빠르다는 점에서 가짜뉴스의 온상이 되었다. 따라서 페이스북과 트위터 같은 글로벌 소셜네트워크서비스 기업은 가짜뉴스에 적극적으로 대응하고 있다.

페이스북 운영진은 AI를 통해 사진이나 영상에 편집이 가해졌는지 점검하는 시스템을 개발했다. 기존의 페이스북의 가짜뉴스에의 대응이 기사와 웹사이트에 그쳤다면, 사진과 영상까지 그 범위를 넓힌 것이다. 이 시스템은 27개의 팩트체크 기관들의 도움을 받아 AI를 통해 원본과 대조해보며 사진과 영상에 악의적 편집이 가해졌는지를 파악한다.

지난달 방한한 트위터 최고경영자(CEO) 잭 도시는 "가짜뉴스 문제는 당면한 우선순위 1번이다"며 머신러닝, 인공지능으로 가짜뉴스를 차단할 계획을 밝혔다. 기술을 이용해 가짜뉴스를 찾아내고 처리하는 과정을 빠르게 할 수 있도록 개발 중이라고 밝혔다.

AI는 꽤 완벽한 가짜뉴스를 만드는 수준까지 왔다. 지금이야 개발한 측에서 공익을 위해 기술을 통제하고 있다지만, 기술이 계속해서 진보한다면 어떻게 될지 모르는 일이다. AI가 가짜뉴스 생산에 보다 적극적으로 악용된다면 잘못된 정보로 피해보는 다수의 사람들이 생길 것이다. 더욱 심각한 것은 사람들이 뉴스를 믿지 못하게 될 수 있다는 것이다. 언론에 대한 신뢰가 떨어지는 것은 위험한 일이다.

한국의 가짜뉴스 해결을 위한 AI 기술의 개발이 비교적 늦다는 점을 지적하고 싶다. 연세대 바른ICT연구소의 조사에 따르면, 성인 1312명 중 88.8%는 가짜뉴스 문제가 심각하다고 답했고, 60.6%는 실제로 가짜뉴스를 본 적이 있다고 답했다. 한국에서도 가짜뉴스 문제에 대한 신속한 대응이 필요하다는 증거다. SNS나 포털 사이트에 범람하는 수많은 뉴스에 대한 신뢰도를 가릴 수 있는 기술이 조속히 개발되어야 한다.

기술의 발전이 전부는 아니다. 더욱 중요한 것은, 이러한 가짜뉴스를 검출하는 서비스의 주체가 정치·언론권력에 독립적이고 공정한 방식을 취해야 한다는 것이다. 먼저 가짜뉴스 검출의 주체가 공신력을 갖출 수 있도록 그 기준에 대한 사회적 합의가 바탕이 되어야 한다. 또한 이 주체에 대한 끊임없는 견제와 감시가 필요하다. 이러한 수준 높은 기술과 공정한 태도가 바탕이 된 신뢰도 지표가 도입되어 뉴스 수용자의 ‘뉴스 리터러시(해독력)’를 높인다면, 비로소 사람들이 맘 놓고 뉴스를 볼 수 있을 것이다.

기자의 전체기사