개인정보 유출 사건으로 서비스가 중단된 인공지능(AI) 챗봇 ‘이루다’가 1년 만에 서비스를 재개할 것으로 보인다. 하지만 이루다 개발사인 스캐터랩은 사용자의 명시적 동의 없이 수집한 개인정보를 대부분 폐기하지 않고 새로운 AI 딥러닝 모델 학습에 전용한 것으로 확인돼 논란이 예상된다.

이루다 1.0 홍보 포스터. /스캐터랩
이루다 1.0 홍보 포스터. /스캐터랩
22일 IT조선 취재 결과, 스캐터랩은 자사 서비스인 ‘텍스트앳’(2013년)과 ‘연애의 과학’(2016년) 출시 이후부터 수집해온 데이터를 활용해 ‘이루다 2.0’의 딥러닝 모델을 제작했다. 개인정보 유출 논란으로 서비스가 잠정 중단된 ‘이루다 1.0’ 역시 같은 출처의 데이터를 활용해 모델을 학습했는데, 이 데이터를 대부분 폐기하지 않고 이루다 2.0 학습에 전용한 것이다. 이루다 2.0은 2022년 1월 클로즈 베타 테스트를 앞두고 있다.

스캐터랩 관계자는 "텍스트앳과 연애의 과학의 서비스 데이터베이스(DB)는 그대로 있다"며 "서비스 운영을 위해 필요한 DB이기 때문에 폐기 대상이 아니었다"고 밝혔다. 그러면서 이루다 2.0과 이루다 1.0의 기반이 된 데이터에 대해 "출처가 달라졌냐고 묻는다면 그건 아니다"고 말했다.

앞서 개인정보보호위원회는 조사를 통해 스캐터랩이 텍스트앳과 연애의 과학에서 수집한 사용자 카카오톡 데이터를 이루다 개발과 운영에 전용한 행동은 당초 수집 목적에서 어긋난 것으로 보고 법 위반이라 판단했다. 스캐터랩이 개인정보처리방침에 ‘신규 서비스 개발' 목적을 포함해 동의를 받기는 했으나, 그것만으로는 사용자들이 이루다 같은 서비스에 자신의 개인정보가 이용되는 것에 동의했다고 보기는 어렵다고 봤다. 그런데 스캐터랩은 이루다 2.0을 출시하며 같은 출처의 데이터를 또다시 전용해 사용한 것이다.

당시 개인정보위는 이러한 ‘개인정보를 수집하면서 정보주체에게 명확하게 인지할 수 있도록 알리고 동의를 받지 않은 행위’를 포함해 총 8가지 개인정보보호법 위반 행위에 대해 총 1억330만원의 과징금과 과태료를 스캐터랩에 2021년 4월 부과했다. 또 법원은 이루다의 개인정보 유출 피해자 측에서 제기한 증거보전신청을 2021년 2월 인용했다.

이에 따라 스캐터랩은 이루다 1.0이 한국어로 대화하는 방법을 배우는 ‘연구용 DB’와 이루다 1.0이 말할 수 있는 답변으로 구성된 ‘루다 답변 DB’를 분리 보관했다. 또 텍스트앳과 연애의 과학에서 수집한 데이터에서 14세 미만이거나 삭제를 요청한 사용자의 데이터는 삭제하고, 1년 이상 사용하지 않은 사용자의 데이터와 민감한 성적 대화를 담고 있는 데이터는 분리 보관했다. 문제는 그 외의 데이터는 스캐터랩이 모두 보유·사용해 왔다는 것이다.

개인정보 유출로 논란이 됐던 이루다 1.0과 사용자 간 대화 화면. /트위터 갈무리
개인정보 유출로 논란이 됐던 이루다 1.0과 사용자 간 대화 화면. /트위터 갈무리
스캐터랩 측은 해당 DB에서 14세 미만이거나 삭제를 요청한 사용자 데이터를 제외한 뒤 철저한 비식별화 과정을 거쳐 이루다 2.0에 활용했기 때문에 문제가 없다는 입장이다. 또 이루다 2.0의 답변 DB는 AI 알고리즘이 자동으로 생성하거나 자사에서 만든 문장으로만 구성했으며, 추가적 필터링 단계를 거쳐 개인정보처럼 보이는 내용을 포함하지 않도록 조치했다고 설명했다. 스캐터랩은 이루다 2.0의 베타 테스트를 통해 사용자 의견과 개선 사항을 점검한 뒤 공식 출시 일정을 결정할 계획이다.

하지만 이루다 1.0 서비스로 인해 개인정보 유출 피해를 본 사용자들은 이루다 서비스로의 데이터 전용이 문제라며 데이터 전량 폐기를 요구하고 있다. 피해자 측 법률 대리인인 우지현 법무법인 태림 변호사는 "문제가 됐던 데이터는 다 파기하고, 정당한 절차로 새로운 동의를 받은 사람들의 데이터로 2.0을 출시한다는 사실을 피해자들에게 소명한 뒤 서비스 런칭을 하는 게 순서이다"며 "피해자들 입장에서는 아무런 달라진 것도 확인한 것도 없었는데 이루다 2.0 서비스를 출시하겠다고 하니 불안감이 큰 상황이다"고 밝혔다.

또 개인정보 유출 피해자에 대한 구제 역시 여전히 이뤄지지 않고 있다는 점도 문제다. 법무법인 태림이 2021년 3월 31일 피해자 254명을 대리해 스캐터랩을 상대로 제기한 손해배상청구소송은 현재 진행 중이다.

태림은 22일 입장문을 통해 "해당 사건은 스캐터랩의 구체적, 실질적 답변이 제출되지 않은 채로 계속되고 있는 상황이다"라며 "변론 기일 지정을 기다리는 와중에 스캐터랩이 서비스 재개를 공표해 피해자들이 추가적 권리 침해를 우려할 수밖에 없는 상황에 놓였다"고 주장했다. 그러면서 "신속한 권리 보호를 위해 사건이 본격적 심리에 접어들 수 있도록 22일 재판부에 변론 기일을 지정해 달라는 신청서를 즉시 제출했다"면서 "실제로 새로운 서비스에 활용된 데이터에 연결성이 존재하는지, 피해자들의 데이터가 활용되지 않은 것인지 등에 대한 의문을 감출 수 없다"고 덧붙였다.

개인정보보호 우려와 관련해 스캐터랩 측은 "이루다 서비스와 관련해 개인정보 수집 절차나 가명화 처리에 대한 비판을 무겁게 받아들이고 있다"며 "관련 법률과 산업계 전반의 사회적 합의에 의해 정해진 개인정보 처리 가이드라인을 적극 준수해 나가겠다"고 밝혔다. 소송에 성실히 임하지 않고 있다는 주장에 대해서는 "해당 소송에 관해 적시에 답변서를 제출하는 등 소송 과정에 성실히 참여하고 있다"며 "향후 법원의 소송 진행에 따라 필요한 사항을 충실히 이행하겠다"고 해명했다.

임국정 기자 summer@chosunbiz.com