AI챗봇 이루다 개발사 "개인정보 침해 의혹, 사실 아냐"
고유명사 등 비식별화 과정의 실수는 인정
이루다 오늘 저녁 6시부터 무기한 정지

인공지능(AI) 챗봇 이루다 개발사 스캐터랩이 개인정보법 침해 의혹에 반박했다. 개인정보 비식별화 과정에서의 기술적 실수는 인정했지만, 개인 대화 유출 등 위법 사항은 없다고 밝혔다.

스캐터랩의 인공지능 챗봇 ‘이루다’ /스캐터랩
스캐터랩의 인공지능 챗봇 ‘이루다’ /스캐터랩
12일 스캐터랩은 추가적인 입장문을 통해 개인정보보호법 침해 의혹에 관해 정면으로 반박했다. 이날 오전 한 매체는 스캐터랩 과거 재직자의 발언을 인용해 사내 대화방에서 수집된 개인 대화를 돌려봤다고 보도했다.

스캐터랩은 해당 보도에 관해 "개인정보 데이터 접근 권한은 엄격하게 제한해 관리하고 있다"며 "사실 확인 결과, 해당 내용이 발견되지 않았다"고 말했다.

AI학습용 데이터의 비식별화 논란에 관해서도 입을 열었다.

스캐터랩은 "1억건의 개별 문장을 사람이 일일이 검수하기는 어렵다. 알고리즘을 통한 기계적인 필터링 등으로 변수를 줬지만, 문맥에 따라 인물 이름이 남아있는 경우가 발생했다"라고 밝혔다.

이루다의 발화에 주소, 사람 등 고유명사를 노출한 것은 사실상 스캐터랩의 잘못이라고 시인한 것이다.

하지만 개인을 특정할 수 있는 식별 데이터는 아니라고 선을 그었다.

스캐터랩은 "문장 내의 이름 정보가 다른 정보와 결합해 이용되지 않았다"라고 해명했다.

개인정보보호법상 기업이 개인정보를 이용하려면 비식별화 과정을 거쳐 가명정보로 만들어야 한다. 가명정보는 개인정보 일부를 삭제하거나 일부 또는 전부를 대체하는 방법으로 추가 정보없이는 개인을 특정할 수 없는 정보다. 이 가명정보는 통계작성, 과학적 연구, 공익적 기록 보존 등의 목적에서는 정부주체 동의 없이 처리할 수 있다. 다시 말해 스캐터랩 측은 이루다 개발 과정에서 개인정보보호법 침해 등 위법행위가 없다고 밝힌 셈이다.

스캐터랩은 ▲실명·주소 필터링 알고리즘 강화 ▲대화 데이터 랜던 변형 조치 ▲민감정보 노출 방지 알고리즘 개선 등으로 비식별화 과정 고도화에 나선다.

김종윤 스캐터랩 대표는 "스캐터랩의 급격한 성장 속에 제대로 대처하지 못한 부분도 있고, 미숙함이 드러나기도 했다"며 "지금 첫걸음은 멈추지만, 사람만큼 대화를 잘하는 친구 같은 AI를 만든다는 꿈은 멈추지 않았다"라고 말했다.

AI 이루다 서비스는 오후 6시부터 전면 중단된다. 스캐터랩은 논란이 일었던 문제점 해결과 추가적인 개선사항이 완비될 때까지 이루다 서비스를 무기한 중단될 예정이다.

송주상 기자 sjs@chosunbiz.com