앤스로픽, 클로드 AI에 ‘대화 종료’ 기능 도입

2025-08-18 홍주연 기자

인공지능(AI) 기업 앤스로픽이 클로드(Claude) AI 모델에 유해한 대화를 스스로 종료할 수 있는 기능을 추가했다. 업계는 AI 안전성과 복지에 새로운 접근이라고 평가했다.

앤스로픽 로고. / 앤스로픽

앤스로픽은 클로드 오푸스 4와 4.1 모델이 소비자용 채팅 인터페이스에서 대화를 종료할 권한을 갖게 됐다고 18일 밝혔다. 해당 기능은 지속적으로 유해하거나 폭력적인 대화를 시도하는 사용자에게만 적용된다. 회사 측은 “AI 복지 연구의 일환으로 개발된 기능이다”라고 강조했다.

AI 모델은 대화 전환에 실패하거나 소통이 불가능할 경우, 혹은 사용자가 명시적으로 종료를 요청할 때 최후의 수단으로만 이 기능을 사용하도록 지시받았다. 앤스로픽은 “대화 차단은 극히 예외적 상황”이라며 “대다수 사용자는 논란이 큰 주제를 논의하더라도 영향을 받지 않을 것이다”라고 밝혔다.

클로드가 대화를 종료하면 사용자는 해당 대화에 더 이상 메시지를 보낼 수 없다. 다만 계정 내 다른 대화에는 영향이 없고 즉시 새로운 채팅을 시작할 수 있다.

앤스로픽은 이번 기능이 아직 실험 단계라며 지속적인 개선이 필요하다고 밝혔다. 예상치 못한 종료가 발생하면 사용자가 피드백을 제출하도록 독려하겠다고 덧붙였다.

홍주연 기자
jyhong@chosunbiz.com