데이터는 ‘AI 연료’라더니… 관련 제도는 출발선에도 못서
9월 15일 열린 제1차 핵심규제 합리화 전략회의에서 정부는 “데이터는 AI 경쟁의 핵심 자산”이라며, 관련 제도를 서둘러 정비해야 한다고 밝혔다. 또 법적 불확실성과 과도한 규제가 국내 AI 기업과 창작자들에게 부담이 되고 있다는 지적도 나왔다. 실제로 우리나라 AI 기업들은 저작물을 정당하게 이용하고 싶어도 마땅한 경로가 없다고 토로한다. 데이터 거래 자체가 제도적으로 막혀 있기 때문이다.
정부는 올해 11월까지 ‘저작물 데이터 공정이용 가이드라인’을 만들 계획이다. 연내에는 저작권자가 명확한 데이터의 합리적인 거래와 보상이 가능한 체계도 마련할 예정이다. AI 업계가 부담하는 저작권료를 줄이는 방안도 함께 추진해, AI 기업과 저작권자 간의 데이터 거래를 활성화한다는 구상이다.
문제는 속도다. 창작자 단체인 ‘범창작자정책협의체’ 등은 아직까지 정부로부터 공정이용 가이드라인과 관련한 의견을 요청받은 적이 없다고 입을 모은다. 정부의 논의가 업계 의견을 들을 수준까지도 진전되지 못했다는 지적이 나오는 이유다.
과학기술정보통신부와 문화체육관광부가 공동으로 추진 중인 ‘데이터 거래 플랫폼’도, 어떤 방식으로 어떤 저작물을 거래할지 방향조차 논의 중인 초기 단계로 알려졌다.
정부가 만들겠다는 공정이용 가이드라인은 저작물을 공익적 목적에 한해 저작권자 허락 없이 사용할 수 있게 하는 방향의 정책이다. 공정이용은 교육, 연구개발, 보도 등을 위한 경우에 적용되는 예외 규정이다. AI 학습을 위한 대량 복제를 허용하는 ‘텍스트·데이터 마이닝(TDM)’과 비슷한 개념이지만, 서로 다른 제도다.
AI 저작권 정책이 늦어진 배경에는 TDM 관련 법안이 국회에서 논의조차 되지 못했던 상황이 있다. 2021년 관련 법안이 발의됐지만 진전이 없었다. 그러는 사이 챗GPT가 등장했고, AI의 무단 학습 논란이 세계적으로 확산됐다. 국내 논의는 제자리걸음을 했다.
정부가 올해 안에 가이드라인과 보상 체계를 마련한다고 해도, 해결해야 할 세부 과제가 많다. 정부는 AI 기업들이 다양한 데이터를 합법적으로 활용할 수 있도록 제도적인 길을 열겠다는 입장이다.
하지만 실제 거래가 이뤄지려면 넘어야 할 산이 많다. 이용료 산정 기준부터, 판매자와 구매자 간의 계약 구조가 필요하다. 이미지와 오디오처럼 여러 데이터가 결합된 경우, 창작자별 기여도를 어떻게 나눌지도 정해야 한다. 어떤 창작자가 얼마만큼의 권리를 가졌는지를 기준으로 수익을 나눠야 하기 때문이다.
중소벤처기업부와 과기정통부는 국내 AI 기업이 저작물 데이터를 충분히 확보하지 못해 경쟁에서 밀릴 수 있다는 점을 우려한다. 문화체육관광부 역시 창작자 편만 드는 것은 아니다. 문체부는 올해 3월부터 과기정통부, 창작자, AI 기업이 모두 참여하는 ‘2025 AI-저작권 제도개선 워킹그룹’을 운영 중이다.
업계에서는 “지금 제도를 그대로 두면 국내 AI 기업 대부분이 저작권법 위반에 해당할 수 있다”는 우려도 나온다.
정부 관계자는 “플랫폼 거래 방식과 계약 구조부터 정해져야 창작자 기여도 같은 세부 항목을 논의할 수 있다”며 “아직은 그 단계까지 가지 못했다”고 설명했다.
AI 업계도 데이터 이용 경로가 열리는 점에는 긍정적이지만, 단기간 내에 제도화되기는 어렵다고 본다.
업계 한 관계자는 “수많은 저작권자로부터 허락을 받아야 하는 플랫폼이 만들어지려면 시간이 꽤 걸릴 것이다”라며 “차라리 정부가 개인정보보호법에 예외를 둬 얼굴 정보 같은 민감 데이터라도 공익 목적에 한해 AI 연구에 활용할 수 있게 하는 편이 더 현실적인 대안이 될 수 있다”고 말했다.
변인호 기자
jubar@chosunbiz.com