탄소 중립 위해 선진기업 독자 기술 채택
정부 가이드라인 부족으로 업계 혼란 우려

주요국이 인공지능(AI) 탄소중립 가이드라인을 내놓는 가운데 ‘AI 강국’을 선언한 우리 정부는 이에 대한 대처가 늦다는 지적이다. 이미 산업계도 탄소중립 정책을 수립하는 상황이어서 업계 혼란 최소화를 위한 전향적인 정책 마련이 시급하다는 주장이다. AI는 광대한 양의 데이터를 처리해, 탄소 배출 등 환경파괴가 상당하다는 분석이다.

22일 정부 및 업계에 따르면 정부가 수립한 데이터센터나 AI 관련 탄소중립 정책은 아직 미미하다. 2020년 12월 ‘2050 탄소중립 추진전략’을 발표하며 탄소 줄이기를 선언했지만 정작 데이터센터와 AI 등에 직접적으로 적용될 관련 내용은 없다. 화석 연료 감축, 재생에너지 도입 등 간접적인 탄소 절감 효과만을 기대하는 상황이다.

MS가 AI를 통한 환경파괴 최소화를 선언하며 마련한 ‘지구를 위한 AI’ 이미지 / MS
MS가 AI를 통한 환경파괴 최소화를 선언하며 마련한 ‘지구를 위한 AI’ 이미지 / MS
정부 관계자는 "데이터센터의 탄소배출량은 인지하고 있는 문제지만, 우선순위는 지금 밝히기 어렵다"며 "3월 중 탄소중립 관련 연구안을 발표할 예정"이라고만 말했다.

이는 국가 차원에서 데이터센터의 탄소배출량 규제 움직임을 보이는 해외와는 다르다. 대표적으로 유럽연합(EU)은 2020년부터 데이터센터 탄소배출량 공개 의무 법제화를 준비하고 있다. 데이터센터 탄소배출량은 비대면 사업 활성화 등으로 급증이 예상되지만, 각 기업의 비정기적인 공개에 기대고 있어 정확한 수치는 파악하기 어렵다. 정부가 직접 나서 데이터센터의 환경 파괴 정도를 파악해 개선하겠다는 것으로 풀이된다.

정부의 늦장 가이드라인은 산업계 피해로 이어질 수 있다는 우려다. 국내외 연구 기관과 기업이 AI로 인해 발생하는 ‘탄소량 잡기’에 나섰지만 기준이 없어 혼란을 줄 수 있다는 것이다.

현재 산업계는 연산을 줄이는 AI 알고리즘을 제시하거나, 친환경 AI칩을 개발하고, 나아가 친환경 데이터센터를 구축 중이다.

삼성은 영국 케임브리지대학교, 옥스퍼드대학교 등 해외 연구진과 손잡고 친환경 알고리즘을 제시했다. ‘연합학습(federated learning)’을 통해 탄소 배출량을 줄일 수 있다고 삼성 측은 밝혔다. 연합학습은 전체 데이터를 한 곳에서 학습하지 않고, 나눠서 학습하는 방법으로 탄소 배출량이 기존보다 최대 60% 줄었다.

네이버도 ‘탄소 네거티브’ 계획을 밝혔다. 탄소 네거티브는 탄소 배출량이 마이너스인 것으로 탄소 제로(0)보다 발전한 개념이다. 한성숙 네이버 대표는 지난해 "2040년까지 배출 탄소량보다 감축을 더 크게 하는 탄소 네거티브를 추진하겠다"고 밝혔다.

국내 산업계의 이런 움직임은 해외 선진 IT기업 움직임과 맥을 함께 한다. IBM은 지난 18일 자체 개발한 알고리즘을 통해 탄소 배출량을 늘리지 않으면서 더 많은 AI 연산을 처리할 수 있는 AI칩을 공개했다. IBM 관계자는 "고품질 AI칩은 적은 에너지로 뛰어난 결과를 내야 ‘효율적’이라고 할 수 있다"고 말했다.

AI 활용 단계에서도 탄소 줄이기에 나선다. 마이크로소프트(MS)를 시작으로 아마존, 구글 등 해외 IT기업은 데이터센터의 탄소중립을 선언하며 지속해서 노력하고 있다. MS는 2017년부터 ‘지구를 위한 인공지능’ 프로젝트로 환경 문제 해결 기술에 지원하고 있고, 구글과 아마존은 각 2030년, 2040년까지 완전한 탄소 제로를 선언했다.

AI 산업은 상당한 탄소를 배출하는 것으로 알려졌다. 지난해 미국 매사추세츠 주립대 연구진은 자연어처리(NLP) AI 구글 버트(BERT) 학습 1회에 약 626㎏ 이산화탄소를 배출한다고 밝혔다. 이 수치는 뉴욕에서 샌프란시스코 왕복 비행기가 뿜어내는 이산화탄소 양과 같다.

데이터센터 이미지. 데이터센터는 IT업계 탄소배출량 주범으로 꼽힌다. /EU 공식홈페이지
데이터센터 이미지. 데이터센터는 IT업계 탄소배출량 주범으로 꼽힌다. /EU 공식홈페이지
하나의 AI가 수천번이 넘는 학습을 단기간에 진행하는 점도 고려하면 환경 파괴 정도는 더 심각하다. 또한 해당 이산화탄소 양은 단순 전략량만 고려한 것으로 AI 서버 유지, 저장 과정, 냉각 시스템 등을 포함하면 더 커진다.

이처럼 AI가 수많은 탄소를 뿜는 이유는 머신러닝(기계학습) 기반의 AI가 수많은 반복 연산 속에서 완성되기 때문이다. AI 기술 발전 정도에 따라 연산 수도 폭발적으로 증가한다. 작년 공개된 NLP AI인 GPT-3는 버트의 수십배에 달하는 약 4990억개의 데이터 세트를 학습해, 약 1750억개의 파라미터를 생산했다. 파라미터는 AI가 내놓는 일종의 결과 값으로 AI 성능과 직결된다. 정확한 수치는 공개되지 않았지만 수백억번의 연산이 진행됐을 것으로 가늠된다.

익명을 요구한 IT 업계 관계자는 "AI나 데이터 산업 모두 빠르게 발전하는 가운데 최근 윤리 문제가 불거진 상황에서 환경까지 신경 쓰기에는 쉽지 않다"며, 정부 차원에서의 빠른 탄소중립 가이드라인 마련이 시급함을 강조했다.

송주상 기자 sjs@chosunbiz.com