미국 스탠포드 대학교와 워싱턴대학교 AI 연구진이 50달러(약 7만원) 미만의 비용으로 성능이 우수한 AI 모델을 개발했다고 밝혔다. 이는 중국 AI 스타트업 딥시크가 오픈AI의 챗GPT 훈련비용 5%를 들여 비슷한 성능의 AI 모델을 개발했다고 주장하며 세계적인 주목을 받는 가운데 나온 논문 내용이다.

AI 증류. / 챗GPT 생성 이미지
AI 증류. / 챗GPT 생성 이미지

9일 테크크런치 등 외신에 따르면 스탠포드 대학교와 워싱턴대학교 AI 연구진은 클라우드 컴퓨팅 비용을 50달러 미만으로 들여 AI 추론 모델을 훈련했다는 논문을 발표했다. AI 추론 모델은 GPTo1 같은 모델을 말한다. 양 대학교 연구진의 만든 AI 추론모델 이름은 ‘s1’이다.

s1 모델과 훈련에 사용된 데이터와 코드는 오픈소스 코드 커뮤니티 깃허브(GitHub)에 공개됐다. 연구진은 s1 개발을 위해 ‘증류(distillation)’로 미세조정(파인튜닝)을 했다고 설명했다. 증류는 다른 AI 모델에 질문한 뒤 그 AI의 답변 내용을 훈련시키려는 AI 학습에 사용해 유사한 기능을 개발하게 하는 행위를 말한다. 딥시크가 자사 AI 추론모델 훈련을 위해 오픈AI 챗GPT를 증류했다는 의혹을 받는다.

연구진은 추론 능력 학습을 위해 추론 과정과 1000개의 질문과 답을 포함한 데이터 세트를 선별해 활용했다고 밝혔다. 연구진은 16개의 엔비디아 첨단 AI 칩 H100그래픽처리장치(GPU)를 사용해 30분쯤 s1을 학습시킨 결과 특정 AI 벤치마크에서 높은 성능을 보였다.

이번 논문에 참여한 니콜라스 뮌니호프(Niklas Muennighoff) 스탠포드대 연구원은 테크크런치에 “이젠 20달러쯤이면 필요한 컴퓨팅 자원을 임대할 수 있다”고 말했다.

다만 외신은 전문가들을 인용해 증류로 기존 모델을 신규 AI로 복제할 수는 있지만 AI의 획기적 발전을 끌어내긴 어려울 것이라고 봤다.

변인호 기자
jubar@chosunbiz.com