구글이 소형 AI 모델 '젬마'를 공개했다. / 구글 블로그
구글이 소형 AI 모델 '젬마'를 공개했다. / 구글 블로그

구글이 22일 소형 인공지능(AI) 모델 ‘젬마(Gemma)’를 공개했다. 이번 모델은 오픈소스로, 이용 약관에 따라 개발자나 기업 규모에 관계없이 모든 조직에서 상업적 사용 및 배포가 가능하다.

구글은 지난 해 공개한 AI 모델 ‘제미나이’의 기술 및 인프라를 기반으로 젬마를 구축했다고 설명했다. 젬마는 ‘젬마 2B’와 ‘젬마 7B’ 두 가지 유형으로 제공되며, 두 유형 모두 각각 사전 훈련(pre-trained) 및 지시 조정(instruction-tuned)된 변형(variants)과 함께 제공된다.

구글은 이번 젬마 모델이 동급 규모의 다른 오픈 모델들과 비교했을 때 더 우수한 성능을 보여준다고 설명하며, 메타의 소형언어모델(sLLM) ‘라마-2(Llama-2)’ 비교 평가 점수를 공개했다.

구글이 공개한 젬마와 라마-2 벤치마크 점수 / 구글
구글이 공개한 젬마와 라마-2 벤치마크 점수 / 구글

이번 젬마 모델은 특정 개인 정보 및 기타 민감 한 데이터를 학습 세트에서 자동으로 필터링하는 기술들이 적용됐다. 또한 지시 조정 모델들이 책임감 있는 행동을 실천할 수 있도록 광범위한 미세 조정을 거치고 인간의 피드백을 기반으로 한 강화 학습(RLHF)을 활용했다.

구글은 젬마 모델의 위험성을 이해하고 방지하기 위해 직접 레드팀을 구성해 평가하고, 자동화된 적대적 테스트, 위험 행동에 대한 모델 역량 평가 등을 진행했다고 설명했다.

젬마는 구글의 딥러닝 프레임워크 ‘케라스 3.0’을 통해 JAX, 파이토치, 텐서플로우와 같은 주요 프레임워크에서 추론 및 지도 학습(supervised fine-tuning, SFT)을 위한 툴체인을 제공한다.

젬마 모델군은 노트북, 업무용 컴퓨터 또는 구글 클라우드에서도 이용 가능하며 버텍스 AI(Vertex AI), 구글 쿠버네티스 엔진(Google Kubernetes Engine, GKE)을 이용해 쉽게 설치할 수 있다. 또 엔비디아 GPU에 맞게 젬마 모델을 최적화해 사용할 수 있다. 젬마는 오늘부터 사용 가능하다.

조상록 기자 jsrok@chosunbiz.com