AI의 ‘넥스트 레벨’ 보여준 오픈AI [인공지능 365]
인공지능이 일상화된 시대입니다. AI 관련 소식들은 하루가 멀다하고 쏟아집니다. 9월 9일부터 13일까지 한 주는 어떤 AI 소식들이 나왔을까요. 국내외 인공지능 이슈를 한 눈에 살펴보는 [인공지능 365]로 한 주간을 시작합니다. [편집자 주]
AI의 ‘넥스트 레벨’ 보여준 오픈AI
많은 빅테크 기업과 AI 스타트업들이 기술 혁신에 엄청난 속도를 내고 있지만 항상 AI의 ‘넥스트 레벨’을 보여주는 것은 오픈AI인 것 같습니다. 12일(현지시각) 오픈AI는 추론 성능이 강화된 AI 모델 ‘오픈AI o1(이하 o1)’을 공개했는데요. 단순한 성능 향상 그 이상을 보여줬다는 평가입니다.
이번 o1은 추론 성능이 높아졌습니다. 그게 대체 어떤 변화인지, 이전 모델 ‘GPT-4o’와는 뭐가 다른지 궁금할 겁니다. o1에는 ‘생각의 사슬’(Chain of Thought, CoT) 방식이 적용됐다고 합니다. 복잡한 문제를 한 번에 풀지 않고 여러 단계로 나눠서 하나씩 사슬을 연결하는 것처럼 풀어나가는 방식입니다. 우리가 복잡한 수학 문제를 풀 때 하나씩 골머리 써가며 푸는 것처럼 말이죠. 그런 이유로 문제 하나 푸는 시간이 좀 걸린다고 하네요.
반면 GPT-4o는 방대한 학습 데이터를 기반으로 답변하지만 복잡한 문제에 대해서는 추론 능력이 약하기 때문에 아무래도 잘못된 대답을 하는 경우가 많죠.
오픈AI는 o1를 공개하면서 예시로 한국어 번역을 들었습니다. 한국인만 겨우 이해할 수 있는 철자 틀린 문장을 제시해도 o1은 그것을 이해하고 정확하게 영어로 번역해 줍니다. 벤치마크에서도 과학, 수학, 코딩 등 복잡한 과제에서 우수한 성능을 보여줬습니다.
물론 아직 미흡한 부분도 있습니다. 한번 답변하는 데 10초가 넘게 걸리기도 하고 비교적 간단하거나 창작에 관한 질문에 대해서는 GPT-4o와 같은 기존 AI 모델 성능이 더 좋았습니다. 오픈AI는 이번 o1이 프리뷰이기 때문에 사용자 피드백을 받는 것이 큰 목적이라고 합니다. 이를 통해 AGI(인공일반지능)를 위한 AI 모델을 만들겠다는 것입니다.
사실 샘 알트만 오픈AI CEO는 “AGI의 모습을 보여주기 위한 방법을 찾았다”며 AI의 넥스트 레벨을 예고한 바 있었는데요. 이번 o1에 그 방법이 적용된 것이죠. 그 덕에 굳이 프롬프트에 명확한 지시(입력값)를 하지 않아도 AI가 ‘알잘깔딱센(알아서 잘 깔끔하게 딱 센스있게)’하게 답변해주는 영리한 AI가 생각보다 더 빨리 나타날 것 같습니다.
네이버, 아랍어 기반 LLM 개발한다
네이버가 아랍어 기반 LLM(대규모 언어모델)을 개발하게 됐습니다. 네이버는 10일(현지시각) 사우디 리야드에서 열린 AI 콘퍼런스 ‘글로벌 AI 서밋’에서 사우디 데이터인공지능청(SDAIA)과 AI 사업 협력을 위한 업무협약를 체결했습니다. SDAIA는 모하메드 빈 살만 사우디 왕세자의 직속기구로 ‘사우디 비전 2030’을 주도하는 기관입니다.
네이버와 네이버클라우드, 네이버랩스는 SDAIA가 준비 중인 데이터센터 관련 솔루션·서비스, 이를 기반으로 한 클라우드 솔루션, 아랍어 기반 LLM 구축과 관련 서비스 개발, 지능형 로봇과 관련 응용 서비스 연구 개발을 모두 함께하게 됩니다.
미스트랄AI, 첫 멀티모달 AI ‘픽스트랄 12B’ 공개
프랑스의 AI 스타트업 ‘미스트랄AI’가 이미지와 텍스트를 모두 처리할 수 있는 멀티모달 AI를 공개했습니다. 이번에 공개한 ‘픽스트랄 12B’(Pixtral 12B)는 기존에 출시한 언어모델 ‘네모 12B’(Nemo 12B)를 기반으로 4억 개의 매개변수 비전 어댑터가 추가됐는데요. 비전 어댑터는 일종의 이미지 처리 기능이라고 볼 수 있습니다.
픽스트랄 12B는 이미지를 인식하고 자동으로 자막을 작성할 수 있으며, URL 이미지를 불러오거나 이미지를 텍스트 형식으로 변환해 처리할 수도 있습니다. 현재 개발 커뮤니티 허깅페이스와 깃허브 등에 공개돼 있습니다.
조상록 기자 jsrok@chosunbiz.com