AI 모델을 공유한다는 것이 구체적으로 어떤 의미인지 처음엔 잘 와닿지 않을 것이다. 현실 응용에서 AI 모델은 어느 정도의 크기일까? 현재 공개된 AI 모델 중 가장 큰 것은 2022년 4월 구글이 발표한 PaLM(Pathways Language Model)이라는 언어 모델로, 파라미터 수가 5400억개에 이른다.

앞선 글에서 소개된 EXAM 프로젝트(Data 공유가 아니라 AI 공유다(中))의 경우, 6350만개의 파라미터가 있는 ResNet-34라는 영상인식 딥러닝 모델을 기본으로 한다. 최소 6350만개의 파라미터를 갖는 AI 모델을 20개 병원이 각각 학습해 가중 평균한 모델을 글로벌 공유 모델로 가지게 된다. AI 모델이 우리 직관으로는 상상이 되지 않을 만큼 크다는 데에 마법이 있다. 이 큰 모델 20개를 합친 모델이 각각의 큰 모델보다 큰 성과를 보여주는 것, 이것이 AI 공유의 힘이자 매직이다.

6350만개의 파라미터를 갖는 ResNet-34 / 네이처 메디슨
6350만개의 파라미터를 갖는 ResNet-34 / 네이처 메디슨
AI 공유를 하는 알고리즘 역시 앞으로 계속 향상될 것이다. 하렉스인포텍 사용자중심인공지능 연구소는 AI 공유 알고리즘 IPA(반복 병렬 평균, Iterative Parallel Average)와 ISA(반복 직렬 평균, Iterative Serial Average)를 새롭게 개발해 특허출원했다. IPA 방법론이 기존의 연합 학습 알고리즘보다 성과가 더 좋았고, 한국어 데이터와 영어 데이터가 섞여있는 상거래 환경에서도 잘 작동함을 보여주고 있다.

이 연구 결과는 대구 인터불고에서 6월 22일부터 23일 열리는 제23회 국제전자상거래학술대회(ICEC 2022, The 23th International Conference on Electronic Commerce)에서 발표된다. 이 연구에 따르면, 한국, 일본, 미국, 중국 백화점에서 각 5년씩 총 20년을 근무한 사람의 지능을 인공지능으로 만든다고 할 때, 기존의 연합 학습 알고리즘은 각 백화점을 5년씩 다닌 네 사람의 지능을 합치는 것에 비유할 수 있다. 반면 IPA 알고리즘은 한국, 일본, 미국, 중국 백화점을 1년씩 다닌 네 사람의 지능을 합치고, 이 과정을 총 다섯 번 반복해 글로벌한 지능을 만드는 것에 비유할 수 있다. 연구소는 최근 ISA 알고리즘의 성능을 시험 중인데, 한 사람이 계속 한국, 일본, 미국, 중국 백화점을 연이어서 근무하여 총 20년을 근무하는 것과 비슷하게 글로벌한 지능을 만들었는데 더 큰 성과가 나올 수도 있음을 보여줬다.

경희대 AI&BM 랩과 하렉스인포텍 사용자중심인공지능 연구소는 AI 공유에 있어 글로컬라이제이션(glocalization) 전략이 더 우수함을 발견하기도 했다. 각 경제주체의 AI 모델을 다 공유하는 것보다는 각 경제주체의 특수성을 반영하는 AI 모델의 입출력 부분의 파라미터들은 공유하지 않고 그대로 놔두고, 각 경제주체의 내부 핵심 공통 AI 모델만 공유하는 것이 더 성과가 좋음을 발견했다.

트랜스포머(Transformer)로 대표되는 자연어 처리 딥러닝 모델의 발전과 연합 학습 방법, 그리고 새롭게 개발된 AI 공유 알고리즘이 결합하면서, 전 세계 경제 주체가 사용하는 언어와 개별적 특성과 상관없이 경제 주체의 핵심 지능을 공유해 시너지를 일으키는 것이 가능해지고 있는 것이다.

이러한 AI 공유 플랫폼의 가능성이 확인되어가면서, 의료, 상거래, 교통, 금융, 스마트 팜, 제조, 로봇, 스마트 시티 등 세계 경제와 산업의 각 부문, 각 레벨에서 가장 큰 AI 엔진들이 AI 공유 방식에 의해 구축될 것으로 예상된다. 이 방식을 채용하면, 경제 주체 간에 데이터 협약을 체결하지 않고도 협력할 수 있게 된다는 큰 장점이 있다.

AI 공유는 그저 인공지능을 공유하는데 그치는 것이 아니라, AI 공유 방식으로 개발 유지되는 AI 엔진에 기반하여 각종 서비스를 공급해 주는 새로운 형태의 플랫폼이 민간과 정부 부문, 그리고 글로벌 비즈니스 환경에서 나타날 것이다. AI 공유 플랫폼은 많은 개인, 기업, 기관들로 하여금 기존에 불가능했던 협력을 가능하게 만들 것이고, 처음엔 작은 규모로 시작될 AI 공유가 점점 확대되어 사회 경제 체제에 큰 긍정적인 변화를 일으킬 것이다.

이경전 경희대학교 경영대학 & 빅데이터응용학과 교수 klee@khu.ac.kr

이경전 교수는 삼성전자, LG전자, 네이버, BC카드, SKT, KT, 신한금융, 부산은행, 현대차 등과 산학협력 프로젝트를 진행하였고, 현재는 하렉스인포텍과 사용자중심인공지능 연구에 집중하고 있다. 정부 3.0위원회, 4차산업혁명전략위원회 위원 등을 역임하였고, EBS 일요초청특강(2000)/오마이미래(2016)/내:일을여는인문학(2022), KBS 장영실쇼(2015)/명견만리(2017), CBS 세바시(2015, 2016), YTN Science(2018), MKYU 세븐테크(2021) 등에서 인터넷 비즈니스, 사물인터넷, 미래 생산과 소비 혁명, 인공지능, 비즈니스 모델 등에 대해서 강연하였다.