자연스러운 행동과 표정 그리고 완벽히 재현된 목소리 등을 갖춘 가상인간이 게임 업계의 핫 이슈로 떠오르고 있다. 최근 IT 산업을 뒤흔든 언어모델 챗GPT와 맞물려 게임 메커니즘의 판도를 크게 바꿀 핵심 기술로 주목받다.

 엔씨소프트가 22일(현지시각) GDC 2023에서 선보인 디지털 휴먼 ‘TJ KIM’의 모습. / 엔씨소프트
엔씨소프트가 22일(현지시각) GDC 2023에서 선보인 디지털 휴먼 ‘TJ KIM’의 모습. / 엔씨소프트
엔씨소프트(엔씨, NC)가 최근 이런 디지털 휴먼 시장에 강자로서의 입지를 공고히 했다. 3월 22일(현지시각) 미국 샌프란시스코에서 열린 게임 개발자 콘퍼런스(GDC 2023)에서 디지털 휴먼을 공개하면서다.

윤송이 엔씨(NC) 최고전략책임자(CSO)는 이날 행사에서 개발 중인 어드벤처 장르 신작 ‘프로젝트M’과 함께 디지털 휴먼 ‘TJ Kim’을 선보였다. ‘TJ Kim’은 엔씨 게임 개발을 총괄하는 김택진 최고창의력책임자(CCO)를 본떠 만든 디지털 휴먼이다. 영상에 등장한 ‘TJ Kim’은 실제 김택진 CCO의 표정, 목소리와 함께 말투까지 동일하게 재현했다.

팀 스위니 에픽게임즈 CEO는 "프로젝트M 개발에 언리얼 엔진5가 적극 활용돼 기쁘다"라며 "엔씨소프트가 만든 고품질(high-fidelity) 디지털 휴먼은 매우 인상적이다"라고 평가했다.

엔씨소프트 프로젝트M의 한 모습.  / 엔씨소프트
엔씨소프트 프로젝트M의 한 모습. / 엔씨소프트
장기간 AI 투자 ‘결실’

엔씨는 이번에 선보인 디지털 휴먼이 약 12년 동안 AI 기술에 꾸준히 투자해 온 노력의 결실이라고 강조했다. 엔씨는 앞서 2011년 국내 게임 업계 최초로 AI 전담 조직을 꾸렸다. 2015년에는 약 200여명 규모의 전문 인력을 갖춘 NLP(자연어처리) 센터를 설립해 한국어 문장을 이해하고 구사할 수 있는 AI를 개발하고 있다.

이번에 공개된 디지털 휴먼 ‘TJ Kim’의 표정과 말투에는 모두 AI 기술이 사용됐다. 영상의 모든 대사는 AI 음성 합성 기술인 ‘TTS(Text-to-Speech)’로 만들어졌다. TTS는 특정인의 목소리, 말투, 감정 등을 데이터로 확보한 뒤 향후 입력된 텍스트를 상황에 맞는 자연스러운 음성으로 생성하는 기술이다.

디지털 휴먼의 자연스러운 표정과 립싱크 애니메이션의 비결은 ‘Voice-to-Face’ 기술이다. 대사나 목소리를 입력하면 상황에 맞는 얼굴 애니메이션을 자동으로 생성하는 AI 기술로 제작됐다.

엔씨(NC)는 이처럼 자체 보유한 AI 기술과 비주얼 역량을 결합해 생동감 있는 디지털 휴먼의 표정을 생생하게 구현하는데 성공했다.

엔씨소프트 프로젝트M의 한 모습.  / 엔씨소프트
엔씨소프트 프로젝트M의 한 모습. / 엔씨소프트
디지털 휴먼, 엔씨(NC) 게임도 ‘레벨 업’

엔씨(NC)가 디지털 휴먼에 주목하는 이유는 분명하다. 진짜 ‘사람’ 같은 캐릭터를 만들기 위해서다. 사람만큼 깊이 있는 캐릭터는 이용자를 게임에 몰입하게 한다. 향상된 몰입감은 엔씨(NC)가 서비스하고 있는 모든 라이브 콘텐츠의 퀄리티를 높일 수 있다. 나아가 디지털 휴먼은 게임 산업에 한정되지 않고 다양한 분야에서 활용될 가능성도 있다.

엔씨(NC)의 R&D를 이끄는 이제희 최고연구책임자(CRO)는 "MMO에서 몰입과 경험이 얼마나 중요한지 잘 알고 있는 엔씨(NC)는 디지털 휴먼을 통해 ‘인터랙션(Interaction)’을 극대화하고자 한다"며 "고도화한 디지털 휴먼을 만든다는 것은 곧 엔씨에서 만드는 모든 서비스의 질을 높이고 비용과 노력은 절감된다는 뜻이다"라고 말했다. 그는 이어 "디지털 휴먼 기술은 엔씨의 미래 비전이자 중요한 기반 기술이다"라고 덧붙였다.

송가영 기자 sgy0116@chosunbiz.com