엔비디아가 인공지능(AI) 기술을 이용, 짧은 단어만으로 사실적인 예술 작품을 만들 수 있는 AI 페인팅 툴 ‘고갱2(GauGAN2)’를 공개했다.

엔비디아 고갱의 딥러닝 모델은 누구나 쉽게 자신의 상상력을 사실적인 그림으로 만들 수 있도록 돕는다. "해변의 일몰"처럼 단순한 문구만 입력해도 AI가 실시간으로 장면을 생성한다.

여기에 "바위가 많은 일몰의 해변"처럼 추가 형용사를 추가하거나 일몰을 오후 또는 비 오는 날로 바꾸면 고갱이 적대적 생성 신경망(Generative Adversarial Networks, GAN)을 기반으로 즉시 그림을 수정한다.

사용자가 입력한 단어만으로 상상한 이미지를 만들어주는 엔비디아의 AI 페인팅 툴  ‘고갱2’의 시연 모습 / 엔비디아
사용자가 입력한 단어만으로 상상한 이미지를 만들어주는 엔비디아의 AI 페인팅 툴 ‘고갱2’의 시연 모습 / 엔비디아
사용자는 버튼 하나로 장면에서 개체의 위치를 보여주는 상위 수준의 윤곽선인 세그멘테이션 맵(Segmentation Map)을 생성할 수도 있다. 하늘, 나무, 바위 및 강과 같은 레이블을 사용해 대략적인 스케치로 장면을 조정하고, 그림으로 전환할 수 있다. ‘스마트 페인트 브러시’는 낙서 수준의 터치를 멋진 이미지로 구현한다.

‘고갱2’의 새로운 텍스트-이미지변환 기능은 엔비디아 리서치(NVIDIA Research)의 최신 엔비디아 AI 데모를 통해 체험할 수 있다. 다양한 텍스트 프롬프트와 스케치를 통해 사용자가 장면을 보다 세밀하게 컨트롤하고, 빠르게 커스터마이징 할 수 있도록 지원한다.

또한, ‘고갱2’는 세그멘테이션 맵, 인페인팅과 텍스트-이미지 생성을 단일 모델에 결합함으로써 단어와 그림의 혼합을 사실적 예술로 바꿀 수 있다. 고갱2의 데모는 단일 GAN 프레임워크 내에서 텍스트, 시멘틱 세그멘테이션(Semantic Segmentation), 스케치 및 스타일과 같은 여러 양식을 하나로 통합한다. 이 기술은 아티스트의 상상력을 고품질 AI 생성 이미지로 더 빠르고 쉽게 전환할 수 있도록 돕는다.

사용자는 상상한 장면의 모든 요소를 직접 그리지 않아도 된다. "눈 덮인 산맥" 같은 짧은 문구를 입력해 이미지의 주요 특징과 테마를 빠르게 생성할 수 있다. 스케치를 통해 특정 산을 더 높게 만들거나 전경에 몇 그루의 나무를 추가하고 하늘에 구름을 더 생성하는 등 사용자 정의 또한 가능하다.

‘고갱2’는 현실기반의 이미지뿐 아니라 다른 세상의 풍경도 묘사할 수 있다. 예를 들어 영화 ‘스타워즈’ 시리즈에서 두 개의 태양이 있는 상징적인 행성 타투인(Tatooine)의 풍경을 재현하려면 ‘사막’, ‘모래언덕’, ‘태양’이라는 텍스트만으로 시작점을 만들고, 이를 바탕으로 사용자가 두 번째 태양을 스케치해 넣으면 된다.

고갱2의 AI 모델은 세계 10대 슈퍼컴퓨터 중 하나인 엔비디아 DGX 슈퍼POD(DGX SuperPOD) 기반 엔비디아 셀린(Selene) 슈퍼컴퓨터를 사용해 훈련됐다. 1000만여 개의 고품질 풍경 이미지와 영상 등에 겨울, 안개, 무지개 등 풍경과 관련된 단어를 연결하고 학습시키는 신경망이 사용됐다.

엔비디아 고갱2의 데모 시연 소개 영상 / 엔비디아 유튜브 채널

엔비디아는 "텍스트-이미지 또는 세그멘테이션 맵-이미지 애플리케이션을 위한 최신 모델보다 고갱2의 신경망은 훨씬 다양한 고품질 이미지를 생성할 수 있다"라며 "고갱2의 연구 데모와 엔비디아 RTX GPU를 갖춘 사용자라면 누구나 다운로드할 수 있는 고갱 기반 엔비디아 캔버스(Canvas) 애플리케이션은 아티스트를 위한 강력한 이미지 생성 도구의 미래를 보여준다"고 강조했다.

최용석 기자 redpriest@chosunbiz.com