엔비디아리서치는 18일(현지시각) GAN(적대적 신경망 네트워크, Generative Adversarial Networks)을 활용, 도면 혹은 낙서를 사진으로 변환하는 기술 ‘고갱(GauGAN)’을 공개했다.

GAN은 데이터를 분석해 결과를 내고 그 결과를 배워 스스로 동작하는 머신러닝 인공지능이다. GAN은 인공지능 여러개로 구성되는데, 한 인공지능이 결과를 내면 다른 인공지능이 그 결과를 반박하는 방식으로 동작 효율과 정확도를 높인다.

엔비디아 GauGAN 동작 예제. / 엔비디아 개발자 블로그 갈무리
엔비디아 GauGAN 동작 예제. / 엔비디아 개발자 블로그 갈무리
엔비디아 GauGAN은 수백만개 이상의 이미지를 분석한 데이터를 토대로 도면 혹은 그림 속 피사체를 분석한다. 분석한 피사체에는 하늘과 물, 언덕과 구름, 강과 바다 등 태그가 붙는다. 이어 태그를 기반으로 사진과 흡사한 효과를 입히고 그림자, 반영, 농도와 질감 등 세부 묘사까지 붙인다.

엔비디아측은 GauGAN의 작업 방식이 실제 예술가의 사고 방식과 흡사하다고 강조한다. 일반 인공지능처럼 사진을 합성하거나 질감을 자르고 붙이는 것이 아니다. 엔비디아 GauGAN은 실제 도면 혹은 그림 속 피사체의 색상과 특징을 기반으로 작업한다.

엔비디아는 미국 실리콘밸리에서 진행 중인 기술 콘퍼런스에서 시연할 예정이다.