오픈AI, GPT-4o 기반 신규 ‘이미지 생성 AI’ 출시
챗GPT 개발사 오픈AI가 기존 이미지 생성 모델 '달리3'(DALL-E3)보다 고도화된 이미지 생성 인공지능(AI) 모델을 선보였다.
25일(현지시각) 오픈AI는 이날부터 '챗GPT-4o 이미지 생성(ChatGPT-4o Image Generation)' 모델을 출시한다고 밝혔다.
오픈AI에 따르면 해당 모델은 오픈AI의 시그니처 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델로, 텍스트와 이미지를 통합한 첫 모델이다. 새 모델은 오픈AI의 기존 이미지 모델인 달리3보다 더 쉽고 정교하게 이미지를 생성한다.
기존에는 이용자가 원하는 이미지를 생성하려면 프롬프트를 하나하나 입력해야 했지만, 새 모델은 이용자의 의도를 파악해 이미지를 생성하기 때문에 편집도 쉬워졌다.
기존 AI 이미지 생성 모델들은 '삼각형 바퀴를 가진 자전거'를 그려달라고 요청하면 '바퀴는 원형'이라는 제약에 걸려 이를 생성하지 못 했다.
특히 텍스트를 이미지에 정확히 삽입하는 기능이 크게 개선됐다는 게 오픈AI의 설명이다. '여러 종류의 고래를 보여주는 포스터를 만들어 줘'라고 요청하면 고래의 종류와 이름을 정확히 매칭해 생성한다.
투명 배경도 지원한다. 이미지에 투명 배경을 요청하면 이를 반영할 수 있고, 비즈니스 로고와 같은 이미지도 투명 배경으로 생성할 수 있다.
오픈AI는 새 모델이 이미지를 생성한다는 점에서 기존 '달리'의 업그레이드 버전이긴 하지만, 두 모델의 기반 기술이 완전히 다르고 이에 새 모델에서 다양한 개선이 이뤄졌다고 설명했다.
가브리엘 고 오픈AI 멀티모달 담당은 "우리는 텍스트에 대한 지능을 가진 GPT-4의 강점과 최고의 이미지 생성 모델의 시각적 지능을 결합한 모델을 만들고자 했다"며 "교육 분야에서 혁신을 일으킬 수 있을 것"이라고 말했다.
새 모델은 한국어로도 이미지 생성이 가능하다. 이날부터 챗GPT 프로 등 유료 가입자는 물론, 무료 가입자도 사용할 수 있다.
김경아 기자
kimka@chosunbiz.com