큐웬의 이미지 편집 혁명과 딥시크의 LLM 도전장[정원훈의 AI 트렌드]
8월 4주차 AI 동향 분석
매주 금요일 ‘정원훈의 AI 트렌드’를 시작합니다. '정원훈의 AI 트렌드는 세계 최대 인공지능(AI) 오픈소스 플랫폼인 허깅페이스(HuggingFace)에서 매주 주목받는 모델과 데이터셋을 분석해 독자들이 최신 AI 트렌드를 쉽게 파악할 수 있도록 돕는 것을 목표로 합니다. [편집자주]
본격적인 분석에 앞서 퀴즈를 내보겠습니다.
"2024년 오픈AI 다음으로 기업가치가 높았던 AI 스타트업은?" 그리고 "챗GPT의 오픈소스 버전을 처음으로 공개한 곳은?"
정답은 모두 허깅페이스입니다. 2024년 기준 기업가치 45억 달러를 기록하며 AI계의 '넘버 2'로 떠올랐고, 챗GPT가 세상을 놀라게 한 직후 오픈소스 대안을 가장 먼저 선보인 곳이기도 합니다.
왜 허깅페이스에 주목해야 할까?
허깅페이스는 단순한 AI 회사가 아닙니다. "AI계의 깃허브(GitHub)"라고 불리는 이곳은 전 세계 AI 연구자와 개발자들이 모이는 거대한 생태계입니다. 2016년 프랑스에서 시작된 이 플랫폼은 현재 100만 개 이상의 AI 모델, 20만 개의 데이터셋, 30만 개의 AI 애플리케이션(스페이스)이 공유되는 세계 최대 AI 허브로 성장했습니다. 여기서 인기 급상승하는 모델들을 보면 "6개월 후 우리 일상을 바꿀 기술"을 미리 엿볼 수 있습니다.
허깅페이스 구조 한눈에 보기:
모델(Models): GPT, BERT 같은 AI 모델들의 보물창고. 무료로 다운로드하고 사용 가능
데이터셋(Datasets): AI 훈련에 필요한 데이터들. 언어, 이미지, 음성 등 모든 영역 포함
스페이스(Spaces): 브라우저에서 바로 체험할 수 있는 AI 앱들. '구글 플레이스토어의 AI 버전'
즉, 허깅페이스의 인기 순위를 보면 "지금 전 세계가 어떤 AI에 열광하고 있는지" 실시간으로 파악할 수 있습니다. 마치 음원차트로 유행가를 알 수 있듯이 말이죠.
이번 주 허깅페이스에서 주목받은 AI 모델과 스페이스 즉 애플리케이션(응용 프로그램)들을 살펴보며, 현재 AI 업계가 어떤 방향으로 흘러가고 있는지 함께 분석해보겠습니다.
AI 모델 톱3
1위: Qwen/Qwen-Image-Edit (Image-to-Image)
이번 주 1위는 알리바바 클라우드의 큐웬 이미지 에딧(Qwen Image Edit)이 차지했습니다. 큐웬은 알리바바가 쳇GPT에 맞서 개발한 '통이원(通义千问)' 시리즈의 영문명으로, "천 개의 질문에 통달한다"는 뜻입니다. 이번에는 질문이 아닌 "편집"에 통달했네요.
이 모델의 놀라운 점은 텍스트 명령만으로 이미지를 자유자재로 편집할 수 있다는 것입니다. "배경을 해변으로 바꿔줘", "이 사람 옷을 빨간색으로 해줘" 같은 자연어 명령을 이해해 포토샵 전문가 수준의 편집을 수행합니다. 마치 "마법사에게 그림을 맡긴 것"처럼 말이죠.
특히 전자상거래에 최적화되어 타오바오, 알리익스프레스 등 알리바바 계열 쇼핑몰에서 상품 이미지 편집에 활용되고 있습니다. 판매자들은 이제 "같은 옷을 10가지 색깔로, 5가지 배경에서" 촬영할 필요 없이 AI로 뚝딱 만들어낼 수 있게 됐죠.
2위: deepseek-ai/DeepSeek-V3.1-Base (Text Generation)
중국의 딥시크(deepseek)가 개발한 6850억 파라미터의 LLM(거대언어모델)이 2위에 랭크됐습니다. 딥시크는 2023년 설립된 신생 AI 스타트업이지만, "중국의 오픈AI"라는 별명을 얻으며 빠르게 성장하고 있습니다.
6850억 파라미터는 GPT-4(약 1.76조)의 절반 정도 크기지만, 오픈소스로 공개된 모델 중에서는 최대 규모입니다. 마치 "공짜로 먹을 수 있는 가장 큰 피자"인 셈이죠. 특히 수학, 코딩, 추론 능력에서 뛰어난 성능을 보여주며 연구기관들 사이에서 큰 화제를 모으고 있습니다.
3위: google/gemma-3-270m (Text Generation)
구글의 Gemma-3 270M이 3위를 차지했습니다. 2위 모델의 1/2500 크기인 2억7000만 파라미터로 "개미가 코끼리와 함께 시상대에 올라간" 격입니다.
이 모델의 매력은 스마트폰에서도 돌아간다는 점입니다. 5G가 끊어져도, 클라우드 비용이 부담스러워도 내 손안에서 AI와 대화할 수 있죠. 마치 "집에서 키우는 애완 AI" 같은 느낌입니다.
AI 응용프로그램(Spaces) 톱3
1위: Qwen Image: 알리바바의 편집 마법사
앞서 소개한 큐웬 이미지 에딧의 웹 버전입니다. 브라우저에서 바로 사용할 수 있어 "포토샵 같은 고급 이미지 편집기의 대중화"를 이끌고 있습니다. 특히 마케터, 디자이너, 1인 창업자들 사이에서 폭발적 인기를 끌고 있습니다.
2위: Canary 1b V2: 엔비디아의 25개국 언어 마법사
엔비디아가 개발한 다국어 음성 인식 모델로, 25개 유럽 언어를 실시간으로 텍스트로 변환하고 번역까지 해줍니다. 10억 개 파라미터의 소형 모델임에도 "EU 전체를 커버하는 통역사" 역할을 톡톡히 하고 있죠.
특히 유럽 시장을 겨냥한 글로벌 기업들과 여행 관련 앱들에서 큰 관심을 보이고 있습니다. "로마에서는 이탈리아어로, 베를린에서는 독일어로" 자동 전환되는 서비스들이 곧 등장할 것 같네요.
3위: Ovis2.5 9B: AIDC-AI의 정밀 비전 분석가
AIDC-AI에서 개발한 90억 파라미터의 시각 이해 모델입니다. 복잡한 이미지도 정확하게 분석해 의료 진단, 제조업 품질 검사, 자율주행 등 고정밀도가 요구되는 분야에서 주목받고 있습니다.
시사점 & 인사이트
이번 주 트렌드를 종합해보면, AI 생태계에서 세 가지 흥미로운 변화를 확인할 수 있습니다.
첫째, 중국 AI의 글로벌 진출 가속화입니다. 큐웬과 딥시크가 상위권을 석권하며 "AI 굴기"를 현실화하고 있습니다. 특히 알리바바는 전자상거래 경험을 바탕으로 실용적인 AI를 만들어 차별화에 성공했습니다.
둘째, 모델 크기의 양극화입니다. 6850억 파라미터 거대모델과 2억7000만 파라미터 소형모델이 동시에 인기를 끌고 있습니다. 마치 "SUV와 경차가 함께 잘 팔리는" 자동차 시장과 비슷한 양상이죠.
셋째, 멀티모달에서 전문화로의 전환입니다. 모든 것을 다 하는 AI보다는 이미지 편집, 음성 인식 등 특정 분야에 특화된 AI들이 더 큰 호응을 얻고 있습니다.
토막 상식: 모델 이름으로 파악하는 AI 구조
deepseek-ai/DeepSeek-V3.1-Base를 예시로 AI 모델명의 숨겨진 정보들을 파헤쳐보겠습니다.
개발사 암호 해독
deepseek-ai/: 허깅페이스에서 슬래시(/) 앞은 개발 기관의 "주민등록번호" 같은 고유 식별자입니다. microsoft/, google/, meta/등으로 어느 빅테크 회사 작품인지 한 번에 알 수 있죠.
모델명 분석
DeepSeek: 회사 브랜드명이 그대로 들어간 경우입니다. GPT(OpenAI), Gemini(Google), Claude(Anthropic)처럼 각 회사마다 고유한 모델 브랜드를 가지고 있어요.
버전정보
V3.1: Version 3.1을 의미합니다. 숫자가 클수록 최신 버전이죠.
V1.0 → V2.0: 대규모 업데이트 (Major Update)
V2.0 → V2.1: 소규모 개선 (Minor Update)
알파(Alpha) → 베타(Beta) → 정식(Release) 순으로 개발 단계를 표시하기도 합니다.
특성 태그
Base: "기본 모델"이라는 뜻으로, 추가 학습 전 상태를 의미합니다.
Chat: 대화에 특화된 버전
Instruct: 명령어 수행에 특화된 버전
Code: 프로그래밍에 특화된 버전
Vision: 이미지 이해 기능이 추가된 버전
[참고] 규모
모델에 따라 파라미터를 표시하는 경우도 많은데요. 그 대표적인 게 “openai/gpt-oss-20b”입니다. 여기서 20b: 200억(20 billion) 개의 파라미터를 의미합니다. 파라미터는 AI가 학습한 "지식의 양"이라고 보시면 됩니다.
K = Thousand (천) → 1K = 1,000
M = Million (백만) → 1M = 1,000,000
B = Billion (십억) → 1B = 1,000,000,000
T = Trillion (조) → 1T = 1,000,000,000,000
실제로 GPT-4는 약 1.76조 개의 파라미터를 가지고 있어 "1.76t" 정도로 표기될 수 있습니다. 파라미터는 AI의 "뇌세포" 같은 개념으로, 많을수록 복잡한 사고가 가능하지만 더 많은 전력과 메모리가 필요합니다. 사람의 뇌가 약 1000억 개의 뉴런을 가진 것과 비교하면 흥미롭죠!
마무리
이번 주는 이미지 편집 AI의 실용화와 초거대 언어모델의 오픈소스화가 동시에 일어난 의미 있는 한 주였습니다. 중국 AI 기업들이 각자의 강점 분야에서 글로벌 경쟁력을 입증하며 AI 패권 경쟁의 새로운 변수로 떠올랐습니다. 독자 여러분의 관심 분야나 궁금한 AI 모델이 있으시면 댓글로 알려주세요. 더욱 유익한 칼럼으로 찾아뵙겠습니다.
※ 외부필자의 원고는 IT조선의 편집방향과 일치하지 않을 수 있습니다.
정원훈 텐스페이스 경영총괄이사는 한국인공지능진흥협회 이사와 한국디지털자산포럼(KODIA Forum) 정책기획실장을 맡고 있다. 법률AI 서울로봇과 블록ESG 프로젝트를 총괄하며 한국지식재산교육연구학회 이사 겸 기술가치평가위원장과 한국벤처창업학회 이사로도 활동한다. 아시아경제신문사 뉴미디어본부, 매일경제인터넷 금융센터 팀장을 거쳐, SNS 개발과 대안신용평가 시스템, AI 기반 법률 서비스 등 혁신 프로젝트를 주도해 온 IT·금융 전문가다.