“‘히트웨이브 생성형AI’는 데이터베이스(DB) 내에 거대언어모델(LLM)과 자동화된 벡터 저장소를 통합한 업계 최초의 제품이다. 이를 통해 생성형 AI 구축 과정의 복잡성을 크게 줄이고, 경쟁 제품 대비 크게는 30배 높은 처리 성능을 제공한다.”
니푼 아가르왈(Nipun Agarwal) 오라클 MySQL 데이터베이스 및 히트웨이브 개발 담당 수석 부사장은 2일 온라인 미디어 브리핑에서 ‘히트웨이브 생성형 AI’의 주요 특징에 대해 이와 같이 소개했다.
오라클은 2일 온라인 미디어 브리핑을 통해 데이터베이스 내에 거대언어모델과 자동화된 벡터 저장소를 내장한 ‘히트웨이브 생성형AI(HeatWave GenAI)’ 제품을 소개했다. ‘히트웨이브 생성형 AI’는 AI 전문가가 아니더라도 별도 벡터 데이터베이스로의 데이터 이동 없이 생성형 AI의 효과를 엔터프라이즈 데이터에 구현할 수 있도록 지원한다. 오라클 클라우드 리전 및 여타 주요 클라우드 서비스 전반에서 즉시 이용 가능하다.
데이터베이스에 벡터 저장소 통합, 생성형 AI 구현의 복잡성 크게 줄여
니푼 아가르왈(Nipun Agarwal) 오라클 MySQL 데이터베이스 및 히트웨이브 개발 담당 수석 부사장은 ‘히트웨이브 생성형AI’를 “업계 최초의 인-데이터베이스 거대언어모델(LLM)을 갖춘 제품”으로 소개했다.
‘히트웨이브’는 오라클이 제공하는 완전관리형 데이터 프로세싱 서비스로, 전통적인 온라인 트랜잭션 처리(OLTP)에서부터 분석, 머신러닝, 데이터 레이크하우스 기능에 이르기까지 단일 서비스 위에서 제공된다. 이제는 생성형 AI와 벡터 저장소까지 통합했다고 덧붙였다.
‘히트웨이브 생성형AI’의 특징은 데이터베이스 내에 자동형 벡터 저장소와 거대언어모델이 통합됐다는 점, 스케일아웃 벡터 프로세싱과 ‘히트웨이브 챗(Chat)’ 등 크게 네 가지가 꼽혔다. 이 중 ‘인-데이터베이스 벡터 저장소’는 고객이 데이터를 별도의 벡터 데이터베이스로 이동하거나, AI 전문성을 갖추지 않고도 생성형 AI를 내부 비즈니스 문서와 함께 사용할 수 있게 지원한다고 설명했다. 이와 함께, 비정형 데이터에 대한 의미론적(Sementic) 검색도 지원한다고 덧붙였다.
벡터 저장소가 데이터베이스에 통합된 구조는 오브젝트 스토리지에 있는 데이터를 히트웨이브 내부에서 생성형 AI가 쉽게 다룰 수 있게 한다. 니푼 아가르왈 수석부사장은 이에 대해 “데이터 처리 과정은 히트웨이브 내에서 수행되고, 벡터 스토리지는 오브젝트 스토리지에 위치할 수 있어, 스토리지 비용을 최소화하면서도 높은 수준의 확장성과 안정성을 구현할 수 있다”고 설명했다.
또한 오라클은 ‘히트웨이브 생성형AI’가 생성형 AI를 사용하는 애플리케이션을 만들 때 벡터 저장소를 만들고 이를 거대언어모델에 적용하는 과정을 크게 줄인다고 소개했다. 니푼 아가르왈 수석부사장은 “지금까지는 벡터 저장소를 만드는 데 9단계, LLM에 적용하는 데 9단계의 작업이 필요했다. 하지만 히트웨이브 생성형AI는 이 과정 전체를 1단계로 줄일 수 있다”고 강조했다.
이 외에도, 히트웨이브 생성형AI는 벡터 저장소를 구성할 때 문서를 분석하고 벡터 스토어에 삽입하는 단계도 한 단계로 줄이고, 벡터 저장소 생성 단계를 자동화하며, 새로운 데이터에 대한 증분형 추가도 가능하다. 특히 증분형 추가의 경우, 기존의 솔루션들이 새로운 데이터를 추가할 때 벡터 저장소를 재생성해야 했던 데 비하면 시간과 복잡성의 부담을 크게 줄일 수 있다고 밝혔다.
데이터베이스에 LLM 통합, 어느 환경에서든 일관적인 LLM 구현 가능
히트웨이브 생성형AI에 통합된 인-데이터베이스 LLM은 거대언어모델을 데이터베이스 내부에서 구동할 수 있으며, 그래픽처리장치(GPU) 자원 없이 중앙처리장치(CPU) 기반 서버나 서비스만으로도 활용할 수 있다. 니푼 아가르왈 수석부사장은 “데이터베이스에 LLM이 통합됨으로써, 히트웨이브를 사용할 수 있는 어느 위치에서든지 같은 LLM을 사용할 수 있다는 점이 장점이다”라고 강조했다.
특히, 오라클은 이 ‘인-데이터베이스 LLM’을 히트웨이브에 포함된 ‘오토ML’과 함께 활용하면, LLM 활용 쿼리 결과의 정확도를 높이고, 비용도 최적화할 수 있다고 제시했다. 이 외에도 데이터가 데이터베이스 밖으로 나가지 않아 보안 측면에서도 이점이 있다고 덧붙였다. 물론, 외부 LLM을 연결하는 것도 가능하며, OCI(Oracle Cloud Infrastructure)의 GPU 기반 생성형AI 서비스를 활용할 수도 있다.
‘확장 벡터 처리’에서는 히트웨이브 내부적으로 새로운 벡터 데이터 유형이 추가돼, 표준 SQL을 통해 의미 쿼리를 효율적으로 수행할 수 있도록 했다. 특히 확장 벡터 처리는 최대 512개 노드로 병렬 처리 확장이 가능하며, 인메모리 프로세싱으로 성능을 극대화했다고 강조했다. 오라클은 이러한 특징을 통해, 스노우플레이크나 데이터브릭스, 구글 빅쿼리 등의 경쟁 서비스 대비 최대 30배까지 빠른 수행 성능을 더 낮은 비용에서 제공할 수 있다고 밝혔다.
‘히트웨이브 챗(Chat)’은 MySQL 쉘(Shell)용 비주얼 코드 플러그인으로 히트웨이브 생성형AI를 위한 그래픽 인터페이스를 제공하며, 개발자들이 자연어 또는 SQL로 질문을 할 수 있게 지원한다. 히트웨이브는 질문 내역, 소스 문서 인용 및 LLM 프롬프트를 바탕으로 컨텍스트를 관리하며, 이는 상황별 대화를 용이하게 하고 사용자가 LLM이 생성한 답변의 출처를 검증할 수 있게 해 준다.
권용만 기자 yongman.kwon@chosunbiz.com
- 오라클, MS·구글 클라우드와 협력 “OCI 서비스 제공 범위 넓혀”
- 오라클, 애플리케이션 코드 AI로 작성하는 ‘코드 어시스트’ 발표
- 제니 차이 스미스 오라클 부사장 “융합형 데이터베이스 23ai, 300개 이상 AI 신기능 담아”
- 오라클·팔란티어, ‘클라우드·AI 서비스’ 공동 판매·지원
- 앤디 멘델손 오라클 부사장 “데이터베이스의 미래는 융합형”
- “AWS서 오라클 데이터베이스 쓴다”
- 구글 클라우드 품에서 오라클 데이터베이스 쓴다… 4개 글로벌 리전 지원
- 오라클, AI 중심 기업용 ‘생성형 개발 인프라’ 발표
- 오라클, 히트웨이브 신기능 대거 발표 “AWS서도 강력한 성능·효율 제공”
- 오라클, 애플리케이션 개발 가속화 ‘코드 어시스트’ 발표… “AI가 코드 제안”
- 오라클, AI·클라우드 시대 ‘오픈 멀티클라우드’로의 전환 [테크리포트]
- 쿠마르 라자마니 오라클 부사장 “자율운영 데이터베이스, AI로 가치 높여” [인터뷰]