인공지능(AI)과 빅데이터의 시대에 규제 등의 이유로 원격지의 데이터를 활용하기 어렵던 의료 등의 분야에서 성과를 극대화하기 위한 ‘연합 학습(Federated Learning)’이 ‘컨피덴셜 컴퓨팅(Confidential Computing)’과 결합, 확장되는 계기가 마련됐다.

인텔은 LF AI & 데이터 재단 기술 자문위원회(LF AI & Data Foundation Technical Advisory Council)가 협업, 표준화, 상호운용성을 더욱 촉진하기 위한 인큐베이션 프로젝트로 개방형 연합학습(OpenFL, 오픈FL)을 승인했다고 13일 밝혔다.

인텔은 이 프레임워크를 개발 및 호스팅해 데이터 과학자가 데이터 개인 정보 보호 문제를 해결하는 동시에 이질적이거나 기밀성이 높은 또는 규제를 받는 데이터 집합에서 인사이트를 확보할 수 있도록 지원한다고 소개했다.

데이터 셋 공유 없이 대규모 분산 학습을 구현하는 ‘연합 학습’ /인텔
데이터 셋 공유 없이 대규모 분산 학습을 구현하는 ‘연합 학습’ /인텔
‘연합 학습’은 의료나 금융, 소매 및 제조업 등 보안에 민감한 데이터를 활용하는 조직들이 대규모 분석 등을 위해 미가공 데이터나 머신러닝 알고리즘들을 공유하지 않고도 여러 시스템과 데이터센터에서 머신러닝 모델을 공동으로 학습할 수 있도록 지원하는 접근 방법이다. 이 기술을 통해 여러 시스템과 데이터 세트를 안전하게 연결하면서 데이터 취합에 방해되는 장애물들을 제거하고, 데이터에서 가치 있는 통찰력을 확보할 수 있다.

인텔이 개발 및 호스팅하는 오픈소스 프레임워크 오픈FL은 연합 학습을 위한 유연하고 확장 가능하며 안전하게 설계된 프레임워크다. 이를 통해 기업은 기밀성이 높거나 규제 대상의 데이터를 외부로 옮기지 않고도 다자간 머신러닝 과정에 참여할 수 있다. 대신, 알고리즘이 데이터를 보유한 곳에서 데이터를 처리한 뒤, 비식별화된 결과를 중앙에서 통합한다. 어떤 개별 조직의 데이터도 다른 조직에게 노출되지 않는다.

인텔은 펜실베니아대학교 페럴만 의과대학(Penn Medicine), VM웨어(VMware) 및 플라워 랩스(Flower Labs)와 함께 LF AI & 데이터 재단에오픈FL을 선보였다. 각 기업의 대표들은 재단에 합류해 본 프로젝트의 벤더 중립적인 생태계를 조성하고 개발 방향을 제시하는 오픈FL 기술 운영 위원회를 구성할 예정이다. 또한 인큐베이션 단계의 프로젝트인 만큼, LF AI & 데이터 재단과 함께 프로젝트 운영 방식을 위한 기반을 마련하고 있다.

또한 오픈FL은 데이터센터용 하드웨어 기반 신뢰실행환경(TEE)인 ‘인텔 소프트웨어 가드 익스텐션(Intel SGX)’ 및 인텔 SGX 기반의 컨피덴셜 컴퓨팅 플랫폼에서 수정되지 않은 애플리케이션을 실행하기 위한 도구 및 인프라 구성 요소 집합인 ‘그래민 프로젝트(The Gramine Project)’를 사용해 개인 정보를 보호하는 AI를 더욱 활성화한다. 현재 오픈FL과 인텔 SGX 오픈소스 통합이 지원되며, 향후 추가 보안 기능이 제공될 예정이다.

이브라힘 하다드 박사(Dr. Ibrahim Haddad) LF AI & 데이터 재단 상임 이사는 "이 프로젝트는 조직이 미가공 데이터를 공유하지 않고도 여러 시스템과 데이터 센터에서 머신러닝 모델을 공동으로 학습할 수 있도록 지원하는 혁신적인 접근방법이다"며 "유능한 인재들과 협력해 프로젝트를 성공적으로 완수할 수 있기를 기대한다"고 말했다.

권용만 기자 yongman.kwon@chosunbiz.com