클라우드 솔루션 전문기업 나무기술이 인공지능(AI) 기반의 청력검사 모델 개발에 나선다.

​​▲순음청력 검사결과 데이터 과제 개요 / 나무기술
나무기술은 과학기술정보통신부가 주관하고, 한국지능정보사회진흥원(NIA)에서 추진하는 ‘2021년도 인공지능 학습용 데이터 구축사업’ 주관기관으로 선정돼, 청력검사 학습데이터 세트를 구축하고 난청 원인 진단 모델 개발 프로젝트를 추진한다고 5일 전했다.

나무기술은 인피노브, 조인트리, 이루온아이앤에스 전남대학교병원, 경북대학교병원, 전북대학교병원, 충남대학교병원 총 8개사와 컨소시엄을 구축해 순음청력 검사결과 데이터 사업을 진행한다. 총 사업비는 22억5000만원 규모다.

'순음청력 검사결과 데이터' 사업을 통해 이미지로 저장돼 있는 순음청력, 어음청력 검사결과를 정형 데이터로 변환하고 효과적으로 라벨링하는 도구를 개발한다. 난청의 원인적 분류를 청력검사 결과로부터 예측하는 AI 학습 모델 개발을 목표로 한다.

대한민국은 인구 고령화에 따른 난청환자가 지속적인 증가세에 있으며, 청각장애는 지체장애에 이어 두 번째로 높은 장애 유형이다.

인구 고령화에 따른 난청환자의 지속적인 증가추세에 따라 필요성이 커지고 있지만, 그동안 난청의 형태 및 원인, 연령별로 수치화된 청각 빅데이터가 없다.

대부분의 병원에서 진행된 청력검사 결과는 수치화된 결과가 아닌 순음청력검사 그래프와 어음청력검사 수치가 기재된 이미지 파일로 병원마다 결과지의 형태가 다르게 존재한다.

이번 과제에서 구축하는 학습데이터셋의 최종 결과는 모두 정형데이터로 변환되며, 학습의 용이성을 위해 CSV 포맷으로 가공할 예정이다.

참여 병원이 보유하고 있는 청력검사 원시데이터와 원천데이터는 좌측과 우측을 모두 포함한 데이터를 수집하며, 라벨링 이후 좌, 우를 분리하므로 최종 데이터는 10만건 규모가 될 것으로 예상된다.
나무기술은 이번 사업을 통해 구축되는 학습데이터는 청력 관련 연구의료진과 인공지능 기업, 보청기, 이어폰, 청력검사기기 등 청력 관련 산업계에 공유될 예정이며, 청력 관련 인공지능 연구의 기폭제가 될 것으로 기대한다.

김경우 나무기술 상무는 "국내외를 통틀어 최대 규모의 청력검사 학습데이터셋이 구축될 것으로 기대된다"며 "개발한 정제 도구와 라벨링 도구는 AI Hub와 대한청각학회의 학술 대회 등을 통해 공개할 예정이다"고 말했다.

류은주 기자 riswell@chosunbiz.com