자연어 이해 실용 인공지능(AI) 기술 기업 무하유는 26일 ‘연구윤리 강화를 위한 인용 참고문헌 간 진위여부 검증 기술 개발’에 나섰다고 밝혔다.

무하유는 중소벤처기업부의 ‘2021년도 중소기업기술개발지원사업’ 중 교육 분야 시장확대형 비대면·서비스로 선정돼 ‘연구윤리 강화를 위한 인용 참고문헌 간 진위여부 검증 기술’을 개발하고 있다. 참고문헌으로 표기된 실제 문헌을 추적해 그 내용을 인용한 것이 맞는지 검증하는 것이 골자다. 현재 전국 90% 이상 대학에서 카피킬러를 활용한 표절검사 결과확인서 제출을 의무화하고 있다.

표절검사 서비스는 보조 수단임에도 불구하고 표절률 수치만 맞으면 연구윤리가 충족되는 것으로 보는 분위기가 일반화됐다. 표절률 수치를 낮추기 위해 불필요한 인용을 하거나, 실제 인용하지 않은 문장에
인용 표기를 하는 등 표절 회피 사례도 증가하고 있다.

이를 방지하기 위해 인용 참고문헌간 적합성 검증기술을 개발하여 카피킬러의 맹점을 보완하고, 연구윤리를 강화할 필요성이 제기됐다. 인용 참고문헌간 적합성 검증기술은 참고문헌 표기가 된 부분에 대해 실제 그 문헌을 추적하여 그 내용이 인용한 것이 맞는지를 검증하는 기술이다.

기존 문서 단위가 아닌 단락, 문장의 마이크로 콘텐츠(정보의 최소 단위) 단위 인용·참조 분석을 진행한다.

무하유는 1차년도 연구개발 목표 ‘참고문헌 인용 적합성 검사 기술 연구개발’을 위해 딥러닝 기반 인용, 참고문헌 영역 인식 및 추출 모델 개발을 완료했다. 학위·학술 논문 4만 건을 활용해 인용과 참고문헌 영역 인식 및 추출의 정확도를 검증한 결과 F1스코어 0.954를 달성했다. F1스코어는 정밀도와 재현율을 모두 고려한 종합값으로, 0과 1사이의 값을 가지는데 0.954는 그만큼 인식과 추출이 정확하다는 의미다.

무하유는 과제를 통해 한국어뿐만 아니라 일본어에도 적용가능한 기술을 개발하고, 검증 시스템을 구축할 계획이다.

신동호 무하유 대표는 "카피킬러는 육안으론 확인할 수 없는 표절을 빠르게 파악할 수 있게 해 연구윤리를 세우는 데 기여해 온 서비스였으나, 표절률 낮추기 위한 ‘꼼수’들이 생겨 이를 보완하기 위해 본 과제를 진행 중이다"며 "출처 표시가 없는 인용·참조는 표절이 되고, 출처를 찾아가는 과정은 지식의 계보학이 된다. 꾸준히 기술 고도화를 진행해 카피킬러가 지식의 계보학을 밝히는 서비스로 그 역할을 확대해 나갈 것이다"고 말했다.

김형원 기자 otakukim@chosunbiz.com