[마소 391호] 왓슨에게 한국어를 가르치다

입력 2018.02.07 11:38 | 수정 2018.02.07 12:00

개발 전문잡지 마이크로소프트웨어의 최신호는 인공지능 개발에 필요한 체크포인트(The Checkpoint of AI)를 다뤘습니다. 데이터 수집, 정제, 학습법, 인프라, 한국어 학습 방법 등 전문가의 최신 개발방법론과 노하우가 풍성합니다. 마소 391호의 주요 기사들을 IT조선 독자에게도 소개합니다.
[편집자주]

IBM 왓슨(Watson)은 자연어 형식으로 된 질문에 답할 수 있는 인공지능 플랫폼이다. 지난 2017년 9월 한국어 지원을 시작해, IBM 클라우드에서 왓슨 서비스를 한국어로 이용할 수 있다. 마소 391호에서 김대용 한국IBM 왓슨 플랫폼팀 개발자는 왓슨에게 한국어를 가르친 과정을 소개했다.

한국어는 매우 다양하게 변형이 일어나기 때문에 영어와 다른 처리 과정이 필요하다. "Weather is good"이란 문장이 있다. 이를 한국어로 번역하면 "날씨 좋다", "날씨가 좋네", "좋은 날씨야" 등 다양한 형태가 가능하다. 띄어쓰기나 어미의 변형도 특징 중 하나다.


어미의 변형 / 마이크로소프트웨어 391호 발췌
'놀'이라는 어간에 '-는'이라는 어미가 붙으면 '노는'이 되지만, '놀아', '놀면', '놀자' 등 무수히 많은 변형이 일어날 수 있다. 이 밖에도 동사 변형 등 한국어가 갖는 특성은 매우 많다.

김대용 과장은 한국어 학습을 위해 어미, 부사 등 품사가 어떤 것인지 알아야 하고, 감성을 분석하는 경우 어미나 조사 등의 공부도 필요하다고 했다. 왓슨의 한국어 학습에 대한 자세한 인터뷰 내용은 '마이크로소프트웨어 391호(www.imaso.co.kr/archives/1301)'에서 확인할 수 있다.