KT가 25일 오전 발생한 전국 단위 유·무선 통신 장애를 두고 재발 방지를 약속했다. 통신 장비 작업에서 관리·감독 프로세스를 강화하고, 테스트베드를 전국 단위로 확대해 오류를 사전에 바로잡겠다는 계획을 밝혔다. 지역 단위 망까지 네트워크 설정 오류가 확산하는 것을 방지하고자 차단 기능도 도입한다.

KT는 29일 과학기술정보통신부(과기정통부)가 발표한 KT 네트워크 장애 원인 분석 결과를 두고 해당 장애가 벌어지게 된 추가 설명을 더했다.

과기정통부에 따르면, KT 유·무선 통신 장애는 KT 부산국사에서 이뤄지던 기업망 라우터 교체 작업에서 발생했다. KT 관리 책임자 없이 협력업체 직원끼리 라우팅(네트워크 경로 설정) 작업을 수행하는 과정에서 작업자가 잘못된 설정 명령을 입력했고, 해당 오류가 전국 라우터로 확산하면서 피해가 커졌다. 통상 이같은 작업은 야간에 이뤄져야 했지만, 주간에 작업이 이뤄지면서 점심시간을 전후로 피해가 발생했다.

KT는 네트워크 장비 관련 작업을 야간에 진행하는 것이 자사 원칙이며, 본래 작업계획서를 제출, 승인한 후 KT 직원 입회하에 작업이 이뤄진다고 밝혔다. 다만 부산 지역 라우팅 작업에선 해당 원칙을 위반한 것이 피해 규모를 키웠다.

KT 측은 "이번 장애의 경우 야간작업으로 승인을 받았음에도 (협력사가) 이를 위반해 주간에 작업이 이뤄졌다. KT 직원도 이를 양해하고 관리, 감독을 소홀히 했다"며 "일탈이 이뤄진 예외 사례이며, 앞으로 이런 사례가 재발하지 않도록 프로세스를 강화하겠다"고 설명했다.

지역에서 발생한 라우팅 오류가 별다른 제한 없이 전국 단위로 확산하며 문제 크기를 키운 것을 개선하기 위해서는 전국 단위로 테스트베드를 운영한다. 장비 작업 중 실험 환경에서 미리 안정성을 검증한 후 실제 작업하는 프로세스를 마련해 문제 재발을 막는다.

KT 측은 "현재 서울 우면동 KT 연구개발센터에서 테스트베드를 운영하고 있다. 실제 환경과 동일하게 적용된 모델실로, 연동 전에 네트워크 작업의 안정성을 확인할 수 있는 기능을 지니고 있다"며 "해당 테스트베드가 현장까지 확산하지 못했지만 이번 일을 계기로 전국 단위로 적용하겠다"고 설명했다.

라우팅 오류 확산 방지를 위해서는 엣지망 단위까지 오류 방지 기능을 추가한다. 기존에 센터망, 중계망, 엣지망으로 이뤄진 KT 전국망에서 라우팅 오류 확산 방지 기능은 센터망과 중계망 단위에서만 적용된 상태였다. 이를 엣지단까지 추가해 인터넷 장애 재발을 방지한다.

KT 측은 "이번 장애에 대해 전적으로 책임을 통감한다. 불편을 겪으신 고객에게 고개 숙여 사과드린다"며 "KT는 재발 방지 대책을 면밀히 수립하고, 피해 보상 방안도 최종 결정되는 대로 발표하겠다"고 밝혔다. KT는 29일 오전 이사회를 개최해 피해 보상 방안을 논의한 상태다.

김평화 기자 peaceit@chosunbiz.com