소프트웨어 전문지 마이크로소프트웨어 395호는 데이터과학을 주제로 담았습니다. 데이터과학에 대한 개론, 학습 방법, 실무 적용 사례, 학계 등 마소 395호 주요 기사들을 IT조선 독자에게도 소개합니다. [편집자주]

많은 조사기관에서 데이터 과학자를 주목받는 직업 상위권에 올리고 있다. 또한 많은 기업이 데이터 선점을 위해 노력하고 있다. 왜 기업은 데이터를 선점하기 위해 노력하는 것일까? 단순히 데이터를 수집하는 것일까? 아마 데이터 그 자체보다는 데이터를 통해 발견할 수 있는 의미를 찾기 위해서일 것이다.

데이터에서 의미 있는 요소를 발견하려는 방법은 여러 가지가 있지만, 그중 하나를 말하라면 당연히 ‘시각화’다. 데이터 자체 그리고 숫자로만 표현하기에는 분명히 한계가 있다. 데이터 시각화의 주요 목적은 그래픽적 의미를 이용해 명확하고 효과적으로 정보를 커뮤니케이션하기 위함이다.

사람의 여러 감각기관 중 시각기관인 ‘눈’이 가장 많은 정보를 받아들인다. 사람의 눈은 크기, 모양, 색, 위치 등 변화를 큰 노력 없이 순식간에 그 차이를 알아차린다. 그리고 시각화는 눈이 정보를 빠르게 파악할 수 있게 도움을 준다.

하지만 데이터 시각화 작업이 중요한 만큼 데이터를 시각적으로 표현하기란 쉽지 않다. 또한 시간 부족을 이유로 분석에 사용한 데이터를 바로 사용하는 경우가 많은데, 이는 좋은 시각화 자료를 만드는 데 있어, 가장 큰 방해 요소다.

데이터 시각화는 구현할 수 있는 다양한 방법 중, 누구나 손쉽게 이용할 수 있는 ‘표’와 ‘차트’로 시작할 수 있다.

표는 데이터 시각화에도 유용하지만, 데이터를 분류하는 데도 도움이 된다. 표는 가로 선과 세로 선 안에 데이터를 가두는 곳이 아니다. 표는 전달할 데이터를 알기 쉽도록 일목요연하게 정리하고 표현하는 도구다. 따라서 양이 많거나 복잡한 데이터를 입력할 때는 표로 정리하는 습관을 갖는 것이 좋다. 이때 표에 행과 열의 수를 제한해서 청중이 직관적으로 파악할 수 있도록 메시지를 작성해야 한다.

표는 데이터를 비교할 때 가장 많이 사용하는 방법이다. 예를 들어 다음 주에 예정된 신제품 출시 발표 행사를 위해 관련 팀별 일정을 체크하고, 가장 빨리 모일 수 있는 날짜와 시간을 정해보자.

팀별 데이터 정보. / 마이크로소프트웨어 395호
팀별 데이터 정보. / 마이크로소프트웨어 395호
정보를 텍스트로만 전달하면 가능한 회의 일정을 한 번에 파악하기가 힘들다. 하지만 데이터를 표로 정리하면, 화요일 오전에 회의할 수 있다는 것을 쉽게 알 수 있다.

표로 정리된 데이터. / 마이크로소프트웨어 395호
표로 정리된 데이터. / 마이크로소프트웨어 395호
엑셀에서는 데이터를 분석하기 위해 표를 사용하고 파워포인트에서는 데이터를 표현하기 위해 표를 사용한다.

프로그램에 따라 표 사용 목적이 서로 다르지만, 데이터를 효율적으로 보여주기 위해 지켜야 할 표 기본 작성 원칙은 ▲선 최소화하기 ▲숫자는 오른쪽 정렬하기 ▲소수점 기준으로 정렬하기 ▲비교용 데이터는 세로로 배열하기 ▲항목 비교 시 비교 항목을 가운데 배치하기 ▲주목할 부분 강조하기 등이 있다.

배준오 필자의 ‘데이터 시각화의 올바른 차트 유형 고르기’에 대한 자세한 내용은 ‘마이크로소프트웨어 395호(https://www.imaso.co.kr/archives/4654)’에서 확인할 수 있다.