[마소 395호] 캐글 데이터를 비주얼 스튜디오 코드로 톺아보기

북마크 완료!

마이페이지의 ‘북마크한 기사’에서 읽으실 수 있습니다.

북마크한 기사 보러가기 close
입력 2019.02.18 06:00
소프트웨어 전문지 마이크로소프트웨어 395호는 데이터과학을 주제로 담았습니다. 데이터과학에 대한 개론, 학습 방법, 실무 적용 사례, 학계 등 마소 395호 주요 기사들을 IT조선 독자에게도 소개합니다. [편집자주]

비주얼 스튜디오 코드(Visual Studio Code, 이하 VS Code)는 마이크로소프트가 2016년 4월 1.0 버전을 발표한 이후, 매월 꾸준히 업데이트하고 있는 오픈소스 편집기다. 디버깅, 태스크 실행, 버전 관리 등 기본 기능에 충실하며 다양한 운영체제 지원한다. 또한, 한국어를 포함한 다국어를 지원하며 플러그인(Extension)으로 부족한 기능을 추가할 수 있어, 꾸준히 인기를 얻으며 개발자의 핵심 도구로 자리 잡고 있다.

크로스 플랫폼 애플리케이션을 개발할 수 있는 프레임워크인 일렉트론(Electron)으로 개발했으며, C나 C#, 자바 이외 익스프레스(Express)나 노드JS(Node.js) 개발에도 사용한다. 아나콘다(Anaconda) 5.1 버전부터는 설치할 때 추가로 설치할 편집기 옵션으로도 반영됐다. 2018년 12월 중순 기준으로 1.30 버전이 공개됐다. 이 글에서는 VS Code로 캐글 데이터를 분석하는 방법을 소개한다.

VS Code가 데이터 분석에 적당한 이유. / 마이크로소프트웨어 395호
오픈소스인 VS Code는 잘 구조화된 개발 환경과 자유로운 텍스트 입력을 할 수 있는 도구다.
기본 기능 외 추가 기능이 필요한 경우, 플러그인을 설치해 해결할 수 있다. MS는 플러그인을 검색하고 설치할 수 있는 사이트(marketplace.visualstudio.com)를 운영하고 있으며, 플러그인 설치 방법은 간단하다. 예를 들면, 마크다운(Markdown), 깃(Git) 및 소스 관리, 통합, 디버깅 기능 등을 추가하면 문서 작성 외 소스코드 빌드, 관리, 테스트 등을 할 수 있다.

처음 VS Code를 설치하면 자바스크립트(JavaScript), 타입스크립트(TypeScript) 및 노드JS의 몇 가지 기술만 지원한다. 소스코드 관리 및 리팩토링 도구와 깃도 지원해 대부분의 기본 웹 개발에는 충분하다.

고(Go), C# 등으로 개발하고 싶거나 데이터 분석 시 많이 사용하는 파이썬을 사용하고 싶다면 해당하는 프로그래밍 언어에 맞는 플러그인만 설치하면 된다. 몇 가지 플러그인을 추가하면 디버깅 도구 이외에도 소스코드 입력 시 힌트 제공 및 정리 등을 자동으로 하는 기능을 추가해 개발 능률을 높일 수 있다. 원하는 기능이 없다면 직접 플러그인을 개발하고 VS Code 마켓플레이스에 공유할 수 있다.

VS Code에서 파이썬 코드를 빌드하기 위해서는 파이썬 플러그인을 설치해야 한다. 파이썬 플러그인은 2016년 1월 20일 공개된 이후, 2018년 12월 꾸준히 개발되고 있다. 린팅, 디버깅, 인텔리센스, 코드 내비게이션, 코드 포맷팅, 리팩토링, 단위 테스트 등을 지원하기 위해 만들어졌으나, 데이터 과학을 위한 작업에도 사용할 수 있다.

주피터 노트북과 유사하지만 VS Code가 제공하는 기능을 통해 개발자에게 친숙한 환경에서 데이터를 분석할 수 있다. ‘IPython’ 커널 및 프레임 시각화, 인터랙티브 그래프 그리기, 커널 재시작, 주피터 노트북 내보내기 등 주피터가 기본적으로 제공하는 기능뿐 아니라 데이터프레임 같은 코드도 검사할 수 있다.

김영하 필자의 ‘캐글 데이터를 비주얼 스튜디오 코드로 톺아보기’에 대한 자세한 내용은 ‘마이크로소프트웨어 395호(https://www.imaso.co.kr/archives/4654)’에서 확인할 수 있다.


0
주요 뉴스
지금 주목할 뉴스