2022년 2월 14일(월)부터 18일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해나갈 예정입니다. 강의 자료의 저작권은 네이버 커넥트재단 부스트캠프 AI Tech에 있습니다.
Interactive Visualization
Interactive를 사용하는 이유
정적 시각화의 장점
원하는 메시지를 압축해서 담을 수 있다는 장점이 있다.
정적 시각화의 단점
각각의 데이터를 살펴보는 것 뿐만이 아니라 관계를 살펴보는 데 많은 plot이 필요하는데, 이는 공간적 낭비가 크다.
또한 각각의 사용자가 원하는 인사이트가 다를 수 있으므로, 필요한 interaction을 통해 원하는 정보만을 얻을 수 있다.
Interactive Visualization이 무조건 좋은 것은 아니고, 필요에 따라 사용할 수 있어야 한다.
라이브러리
대표적인 라이브러리로 Plotly, Bokeh, Altair 등이 있다.
Interactive Library
Matplotlib
Matplotlib도 interactive를 제공하지만, 주피터 노트북 환경 또는 local에서만 실행할 수 있다.
mpld3
를 사용하면 웹에서 D3-based Viewer를 제공하지만, 되도록 다른 라이브러리를 사용하는 것이 좋다.
Plotly
Interactive 시각화에 가장 많이 사용되고, Python 뿐만이 아니라 R, JS에서도 제공한다.
Plotly Express
Plotly를 seaborn과 유사하게 만들어서 문법이 쉬우며, 커스텀 부분은 부족하지만 다양한 함수를 제공한다.