Data Science
-
2022년 2월 14일(월)부터 18일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해나갈 예정입니다. 강의 자료의 저작권은 네이버 커넥트재단 부스트캠프 AI Tech에 있습니다. 비정형 데이터셋에 사용할 수 있는 EDA & Visualization 일반적으로 비정형 데이터(이미지, 텍스트 등)에서는 다음과 같은 시각화를 해 볼 수 있다. Dataset meta data visualization 메타 데이터는 데이터 자체가 아니라 그 데이터에 대한 정보를 의미한다. 일반적으로는 target 값..
비정형 데이터 셋에서의 데이터 시각화2022년 2월 14일(월)부터 18일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해나갈 예정입니다. 강의 자료의 저작권은 네이버 커넥트재단 부스트캠프 AI Tech에 있습니다. 비정형 데이터셋에 사용할 수 있는 EDA & Visualization 일반적으로 비정형 데이터(이미지, 텍스트 등)에서는 다음과 같은 시각화를 해 볼 수 있다. Dataset meta data visualization 메타 데이터는 데이터 자체가 아니라 그 데이터에 대한 정보를 의미한다. 일반적으로는 target 값..
2022.02.18 -
2022년 2월 14일(월)부터 18일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해나갈 예정입니다. 강의 자료의 저작권은 네이버 커넥트재단 부스트캠프 AI Tech에 있습니다. Interactive Visualization Interactive를 사용하는 이유 정적 시각화의 장점 원하는 메시지를 압축해서 담을 수 있다는 장점이 있다. 정적 시각화의 단점 각각의 데이터를 살펴보는 것 뿐만이 아니라 관계를 살펴보는 데 많은 plot이 필요하는데, 이는 공간적 낭비가 크다. 또한 각각의 사용자가..
Interactive(인터렉티브) 시각화2022년 2월 14일(월)부터 18일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해나갈 예정입니다. 강의 자료의 저작권은 네이버 커넥트재단 부스트캠프 AI Tech에 있습니다. Interactive Visualization Interactive를 사용하는 이유 정적 시각화의 장점 원하는 메시지를 압축해서 담을 수 있다는 장점이 있다. 정적 시각화의 단점 각각의 데이터를 살펴보는 것 뿐만이 아니라 관계를 살펴보는 데 많은 plot이 필요하는데, 이는 공간적 낭비가 크다. 또한 각각의 사용자가..
2022.02.18 -
2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Seaborn 파이썬 데이터 분석에서 한 번 즈음은 꼭 쓰게 되며, Matplotlib 기반의 통계 시각화 라이브러리이다. 구성, 분포 관계 등 통계 정보를 파악하는 데 유용하다. Matplotlib 기반이라서 Matplotlib으로 커스텀할 수 있다. 쉬운 문법과 깔끔한 디자인을 특징으로 갖는다. import seaborn as sns처럼 관용적으로 sns로 import 한다. 왜..
Matplotlib 기반의 시각화 라이브러리 Seaborn2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Seaborn 파이썬 데이터 분석에서 한 번 즈음은 꼭 쓰게 되며, Matplotlib 기반의 통계 시각화 라이브러리이다. 구성, 분포 관계 등 통계 정보를 파악하는 데 유용하다. Matplotlib 기반이라서 Matplotlib으로 커스텀할 수 있다. 쉬운 문법과 깔끔한 디자인을 특징으로 갖는다. import seaborn as sns처럼 관용적으로 sns로 import 한다. 왜..
2022.02.15 -
2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. More Tips for Chart Grid 이해하기 기본적인 Grid는 축과 평행한 선을 사용하여 거리 및 값 정보를 보조적으로 제공한다. Grid의 요소 다음은 기본적인 Grid의 요소이다. color 색은 다른 표현들을 방해하지 않도록 무채색으로 만든다. zorder 항상 Layer 순서 상 맨 밑에 오도록 조정한다. 예시 코드 np.random.seed(970725) x = ..
Matplotlib 모듈로 Chart를 그리기 위한 팁2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. More Tips for Chart Grid 이해하기 기본적인 Grid는 축과 평행한 선을 사용하여 거리 및 값 정보를 보조적으로 제공한다. Grid의 요소 다음은 기본적인 Grid의 요소이다. color 색은 다른 표현들을 방해하지 않도록 무채색으로 만든다. zorder 항상 Layer 순서 상 맨 밑에 오도록 조정한다. 예시 코드 np.random.seed(970725) x = ..
2022.02.15 -
2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Facet in Chart Facet 화면에 대한 분할 → Multiple Vew 화면 상에 View를 분할 및 추가하여 다양한 관점을 전달할 수 있다. 같은 데이터셋에 서로 다른 인코딩을 통해 다른 인사이트를 보여줄 수 있다. 예) 막대 그래프, 파이 차트를 인접하게 배치하는 경우 같은 방법으로 동시에 여러 feature를 볼 수 있다. 큰 틀에서 볼 수 없는 부분 집합을 세세하게..
Matplotlib 모듈로 그린 Chart에서 Facet 사용하기2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Facet in Chart Facet 화면에 대한 분할 → Multiple Vew 화면 상에 View를 분할 및 추가하여 다양한 관점을 전달할 수 있다. 같은 데이터셋에 서로 다른 인코딩을 통해 다른 인사이트를 보여줄 수 있다. 예) 막대 그래프, 파이 차트를 인접하게 배치하는 경우 같은 방법으로 동시에 여러 feature를 볼 수 있다. 큰 틀에서 볼 수 없는 부분 집합을 세세하게..
2022.02.15 -
2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Color in Chart 시각화에서의 Color 색이 중요한 이유 위치와 색은 구분을 위한 가장 효과적인 채널이다. 공통적으로 사람들이 색에 관해 가지는 느낌은 다르므로 색을 어떻게 하느냐에 따라 전하고자 하는 인사이트가 달라질 수 있다. 심미적으로 화려한 것은 분명히 매력적이지만, 하지만 화려함보다는 독자에게 원하는 인사이트를 전달하는 게 가장 중요하다. 색을 통해 전하고 싶은 ..
Matplotlib 모듈로 그린 Chart에서 Color 사용하기2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Color in Chart 시각화에서의 Color 색이 중요한 이유 위치와 색은 구분을 위한 가장 효과적인 채널이다. 공통적으로 사람들이 색에 관해 가지는 느낌은 다르므로 색을 어떻게 하느냐에 따라 전하고자 하는 인사이트가 달라질 수 있다. 심미적으로 화려한 것은 분명히 매력적이지만, 하지만 화려함보다는 독자에게 원하는 인사이트를 전달하는 게 가장 중요하다. 색을 통해 전하고 싶은 ..
2022.02.15 -
2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Chart에서 Text 사용하기 Matplotlib에서 Text 시각화에서의 text라는 말이 어색할 수도 있지만, 그림만으로는 줄 수 없는 많은 설명을 추가해줄 수 있다. 잘못된 전달에서 생기는 오해를 방지할 수도 있다. 하지만 Text를 과하게 사용하면 오히려 이해를 방해할 수도 있다. Figure에서의 Text 요소 Ttile 가장 큰 주제를 설명한다. Label 축에 해당하는..
Matplotlib 모듈로 그린 Chart에서 Text 사용하기2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Chart에서 Text 사용하기 Matplotlib에서 Text 시각화에서의 text라는 말이 어색할 수도 있지만, 그림만으로는 줄 수 없는 많은 설명을 추가해줄 수 있다. 잘못된 전달에서 생기는 오해를 방지할 수도 있다. 하지만 Text를 과하게 사용하면 오히려 이해를 방해할 수도 있다. Figure에서의 Text 요소 Ttile 가장 큰 주제를 설명한다. Label 축에 해당하는..
2022.02.15 -
2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Scatter Plot Scatter Plot 점을 사용하여 두 feature간의 관계를 알기 위해 사용하는 그래프이다. 산점도 등의 이름으로도 사용된다. 직교 좌표계에서 $x$축 또는 $y$축에 feature 값을 매핑해서 사용한다. .scatter() 메소드를 사용한다. fig = plt.figure(figsize=(7, 7)) ax = fig.add_subplot(111, as..
Matplotlib의 Pyplot 모듈로 Scatter Plot 그리기2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Scatter Plot Scatter Plot 점을 사용하여 두 feature간의 관계를 알기 위해 사용하는 그래프이다. 산점도 등의 이름으로도 사용된다. 직교 좌표계에서 $x$축 또는 $y$축에 feature 값을 매핑해서 사용한다. .scatter() 메소드를 사용한다. fig = plt.figure(figsize=(7, 7)) ax = fig.add_subplot(111, as..
2022.02.15