Data Science
-
2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Line Plot Line Plot Line Plot이란? 연속적으로 변화하는 값을 순서대로 점으로 나타내고, 이를 선으로 연결한 그래프이다. 꺾은선 그래프, 선 그래프, line chart, line graph 등의 이름으로 사용된다. 시간 또는 순서에 대한 변화에 적절해서 추세를 살피기 위한 시계열 분석에 특화되어 있다. 사용할 때 .line이 아니라 .plot()임을 유의한다...
Matplotlib의 Pyplot 모듈로 Line Plot 그리기2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Line Plot Line Plot Line Plot이란? 연속적으로 변화하는 값을 순서대로 점으로 나타내고, 이를 선으로 연결한 그래프이다. 꺾은선 그래프, 선 그래프, line chart, line graph 등의 이름으로 사용된다. 시간 또는 순서에 대한 변화에 적절해서 추세를 살피기 위한 시계열 분석에 특화되어 있다. 사용할 때 .line이 아니라 .plot()임을 유의한다...
2022.02.15 -
2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Bar Plot Bar Plot이란? 직사각형 막대를 사용하여 데이터의 값을 표현하는 차트이자 그래프이다. 막대 그래프, bar chart, bar graph 등의 이름으로도 사용된다. 범주(category)에 따른 수치 값을 비교하기에 적절한 방법이며, 개별 비교, 그룹 비교 모두 적합하다. 막대의 방향에 따른 분류 수직 (vetrical) .bar() $x$축에 범주, $y$축에..
Matplotlib의 Pyplot 모듈로 Bar Plot 그리기2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Bar Plot Bar Plot이란? 직사각형 막대를 사용하여 데이터의 값을 표현하는 차트이자 그래프이다. 막대 그래프, bar chart, bar graph 등의 이름으로도 사용된다. 범주(category)에 따른 수치 값을 비교하기에 적절한 방법이며, 개별 비교, 그룹 비교 모두 적합하다. 막대의 방향에 따른 분류 수직 (vetrical) .bar() $x$축에 범주, $y$축에..
2022.02.15 -
2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Python과 Matplotlib Matplotlib Matplotlib란? Matplotlib은 Python에서 사용할 수 있는 시각화 라이브러리 현재 사용되고 있는 다양한 데이터 분석 및 머신러닝/딥러닝은 Python에서 이뤄지고 있다. numpy와 scipy를 베이스로 하여 다양한 라이브러리와 호환성이 좋다. Scikit-Learn, PyTorch, Tensorflow Pand..
Python과 Matplotlib2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. Python과 Matplotlib Matplotlib Matplotlib란? Matplotlib은 Python에서 사용할 수 있는 시각화 라이브러리 현재 사용되고 있는 다양한 데이터 분석 및 머신러닝/딥러닝은 Python에서 이뤄지고 있다. numpy와 scipy를 베이스로 하여 다양한 라이브러리와 호환성이 좋다. Scikit-Learn, PyTorch, Tensorflow Pand..
2022.02.15 -
2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. 데이터 시각화 데이터 시각화란? 데이터 시각화란 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것을 의미한다. 시각화는 다양한 요소를 포함하는 Task이다. 목적: 왜 시각화를 하는지 명확하게 데이터의 특정 부분을 통해 다른 step으로 어떻게 나아갈지 독자: 시각화 결과는 누구를 대상을 하는지 본인을 위한 것인지 다른 사람에게 presentation 하기 위한 것인지 데이터:..
Data Visualization - 데이터 시각화와 데이터 시각화의 요소2022년 2월 3일(목)부터 4일(금)까지 네이버 부스트캠프(boostcamp) AI Tech 강의를 들으면서 개인적으로 중요하다고 생각되거나 짚고 넘어가야 할 핵심 내용들만 간단하게 메모한 내용입니다. 틀리거나 설명이 부족한 내용이 있을 수 있으며, 이는 학습을 진행하면서 꾸준히 내용을 수정하거나 추가해 나갈 예정입니다. 데이터 시각화 데이터 시각화란? 데이터 시각화란 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것을 의미한다. 시각화는 다양한 요소를 포함하는 Task이다. 목적: 왜 시각화를 하는지 명확하게 데이터의 특정 부분을 통해 다른 step으로 어떻게 나아갈지 독자: 시각화 결과는 누구를 대상을 하는지 본인을 위한 것인지 다른 사람에게 presentation 하기 위한 것인지 데이터:..
2022.02.15 -
머신러닝의 데이터 전처리에서의 피처 스케일링(Feature Scaling) Feature Scaling이란? 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업이다. Feature Scaling을 하는 이유는? 변수 값의 범위 또는 단위가 달라서 발생 가능한 문제를 예방할 수 있다. 머신러닝 모델이 특정 데이터의 편향성을 갖는 걸 방지할 수 있다. 데이터 범위 크기에 따라 모델이 학습하는 데 있어서 bias가 달라질 수 있으므로 하나의 범위 크기로 통일해주는 작업이 필요할 수 있다. Feature Scaling의 종류 표준화 정규화 표준화(Standardization)란? 서로 다른 범위의 변수들을 평균이 0이고 분산이 1인 가우시안 정규 분포를 가진 값으로 변환하는 작업이다. 표준화를 하는 이유는..
데이터 전처리의 피처 스케일링(Feature Scaling)머신러닝의 데이터 전처리에서의 피처 스케일링(Feature Scaling) Feature Scaling이란? 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업이다. Feature Scaling을 하는 이유는? 변수 값의 범위 또는 단위가 달라서 발생 가능한 문제를 예방할 수 있다. 머신러닝 모델이 특정 데이터의 편향성을 갖는 걸 방지할 수 있다. 데이터 범위 크기에 따라 모델이 학습하는 데 있어서 bias가 달라질 수 있으므로 하나의 범위 크기로 통일해주는 작업이 필요할 수 있다. Feature Scaling의 종류 표준화 정규화 표준화(Standardization)란? 서로 다른 범위의 변수들을 평균이 0이고 분산이 1인 가우시안 정규 분포를 가진 값으로 변환하는 작업이다. 표준화를 하는 이유는..
2021.09.15