<aside> 📖

목차

</aside>

<aside> 💯

오늘의 목표

<aside> 🌟

데이터 분석가라면 필수적으로 알아야 하는 데이터 전처리를 배워보고, 가장 많이 사용하는 판다스(Pandas) 라이브러리에 대해 배워보겠습니다.

</aside>

<aside> 📢

해당 라이브 세션은 VS Code + Python Jupyter Notebook (python 3.10.12) 실습 환경에서 진행합니다.

</aside>

<aside> 📎

미니 과제 파일

  1. 꼭 데이터 = .csv 파일을 다운로드 받으셔야 합니다!
  2. 다운로드 받은 데이터 파일(.csv, .xlsx … )과 미니과제 (.ipynb) 파일은 같은 공간, 같은 디렉터리에 있어야 합니다! 즉 같은 폴더에 있어야 해요! (데이터를 판다스로 로드할 때, 직접 경로를 입력해준다면 OK)

https://drive.google.com/file/d/16ZjKUj3OtBMCygFiVD7_4K2y3Z5UZ5z-/view?usp=sharing

https://drive.google.com/file/d/17dJjmGaYuWqWVg6wsTvsKrXqOt32nYwq/view?usp=drive_link

</aside>

<aside> ➡️

실습 데이터

  1. https://drive.google.com/file/d/1whWE5pvt8PTmD1iEzEloaQSHuT12dCLw/view?usp=drive_link </aside>

0. 데이터 분석? 데이터 전처리?

데이터 분석(Data Analysis)이란?

image.png

👉 쉽게 말해, 데이터 분석 = 데이터로부터 답을 찾는 과정이에요

전처리의 중요성 (Importance of Data Preprocessing)