<aside> 📖
</aside>
<aside> 💯
Series와 DataFrame의 차이를 이해하고, 각각을 리스트/딕셔너리/넘파이 배열 등으로 생성할 수 있다..values, .index, .columns 속성을 활용할 수 있다..shape, .info(), .describe()로 확인할 수 있다.pd.read_csv, pd.read_excel, pd.read_json 등을 사용해 외부 데이터(CSV, Excel, JSON 등) 를 불러오고, to_csv, to_excel, to_json으로 저장할 수 있다..loc(라벨 기반)과 .iloc(정수 위치 기반)을 이용해 행/열 단위의 인덱싱과 슬라이싱을 정확히 수행할 수 있다.&, |, ~ 연산자의 올바른 사용 포함)sort_values, sort_index로 데이터를 정렬할 수 있고, rename, drop, str.strip/str.lower 등을 활용해 데이터 정제 작업을 수행할 수 있다.isnull, notnull, dropna, fillna를 이용해 결측치(Missing Data)를 탐지하고, 삭제/대체 전략을 적용할 수 있다.duplicated, drop_duplicates를 이용해 중복 데이터를 탐지·제거할 수 있다.<aside> 🌟
데이터 분석가라면 필수적으로 알아야 하는 데이터 전처리를 배워보고, 가장 많이 사용하는 판다스(Pandas) 라이브러리에 대해 배워보겠습니다.
</aside>
<aside> 📢
해당 라이브 세션은 VS Code + Python Jupyter Notebook (python 3.10.12) 실습 환경에서 진행합니다.
</aside>
<aside> 📎
미니 과제 파일
https://drive.google.com/file/d/16ZjKUj3OtBMCygFiVD7_4K2y3Z5UZ5z-/view?usp=sharing
https://drive.google.com/file/d/17dJjmGaYuWqWVg6wsTvsKrXqOt32nYwq/view?usp=drive_link
</aside>
<aside> ➡️
실습 데이터

👉 쉽게 말해, 데이터 분석 = 데이터로부터 답을 찾는 과정이에요