- 데이터 분석
- 데이터를 정제 및 가공해서 의미 있는 정보로 추출
- 목적 : 경험과 직감에만 의존하지 않고 객관적인 데이터 기반한 합리적인 결정
- 데이터 - 정보 - 지식 - 지혜
- 데이터 : 가공되지 않은 객관적 사실 (의미x)
- 정보 : 데이터의 가공,처리, 데이터간 상관관계에서 의미를 부여함(의미o)
- 지식 : 정보를 바탕으로 의사결정에 활용하는 것 → 개인의 경험을 결합해 고유의 지식으로 내재화
- 지혜 : 지식의 축적과 아이디어가 결합된 창의적인 산물
- 데이터 분석 실무 예시
- 데이터 분석 절차
- 문제 정의 → 가장 중요하고 어려운 단계
- 데이터 수집 → 공공포털 or 크롤링 등을 이용
- 데이터 전처리 Main → 가장 많은 시간이 소요됨, 결측값, 이상값, 중복값 등 처리해줘야함
- Feature Engineering : scaling 로그함수 스케일링, binning 범위데이터로 바꾸는 행위, transforming 개별데이터를 다른데이터로 바꾸는 행위
- 데이터 분석 Main → 탐색적 데이터 분석(패턴, 시각화, 분포확인), 통계적 분석(변수간 상관관계, 가설 검정, 선형 모형), 기계학습(분류 및 회귀(지도학습), 클러스터링(비지도학습))
- 현황분석 - 진단(원인)분석 - 예측 분석 - 예측 최적화 분석
- 보고 및 피드백 반영 → 분석 결과 및 인사이트 설득력있게 전달, 내용의 초점은 상대방이 되어야함, 간결하고 명확한 메세지로 전달
- 데이터 분석의 중요성
- 합리적 의사결정
- 설득과 협상의 도구
- 생산성, 효율성, 수익성 성장