✅ 가설검정
🔸
분석방식
EDA (탐색적 데이터 분석)
: 패턴을 보고 가설을 세우는 단계
가설검정 (확증적 분석)
: 세운 가설을 데이터로 검증
“이 차이는 우연일까, 실제 효과일까?“ 판정
🔸
가설검정이 풀리려면 필요한 선행지식
모집단 vs 표본
모집단 전체는 볼 수 ❌ → 표본만 사용
표본평균에는 표본오차가 자연스럽게 섞임
표본평균의 분포
같은 모집단에서 n명을 뽑아도 → 평균은 매번 달라짐
흔들림 크기 = 표준오차(SE)
정규분포 vs t분포
σ 알면 → 정규분포
σ 모르면 → 표본 s사용. t분포
n 위화살표 → t분포는 정규분포에 가까워짐
신뢰구간 ↔ 검정
“차이의 95% CI가 0을 포함하지 않는다”
“p < 0.05에서 H0 기각“ (양측검정)
검정은 표본평균의 확률적 흔들림(SE)를 전제로 한다 → 그래서 SE, t분포,신뢰구간 같이 다님
🔸 가설검정
“우연인가, 의미 있는 차이인가”를 구분하는 절차
귀무가설
(H0) : 차이❌ 효과❌ 기존 가설
대립가설
(H1) : 차이⭕ 효과⭕ 내가 입증하고자 하는 가설
EX)
귀무가설 (H0) : 무죄 추정
대립가설 (H1) : 유죄 주장
검사는 무죄 세계에선 나올 수 없는 증거를 제시해야 함
증거가 애매하면 → 무죄 유지 (H0 유지)