천년만년 만에 꼭꼬 편지함에 요청이 들어왔습니다. 선덕선덕 설레는 마음으로 열어보니...!

<aside> 💌 2020년 11월 5일 10시 10분

마부작침 프로젝트와 레퍼런스를 한 눈에 보기 편하게 요약&소개 해주어서 너무 좋습니다!!

</aside>

라는 쪽지가 있더군요! 코너 이름은 틀렸지만 마침 미국 대선 시즌이기도 했고 신뢰수준, 신뢰구간에 관해서 이야기할 타이밍을 재고 있었는데 아주 감사한 쪽지였지요. 그래서 이번 주부터는 통계학의 기초라고 할 수 있는 가설 검정과 오류, 그리고 유의수준, 유의확률에 대해 살펴보려고 해요. 오늘은 그중에 가설 검정에 대해 이야기해보겠습니다.

다시 등장한 모수, 오늘 다룰 모수는 역시 이 분이 아니시다

다시 등장한 모수, 오늘 다룰 모수는 역시 이 분이 아니시다

지난 [005] 모집단과 표본집단편 매스매스를 기억하시나요? 모수를 파악하기 위해서 모집단을 전수조사하면 되지만 그게 여의치 않으니 표본집단의 특성을 바탕으로 모집단의 특성을 알아내는 과정을 거친다고 했었죠. 이를테면 표본평균으로 모평균을, 표본분산을 통해 모분산을 알아내는 방식으로 말이죠. 이러한 과정을 우리는 통계적 추론이라고 합니다.

제한된 표본으로 모집단의 특정을 결론짓는건 본질적으로 불확실성을 수반할 수 밖에 없어요. 나무만 보고서 숲을 판단하겠다는 거니까요. 이러한 불확실성을 제거하기 위해 가설 검정과 오류, 유의수준 등이 존재하는 거라고 생각하시면 됩니다. 간단한 예를 들어볼게요. 꼭꼬가 마부작침 탐정사무소 회식에 참석할 확률은 50%다라는 가설을 검정한다고 생각해봅시다. 가설은 말 그대로 (아직은) 거짓인 이야기입니다. 제대로된 검정 과정을 거치지 않는 상태에서는 계속 거짓이겠죠. 그리고 이 가설이 참인지 거짓인지 판단하기 위해 귀무가설대립가설을 두고 검증해보겠습니다.

귀무가설의 사전적 의미는 이렇습니다. "설정한 가설이 진실할 확률이 극히 적어 처음부터 버릴 것이 예상되는 가설", 버리는 가설이라는 뜻이죠. 수학적으로는 $H_0$라고 합니다. 귀무가설에 대응하는 대립가설은 귀무가설이 기각될(버려질) 때 대체되는 가설을 말하죠. 수학적으로는 $H_1$이라고 합니다. 통계적 추론 방식은 이런겁니다. 내가 주장하고 싶은 주장이 있다면 그것과 반대되는 놈을 귀무가설로 놓고 이 놈이 틀렸다는 걸 증명하는 식이죠.

$$ H_0 : P_K\ne0.5 \\H_1 : P_K=0.5 $$

누군가 꼭꼬가 회식에 참석할 확률이 50%이라는 주장을 한다고 하면, 귀무가설로는 꼭꼬가 회식에 참석할 확률이 50%가 아니다라고 두고 이 귀무가설이 틀리다는 것만 증명하면 되는 겁니다. 이렇게 가설을 설정해두는것부터 기본적인 통계적 추론이 시작됩니다. 어떤 가설을 선택해야 하는지, 그리고 그 가설을 선택한다음엔 어떤 과정이 있는지... 다음주는 가설에 이어서 신뢰수준과 유의확률에 대해서 살펴보겠습니다. 그러면 다음주까지 안뇽~!