"표본은 많을수록 좋다던데 대체 '몇 개'부터 '많은' 거야?"

"... 제가 어떻게 알아요 ...?"

'통계적인 어떤 것'의 시작과 끝은 바로 표본을 통한 전체의 예측 (추정) 입니다.

그리고 곧 우리는 통계를 공부하면서 아주 간단한 명제를 마주합니다.

"표본(샘플)은 많을수록 좋다."

그렇지... 표본이 많아지면 분포가 종 모양을 띄면서... 모집단에도 가까워지고... 특이한 것보단 평균값 같은 것에 가까워지고...

여러분은 표본이 많을수록 좋은 것은 이해했습니다. 하지만 도대체 몇 개 이상(n≥?)이면 많은 것일까요?

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/15b13667-88d7-43fe-a86a-38a1df90c8b9/모르는데_어떻게.jpeg

... 모르는데 어떻게 정해요!


결론부터 말씀드립니다. n=30 을 기억하시고, 그와 동시에 n=30을 잊어버리십시오. 🤭

굉장히 모순적인 표현이지만 그럴 이유가 다 있습니다.

이번 포스팅을 통해 저는 왜 n=30이 다른 표본의 개수보다 중요한 포지션을 갖는지 설명하고