내 주변 사람들은 모두 후보자 A를 좋아한다고 하던데... 지지율 발표를 보면 후보자 B가 높게 조사된다든가. 꼭꼬 주변의 친구들을 모두 둘러봐도 키가 170cm 넘는 애들이 없는데 평균 신장은 173cm라던가😭 주변 사람들의 데이터는 X라고 이야기하고 있지만, 그것이 다수가 아닌 소수일 수 있다는 것, 다수의 사람은 평균에 몰려 있고, 내 눈에 보이진 않지만 많은 사람의 데이터를 모으고 모으다 보면 평균을 중심으로 종 모양의 분포 형태를 띤다는 것. 이런 종 모양의 분포 형태를 우리는 정규분포(Normal Distribution)라고 합니다.

정규분포를 이용한 장난감. Galton Board라고 검색하면 구매할 수 있다(뒷광고 아님)

정규분포를 이용한 장난감. Galton Board라고 검색하면 구매할 수 있다(뒷광고 아님)

우리 주변에서는 이러한 정규분포를 따르는 다양한 수치들을 확인할 수 있어요. 앞에서 언급했던 대한민국 남성의 신장 분포라던가 수능 점수 분포라던가 말이죠. 그래서 일각에서는 세상은 정규분포가 지배하고 있다고 이야기하기도 해요. 이러한 원리를 이용한 장난감도 위에 있답니다. (엄밀히 말하면 위의 장난감은 이항분포의 정규 근사를 표현하는 것에 더 가까워요!)

정규분포 "이 세상은 나의 것!"

정규분포 "이 세상은 나의 것!"

정규분포를 일컫는 또다른 말, 바로 가우시안 분포(Gaussian Distribution)인데요. 독일의 수학자인 가우스의 이름을 따와서 명명한건데, 이름을 붙일 정도라면 당연히 정규분포를 가우스가 처음 만든거라고 오해하기 쉽지만 사실은 그렇지 않아요. 밑의 지폐를 보셔요. 1990년 통일 독일부터 2002년 유로화를 도입하기 전까지 사용한 최후의 마르크화를 보면 10마르크 지폐에 가우스 얼굴과 함께 정규분포 그래프가 담겨져 있죠. 그정도로 자부심이 뿜뿜했나봐요. 하지만 정규분포는 가우스 이전에 나왔답니다.

코가 상당히 날카로운 가우스

코가 상당히 날카로운 가우스

정규분포를 탄생시킨 주인공은 바로, 프랑스 출신의 드 무아브르라는 수학자입니다. 드 무아브르는 1733년 처음으로 정규분포를 도입했어요. 가우스가 태어난 때가 1777년이니 40년 앞서서 이미 등장했던 개념인거죠. 물론 가우스는 이 정규분포를 오차에 대한 확률분포 관점에서 바라보면서 수학적 체계를 단단히 한 공로가 어마어마해요. 그래서 가우시안 분포라는 이름을 붙인거겠고요. 가우스와 함께 정규분포를 정립에 큰 기여를 한 또 다른 수학자가 있었으니 바로바로바로! 라플라스입니다. 네 [007] 내일 해가 뜰 확률은? 에서 다뤘던 프랑스의 천재 수학자 라플라스 맞습니다.

종 모양의 정규분포. 파란색 그래프의 분포를 보면 평균이 0이고 표준편차는 0.2이다

종 모양의 정규분포. 파란색 그래프의 분포를 보면 평균이 0이고 표준편차는 0.2이다

이 그래프 기억나시나요? [006] 프리퀀티스트와 베이지안에서 설명했던 자료입니다. 위의 그래프에 그려진 종 모양의 분포가 모두 정규분포입니다. Normal Distribution의 앞글자인 N을 따서 $N(\mu,\sigma^2)$라고 표현하는데요, $\mu$는 평균을 뜻하고 $\sigma$는 표준편차, 산포도를 나타내는 수치죠. 표준편차가 작으면 작을수록 자료들이 평균에 몰려있다는 건데요, 파란색 분포는 $N(0,{0.2}^2)$를 따르고 초록색 분포는 $N(-2,0.5^2)$를 따르는 거죠.

오늘 매드매스는 정규분포 이야기로 풀어봤어요. 정규분포가 무엇인지, 어디서 시작되었는지 간단하게 살펴보았죠. 정규분포 이야기는 아직 끝이 아니랍니다. 다음주엔 천재 수학자 라플라스와 가우스가 과연 정규분포에 어떤 수학적 영향을 미쳤는지 살펴보려고 해요. 추가로 과연 세상엔 정규분포만 있는 것일까...? 라는 질문에도 조금씩 답해보려고 합니다. 그러면 다음주까지 안뇽~!