라플라스 "내가 왔다"
벌써 정규분포 세 번째 이야기입니다. 지난주 수학 천재 가우스에 이어 오늘 살펴볼 또 다른 수학 천재는 바로! 라플라스입니다. 프랑스의 천재적인 수학자인 라플라스는 이미 매드매스에서 다룬 적이 있어요. 베이즈 이론을 수식으로 정리했던 사람이 바로 라플라스였죠? 그래서 현대 통계학의 아버지라고 불리기도 하고요.
혹시나 기억이 나지 않는 분들은 이곳을 클릭해 주세요! “지구가 생성된 이래 45억 년 동안 해가 떠왔다고 하면, 내일 해가 뜰 확률은 얼마일까?”에 대한 라플라스의 대답을 확인하실 수 있습니다. 라플라스는 프랑스의 뉴턴이라고 불릴 정도로 대단한 과학자였답니다. 지난주 주인공이었던 가우스에 버금갈 만큼 자연과학 여러 영역에 걸쳐 본인의 흔적을 남겨두었죠. 물리학도라면 라플라스의 이름을 딴 라플라시안 연산자와 라플라스 방정식을 기억할 거예요. (라플라스 방정식이 뭔지 궁금하신 분은 MIT 스트랭 교수님의 설명을 참고해보세요! 물론 전 듣지 않았지만, 고개가 절로 끄덕여지네요. 조는 거 아닙니다.)
응용수학의 대가 MIT 스트랭 교수님. 열정이 모니터를 뚫고 나올 정도다
응용수학의 대가 MIT 스트랭 교수님. 열정이 모니터를 뚫고 나올 정도다
오늘 다룰 이야기는 라플라스와 정규분포 이야기입니다. 그러기 위해선 이항분포를 먼저 알아야 하는데요, 지금부터 시작해보겠습니다. 이항분포(二項分布)는 영어로 Binomial Distribution이라고 합니다. 이항분포는 어떤 시행(동전 던지기, 주사위 던지기 등)에서 사건 X가 일어날 확률이 매회 p로 일정하다고 할 때, 이 시행을 n 회 반복할 때 사건 X가 일어날 확률 분포를 의미해요.
뭔가 복잡하죠? 간단한 예시를 살펴봅시다. 이를테면 동전을 5번 던졌을 때 앞면이 0번 나올 확률부터 5번 모두 나올 확률까지를 나열한다고 칩시다. 이때의 확률 분포가 바로 확률 0.5(앞면 혹은 뒷면), 시행 횟수가 5인 이항분포입니다. 수식으로 표현하면 $B(N, p)$라고 하는데. $B$는 Binomial의 $B$이고 $N$은 시행횟수, $p$는 사건이 일어날 확률입니다. 동전 던지기 예시를 수식으로 표현하면 $B(5, {1\over2})$가 되는 거고요.
동전 던지기로 그려본 확률분포(출처 https://bookdown.org/mathemedicine/Stat_book/)
그런데 이 동전 던지기를 무한히 반복한다면 어떻게 될까요? 정규분포 ①편에서 이야기했던 드 므아브르 기억하시나요? 정규곡선을 처음으로 탄생시킨 프랑스 출신의 수학자였죠. 이 형님께서 다시 등장합니다. 드 므아브르는 동전 던지기를 해서 앞면이 나올 확률처럼 $p=0.5$일 때 이항분포가 정규분포로 근사할 수 있음을 증명했어요. 이걸 더 발전시킨 게 바로 오늘의 주인공 라플라스였죠. 라플라스는 중심극한정리를 증명하면서 다른 확률($p$)에서도 적용할 수 있음을 증명해요. 그래서 시행 횟수가 충분히 큰 이항분포는 정규분포로 근사할 수 있다는 정리를 드 므아브르-라플라스 정리
라고 합니다.
가우스와 동시대를 살았기 때문에 서로 교류도 있었다고 해요. 라플라스가 생각해냈지만 완벽하게 수학적으로 증명하지 못했던 개념을 가우스는 논문으로 발표하죠. 1810년 4월로 가보시죠. 라플라스는 <The Theory of the Motion of heavenly Bodies Moving about the Sun in Conic Sections>라는 이름의 논문을 보고 큰 충격을 받았다고 해요. 그리고 가우스에게 질 수 없다는 듯 1811년 가우스의 생각을 발전 시켜 BLUE(최소분산선형불편추정량)
개념을 제공했고 또다시 가우스는 이걸로 가우스-마코프 정리를 만들어냅니다.