https://s3-us-west-2.amazonaws.com/secure.notion-static.com/61612813-29b5-42f1-97a2-7550f4c506b0/KakaoTalk_20210120_174043079.png

황당한😨 뻘소리로 들릴지 모르겠지만 이 이야기는 세계 최고 권위를 가진 의학 저널에 실린 내용이여요. 미국 매사추세츠 의사 협회에서 발행하는 뉴잉글랜드 저널 오브 메디슨지(NEJM)라는 곳인데요, 1년에 NEJM에 제출되는 논문만 해도 5,000여 편! 제출됐다고 다 걸리는 것도 아니고 5% 미만만 고르고 골라서 게재하는 게 원칙일 정도로 아주 깐깐한 저널이라고 해요.

그런데 이 학술지에 프란츠 메세를리 박사라는 분이 2012년에 “초콜릿 섭취량이 늘어날수록 인구 대비 노벨상 수상자도 더 많아진다”는 연구를 게재했어요. 초콜릿을 먹으면 두뇌 회전이 빨라진다는 이야기가 있던데 그 결과였던 걸까요? 아래 그래프가 바로 국가별 초콜릿 섭취량(X)과 인구 대비 노벨상 수상자(Y)와의 관계를 그린건데 보시다시피 우상향하는 양의 상관관계를 가지고 있죠. 상관계수는 무려 0.791! 상당히 강한 상관성을 지니고 있어요.

상관계수가 무려 0.791

상관계수가 무려 0.791

상관계수는 상관관계의 정도를 나타내는 지수여요. 숫자가 1에 가까우면 가까울수록 양의 상관관계를 뜻하고 -1에 가까우면 가까울수록 음의 상관관계를 갖고 있다는 겁니다. 위 그래프에서 중국부터 스위스까지 직선이 그려질 텐데 그 기울기의 정도가 0.791이라는 겁니다. 지난 2주 동안 이야기했던 회귀분석이 바로 변수 간의 상관관계(그리고 상관계수)를 분석하는 방법이었던 거고요!

위 그래프에서 스웨덴은 직선을 중심으로 약간 왼쪽에 치우쳐져 있어요. 스웨덴의 1인당 연간 초콜릿 소비량은 6.4kg인데 상관계수로 계산하면 인구대비 노벨상 수상자는 14명 정도일 거예요. 그래프로 따지면 프랑스 위쪽 정도? 하지만 실제로는 32명으로 그 두 배가 넘었죠. 메세를리 박사는 노벨 위원회가 스톡홀름에 있으니 수상자 선정 과정에서 약간의 애국심이 발휘된 결과이거나, 혹은 스웨덴 사람들이 특별히 초콜릿에 민감하다고 비꼬았어요.

그래서 정말로 초콜릿을 많이 소비하면 노벨상 수상자를 많이 배출할 수 있을까요? 그렇다고 할 수 없을 겁니다. 이 논문은 두 변수 간의 상관관계는 존재하지만, 인과관계가 있는지는 증명하지 못했거든요. 그래서 논문이 게재된 직후 메세를리 박사는 상관관계와 인과관계의 차이를 명확하게 구분 짓지 않았다는 비판을 받았어요. 노벨상을 수상한 미국 물리학자 에릭 코넬은 이 연구를 보고 인과관계가 없다고 말했어요. 국가별 초콜릿 섭취량은 그 국가가 얼마나 잘 사는지, 즉 경제 수준과 연관이 있고, 경제 수준이 높은 만큼 R&D나 기초 연구에 투자되는 금액도 많아 노벨상 수상에 영향이 있다는 해석이였죠.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/4f5cb4e5-ca1d-4109-bed6-eaa05c21abd4/chart.png

이 그래프를 보시죠. 검정색과 빨간색 두 변수의 연도별 변화를 살펴보면 상당히 흐름이 유사하죠? 변수 사이의 상관계수는 0.67, 강한 양의 상관관계가 있다고 할 수 있어요. 두 변수가 무언지 살펴보면 하나는 풀장에서 익사한 사람의 수이고, 또 하나는 니콜라스 케이지의 연도별 필모그래피 수입니다. 풀장에 니콜라스 케이지의 저주가 내린 걸까요? 그게~ 아니죠! 두 변수 간의 상관성은 있지만, 인과관계는 없는 겁니다. 어쩌다 수치가 비슷한 흐름을 보였던 거죠. 혹은 우리가 모르는 두 변수 간의 어떤 관계성이 실제로 있을지도 모르고요.

어이가 없어 헛웃음이 나오는 니콜라스 케이지

어이가 없어 헛웃음이 나오는 니콜라스 케이지