다양한 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합분야(출처 : 위키백과)인 데이터 사이언스.
데이터 사이언티스트는 데이터의 형태에 따라, 그리고 데이터를 가공해서 어떤 아웃풋을 내는지에 따라 다양한 직군으로 분류될 수 있다. 직군별 집중해서 길러야할 기술적 역량과 인사이트들은 조금씩 다르겠지만, 그 중 매트릭스(행렬)의 성질을 배우는 선형대수학(Linear Algebra)은 데이터 사이언스의 어떤 직군이던 탄탄히 갖춰야할 기본 소양이다. 우리가 다루고자 하는 데이터는 결국 모두 매트릭스이기 때문이다.
우리가 경험하는 대부분의 것들은 숫자로 표현가능하고, 숫자의 차원수가 커질 수록 더욱 다양한 변수들을 고려해서 표현 가능하다. 집값을 땅의 위치, 학군, 주변 인프라 등의 요소를 포함한 행렬로, 이미지를 RGB 3차원 행렬로, 그리고 목소리를 2차원의 스펙트로그램(마찬가지로 행렬)으로 표현 가능하다. 이렇게 선형 대수학은 데이터 사이언스의 기초를 견고하게 지탱하고 있는 학문이다.
3Blue1Brown 강추!!
3Blue1Brown은 내가 좋아하는 수학 교육 유튜버다. 딱딱한 공식으로 배운 수학 개념을 재미있고, 알아듣기 쉽게 풀어서 설명해준다. 시각 애니메이션으로 설명도 해줘서 눈앞에 수학이 펼쳐지는 것과 같은 경험을 선사해준다. 이번 글은3Blue1Brown이 설명하는 선형대수학 강의를 정리했다.