회귀분석은 변수들의 어떤 연관성이 있는지를 보여줄 수 있는 분석이다.

변수들 간의 함수 관계를 분석하는 방법으로 독립변수가 종속변수에 미치는 영향력을 파악하고 이를 통해 독립변수의 일정한 값에 대응하는 종속변수의 값을 예측하는 모형을 산출하는 방법이다.

image.png

회귀분석은 전제조건이 필요하다.

  1. 특정한 독립변수 값에 해당되는 종속변수의 값들은 정규분포 해야하며, 모든 정규뷴포의 분산은 동일해야한다.
  2. 종속변수 값들은 통계적으로 서로 독립적이어야 한다.
  3. 다중회귀분석의 경우 독립변수들 간에 다중공선성이 존재하지 않아야 한다.

가장 단순한 형태의 회귀분석을 살펴보자

단순선형회귀모형

독립변수가 하나일 경우에 종속변수와의 관계를 분석하여

독립변수가 종속변수에 미치는 영향을 분석한다.

대략적으로 두 변수 간의 관계가 어떠한지 산점도를 그려서 파악한다.