En estad铆stica, la regresi贸n lineal es un modelo matem谩tico usado para aproximar la dependencia entre una variable dependiente Y, las variables independientes Xi y un termino aleatorio 茞.

La primer forma de regresi贸n lineal documentada fue el m茅todo de los m铆nimos cuadrados que fue publicada por el matem谩tico Adrien-Marie Legendre em 1805.

Gauss public贸 un trabajo donde se desarrollaba de manera m谩s profunda el m茅todo de los m铆nimos cuadrados, y en donde se inclu铆a una versi贸n del teorema de Gauss-M谩rkov. [1]

Regresi贸n Lineal y M铆nimos Cuadrados Ordinarios [2]:

https://www.youtube.com/watch?v=k964_uNn3l0

M茅todo de m铆nimos cuadrados [3].

Dado un set de datos X e Y, siendo Y variable dependiente de X. En su forma m谩s simple, podemos calcular la ecuaci贸n de la recta $\bar{y} = b_0 + b_1\bar{x}$, que nos permitir谩 predecir valores futuros aplicando el siguiente algoritmo.

Para visualizar este concepto, ilustremos el ejemplo realizado por Ricardo Celis [4] en el curso de Regresi贸n Lineal en Platzi.

Dataset

Primero debemos calcular $b_1$ usando la siguiente ecuaci贸n:

$$ b_1 = \frac{\Sigma(x-\bar{x})(y-\bar{y})}{\Sigma(x-\bar{x})^2} $$

Como podemos apreciar en la formula anterior, vamos a necesitar los promedios de $x$ y $y$ denotados como $\bar{x}$ y $\bar{y}$, los cuales sabemos de estad铆stica, que los podemos calcular como la sumatoria de los datos dividido entre el numero de datos:

$$ \bar{x} = \frac{\Sigma x_i}{n} $$

De lo anterior tenemos que $\bar{x} = 3$ y $\bar{y} = 4.2$. Para mayor facilidad de visualizaci贸n de datos para aplicar nuestra formula llenamos la siguiente tabla:

Copy of Valor de Renta Por A帽o

Con la tabla anterior podemos proceder a calcular nuestro $b_1$:

$$ b_1 = \frac{9}{10} = 0.9 $$

Ahora, si despejamos $b_0$ de la ecuaci贸n de la recta podemos calcularlo as铆:

$$ b_0 = \bar{y} - b_1 * \bar{x} = 4.2-0.9*3 = 1.5 $$