En la estadística el punto de partida son los datos experimentales que consisten en las observaciones de variables aleatorias y partir de ellas buscar conocer las distribuciones que pueden haber generado dichos resultados.
Inferencia: Construir un modelo sobre la base de datos experimentales y extraer conclusiones.
Población: Totalidad de los resultados experimentales posibles.
Muestra: Conjunto de datos que se obtiene al realizar el experimento una cierta cantidad de veces.
Un problema básico de la estadística es como extraer información de las muestras para usar esa información al estudiar las poblaciones de las cuales se obtuvieron dichas muestras.
Variable aleatoria $X$, definida sobre $(\Omega,\Lambda,P)$ con distribución $F_X(x)=P(X\le x)$ que se desconoce, al menos parcialmente.
Supongamos que tenemos un experimento aleatorio relacionado a la VA $X$ la cual representa lo que llamamos un “observable” del experimento aleatorio. Es decir, $X$ representa una magnitud física que se puede medir cuando realizamos el experimento. Los valores de $X$ van a constituir la población sujeta al estudio. Buscamos saber como se comporta dicha población. Es decir, queremos conocer la distribución de la VA $X$.
Se dispone de una muestra aleatoria de volumen infinito (es decir, suponemos que se pueden examinar tantas repeticiones del experimento como se desee)
Muestra aleatoria: Sucesión de $X_1,X_2,X_3,...$ todas $iid$ a $X$.
Por lo tanto, dada una muestra aleatoria, tendremos que
$$
F_{X_1,...,X_n}=P(X_1\leq x_1,...,X_n\le x_n)= \prod_{i=1}^{n}F_X(x_i), \ \forall \ n \ \epsilon \ \N $$