Inferencia estadística

La Inferencia estadística estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.

Muestreo probabilístico

Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos de muestreo:

Muestreo aleatorio simple

    Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar los n elementos que contiene la muestra.

Muestreo aleatorio sistemático

    Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra.

    Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el intervalo de selección que será igual a 100/25 = 4. A continuación elegimos el elemento de arranque, tomando aleatoriamente un número entre el 1 y el 4, y a partir de él obtenemos los restantes elementos de la muestra.

2, 6, 10, 14,..., 98

Muestreo aleatorio estratificado

    Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de cada estrato proporcional al número de componentes de cada estrato.

Ejemplo

En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.

solución

solución

solución

solución


Un muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita.

En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición.

Si consideremos todas las posibles muestras de tamaño n en una población, para cada muestra podemos calcular un estadístico (media, desviación típica, proporción, ...) que variará de una a otra.

Así obtenemos una distribución del estadístico que se llama distribución muestral.

Intervalos característicos

P[μ - k < x < μ + k] = p

Hallar el intervalo característico de una distribución normal N(0, 1) correspondiente a la probabilidad p = 0.9.


gráfica

solución


El nivel de confianza (p) se designa mediante 1 - α.

El nivel de significación se designa mediante α.

El valor crítico (k) como z α/2 .

P(Z>z α/2) = α/2      P[-z α/2 < z < z α/2] = 1- α


Valores críticos

1 - α α/2 z α/2
0.90 0.05 1.645
0.95 0.025 1.96
0.99 0.005 2.575

En una distribución N(μ, σ ) el intervalo característico correspondiente a una probabilidad p = 1 - α es:

(μ - z α/2 · σ , μ + z α/2 · σ )

1 - α α/2 z α/2 Intervalos característicos
0.90 0.05 1.645 (μ - 1.645 · σ , μ + 1.645 · σ)
0.95 0.025 1.96 (μ - 1.96 · σ , μ + 1.96 · σ )
0.99 0.005 2.575 (μ - 2.575 · σ , μ + 2.575 · σ )

Teorema central del límite

Si una población tiene media μ y desviación típica σ, y tomamos muestras de tamaño n (n>30, ó cualquier tamaño si la población es "normal"), las medias de estas muestras siguen aproximadamente la distribución:

N

Consecuencias:

1.Permite averiguar la probabilidad de que la media de una muestra concreta esté en un cierto intervalo.

2.Permite calcular la probabilidad de que la suma de los elementos de una muestra esté, a priori, en un cierto intervalo.

N

3.Inferir la media de la población a partir de una muestra.


Ejemplo

Las bolsas de sal envasadas por una máquina tienen μ = 500 g y σ = 35 g. Las bolsas se empaquetaron en cajas de 100 unidades.

1.Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor que 495 g.

 solución

 solución

 solución

2.Calcular la probabilidad de que una caja 100 de bolsas pese más de 51 kg.

 solución

 solución

 solución