sábado, 6 de junio de 2020

TEMA 9: INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS

LA INFERENCIA ESTADÍSTICA
Es generalizar los datos obtenidos en la muestra a la población de la que procede, de manera que al extender los resultados de la muestra a un colectivo mayor, asumimos que puede haber variables o elementos en la población que difieran de los que componen la muestra y por ello asumimos que al inferir o generalizar los hallazgos obtenidos tenemos alguna probabilidad de cometer un error. 

Al conjunto de procedimientos estadísticos que permiten pasar de lo particular a lo general lo denominamos inferencia estadística.
Exige aletoriedad.

Se divide en dos formas:

- Estimación del valor de la población a partir de un valor de la muestra: el valor de la población se denomina parámetro y es cada uno de los estadísticos que nos proporcionan información sobre la población y el valor de la muestra se denomina estimador que es le índice que representa una información de la muestra estudiada. Las propiedades deseables del estimador son: insesgadez (la diferencia entre el parámetro a estimar y la esperanza de nuestro estimador tendría que ser 0), eficiente (cuando la varianza es reducida) y consistencia (consiste que a medida que la muestra crece se aproxima cada vez más al valor real del parámetro).

-Contraste de hipótesis: a partir de valores de la muestra, se concluye si hay diferencias entre ellos en la población.


FORMAS DE ESTADÍSTICA INFERENCIAL


Pruebas paramétricas:

  • T-Student: es el valor t. Se utiliza para determina si hay una diferencia significativa entre las medidas de dos grupos, es decir, que se utiliza cuando deseamos comparar dos medias. Se utiliza para la comparación de dos medias de poblaciones independientes normales. Asumimos que las variables dependientes tienen una distribución normal.
  • Anova (análisis de la varianza): es un método para comparar dos o más medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student.
  • Prueba de Fisher: es el test exacto utilizado cuando se quiere estudiar si existe asociación entre dos variables cualitativas, es decir, si las proporciones de una variable son diferentes dependiendo del valor que adquiera la otra variable.
  • Coeficiente de correlación de Pearson: se utiliza para estudiar la relación (o correlación) entre dos variables aleatorias cuantitativas (escala mínima de intervalo); por ejemplo, la relación entre el peso y la altura. Es una medida que nos da información acerca de la intensidad y la dirección de la relación.
Pruebas no paramétricas:
  • de Mann-Whitney (Mann-whitney-Wilcoxon, prueba de suma de rangos): es una prueba no paramétrica aplicada a dos muestras indepentiente. Es la versión no paramétrica de la habitual prueba “t” de Student.
  • Prueba de Kruskal-Wallis (de William Kruskal y W.Allen Wallis): es un método no paramétrico para probar si un grupo de datos proviene de la misma población. Intuitivamente, es idéntico al ANOVA con los datos reemplazados por categorías. Es una extensión de la prueba de la U de Mann-Whitney para 3 o más grupos.
  • En estadística las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables, habitualmente de naturaleza cualitativa-nominales u ordinales.


 ¿Qué es la estimación puntual?
Es cuando se utiliza un único valor para estimar ese parámetro, es decir, se usa un punto en concreto de la muestra para estimar el valor deseado.


¿Qué es la estimación por intervalos?
Informa de la probabilidad de que el parámetro poblacional se encuentre entre unos valores determinados.

FACTORES DE LOS QUE DEPENDE UN INTERVALO DE CONFIANZA

-Tamaño de la muestra seleccionada
-Nivel de confianza
-Margen de error de nuestra estimación
-Lo estimado en la muestra (media, varianza, diferencia de medias)

ERROR ESTÁNDAR
Es la medida que trata de captar la variabilidad de los valores estimado. Mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.
Cuánto más pequeño es más nos podemos fiar.
Fórmula:
EJERCICIOS PARA CALCULAR EL ERROR ESTÁNDAR
  1. Una agencia de encuesta selecciona 900 familias y calcula la proporción de éstas que utilizan cierto tipo de detergente. Si la proporción estimada es 0´35 ¿Cuál es el error estándar estimado? (Sol. 0´016).
  1. En el estudio de cierta característica X de una población se sabe que la desviación estándar es 3. Se va a escoger una muestra de tamaño 100, halle el error estándar de la media muestral. (Sol. 0´3).
  1. Se escogió al azar una muestra de 10 clientes de un banco y se les preguntó el número de veces que habían utilizado el banco para llevar a cabo alguna transacción comercial. Los resultados fueron los siguientes: 0, 4, 2, 3, 2, 0, 3, 4, 1, 1. Estime el error estándar del número de transacciones promedio. ( Sol. 0´47).

A continuación se muestra un vídeo explicativo de los intervalos de confianza


No hay comentarios:

Publicar un comentario