Hola, bienvenid@s a este curso.
Un curso muy sencillito y ameno. Así que no me entretengo. Vamos a por él.
MUESTREO Y ESTIMACIÓN
TIPOS DE MUESTREO:
- Muestreo aleatorio simple: Vamos a numerar los N individuos de
la población y por sorteo, seleccionamos los n individuos que compondrán la muestra
- Muestreo aleatorio sistemático: Numeramos los N individuos de
la población. Elegimos por sorteo un individuo cualquiera y supongamos que el número asignado para ese .
Hallamos k, el entero más próximo a N/n donde n es el tamaño de la muestra.
Seleccionamos el individuo y los siguientes, de k en k a partir de , teniendo en cuenta que, al sobrepasar N, debemos empezar de nuevo.
- Muestreo aleatorio estratificado con afijación proporcional: La
Población está formada por grupos o estratos diferenciados y queremos que todos los grupos estén representados proporcionalmente.
Para ello, vamos a obtener de forma proporcional (con regla de tres) el tamaño de las submuestras correspondientes a cada estrato y después seleccionamos cada submuestra por muestreo aleatorio simple o sistemático
De este tipo, vamos a ver un ejemplo, puesto que, suele caer mucho en los ejercicios de los exámenes.
Tenemos una empresa con 1000 emplead@s, de los cuales 500 trabajan en el sector 1, 300 trabajan en el sector 2 y 200 lo hacen en el sector 3. Si queremos seleccionar una muestra representativa de 500 trabajadores por muestreo aleatorio con afijación proporcional:
Si de 1000 emplead@s, 500 son del sector 1
De 500 emplead@s, seleccionaremos x del sector 1
x = = 250 emplead@s del sector 1 tomaríamos para la muestra
Ahora lo mismo, para los otros sectores:
Si de 1000 emplead@s, 300 trabajan en el sector 2
De 500 emplead@s, seleccionamos x del sector 2
x = = 150 emplead@s del sector 2 tomaríamos para la muestra
Y la diferencia hasta 500, es decir 100 tomaríamos del sector 3 para la muestra.
INTERVALO DE CONFIANZA: Llamamos así a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto o como su propio nombre indica, de confianza.
Este intervalo de confianza podemos hacerlo para valores como la media, la proporción o una diferencia de medias.
Su expresión será un error menos la media, proporción o diferencia de medias y el otro extremo lo definirá un error más la media, proporción o diferencia de medias. Vamos a ver cómo se calcula en cada caso:
El error máximo para la media: E = , donde es un estimador (valor que sacamos de la tabla, en función del nivel de confianza con el que queramos hacer el intervalo)
El nivel de confianza vendrá dado por un porcentaje, lo llamaremos y en la tabla buscamos el nivel de significancia s = 1 –
es la desviación típica y n es el tamaño de la muestra
En este caso, el intervalo de confianza será: I. C. =
El error máximo para la proporción es: E = , donde p es la proporción. Y su intervalo de confianza será: I.C. =
Y por último el error para la diferencia de medias será: E = y por tanto, su I.C. =
Siendo la longitud del intervalo la diferencia entre un extremo y otro, es decir, extremo mayor menos extremo menor.
longitud = (esto puede hacerse con cualquiera de los tipo de intervalo y siempre saldrá lo mismo, que la longitud de un intervalo, equivale al doble del error)
En la pestaña de materiales, te dejo la tabla que usaremos para buscar el valor de en función del nivel de significancia, S.
CONTRASTE DE HIPÓTESIS:
Para decidir si una hipótesis se acepta o rechaza, nos basamos en los test de errores.
En este caso vamos a considerar que aceptamos una hipótesis si el valor que nos da está dentro del intervalo de confianza que calcularemos. Se rechazará si está fuera de este intervalo.
Si aceptamos un valor y éste es verdadero, o bien, rechazamos un valor y es falso, no estaremos cometiendo ningún error.
Si aceptamos un valor, y este es falso, cometeremos un error que vamos a llamar de tipo I.
Si rechazamos un valor y éste era verdadero, cometeremos un error que vamos a llamar de tipo II.
Vamos a ver un ejemplo:
En un determinado instituto aseguran que las notas obtenidas por sus alumnos en las pruebas de acceso a la Universidad tienen una media igual o superior a 7 puntos. Pero la media obtenida en una muestra aleatoria de 80 alumnos en los últimos exámenes fue de 6,89 puntos. Si sabemos que la varianza es igual a 4,84, ¿podemos considerar, con un nivel de significación del 1%, que la afirmación hecha por el instituto es cierta?
Lo primero que se observa es que nos están hablando de medias, por lo que ya sabemos que vamos a hacer, tanto el error como el intervalo de confianza respecto a ella.
Datos:
- = 89
- = 4.84 , por tanto la desviación será:
- S = 1% = 0.01, buscamos en la tabla este valor y obtenemos que = 2.576
- n = 80
Con todo esto vamos a calcular el error máximo para la media:
E = = = 0.63
EL intervalo de confianza será: I. C. = = (6.89-0.63 , 6.89+0.6) = (6.26, 7.52)
Como el valor dado en el enunciado como media era 7 y este valor está dentro de este intervalo de confianza, podríamos aceptar la hipótesis como correcta.
Y ahora, ya sabes…a poner en práctica todo esto con los ejercicios que te he dejado en la pestaña de materiales