Apuntes Distribuciones de Probabilidad
Short Description
Download Apuntes Distribuciones de Probabilidad...
Description
ESTADÍSTICA DESCRIPTIVA DISTRIBUCIONES DE PROBABILIDAD DISTRIBUCIÓN PROBABILÍSTICA Enumeración de todos los resultados de un experimento junto con la probabilidad asociada a cada uno. EJEMPLO: Suponga que se está interesado en el número de águilas que caen al volar tres veces una moneda. Este es el experimento. Los posibles resultados son: cero, uno, dos y tres águilas. ¿Cuál es la distribución probabilística para el número de águilas? SOLUCIÓN: Hay ocho posibles resultados. Posibles resultados 1 2 3 4 5 6 7 8
Tiradas de la moneda Primera Segunda tercera Sol Sol Sol Sol Sol Águila Sol Águila Sol Sol Águila Águila Águila Sol Sol Águila Sol Águila Águila Águila Sol Águila Águila Águila
Número de águilas 0 1 1 2 1 2 2 3
Distribución de probabilidades para los eventos de cero, una, dos y tres águilas resultantes en tres tiradas de una moneda. Número de Águilas x 0 1 2 3 Total
Probabilidad del resultado P(x) 1 0.125 8 3 0.375 8 3 0.375 8 1 0.125 8 8 1.000 8
Nota: La suma de las probabilidades de todos los resultados mutuamente excluyentes es 1.000
1
ESTADÍSTICA DESCRIPTIVA VARIABLES ALEATORIAS Variable aleatoria: Cantidad que es el resultado de un experimento aleatorio el cual, debido al azar, puede tomar valores diferentes. En el ejemplo de la moneda tenemos: Resultados posibles: Águila o sol Evento: Águila Variable aleatoria: x = 1 Variable aleatoria Discreta: Variable que solo puede tener ciertos valores claramente separados, que resultan de contar algún elemento de interés. Variable aleatoria continua: Variable que puede tomar un número infinito de valores dentro de un intervalo dado.
DISTRIBUCIÓN PROBABILÍSTICA BINOMIAL O BINÓMICA (VARIABLE ALEATORIA DISCRETA) Características de la distribución binomial: Un resultado de cada ensayo o realización de un experimento se clasifica en una de dos categorías mutuamente excluyentes: éxito o fracaso. La variable aleatoria es el resultado de contar el número de éxitos en una cantidad fija de ensayos. La probabilidad de un éxito permanece igual para cada ensayo. Lo mismo sucede con la probabilidad de fracaso. Los ensayos son independientes. Lo cual significa que el resultado de un ensayo no afecta el resultado de algún otro.
Para establecer una distribución binomial, se debe saber: 1. El número de ensayos y 2. la probabilidad de éxito en cada ensayo
Distribución probabilística binomial: P(x) =
n! p x (1 p ) n x x!(n x)!
Donde: n es el número de ensayos. x es el número de éxitos. p es la probabilidad de éxito en cada ensayo q = (1 – p) es la probabilidad de fracaso en cada ensayo.
2
ESTADÍSTICA DESCRIPTIVA Ejemplo: Como se sabe, la respuesta a una pregunta de verdadero/ falso es correcta e incorrecta. Considere que: (1) un examen consiste en cuatro preguntas de verdadero/falso, y (2) un estudiante no sabe nada acerca de una materia. La posibilidad (probabilidad) de que el alumno adivine la respuesta correcta a la primera pregunta, es 0.50. Asimismo, la probabilidad de acertar en cada una de las preguntas restantes vale 0.50. ¿Cuál es la probabilidad 1. No obtener exactamente ninguna de las cuatro en forma correcta? 2. Obtener exactamente una de las cuatro? Solución: 1. P (0) =
2. P (1) =
4! (0.50 ) 0 (1 0.50 ) 4 0 0.0625 0!(4 0)! 4! (0.50 )1 (1 0.50 ) 4 1 0.2500 1!(4 1)!
Nota: Estos cálculos se pueden evitar haciendo uso de las tablas de probabilidades. Apéndice A. Ejemplo: Con base en experiencia reciente, 5% de los engranes producidos por una máquina automática de alta velocidad Carter-Bell, resultan defectuosos. ¿Cuál es la probabilidad de que si entran seis engranes seleccionados al azar, exactamente cero sean defectuosos? ¿Exactamente uno? ¿Dos? ¿Tres? ¿Cuatro? ¿Cinco? ¿O exactamente seis de los seis? EJERCICIOS: 1. En una situación binomial n = 4 y p = 0.25. Determine las siguientes probabilidades utilizando la fórmula binómica: a) x = 2 b) x = 3 2. En un caso binomial n = 5 y p = 0.40. Determine las siguientes probabilidades utilizando la fórmula respectiva: a) x = 1 b) x = 2 3. Supóngase que una distribución binomial donde n = 3 y p = 0.60. a) Considere el apéndice A y enuncie las probabilidades de un éxito para valores de x desde 0 hasta 3. 4. Se asegura que el 95% del correo de primera clase se entrega, dentro de la misma ciudad, a los dos días de haber hecho el envío. Se mandan aleatoriamente seis cartas a diferentes sitios. a) ¿Cuál es la probabilidad de que las seis lleguen a su destino dentro de los dos días? b) ¿Cuál es la probabilidad de que exactamente cinco lleguen dentro de dos días? c) Determine la media del número de cartas que llegarán dentro de dos días. Utilice np d) Calcule la varianza y la desviación estándar del número de cartas que llegará dentro de dos días. Utilice 2 np(1 p) 3
ESTADÍSTICA DESCRIPTIVA DISTRIBUCIONES PROBABILÍSTICAS ACUMULATIVAS Ejemplo: Un estudio hecho reciente por la policía federal de caminos reveló que 60% de los conductores en México se coloca el cinturón de seguridad al manejar. Se selecciono una muestra de 10 automovilistas en una carretera de Veracruz. 1. ¿Cuál es la probabilidad de que exactamente 7 llevarán fijo el cinturón? 2. ¿Cuál es la probabilidad de que 7 o menos de los conductores lo lleven puesto? Solución: 1. P(x = 7/ n = 10, p = 0.60) = 0.215 2. P(x 7/ n = 10, p = 0.60) = P(x = 0) + P(x = 1) + P (x =2) + P(x = 3) + P(x = 4) + P(x = 5) + P(X = 6) + P(x = 7). = 0.000 + 0.002 + 0.011 + 0.042 + 0.111 +0.201 + 0.251 + 0.215 = 0.833 EJERCICIOS: 1. en una distribución binomial n = 8 y p = 0.30. Determine las siguientes probabilidades. a) x = 2 b) x 2 c) x 2 2. En una distribución binomial n = 12 y p = 0.60. Determine las siguientes probabilidades. a) x = 5 b) x 5 c) x 6 DISTRIBUCIÓN PROBABILÍSTICA POISSON (VARIABLES DISCRETAS) La forma límite de la distribución binomial cuando la probabilidad de éxito (p) es muy pequeña (menores a 0.05) y n es grande (100 o más) se denomina distribución probabilística Poisson (Ley de eventos improbables). Distribución de Poisson P(x) =
x x!
Donde: (mu) es la media aritmética del número de éxitos en un intervalo de tiempo específico. Es la constante 2.71828 (base del sistema logarítmico neperiano). X es el número de éxitos P(x) es la probabilidad que se va a calcular para un valor dado de x. 4
ESTADÍSTICA DESCRIPTIVA Media de una distribución Poisson
np
EJEMPLO: En la empresa Mexicana de aviación rara vez se pierde el equipaje. En la mayoría de los vuelos no se observa un mal manejo de las maletas; algunos reportan una valija perdida; unos cuantos tienen dos maletas extraviadas; rara vez un vuelo tiene tres; y así sucesivamente. Supóngase que una muestra aleatoria de 1 000 viajes aéreos revela un total de 300 maletas pérdidas. ¿Cuál es la probabilidad de no perder ninguna maleta? P (0) =
(0.30 ) 0 ( 0.30 ) 0.7408 0!
Nota: Para evitar los cálculos se puede utilizar la tabla del apéndice C. Bibliografía utilizada: Estadística para Administración y economía de Mason / Lind / Marchal. 10ª. Edición. Editorial Alfaomega. DISTRIBUCIÓN PROBABILÍSTICA NORMAL (VARIABLES CONTINUAS) Características de la distribución normal y su respectiva curva normal:
La curva normal es acampanada y presenta un solo pico (cresta o curtosis) en el centro de la distribución. La media (aritmética), la mediana y la moda de la distribución son iguales y están localizadas en el pico. De esta forma, la mitad del área bajo la curva se encuentra por arriba de este punto central, y la otra mitad por abajo. La distribución probabilística normal es simétrica con respecto a su media. Si se corta la curva normal verticalmente en este valor central, las dos mitades se reflejan como imágenes en un espejo. La curva normal decrece uniformemente en ambas direcciones a partir del valor central. Es asintótica, lo cual significa que la curva se acerca cada vez más al eje x, pero en realidad nunca llega a tocarlo. Esto es, los puntos extremos de la curva se extienden indefinidamente en uno y otros sentidos. El área total comprendida bajo la curva y por encima del eje horizontal es igual a 1. (unidad cuadrada). La distancia horizontal que hay desde el punto de inflexión de la curva (el punto donde la curva deja ser cóncava hacia abajo y empieza a ser cóncava hacia arriba) hasta una perpendicular levantada sobre la media es igual a la desviación estándar. La distribución normal es realmente una familia de distribuciones, puesto que existe una distribución diferente para cada valor de y .
5
ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN PROBABILÍSTICA NORMAL ESTÁNDAR Se observó que existe una familia de distribuciones normales. Cada distribución tiene media o desviación estándar , con valores diferentes. Por lo tanto el número de distribuciones normales es ilimitado. Por fortuna, puede utilizarse un elemento de la familia de distribuciones normales para todos los problemas donde la distribución resulte aplicable. Tiene una media igual a cero y una desviación estándar igual a 1, y se denomina distribución estándar. Cualquier distribución normal puede convertirse en una distribución normal estándar restando la media a cada observación, dividiendo luego entre la desviación estándar. Valor Z: Diferencia (desviación) entre un valor seleccionado, denotado por x, y la media , dividida tal diferencia entre la desviación estándar . Valor normal estándar Z =
x
Donde: X es el valor de cualquier medida u observación específica. es la media de la distribución. es la desviación estándar de la distribución. APLICACIONES: ¿Cuál es el área bajo la curva entre la media y X para los siguientes valores Z? Valor z calculado Área bajo la curva 2.84 0.4977 1.00 0.3413 0.49 0.1879 -2.04 0.4793 -1.65 0.4505 0.63 0.2357 Se calculará el valor Z cuando se conoce la media poblacional , la desviación estándar de población y una X seleccionada. EJEMPLO: La media de un grupo de ingresos semanales con distribución normal para un gran conjunto de gerentes de nivel medio, es $10 000, y la desviación estándar es de $1 000. ¿Cuál es el valor Z para un ingreso X de $11 000? ¿Y para uno de $9 000? Solución: Para x = $11 000 x Z= 11000 10000 = 1000 Z = 1.00
Para x = $9 000 x Z= 9000 10000 = 1000 Z = -1.00 6
ESTADÍSTICA DESCRIPTIVA Ejercicio: Con la información anterior convierta: a) El ingreso semanal de $12 250 a una unidad estándar (valor Z). b) El ingreso semanal de $ 7 750 a un valor Z. Áreas bajo la Curva Normal 1. Aproximadamente 68% del área bajo la curva normal está dentro de más una y menos una desviaciones estándares respecto a la media. Esto se expresa como 1 . 2. Aproximadamente 95% del área bajo la curva normal está dentro de más dos y menos dos desviaciones estándares respecto a la media. Esto se expresa como 2 . 3. Prácticamente toda el área (99.7%) bajo la curva normal está dentro de tres desviaciones estándares respecto a la media (a uno y otro lado del centro), lo cual se indica por 3 . Diagrama: *EJEMPLO: Una prueba de vida útil para un gran número de pilas alcalinas tipo D, reveló que la duración media para un uso específico antes de la falla, es 19 horas (h). La desviación estándar de la distribución fue 1.2h. 1. ¿Entre qué par de valores falló aproximadamente 68% de las pilas? 2. ¿Entre cuáles dos valores ocurrió la falla de alrededor de 95% de las pilas? 3. ¿Entre qué par de valores fallaron prácticamente todas las pilas? Solución: 1. Entre 17.8h y 20.2h, valores obtenidos de 19.0 1(1.2). 2. Entre 16.6h y 21.4h, valores obtenidos de 19.0 2(1.2). 3. Entre 15.4h y 22.6h, valores obtenidos de 19.0 3 (1.2). Ejercicios: 1. A los empleados de una empresa se les otorgan puntuaciones por eficiencia. La distribución de éstas sigue, aproximadamente, una distribución normal. La media es 400, y la desviación estándar 50. a) ¿Cuánto vale el área bajo la curva normal entre 400 y 482? b) ¿Cuánto vale el área bajo la citada curva para puntuaciones mayores que 482? c) Muestre los aspectos de este problema en un diagrama. 2. Una población normal tiene una media de 20 y una desviación estándar de 4. a) Calcule el valor z asociado a 25. b) ¿Qué porcentaje de la población está entre 20 y 25? c) ¿Qué porcentaje de la población es menor que 18? 3. Una máquina expendedora de refresco se ajusta para servir 7 onzas (oz) del líquido por vaso. La desviación estándar es de 0.10 oz. ¿Cuál es la probabilidad de que la máquina sirva: a) entre 7.10 y 7.25 onzas? 7
ESTADÍSTICA DESCRIPTIVA b) 7.25 oz o más? c) Entre 6.8 y 7.25 onzas? 4. PRUEBA DE HIPÓTESIS
HIPÓTESIS: Enunciado acerca de una población elaborado con el propósito de poner a prueba. PRUEBA DE HIPÓTESIS: Procedimiento basado en la evidencia muestral y en la teoría de la probabilidad que se emplea para determinar si la hipótesis es un enunciado razonable.
PROCEDIMIENTO DE CINCO PASOS PARA PROBAR UNA HIPÓTESIS
Plantear las hipótesis nula y alternativa
Seleccionar un nivel de significación Identificar el estadístico de prueba Formular una regla de decisión
Tomar una muestra y llegar a una decisión.
PASO 1: PLANTEAR LA HIPÓTESIS NULA (H0) Y LA HIPÓTESIS ALTERNATIVA (H1) HIPÓTESIS NULA Afirmación (o enunciado) acerca del valor de un parámetro poblacional. Se designa mediante H0 y se lee “H subcero”. Donde la H significa hipótesis y el subíndice cero “no hay diferencia”.
8
ESTADÍSTICA DESCRIPTIVA HIPÓTESIS ALTERNATIVA Afirmación que se aceptará si los datos maestrales proporcionan amplia evidencia de que la hipótesis nula es falsa. Se designa por H1 y se lee “H subuno”. Con frecuencia se denomina también como la hipótesis de investigación. Hay tres maneras diferentes de plantear ambas hipótesis, por ejemplo: H0: 15 H1: 15
H0: 15 H1: 15
H0: 15 H1: 15
NOTA: Como puede observarse la hipótesis nula siempre incluirá el signo igual porque la hipótesis nula es un enunciado a probar. La hipótesis alternativa nos dirá si se trata de una prueba de una o dos colas. En el ejemplo anterior: el primer caso la hipótesis alternativa describiría que se trata de dos colas debido a que el signo no indica dirección, en el segundo caso, se trata de una cola a la derecha, mientras que en el tercero nos indica una cola a la izquierda. PASO 2. SELECCIONAR EL NIVEL DE SIGNIFICANCIA. Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se denota por , la letra griega alfa, algunas veces también se denota nivel de riesgo (riesgo que existe al rechazar la hipótesis nula cuando en realidad es verdadera). Se recomienda utilizar los niveles: 0.01 para aseguramiento de calidad 0.05 para proyectos de investigación sobre consumo 0.10 para encuestas políticas. ERROR TIPO I. Rechazar la hipótesis nula, H0 cuando en realidad es verdadera. ERROR TIPO II. Aceptar la hipótesis nula cuando en realidad es falsa. EJEMPLO: Una muestra de 50 tableros de circuitos que se recibió en cierto día de una empresa electrónica, reveló que cuatro de ellos- o sea el 8%estaban por debajo del estándar. El embarque se rechazó porque excedía el máximo del 6% de tableros de tipo subestándar, sin embargo, si estos 4 son los únicos de un embarque de 4 000 tableros sería un error de tipo I rechazar la remesa. Si en la muestra dos de los 50 tableros estuvieran por debajo del estándar, diríamos que 48 cumplen con los requisitos de calidad, pero que pasa si resulta que estos 48 eran los únicos aceptables de todo el embarque se cometería un error de tipo II. TABLA QUE RESUME LAS DECISIONES QUE PODRÍA TOMAR EL INVESTIGADOR Y LAS CONSECUENCIAS POSIBLES.
Hipótesis Nula
INVESTIGADOR Se acepta H0 Se rechaza H0 9
ESTADÍSTICA DESCRIPTIVA H0 es verdadera H0 es falsa
Decisión correcta Error de tipo II
Error de tipo I Decisión correcta
PASO 3. CALCULAR EL VALOR ESTADÍSTICO DE PRUEBA. Valor Estadístico de Prueba: Valor obtenido a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula. En las pruebas de hipótesis para la media ( ), el valor estadístico de prueba z se determina a partir de: z de distribución como valor estadístico de prueba z =
x / n
El valor z se basa en la distribución muestral de x, que se distribuye de manera normal cuando la muestra es razonablemente grande con una media ( x ) igual a , y una desviación estándar x , que es igual a n .
PASO 4. FORMULAR LA REGLA DE DECISIÓN. Una regla de decisión es un enunciado de las condiciones según las que se acepta o se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores que son demasiado grandes o demasiado pequeños, por lo que es muy remota la probabilidad de que ocurran según una hipótesis nula verdadera. Valor Crítico: Número que es el punto divisorio entre la región de aceptación y la región de rechazo, de la hipótesis nula.
PASO 5. TOMAR UNA DECISIÓN. Con base a información muestral, se calcula z y a través del diagrama de la distribución normal teniendo ubicado el valor crítico, se observa si éste valor de z calculado se encuentra dentro o fuera de la región de aceptación de la hipótesis nula, y es así como se toma la decisión de aceptar o rechazar la hipótesis nula establecida. PRUEBA DE SIGNIFICANCIA DE UNA Y DE DOS COLAS. PRUEBA DE DOS COLAS
10
ESTADÍSTICA DESCRIPTIVA EJEMPLO: Una empresa fabrica y ensambla escritorios y otros muebles para oficina, en diversas plantas en México. La producción semanal del escritorio Modelo A325 en la planta 1, se distribuye normalmente, con una media de 200 y una desviación estándar de 16. Recientemente debido a la expansión del mercado, se han introducido nuevos métodos de producción y se han contratado más empleados. El vicepresidente de la compañía quisiera saber si ha habido un cambio total en la producción semanal del citado mueble de oficina, es decir, ¿el número medio de escritorios producidos en la planta mencionada es diferente de 200? Utilice el nivel de significancia de 0.01. Solución: Paso 1. H0: 200 H1: 200 Paso 2.
0.01 (Probabilidad de rechazar una hipótesis verdadera)
Paso 3. z=
x / n
Paso 4. Diagrama que muestra la regla de decisión para el nivel de significación 0.01 *La regla de decisión se formula hallando el valor crítico de z a partir del apéndice D. Puesto que esta es una prueba de dos colas, la mitad de 0.01, o sea 0.005, está en cada cola. El área de aceptación H 0, que se localiza entre las dos colas, vale, por consiguiente 0.99. El apéndice D se basa sólo en la mitad del área bajo la curva, o sea, 0.5000. De tal manera que tenemos (0.5000 – 0.005 = 0.4950), esto nos permite localizar el valor en la tabla, encontrando que el valor más cercano a éste es 0.4951 el cual nos permite obtener el valor crítico que es 2.58. Por consiguiente, la regla de decisión es: si el valor z calculado no que da en la región entre -2.58 y +2.58 se rechaza la hipótesis nula y se acepta la hipótesis alternativa. En caso contrario, no se descarta la hipótesis nula. Paso 5. Se toma una muestra de la población (producción semanal); y se calcula z y –con base a la regla decisoria- se decidirá rechazar H0 o no rechazarla. El número medio de escritorios producidos en el último año (50 semanas, porque la planta estuvo cerrada dos por vacaciones), es de 203.5. La desviación estándar de la población es de 16 escritorios al mes. Calculando z queda: z=
x 203 .5 200 1.55 = / n 16 / 50
11
ESTADÍSTICA DESCRIPTIVA Puesto que 1.55 no cae en la región de rechazo, H0 no se descarta. De modo que se concluye que la media de la población no es distinta de 200. Es decir que no se encuentra suficiente evidencia para refutar la hipótesis nula. EJERCICIO: La tasa anual media de resurtido de botellas de 200 aspirinas es de 6.0 (Esto indica que las existencias del medicamento tienen que renovarse en promedio 6 veces al año en un establecimiento.) La desviación estándar es de 0.50. Se sospecha que el volumen de ventas promedio ha cambiado y no es 6.0. Se utilizará el nivel de significancia de 0.05 para probar esta hipótesis. a) Plantee las hipótesis nula y alternativa. b) ¿Cuál es la probabilidad de un error tipo I? c) Proporcione la fórmula para el valor estadístico de prueba. d) Enuncie la regla de decisión. e) Se seleccionó una muestra aleatoria de 64 frascos de tal producto, con una media de 5.84. ¿Debe rechazarse la hipótesis de que tal media poblacional es 6.0? Interprete el resultado.
PRUEBA DE UNA COLA Considerando la información del ejemplo anterior. Supóngase que el vicepresidente desea saber si ha habido un aumento en el número de unidades ensambladas. De otra manera, ¿se puede concluir-ya que se tienen mejores métodos de producción-que el número medio de escritorios armados en las últimas 50 semanas fue mayor que 200? Paso 1.
H0: 200 H1: 200
Paso 2.
0.01 (Probabilidad de rechazar una hipótesis verdadera) En este caso como la prueba es de una cola a la derecha la región de rechazo es de0.01 en una sola extremidad. Paso 3. z=
x / n
Paso 4. Diagrama que muestra la regla de decisión para el nivel de significación 0.01
*La regla de decisión se formula hallando el valor crítico de z a partir del apéndice D. Puesto que esta es una prueba de una cola el valor crítico es de 12
ESTADÍSTICA DESCRIPTIVA 2.33, obtenido de (0.5000 – 0.01 = 0.4900). Por lo tanto, la regla de decisión queda de la siguiente manera: Si al calcular el valor z de la muestra, este es menor o igual a 2.33 la hipótesis nula se acepta de lo contrario se rechaza y se acepta la hipótesis alternativa.
Paso 5. z=
x 203 .5 200 1.55 = / n 16 50
Por lo tanto se acepta la hipótesis nula y se rechaza la hipótesis alternativa debido a que no hay suficiente evidencia para rechazarla. PRUEBAS PARA LA MEDIA DE POBLACIÓN: MUESTRA GRANDE Y SE DESCONOCE LA DESVIACIÓN ESTÁNDAR POBLACIONAL. Valor z; se desconoce
z
x s/ n
EJEMPLO: Una cadena de tiendas de descuento expide su propia tarjeta de crédito. El gerente de esta función desea averiguar si el saldo insoluto medio mensual es mayor que $4000 (pesos). El nivel de significancia se fija en 0.05. Una revisión aleatoria de 172 saldos insolutos reveló que la media muestral es $4 070 y que la desviación estándar de la muestra vale $ 380. ¿Debería concluir el funcionario de crédito que la media poblacional es mayor que $4 000, o bien es razonable suponer que la diferencia de $70 se bebe al azar?
Solución: Paso 1.
H0: $4000 H1: $4000
Paso 2.
005
Paso 3. z
x s/ n
Paso 4. Debido a que la hipótesis alternativa indica un sentido o dirección, se aplica una prueba de una cola a la derecha, como lo muestra el diagrama.
13
ESTADÍSTICA DESCRIPTIVA El valor crítico de z es 1.65, por lo tanto, si al calcular z de la muestra este valor es menor o igual a 1.65 la hipótesis nula se acepta de lo contrario se rechaza y se acepta la hipótesis alternativa. Paso 5. z
x 4070 4000 2.42 s/ n 380 / 172
Debido a que el valor estadístico de prueba calculado 2.42 es mayor que el valor crítico de 1.65, la hipótesis nula se rechaza y se acepta la hipótesis alternativa. El gerente de crédito puede concluir que el saldo insoluto medio es mayor que $4 000. EJERCICIOS: Para los ejercicios del 1 al 4 aplique los cinco pasos para probar la hipótesis. 1. Se ha dado la siguiente información. H0 = 50 H1 = 50 La media muestral es 49, y el tamaño de muestra, 36. La desviación estándar de la población es 5. Utilice el nivel de significancia de 0.05. 2. Se dispone de la siguiente información: H 0 10
H1 10 La media muestral es 12 para una muestra de 36. La desviación estándar de la población es 3. Utilice el nivel de significancia de 0.02. 3. Una muestra de 36 observaciones se selecciona de una población normal. La media muestral es 21, y la desviación estándar de la muestra, 5. Efectúe la siguiente prueba de hipótesis utilizando el nivel de significancia de 0.05. H 0 : 20 H1 : 20 4. Una muestra de 64 observaciones se selecciona de una población normal. La media muestral es 215, y la desviación estándar de la muestra es 15. Realice la siguiente prueba de hipótesis utilizando el nivel de significancia de 0.03. H 0 : 220 H1 : 220 ESTIMACIONES PUNTUALES E INTERVALOS DE CONFIANZA Estimación Puntual: El valor, calculado a partir de la información de muestreo, que se emplea para estimar el parámetro de población. Intervalo de Confianza: Una gama de valores obtenidos a partir de datos de muestreo, de modo que el parámetro ocurre dentro de esa variedad a una probabilidad específica. La probabilidad específica en cuestión se denomina el nivel de confianza. 14
ESTADÍSTICA DESCRIPTIVA s n
Intervalo de Confianza para una media x z
EJEMPLO: En un experimento se trata de seleccionar una muestra aleatoria de 256 gerentes de nivel medio. Un elemento de interés es su ingreso anual. La media muestral vale $454 200 y la desviación estándar en la muestra, es $20 500. a) ¿Cuál es el ingreso medio estimado de todos los gerentes de nivel medio? Es decir, ¿cuál es la estimación puntual? b) ¿Cuál es el intervalo de confianza de 95% para la media de la población? c) ¿Cuáles son los límites del intervalo de confianza de 95%, para la media de la población? d) Interprete los resultados.
SELECCIÓN DEL TAMAÑO DE MUESTRA ADECUADO
1. El nivel de confianza deseado 2. El máximo error permisible por el investigador 3. La variación en la población que se estudia
z*s n E
2
n = p (1 – p) (z / E)2
Ejercicios: 1. Se estima que una población tiene una desviación estándar de 10- Ha de evaluarse la media de la población dentro de 2, con un nivel de confianza de 95%. ¿Qué tamaño se requerirá para la muestra? 2. Se requiere estimar la media poblacional dentro de 5, con un nivel de confianza de 99%. La desviación estándar de la población se determina que es 15. ¿Qué tamaño debe tener la muestra? 3. El valor de la proporción de población ha de estar entre ± 0.05, con un nivel de confianza de 95%. El mejor cálculo de la proporción de la población es 0.15. Qué tamaño se requerirá para la muestra?
15
View more...
Comments