Ejercicios Resueltos de Probabilidades2
Short Description
Download Ejercicios Resueltos de Probabilidades2...
Description
Ejercicios PROBABILIDADES. Ejemplo: Hallar la probabilidad de sacar una suma de 8 puntos
al lanzar dos dados.
1,1 1,2 1,3 1,4 1,5 1,6 2,1 2,2 2,3 2,4 2,5 2,6 3,1 3,2 3,3 3,4 3,5 3,6 4,1 4,2 4,3 4,4 4,5 4,6 5,1 5,2 5,3 5,4 5,5 5,6 6,1 6,2 6,3 6,4 6,5 6,6 P = 5/36 = 0.1389 Ejemplo: Cual es la probabilidad de la siguiente valuación cualitativa: Calificación Muy deficiente Deficiente Bueno Muy bueno Total
ni 30 20 16 14 80
pi Pi = ni/total
1.0000
LA DISTRIBUCIÓN DIS TRIBUCIÓN BINOMIAL . Se aplica cuando se realizan un número "n" de veces el experimento de Bernouiili, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre: 0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido éxitos La distribución de probabilidad de este tipo de distribución sigue el siguiente modelo:
Ejemplo: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? " k " es el número de aciertos, k = 6, " n" es el número de ensayos, n = 10, " p " es la probabilidad de éxito, salga "cara" p = 0,5
P (x = 6) = 0,205 Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda. Ejemplo: ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho veces? " k " número de aciertos aciertos = 4, " n" toma el valor 8, " p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 = 0,1666 GEOESTADISTICA-I
Página 1
P (x = 4) = 0,026 Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el números 3 al tirar un dado 8 veces. LA DISTRIBUCIÓN DE POISSON. Es parte de la distribución binomial, cuando en una distribución binomial se realiza el experimento un número "n" muy elevado de veces y la probabilidad de éxito "p" en cada ensayo es reducida, entonces se aplica el modelo de distribución de Poisson. Se tiene que cumplir que: " p " < 0,10 y " p * n " < 10
"e" es 2,71828 " "=n*p " k " es el número de éxito cuya probabilidad se está calculando Ejemplo: La probabilidad de tener un accidente de tráfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, ¿cual es la probabilidad de tener 3 accidentes? Probabilidad "p" < que 0,1, “n*p” < 10, aplicamos el modelo de distribución de Poisson.
P (x = 3) = 0,0892 Por lo tanto, la probabilidad de tener 3 accidentes de tráfico en 300 viajes es del 8,9% probabilidad de que un niño nazca pelirrojo pelirrojo es de 0,012. ¿Cuál ¿Cuál es la probabilidad probabilidad de Ejemplo: La probabilidad que entre 800 recién nacidos haya 5 pelirrojos?
P (x = 5) = 4,602 Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recién nacidos es del 4,6%.
DISTRIBUCIONES NORMAL Es el modelo de distribución más utilizado en la práctica, 2 X N( , ) Cuando la media de la distribución es 0 y la varianza es 1se denomina "normal estandarizada", y su ventaja reside en que hay tablas tablas donde se recoge la probabilidad probabilidad acumulada acumulada para cada punto de la curva de esta distribución. Z= (X - )/
Z N (0, ) Ejemplo: una variable aleatoria sigue el modelo de una distribución normal con media 10 y vari varian anza za 4, para para una una vari variab able le X dist distri ribu buid ida a entr entre e 15 y 20. 20. Tran Transf sfor orma marl rla a en una una norm normal al estandarizada. X N (10, 4) P [ 15 ≤ x ≤ 20] GEOESTADISTICA-I
Página 2
P [ (15-10)/2 ≤ (X-10)/2 ≤ (20-10)/2 ]
P [ 2.5 ≤ Z ≤ 5 ] P = 0.5 - 0.4938 = 0.0062
una vari variab able le alea aleato tori ria a sigu sigue e el mode modelo lo de una una dist distri ribu buci ción ón con con las las sigu siguie ient ntes es Ejemplo: una características, transformarla en una normal estandarizada. X N (20.5, 52) P [ 44.5 ≤ x ≤ 60.3] P = 0.3849 + 0.4750 = 0.8599 = 85.99% Ejemplo: El diámetro interno de un aro de pistón esta distribuido normalmente con media de 4.5 cm. y una desviación estándar de 0.005 cm. ¿Qué porcentaje de aros tendrán un diámetro que exceda a 4.51 cm.? µ = 4.5 cm. σ = 0.005 cm. > 4.51 cm. %? X N (4.5 cm.,0.005 2cm2.) P [ x ≥ 4.51] P = 0.5 – 0.4772 = 0.0228 = 2.28 %
Ejemplo: el salario medio de los empleados de una empresa se distribuye según una distribución normal, normal, con una media 5 mil $. y desviación desviación típica típica de mil $. Calcular el porcentaje porcentaje de empleados con un sueldo inferior a 7 mil $. X N (5000 $,1000 2$2) P [ x ≤ 7000 $] P [ z ≤ 2] P = 0.5 + 0.47725 = 0.97725
Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 mil $ es del 97,725%. Ejemplo: La renta media media de los hab habita itante ntess de un paí paíss es de 4 mil millon lones es de pta ptas/a s/año, ño, con una varianza de 1,5. Se supone que se distribuye según una distribución normal. Calcular: a) Porcentaje de la población con una renta inferior a 3 millones de ptas. b) Renta a partir de la cual se sitúa el 10% de la población con mayores ingresos. c) Ingresos mínimo y máximo que engloba al 80% de la población con renta media. µ = 4 millones σ 2 = 1.5 X N (4 , 1.5)
a) Porcentaje de la población con una renta inferior a 3 millones de ptas. P [ x ≤ 3] P [ z ≤ -0.82] P = 0.5 - 0.29389 = 0.20611
Luego, el 20,61% de la población tiene una renta inferior a 3 millones ptas. GEOESTADISTICA-I
Página 3
b) Nivel de ingresos a partir del cual se sitúa el 10% de la población con renta más elevada. Según el área es el 90% de probabilidad acumulada, lo que quiere decir que por encima se sitúa el 10% superior. P = 90% de 0.5 (área total) = 0.45 (se ubica en la tabla de cómo área de probabilidad) Z para 0.45 es = 1.65 Despejando X de Z = (X - )/ X = 6.02 Por lo tanto, aquellas personas con ingresos superiores a 6.02 millones de ptas. constituyen el 10% de la población con renta más elevada. c) Nivel de ingresos mínimo y máximo que engloba al 80% de la población con renta media Vemos en la tabla el valor de la variable normalizada Y cuya probabilidad acumulada es el 0,8 (80%). P = 80% de 0.5 = 0.4 (se ubica en la tabla como área) Limites de control Max y Min (+ y -) Z para 0.40 es = 1.28 Despejando X de Z = (X - )/ X = 5.567 es el valor mayor, y el valor menor es: 4 – (5.567 - 4) = 2.433 Por lo tanto, las personas con ingresos superiores a 2,433 millones de ptas. e inferiores a 5,567 millones de ptas. constituyen el 80% de la población con un nivel medio de renta. Ejemplo: La vida media de los habitantes de un país es de 68 años, con una varianza de 25. Se hace un estudio en una pequeña ciudad de 10.000 habitantes: a) ¿Cuántas personas superarán previsiblemente los 75 años? b) ¿Cuántos vivirán menos de 60 años? a) Personas que vivirán (previsiblemente) más de 75 años Calculamos el valor de la normal tipificada equivalente a 75 años X N ( 68 años , 25 años) P [ x ≥ 75] P [ Z ≥ 1.4 ] P = 0.5 – 0.41924 = 0.08076 = 8.1 %
Luego, el 8,076% de la población de 10,000 es 808 habitantes que vivirán más de 75 años.
b) Personas que vivirán (previsiblemente) menos de 60 años P [ x ≤ 60] P [ z ≤ -1.6] P = 0.5 – 0.44520 = 0.0548
Luego, el 5,48% de la población es 548 habitantes que no llegarán probablemente a esta edad. Ejercicio: El consumo medio anual de cerveza de los habitantes de un país es de 58 litros, con una varianza de 36. Se supone que se distribuye según una distribución normal. a) Si usted presume de buen bebedor, ¿cuántos litros de cerveza tendría que beber al año para pertenecer al 5% de la población que más bebe? b) Si usted bebe 45 litros de cerveza al año y su mujer le califica de borracho ¿qué podría argumentar en su defensa? GEOESTADISTICA-I
Página 4
a) 5% de la población que más bebe. Vemos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,95 (95%), por lo que por arriba estaría el 5% restante. Área = 0.5*0.95 = 0.475 Tabla al revés = para 0.475 se tiene Z = 1.96 Z= (X - µ )/σ 1.96 = ( X – 58 ) / 6 X = ( 1.96 * 6 ) + 58 X = 69.76 Por lo tanto, tendría usted que beber más de 69,76 litros al año para pertenecer a ese "selecto" club de grandes bebedores de cerveza. b) Usted bebe 45 litros de cerveza al año. ¿Es usted un borracho? P [ X ≤ 45 ] P [ Z ≤ -2.17 ] P [ Z ≥ 2.17 ] P = 0.4850 Pero para no ser borracho tiene que ser menor (6to. Caso): P = 0.5 – 0.4850 = 0.015 Por lo tanto, sólo un 1,5% de la población bebe menos que usted. Parece un argumento de suficiente peso para que dejen de catalogarle de "enamorado de la bebida" P = 0.5 – 0.475 = 0.025 X N (20.5, 52) P [ 44.5 ≤ x ≤ 60.3] P = 0.3849 + 0.4750 = 0.8599 = 85.99% Ejercicio: Un estudio de la DGT estima que el número de horas prácticas necesarias para la obtención del permiso de conducir sigue una distribución normal con N(24, 3 2). (a) ¿Qué probabilidad hay de obtener el permiso de conducir con 20 horas de prácticas o menos? (b) ¿Cuántas horas de prácticas ha necesitado un conductor para obtener el permiso si el 68% de los conductores ha necesitado más horas de prácticas que él? La autoescuela D’spacio tiene un ingreso por alumno una parte fija de 250 euros, más 23 euros por hora de práctica. (c) Calcular el ingreso por alumno esperado. (d) Calcular la desviación típica del ingreso por alumno. Solución:
X ~ N(24, 32). μ = 24 σ=3 a) P[ X ≤ 20 ] P [ Z ≤ -1.33 ] P [ Z ≥ 1.33 ] P = 0.5 – 0.4082 = 0.0918 = 9.18% GEOESTADISTICA-I
Página 5
b) Sea x0 el número de horas prácticas que buscamos. P(X ≥ x0) = 0.68 Para la probabilidad de 0.68 en la tabla Z es: 0.5 – 0.68 = 0.18 el área de 0.18 nos da Z = 0.47 Z= (X - µ )/σ 0.47 = ( X – 24 ) / 3 X = ( 0.47 * 3 ) + 24 X = 25.41 c) Como X ~ N(24, 3 2), el número de horas de práctica necesarias para obtener el permiso de conducir es de 24. El ingreso de la autoescuela por las prácticas de un alumno es 23X. El ingreso por alumno es I = 250 + 23X. I = 250 + (23 × 24) = 802 euros d) Aplicando que Var(I) = Var(23X) = 23 2Var(X). Como X ~ N(24, 3 2), sabemos que Var(X) = 3 2. Var(I) = 232x32 La desviación típica del ingreso es: dtI=Var(I)=23x3=69
TEOREMA DEL LÍMITE CENTRAL El teorema del límite central dice que si una muestra es lo bastante grande ( n > 30), sea cual sea la distribución de la variable de interés, la distribución de la media muestral será aproximadamente una normal. Además, la media será igual a μ y la varianza será igual a σ 2/n.
Ejemplo: Una empresa de mensajería que opera en la ciudad tarda una media de 35 minutos en llevar un paquete, con una desviación típica de 8 minutos. Supongamos que durante el día de hoy han repartido doscientos paquetes. a) ¿Cuál es la probabilidad de que la media de los tiempos de entrega de hoy esté entre 35 y 36 minutos? b) ¿Cuál es la probabilidad de que, en total, para los doscientos paquetes hayan estado más de 115 horas? Solución: µ = 35
σ=8 n = 200 a). Consideremos la variable X = “Tiempo de entrega del paquete”. Sabemos que su media es 35 minutos y su desviación típica, 8. Pero no sabemos si esta variable sigue una distribución normal. Durante el día de hoy se han entregado n = 200 paquetes. Es decir, tenemos una muestra x 1, x 2, ..., xn de nuestra variable. Por el teorema del límite central sabemos que la media muestral se comporta como una normal de esperanza 35 y desviación típica: S=σ2n=σn=8200=0.5656
P [ 35 ≤ X ≤ 36 ] P [ 0 ≤ Z ≤ 1.768 ] GEOESTADISTICA-I
Página 6
P = 0.4616 Tenemos una probabilidad del 0,4616 de que la media del tiempo de entrega de hoy haya estado entre 35 y 36 minutos. b). Por lo que respecta a la segunda pregunta, de entrada debemos pasar las horas a minutos, ya que ésta es la unidad con la que nos viene dada la variable. Observa que 115 horas por 60 minutos nos dan 6.900 minutos. Se nos pide que calculemos la probabilidad siguiente: P [ X ≥ 6900/200 ] P [ X ≥ 34.5 ] P [ Z ≥ -0.884 ] P [ Z ≤ 0.884 ] P = 0.5 + 0.3106 = 0.8106
Ejemplo: Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de tres maestros universitarios de matemáticas: Maestro de matemáticas Antiguedad A 6 B 4 C 2 Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo. Calcule la antigüedad media para cada muestra, la media de la distribución muestral y el error estándar, o la desviación estándar de la distribución muestral. Solución:
Se pueden tener 3C2 =3 muestras posibles y significativas. La tabla lista todas las muestras posibles de tamaño 2, con sus respectivas medias muestrales.
Muestras Antigüedad A,B (6,4) A,C (6,2) B,C (4,2) La media poblacional es:
Media Muestral 5 4 3
μ=2+4+63=4
La media de la distribución muestral es: μ=5+4+33=4
La desviación estándar de la población es: σ=(6-4)2+(4-4)2+(2-4)23=1.63
El error estándar o la desviación estándar de la distribución muestral es: σ=(5-4)2+(4-4)2+(3-4)23=0.816
Si utilizamos la fórmula del error estándar sin el factor de corrección tendríamos que: σX=σ2n=σn=1.632=1.152
Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección obtendremos el valor correcto: σX=σnN-nN-1=1.6323-23-1=0.816
Ejemplo: Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. GEOESTADISTICA-I
Página 7
Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas. Solución:
Z = X- μσ2n=775- 8004016=-2.5
P [X ≤ 775 ] P [ Z ≤ -2.5 ] P [ Z ≥ 2.5 ] P = 0.5 – 0.4938 = 0.0062
La interpretación sería que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062. Ejemplo: Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine: a) El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros. b) El número de medias muestrales que caen por debajo de 172 centímetros. Solución:
Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular el denominador de Z para sólo sustituirlo en cada inciso. σX=σnN-nN-1=6.9251000-251000-1=1.36
a). P [ 172.5 ≤ X ≤ 175.8 ] Z1 = X- μσX=172.5-174.51.36=-1.47 Z2 = X- μσX=175.8-174.51.36=-0.96
P [ -1.47 ≤ Z ≤ 0.96 ] P = 0.4292 + 0.3365 = 0.7657 El numero de medias muestrales = (0.7657)(200) = 153.14 = 153 b). P [ X ≤ 172 ] Z3 = X- μσX=172-174.51.36=-1.83
P [ Z ≤ -1.83 ] P [ Z ≥ 1.83 ] P = 0.5 - 0.4664 = 0.0336 El numero de medias muestrales = (0.0336)(200) = 6.72 = 7 INTERVALOS DE CONFIANZA. Un intervalo de confianza es un intervalo estimador de un parámetro, cuyos extremos, el límite inferior (LI) y límite superior (LS) son funciones de la muestra, es decir depende solamente de valores muestrales. GEOESTADISTICA-I
Página 8
Un intervalo de confianza del parámetro θ cierto grado de incertidumbre establecido.
es un intervalo [ LI , LS ], que incluye al parámetro con
CUANDO LA VARIANZA POBLACIONAL
σ
2
ES CONOCIDA
Si x es la media de una muestra aleatoria de tamaño n obtenida de una población normal con varianza poblacional σ 2 conocida, entonces: Para tamaños de muestra >30
Ejercicio: La duración media de los neumáticos de un camión fue de veinte días. Se toma una muestra de cien neumáticos este año y se obtiene una media de dieciocho días con una desviación estándar de 8.1 días. Construir un intervalo de confianza para la duración media de los neumáticos del 99%. El tamaño muestral, n = 100, es grande (>30), Media = 20 días (población) Media = 18 días (muestra) Deviación estándar = 8.1 Con un nivel de confianza del 99%, 0.99/2 = 0.495 esta área se busca en la tabla el valor de Z Z =2.58
X ±Z Sn =18 ±2.58 8.1100=18 ±2.090
LS = 18 + 2.090 = 20.090 LI = 18 – 2.090 = 15.91
15.91 < µ < 20.090 Ejercicio: Se encuentra que la concentración promedio de zinc que se saca del agua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el río. Suponga que la desviación estándar de la población es 0.3. Solución:
La estimación puntual de m es x = 2.6. El valor de z para un nivel de confianza del 95% es 1.96, por lo tanto: n = 36 Concentración media = 2.6 Intervalos de confianza = ? de 95% y 99% Deviación estándar = 0.3 a). Con un nivel de confianza del 95%, 0.95/2 = 0.475 esta área se busca en la tabla el valor de Z Z =1.96
X ±Z Sn =2.6 ±1.96 0.336=2.6 ±0.098
LS = 2.6 + 0.098 = 2.698 LI = 2.6 – 0.098 = 2.502
2.502 < µ < 2.698 b). Para un nivel de confianza de 99% el valor de Z es de 2.58. GEOESTADISTICA-I
Página 9
X ±Z Sn =2.6 ±2.58 0.336=2.6 ±0.129
LS = 2.6 + 0.129 = 2.729 LI = 2.6 – 0.129 = 2.471
2.471 < µ < 2.729 Como se puede observar en los resultados del ejercicio se tiene un error de estimación mayor cuando el nivel de confianza es del 99% y más pequeño cuando se reduce a un nivel de confianza del 95%. Ejercicio: La prueba de corte sesgado es el procedimiento más aceptado para evaluar la calidad de una unión entre un material de reparación y su sustrato de concreto. El artículo “Testing the Bond Between Repair Materials and Concrete Substrate” informa que, en cierta investigación, se obtuvo una resistencia promedio muestral de 17.17 N/mm 2, con una muestra de 48 observaciones de resistencia al corte, y la desviación estándar muestral fue 3.28 N/mm 2. Utilice un nivel de confianza inferior del 95% para estimar la media real de la resistencia al corte. Solución:
Resistencia promedio = 17.17 N/mm 2 n = 48 Desviación estándar = 3.28 N/mm 2 Nivel de confianza = 95% Piden un intervalo de confianza unilateral. Para el intervalo de confianza unilateral, se cargará el área bajo la curva hacia un solo lado como sigue:
Z = 1.96 X-Z Sn =17.17-1.96 3.2848=17.17-0.9279
LI = 16.242 Esto quiere decir que con un nivel de confianza de 95%, el valor de la media está en el intervalo
16.242 < µ <
CUANDO LA VARIANZA POBLACIONAL, σ 2 , SE DESCONOCE Si x es la media de una muestra aleatoria de tamaño n obtenida de una población normal con varianza poblacional σ 2 desconocida, entonces: Para muestras de menor tamaño. X ±t Sn para la media
Ejercicio: Dadas las siguientes resistencias a la tensión: 28.7, 27.9, 29.2 y 26.5 psi, y con un nivel de confianza del 95% Estimar la media puntual X media = (28.7 + 27.9 + 29.2 + 26.5) / 4 = 112.3 / 4 = 28.075 S2 = ((28.7 – 28.08)2 + (27.9 – 28.08) 2 + (29.2 – 28.08) 2 + (26.5 – 28.08) 2) / 4 = 4.1675 / 4 S2 = 1.041875 GEOESTADISTICA-I
Página 10
S = 1.02 Estimar el intervalo de confianza para un nivel de confianza del 95% α = 1-0.95 = 0.05 y g.l. = (n – 1) = (4 – 1) 3 g.l. t (0.05, 3 g.l.) a dos colas = 3.1824
X ±t Sn=28.075 ±3.1824 1.024=28.075±1.623
LS = 28.075 + 1.623 = 29.698 LI = 28.075 - 1.623 = 26.452 26.452 < µ < 29.698 Ejercicio: Se ha recogido una muestra aleatoria para prever la inflación en el ano, en siete países. Las previsiones han sido: 1.5 2.1 1.9 2.3 2.5 3.2 3.0 a). Utilizando estos datos, construye un intervalo de confianza al 99% para la media de la previsión de inflación, en estos siete países. Indica los supuestos que necesitas hacer b). Los expertos opinan que el intervalo de confianza calculado para la media es demasiado amplio, y desean que su longitud total sea de 1.0 puntos. Hallar el nivel de confianza para este nuevo intervalo. Solución: a). n = 7 Media de la muestra = (1.5 + 2.1 + 1.9 + 2.3 + 2.5 + 3.2 + 3.0) / 7 = 2.357 Desviación estándar de la muestra: S2=[(1.5-2.357)2+(2.1-2.357)2+(1.9-2.357)2+(2.3-2.357)2+(2.5-2.357)2+(3.2-2.357)2+(3.0-2.357)2] / 7 S2 = 0.30816 S = 0.555 Calculo de t para (n – 1) g.l. = (7-1) = 6 g.l. t ( 0.01, 6 g.l.) a dos colas = 3.7074
X ±t Sn=2.357 ±3.7074 0.5557=2.357±0.7777 LS = 2.357 + 0.7777 = 3.1347 LI = 2.357 – 0.7777 = 1.5793
1.5793 < µ < 3.1347 b). L = 1.0 L=2t Sn t= Ln2S=1.0 x 72 x 0.555=2.3836
El valor de t se ubica en la tabla en sentido contrario: Para 6 g.l. y un área de 2.3836 se tiene un alfa de ≈ 0.05 para una t = 2.4469 El nuevo nivel de confianza del nuevo intervalo es: 1 – 0.05 = 0.95 = 95%
PARA ESTIMAR LA PROPORCIÓN DE UNA POBLACIONAL π DE UNA POBLACIÓN BINOMIAL Si p es una proporción de una muestra aleatoria n (grande) obtenida de una población binomial con parámetro π , entonces:
GEOESTADISTICA-I
Página 11
Ejercicio: Se aplica un test que mide la actitud hacia la autoevaluación de su conducta y comportamiento hacia sus compañeros de trabajo, a una muestra aleatoria de trabajadores de la empresa “Gardilcic”. De un total de 364 trabajadores, 247 evidencian actitud positiva hacia la autoevaluación. Se solicita que estime la proporción de trabajadores de la empresa con actitud positiva hacia la autoevaluación de su conducta y comportamiento para un nivel de confianza del 90%. N = 364 n = 247 P = ni / N = 247 / 364 = 0.6786 Para una confianza del 90% 0.90/2 = 0.45 esta área se ubica en la tabla de Z, se tiene: Z = 1.65
p±Zp(1-p)n=0.6786±1.650.6786(1-0.6786)364=0.6786±0.040389
LS = 0.6786 + 0.040389 = 0.718989 LI = 0.6786 – 0.040389 = 0.638211 0.638211 < π
< 0.718989
6 3. 82 % < π
< 7 1. 89 %
Ejercicio: En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de confianza para aproximar la proporción de todos los accidentes automovilísticos que en esa ciudad tienen consecuencias fatales. Solución:
N = 300 n = 60 Confianza = 90% P= 60/300 = 0.20 Z0.90 = 1.65 p±Zp(1-p)n=0.2±1.650.2(1-0.2)300=0.2±0.0381
LS = 0.2 + 0.0381 LI = 0.2 – 0.0381 0.1619 < π
< 0.2381
1 6. 19 % < π
< 2 3. 81 %
TAMAÑO DE MUESTRA.
Ejemplo: Un biólogo quiere estimar el peso promedio de los sólidos contenidos en las muestras de agua contaminada de su localidad. Un estudio anterior de diez nuestras mostró que la desviación estándar de sus pesos es de 12.2 gramos. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 95% de confianza de que el error de estimación es a lo más de 4 gramos? Solución:
Z para 95% de confianza es: 0.95/2 = 0.475 σ = 12.2 E=4 GEOESTADISTICA-I
Página 12
esta área en la tabla de Z se tiene Z = 1.96
n=Z . σE2=1.96 x 12.242= 35.736 = 36
Ejemplo: Una empresa eléctrica fabrica focos que tienen una duración aproximadamente normal con una desviación estándar de 40 horas. a). ¿De qué tamaño se necesita una muestra si se desea tener 96% de confianza que la media real esté dentro de 10 horas de la media real? Solución:
σ = 40 Confianza = 96% E = 10
Z para 96% de confianza es: 0.96/2 = 0.48
esta área en la tabla de Z se tiene Z = 2.06
n=Z . σE2=2.06 x 40102= 67.89 = 68
Se necesita una muestra de 68 focos para estimar la media de la población y tener un error máximo de 10 horas. b). ¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se requiere un error de 5 horas? n=Z . σE2=2.06 x 4052= 271.59 = 272
Se puede observar como el tamaño de la muestra aumenta, pero esto tiene como beneficio una estimación más exacta. c). Suponga que en el ejercicio anterior se tiene una población de 300 focos, y se desea saber de que tamaño debe de ser la muestra. El muestreo se realizará sin reemplazo. Solución:
Como se tiene una población finita y un muestreo sin reemplazo es necesario utilizar la formula con el factor de corrección. n= Z2σ2NE2N-1+σ2Z2=2.0624023001023001+4022.062=203692836689.76=55.5176=56
Si se tiene una población finita de 300 focos sólo se tiene que extraer de la población una muestra sin reemplazo de 56 focos para poder estimar la duración media de los focos restantes con un error máximo de 10 horas. Ejemplo: En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de P esté dentro de 0.02? Solución:
P = 340 / 500 = 0.68 Confianza = 95% E = 0.02 Z para 95% de confianza es: 0.95/2 = 0.475
esta área en la tabla de Z se tiene Z = 1.96
n=p1-pZE2=0.681-0.681.960.022=2089.83=2090
Por lo tanto si basamos nuestra estimación de P sobre una muestra aleatoria de tamaño 2090, se puede tener una confianza de 95% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02. GEOESTADISTICA-I
Página 13
Ejemplo: Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qué proporción del electorado conoce la opinión de ella, respecto al uso de fondos estatales para pagar abortos. ¿Qué tamaño de muestra se necesita si se requiere un confianza del 95% y un error máximo de estimación de 0.10? Solución:
En este problema, se desconoce totalmente la proporción de residentes que conoce la opinión de la legisladora, por lo que se utilizará un valor de 0.5 para p. Confianza = 95% E = 0.10 Z para 95% de confianza es: 0.95/2 = 0.475 esta área en la tabla de Z se tiene Z = 1.96 n=p1-pZE2=0.51-0.51.960.102=96.04=97
Se requiere un tamaño de muestra de 97 residentes para que con una confianza del 95% la estimación tenga un error máximo de 0.10 PRUEBAS DE HIPÓTESIS. PRUEBAS DE HIPÓTESIS PARA MUESTRAS GRANDES
Ejercicio: Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de
forma aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas, ¿muestran los datos suficiente evidencia para decir que la duración media ha cambiado? Utilice un nivel de significancia del 0.04 Solución:
1. Supuestos Se trata de una distribución muestral de medias con desviación estándar conocida. Datos: µ=800 horas
σ = 40 horas X = 788 horas
n = 30 α = 0.04
Nivel de confianza = 96% 2. Ensayo de hipótesis H0: µ = 800 horas H1: µ ≠ 800 horas 3. Estadístico de contraste Z=X-μσ/n 4. Definir la región α = 1 – NC = 1 – 0.96 = 0.04; α/2 = 0.04/2 = 0.02 p = 0.96/2 = 0.48 Tabla de Distribución Normal Z0.48 = 2.06 Contraste bilateral, luego Z < − z α / 2 ó Z > z α / 2 = ± 2.06 GEOESTADISTICA-I
Página 14
µ=800 Z = -2.06 H0 se rechaza si z < - 2.06 ó z > 2.06 5. Cálculo estadístico
Z = +2.06
Z=X-μσ/n=788-80040/30=-127.30296=-1.643 6. La regla de decisión
Región de rechazo
- 2.06
Región de aceptación
- 1.643 - 2.06 < - 1.643 < 2.06
Región de rechazo
+ 2.06
Z calc < Z teor - 1.643 < 2.06
Como - 2.06 < - 1.643 < 2.06 por lo tanto, se acepta H0, y se concluye con un nivel de significancia del 0.04 que la duración media de los focos no ha cambiado.
Ejercicio: Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación si una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bombas de calor? Utilice un nivel de significancia de 0.10 Solución:
1. Supuestos Se trata de una distribución muestral de proporciones. Datos: P= 0.70 n = 15 Tienen bombas = 8 Nivel de significancia α = 0.10 p = 8/15 = 0.5333 2. Ensayo de hipótesis GEOESTADISTICA-I
Página 15
H0: P = 0.70 H1: P ≠ 0.70 3. Estadístico de contraste Z=p-PPqn 4. Definir la región
Nivel de confianza = 1 – 0.1 = 0.9 = 90% α = 1 – NC = 1 – 0.90 = 0.1; α/2 = 0.1/2 = 0.05 p = 0.90/2 = 0.45 Tabla de Distribución Normal Z0.45 = 1.65 Contraste bilateral, luego Z < − z α / 2 ó Z > z α / 2 = ± 1.65
Z = -1.65 P=0.70 H0 se rechaza si z < - 1.65 ó z > 1.65
Z = +1.65
5. Cálculo estadístico Z=p-PPqn=0.5333-0.700.70 x 0.3015=-1.40887 6. La regla de decisión
Región de rechazo
- 1.65
Región de aceptación
- 1.41 - 1.65 < - 1.41 < 1.65
Región de rechazo
+ 1.65
Z calc < Z teor - 1.41 < 1.65
Como - 1.65 < - 1.41 < 1.65 por lo tanto, se acepta H0, y se concluye con un nivel de significancia del 0.01 que la afirmación del constructor es cierta.
Ejercicio: Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor que 0.05, y que el fabricante demuestre esta característica del proceso de fabricación con este nivel de calidad, utilizando α = 0.1. El fabricante de semiconductores toma una muestra aleatoria de 200 GEOESTADISTICA-I
Página 16
dispositivos y encuentra que cuatro de ellos son defectuosos. ¿El fabricante puede demostrar al cliente la calidad del proceso? Solución:
1. Supuestos Se trata de una distribución muestral de proporciones. Datos: P= 0.05 n = 200 Defectuosos = 4 Nivel de significancia α = 0.1 p = 4/200 = 0.02 2. Ensayo de hipótesis H0: P = 0.05 H1: P < 0.05 3. Estadístico de contraste Z=p-PPqn 4. Definir la región
Nivel de confianza = 1 – 0.1 = 0.90 = 90% α = 1 – NC = 1 – 0.90 = 0.1; p = 0.90/2 = 0.45 Tabla de Distribución Normal Contraste unilateral, luego 1.65 se rechaza H0 Z < z α Z > z α 1.65 se acepta H0
Z0.45 = 1.65
Z = -1.65
P=0.05
H0 se rechaza si Z < - 1.65 5. Cálculo estadístico Z=p-PPqn=0.02-0.050.05 x 0.95200=-1.9466 6. La regla de decisión
0.1
GEOESTADISTICA-I
Página 17
Región de rechazo
Región de aceptación
- 1.65 - 1.9466 < - 1.65
+ 1.65
Z calc < Z teor - 1.95 < 1.65
Como - 1.95 < - 1.65 por lo tanto, se rechaza H1, y se concluye con un nivel de significancia del 0.1 que la fracción de artículos defectuosos es menor que 0.05.
Ejercicio: Existen dos tipos de plástico apropiados para su uso por un fabricante de componentes electrónicos. La tensión de ruptura de ese plástico es un parámetro importante. Se sabe que σ1=σ2= 1.0 psi. De una muestra aleatoria de tamaño 10 y 12 para cada plástico respectivamente, se tiene una media de 162.5 para el plástico 1 y de 155 para el plástico 2. La compañía no adoptará el plástico 1 a menos que la tensión de ruptura de éste exceda a la del plástico 2 al menos por 10 psi. Con base a la información contenida en la muestra, ¿la compañía deberá utilizar el plástico 1? Utilice α = 0.05 para llegar a una decisión. Solución: 1. Supuestos Se trata de una distribución muestral de diferencia de medias con desviación estándar conocida. Datos: Tensión de ruptura Plástico 1 Plástico 2 σi 1.0 psi 1.0 psi n 10 12 162.5 155.0 X Tensión exceda al plástico 2 al menos por 10 psi α = 0.05 2. Ensayo de hipótesis H0: µ 1-µ
2
= 10
H1: µ 1-µ 2 > 10 Se desea rechazar Ho si la media del plástico 1 supera a la media del plástico 2 en por lo menos 10 psi. 3. Estadístico de contraste Z=(X1-X2)-(μ1-μ2)S12n1+S22n2 4. Definir la región
Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; p = 0.95/2 = 0.475 GEOESTADISTICA-I
Página 18
Tabla de Distribución Normal Contraste unilateral, luego Z > z α 1.96 se rechaza H0 1.96 se acepta H0 Z < z α
Z0.475 = 1.96
µ 1-µ 2 = 10
Z=1.96
H0 se rechaza si Z > 1.96 5. Cálculo estadístico Z=(X1-X2)-(μ1-μ2)S12n1+S22n2=(162.5-155.0)-101210+1212=-5.8387 6. La regla de decisión
Región de aceptación
Región de rechazo
1.96 - 5.8387 < 1.96
+ 1.96
Z calc < Z teor - 5.8387 < 1.96
No existe evidencia suficiente para apoyar el uso del plástico 1 ya que – 5.8387 < 1.96 por lo tanto, se acepta H0. Ejercicio: Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso en una operación de pulido en la fabricación de brocas saca testigos. Se pulen 300 brocas con la primera solución y, de éstos, 253 no presentaron defectos inducidos por el pulido. Después se pulen otras 300 brocas con la segunda solución, de los cuales 196 resultan satisfactorios. ¿Existe alguna razón para creer que las dos soluciones para pulir son diferentes? Utilice α = 0.01 Solución: 1. Supuestos Se trata de una distribución muestral de diferencia de proporciones. Datos:
ni No defectos GEOESTADISTICA-I
Solución de pulido Solución 1 Solución 2 300 300 253 196 Página 19
p1= 253/300= 0.8433 p2 = 196/300= 0.6533 n1=n2 = 300 α = 0.01 2. Ensayo de hipótesis Ho: P1-P2 = 0 H1: P1-P2 ≠ 0 3. Estadístico de contraste Z=(p1-p2)Pq1n1+1n2
4. Definir la región Nivel de confianza = 1 – 0.01 = 0.99 = 99% α = 1 – NC = 1 – 0.99 = 0.01 α/2 = 0.01/2 = 0.005 p = 0.99/2 = 0.495 Tabla de Distribución Normal Z0.495 = 2.58 Contraste bilateral, luego Z < − z α
/2
ó Z >
z α
/2
= ± 2.58
Z = -2.58 P1-P2=0.0 Z = +2.58 H0 se rechaza si z < - 2.58 ó z > 2.58 5. Cálculo estadístico P=x1+x2n1+n2=253+196300+300=0.7483 Z=(p1-p2)Pq1n1+1n2=(0.8433-0.6533)0.7483(0.2517)1300+1300=5.3619
6. La regla de decisión
GEOESTADISTICA-I
Página 20
Región de rechazo Región de aceptación - 2.58
P1-P2=0.0
Región de rechazo + 2.58 5.36 5.36 > 2.58
Z calc > Z teor 5.36 > 2.58
Puesto que 5.36 > 2.58, se rechaza la hipótesis nula H 0 y se concluye con un nivel de significancia de 0.01 que los dos fluidos para pulir son diferentes.
PRUEBAS DE HIPÓTESIS PARA MUESTRAS PEQUEÑAS. Ejercicio: Un artículo publicado en la revista Materials Engineering describe los resultados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga para la que cada espécimen falla es la siguiente en MPa: 19.8 18.5 17.6 16.7 15.8 15.4 14.1 13.6 11.9 11.4 11.4 8.8 7.5 15.4 15.4 19.5 14.9 12.7 11.9 11.4 10.1 7.9 ¿Sugieren los datos que la carga promedio de falla es mayor que 10 Mpa? Supóngase que la carga donde se presenta la falla tiene una distribución normal, y utilícese α = 0.05. Calcule el valor de la Prueba de hipótesis. Solución: 1. Supuestos Datos: µ = 10
S = 3.4718 (calcular) X = 13.7136 (calcular)
n = 22 α = 0.05
2. Ensayo de hipótesis 3. Ensayo de hipótesis Ho: µ = 10 H1: µ > 10 Se rechaza si Ho es mayor que 10 Mpa. 3. Estadístico de contraste t=X-μS/n
4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; 1/α = 1/0.05 = 20 para una cola = 20/2 = 10 Grados de libertad = (n-1) = (22-1) = 21 g.l. Tabla de Distribución t para una cola t(10, 21) = 1.7207 GEOESTADISTICA-I
Página 21
Contraste unilateral, luego t > t cal 1.7207 se rechaza H 0 t < t cal 1.7207 se acepta H 0
µ = 10
t=1.7207
H0 se rechaza si t > 1.7207 5. Cálculo estadístico t=X-μS/n=13.7136-103.471822=5.017
6. La regla de decisión
Región de aceptación 1.7207
Región de rechazo + 1.7207 5.017 > 1.7207
t calc > t teor 5.017 > 1.7207
Como 5.017 > 1.7207 se rechaza H0 y se concluye con un nivel de significancia del 0.05 que la carga de falla promedio es mayor que 10 Mpa. Ejercicio: Para encontrar si un compuesto químico detiene el deterioro del puntal en el sostenimiento de la caída de roca, se seleccionan nueve puntales, todos preparados para su aplicación en el sostenimiento. Cinco puntales reciben el tratamiento y cuatro no. Los tiempos de duración en años, a partir del momento en que comienza el experimento son los siguientes: Con tratamiento 2.1 5.3 1.4 4.6 0.9 Sin tratamiento 1.9 0.5 2.8 3.1 ¿Se puede decir en el nivel de significancia del 0.05 que el compuesto químico es efectivo? Suponga que las dos poblaciones se distribuyen normalmente con varianzas iguales. Solución:
1. Supuestos Datos: GEOESTADISTICA-I
Página 22
Tratamiento de puntales con compuesto químico Con tratamiento Sin tratamiento 2.86 (calcular) 2.075 (calcular) X Si 1.7625 (calcular) 1.011 (calcular) n 5 4 Las poblaciones se distribuyen normalmente S12 = S22 α = 0.05 2. Ensayo de hipótesis Ho: µCT - µST = 0 H1: µCT - µST > 0 Se rechaza si Ho es mayor que 0 3. Estadístico de contraste t=(X1-X2)-(μ1-μ2)Sm1n1+1n2
4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; 1/α = 1/0.05 = 20 para una cola = 20/2 = 10 Grados de libertad = (n 1 + n2 - 2) = (5 + 4 - 2) = 7 g.l. Tabla de Distribución t para una cola t(10, 7) = 1.8946 Contraste unilateral, luego t > t cal 1.8946 se rechaza H 0
t < t cal
1.8946 se acepta H0
µCT - µST = 0
t = 1.8946
H0 se rechaza si t > 1.8946 5. Cálculo estadístico Sm2=n1-1S12+n2-1S22n1+n2-2=5-11.76252+4-11.01125+4-2=2.213 Sm = 1.4876 t=(X1-X2)-(μ1-μ2)Sm1n1+1n2=(2.86-2.075)-01.487615+14=0.7866
6. La regla de decisión
GEOESTADISTICA-I
Página 23
Región de aceptación 1.8946 0.7866 < 1.8946
Región de rechazo + 1.8946
t calc < t teor 0.7866 < 1.8946
Como 0.7866 < 1.8946 se acepta H 0 y se concluye con un nivel de significancia del 0.05 que no existe suficiente evidencia para decir que el compuesto químico detiene el deterioro del puntal. Ejercicio: Dos proveedores fabrican un engranaje de acero utilizado en un equipo de bajo perfil. Una característica importante de estos engranajes es la resistencia al impacto la cual se mide en pies-libras. Una muestra aleatoria de 10 engranajes suministrados por el primer proveedor arroja los siguientes resultados: X1 = 321 y S 1 = 12. Del segundo proveedor se toma una muestra aleatoria de 16 engranajes, donde los resultados son: X2 = 290 y S2 = 45. ¿Existe evidencia que apoye la afirmación de que los engranajes del proveedor 2 tienen una mayor resistencia promedio al impacto. Use un nivel de significancia de 0.05. Solución:
1. Supuestos Datos:
Proveedor de engranajes Proveedor 1 Proveedor 2 321 290 X Si 12 45 n 10 16 Las poblaciones se distribuyen normalmente Varianzas de las poblaciones desconocidas y diferentes α = 0.05 2. Ensayo de hipótesis Ho: µ2 - µ1 = 0 H1: µ2 - µ1 > 0 Se rechaza si Ho es mayor que 0 3. Estadístico de contraste t=(X1-X2)-(μ1-μ2)S12n1+S22n2
4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; GEOESTADISTICA-I
Página 24
1/α = 1/0.05 = 20 para una cola = 20/2 = 10 Grados de libertad es igual a: v= S12n1+S22n22S12n12n1-1+S22n22n2-1=12210+45216212210210-1+452162161=18.2145
Grados de libertad v = 18 g.l. Tabla de Distribución t para una cola Contraste unilateral, luego t > t cal 1.7341 se rechaza H 0 t < t cal 1.7341 se acepta H 0
t(10, 18) = 1.7341
µ2 - µ1 = 0
t = 1.7341
H0 se rechaza si t > 1.7341 5. Cálculo estadístico t=(X1-X2)-(μ1-μ2)S12n1+S22n2=(321-290)-012210+45216=2.611
6. La regla de decisión
Región de aceptación 1.7341
Región de rechazo + 1.7341 2.611 > 1.7341
t calc > t teor 2.611 > 1.7341
Como 2.611 > 1.7341 se rechaza H 0 y se concluye con un nivel de significancia del 0.05, que existe suficiente evidencia para decir que el promedio de resistencia de los engranajes del proveedor 2 es mayor al promedio de resistencia de los engranajes del proveedor 1. Ejercicio: El rendimiento de los carros de transporte de mineral se ven afectadas por el sobre peso de los operadores, para ello diez hombres se sometieron a una dieta especial registrando sus pesos antes de comenzarla y después de un mes de estar en ella. Los resultados de los pesos, en libras, se muestran a continuación: GEOESTADISTICA-I
Página 25
Hombre A B C D E F G H I J Antes 181 172 190 186 210 202 166 173 183 184 Después 178 175 185 184 207 201 160 168 180 189 Haga una prueba con a = 0.05 para determinar si la dieta logró alguna diferencia, ya sea positiva o negativa. Solución:
1. Supuestos Datos: Las muestras son independientes y no están relacionadas Muestras independientes pareadas o relacionadas Hombre A B C D E F G H I J Antes 181 172 190 186 210 202 166 173 183 184 Después 178 175 185 184 207 201 160 168 180 189 Diferencia 3 -3 5 2 3 1 6 5 3 -5 Promedio 2 Varianza 14.4 Desviación estándar 3.7947 α = 0.05
2. Ensayo de hipótesis Ho: µ A - µD = 0 H1: µ A - µD ≠ 0 Se rechaza si Ho es diferente que 0 3. Estadístico de contraste t=dSd/n
4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; Grados de libertad es igual a: (n-1) = (10-1) = 9 g.l. Tabla de Distribución t para dos cola t(0.05, 9) = 2.2622 Contraste bilateral, luego -2.2622 < t cal < 2.622 se acepta H0
t = 2.2622 µ A-µD=0 H0 se rechaza si t > 2.2622 5. Cálculo estadístico GEOESTADISTICA-I
t = 2.2622
Página 26
t=dSd/n=23.794710=1.6667
6. La regla de decisión
Región de rechazo Región de aceptación Región de rechazo - 2.2622 + 2.2622 -2.2622 < 1.6667 < 2.622 t teor < t calc < t teor -2.2622 < 1.6667 < 2.622 Como 1.6667 está entre los dos valores críticos de –2.2622 y 2.2622, por lo tanto no se rechaza H0, y se concluye con un α = 0.05 que no existe evidencia estadística que apoye la efectividad de la dieta para variar el peso. PRUEBA DE JI CUADRADO Y ANÁLISIS DE VARIANCIA La prueba de Ji cuadrado nos permite trabajar con más de dos proporciones y ANOVA (análisis de varianzas) nos permitirá probar si más de dos medias de poblaciones pueden considerarse iguales.
Ejercicio: En un procesos de llenado, la tolerancia para el peso de los recipientes es de 8 gramos, para reunir este requisito la desviación estándar en el peso debe ser de 2 gramos, los pesos de 25 recipientes seleccionados al azar dieron como resultado una desviación estándar de 2.8 gramos; si los pesos se encuentran normalmente distribuidos, determinar si la varianza de esta muestra es diferente del valor necesario al 2.5% de nivel de significancia. Solución:
1. Supuestos Datos: Tolerancia = 8 gr. S1 = 2 gr. n = 25 S2 = 2.8 gr. S12 ≠ S22 = ? α = 0.025 2. Ensayo de hipótesis Ho: σ 2 = 22 = 4 H1: σ 2 > 22 = 4 Se rechaza si Ho es mayor que 4 3. Estadístico de contraste X2=(n-1)S2σ02 GEOESTADISTICA-I
Página 27
4. Definir la región Nivel de confianza = 1 – 0.025 = 0.975 = 97.5% α = 1 – NC = 1 – 0.975 = 0.025; Grados de libertad es igual a: (n-1) = (25-1) = 24 g.l. Tabla de X2 para una cola t(0.025, 24) = 39.3641 Contraste unilateral, luego X 2 cal < 39.3641 se acepta H0
X 2(0.025, 24) = 39.3641
H0 se rechaza si X2 > 39.3641 5. Cálculo estadístico X2=n-1S2σ02=25-12.8222=47.04
6. La regla de decisión
Región de aceptación < 39.3641
Región de rechazo + 39.3641 47.04 > 39.3641
X 2 calc > X 2 teor
47.04 > 39.3641 Como 47.04 está en la región de rechazo, por lo tanto se rechaza H 0 σ2 = 4 y se acepta que σ 2 > 4. Ejercicio: Un inversionista desea comparar los riesgos asociados con dos diferentes mercados A y B; el riesgo de un mercado se mide por la variación en los cambios diarios de precio. El inversionista piensa que el riesgo asociado con el mercado B es mayor que del mercado A. Se obtienen muestras aleatorias de precios de 21 días para el mercado A y de 17 días para el mercado B siendo estas las siguientes características: Comparación de riesgos de mercado Mercado A Mercado B 0.3 0.4 X Si 0.25 0.45 n 21 17 GEOESTADISTICA-I
Página 28
Si se dispone que las muestras provienen de dos poblaciones normales e independientes a un nivel del 5% ¿encuentra apoyo la creencia del inversionista? Solución:
1. Supuestos Datos: Riesgo A > B σA > σB
?
α = 0.05
2. Ensayo de hipótesis Ho: σ B2 = σ A 2 Ho: σ B2 > σ A 2 Se rechaza Ho si el mercado A es mayor que el mercado B 3. Estadístico de contraste F=S12S22 >1
4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; Grados de libertad: Mercado A = (n A-1) = (21-1) = 20 g.l. Mercado B = (nB-1) = (17-1) = 16 g.l. Por la condición de la formula la relación de n B y nA Tabla de F para una cola F(0.05; 16, 20) = 2.18 Contraste unilateral, luego F cal < 2.18 se acepta H0
F (0.05; 16,20) = 2.18
H0 se rechaza si F > 2.18 5. Cálculo estadístico F=SB2SA2 = 0.4520.252=3.24
6. La regla de decisión
GEOESTADISTICA-I
Página 29
Región de aceptación < 2.18
Región de rechazo + 2.18 3.24 > 2.18
F calc > F teor
3.24 > 2.18 Como 3.24 está en la región de rechazo, por lo tanto se rechaza H 0 σ B2 = σ A 2 y se acepta que σ B2 2 > σ A .
REGRESIÓN LINEAL Y CORRELACIÓN Su propósito es determinar la ecuación de regresión; se usa para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X), del mismo modo el coeficiente de correlación (r) es una medida de la intensidad de la relación entre dos variables. Ejemplo: El volumen de ahorro y la renta del sector familias en billones de ptas. constantes de 1.977, para el período 77-86 fueron: Año 77 78 79 80 81 82 83 84 85 86
Ahorro (X) 1.9 1.8 2.0 2.1 1.9 2.0 2.2 2.3 2.7 3.0
Renta (Y) 20.5 20.8 21.2 21.7 22.1 22.3 22.2 22.6 23.1 23.5
a). Recta de regresión del ahorro sobre la renta. b). Recta de regresión de la renta sobre el ahorro. c). Para el año 87 se supone una renta de 24.1 billones de ptas. ¿Cuál será el ahorro esperado para el año 87? d). Cual es el grado de relación entre el ahorro y la renta. Solución:
a). Recta de regresión del ahorro sobre la renta. Año Ahorro (X) Renta (Y) 77 1.9 20.5 78 1.8 20.8 79 2 21.2 80 2.1 21.7 GEOESTADISTICA-I
X2 3.61 3.24 4 4.41
Y2 420.25 432.64 449.44 470.89 Página 30
XY 38.95 37.44 42.4 45.57
81 82 83 84 85 86 ∑
1.9 2 2.2 2.3 2.7 3 21.9
22.1 22.3 22.2 22.6 23.1 23.5 220
3.61 4 4.84 5.29 7.29 9 49.29
488.41 497.29 492.84 510.76 533.61 552.25 4848.38
41.99 44.6 48.84 51.98 62.37 70.5 484.64
b=nXY-XYnX2-X2=10484.64-21.9(220)1049.29-(21.9)2=2.1369 a=Yn-bXn=22010-2.136921.910=17.32
Y = a + bX Y = 17.32 + 2.1369X b). Recta de regresión de la renta sobre el ahorro. c). Para el año 87 se supone una renta de 24.1 billones de ptas. ¿Cuál será el ahorro esperado para el año 87? Y = 17.32 + 2.1369X 24.1 = 17.32 + 2.1369 X X = (24.1 – 17.32) / 2.1369 = 3.1728 d). Cual es el grado de relación entre: Sxy = n∑XY - ∑X∑Y = 28.4 Sx = n∑X2 – (∑X)2 = 13.29 Sy = n∑Y2 – (∑Y)2 = 83.8 r=SxySx Sy=28.413.29 x 83.8=0.851
r = 0.851 se le considera como excelente
r 2 = 0.7242 = 72.42 explica la renta sobre el ahorro Ejemplo: Las siguientes cifras son mediciones de la velocidad del aire y del coeficiente de evaporación de gotitas de combustible en la cámara de combustión de un motor de impulsión: Nuestra 1 2 3 4 5 6 7 8 9 10 GEOESTADISTICA-I
Velocidad del aire (cm/s) (X) 20 60 100 140 180 220 260 300 340 380 Página 31
Coeficiente de evaporación (mm2/s) (Y) 0.18 0.37 0.35 0.78 0.56 0.75 1.18 1.36 1.17 1.65
View more...
Comments