Trabajo Diseño Experimental 2
Short Description
trabajo diseño...
Description
22)Se desea comprar una gran cantidad de bombillas y se tiene que elegir entre las arcas A y B. Para ello, se compraron 100 focos de cada marca, y se encontró que las bombillas probadas de la marca A tuvieron un tiempo de vida medio de 1 120 horas, con una desviación estándar de 75 horas; mientras que las de la marca B tuvieron un tiempo de vida medio de 1 064 horas, con una desviación estándar de 82 horas. a)
¿Es significativa la diferencia entre los tiempos medios de vida?
Use a = 0.05. Tenemos que
Datos
N (a y b) Sa Sa Xb Sb α
100 11,2 75 10,64 82 0,05
Primero vemos si las varianzas son iguales o diferentes para esto proponemos como hipótesis nula que las varianzas son iguales y la alterna que una es mayor que otra.
Procedemos con el estadístico de prueba
∞,−,−
Ahora hallamos
Tenemos como criterio de rechazo que si
= 5625 6725 0,836431 ,,, 1,39 se rechaza la Ho
(0,83) < ∞(1,39)
Vemos que por lo tanto no se rechaza la Ho y podemos decir que las muestras poseen varianzas desconocidas pero iguales. Ahora si procedemos a mirar mirar si existe diferencia entre entre los tiempos medio de vida, para esto decimos decimos que la hipótesis nula es que las medias de las dos muestras son iguales.
Procedemos con el estadístico de prueba , para esto primero ca lculamos Sp .
(99) ∗6724 = (99) ∗5625 99992 =78,9779
Reemplazando valores
11201064 4,98867 1 1 78,9779∗ √ 99 99
Tenemos que
,+− ,, 1,960 Como criterio de rechazo para esta prueba tenemos que :
||(4,98867) > ,+−(1,960)
Por lo tanto se rechaza la hipótesis nula, esto quiere decir que si existen diferencias significativas entre las dos tiempos medios de vida.
b)
¿Con qué tamaño de muestra se aceptaría que las marcas son iguales, utilizando a = 0.05?
esto se daría cuando los grados de libertad fuesen 1 ,por lo tanto existe una diferencia muy grande entre las dos medias que no hace que fácilmente se igualen.
23. En un laboratorio bajo condiciones controladas, se evaluó, para 10 hombres y 10 mujeres, la temperatura que cada persona encontró más confortable. Los resultados en grados Fahrenheit fueron los siguientes:
a)
¿Cuáles son en realidad los tratamientos que se comparan en este estudio?
La temperatura más confortante entre ambos sexos. b)
¿Las muestras son dependientes o independientes? Explique.
Las muestras son independientes, no existe relación de otros factores que influyan en algún dato. Ningún dato depende de alguna relación a otra variable. c)
¿La temperatura promedio más confortable es igual para hombres que para mujeres? Pruebe la hipótesis adecuada. Usando el software estadístico statgraphic introducimos los datos para corroborar esta afirmación . como primera medida tenemos un resumen de los datos estadísticos que se pueden calcular . Resumen Estadístico
Recuento Promedio Desviación Estándar Coeficiente de Variación Mínimo Máximo Rango Sesgo Estandarizado Curtosis Estandarizada
hombre
mujer
10 77,4 2,06559 2,66872% 73,0 80,0 7,0 -1,47949 0,814864
10 74,5 1,58114 2,12233% 72,0 77,0 5,0 0 -0,577874
Esta tabla contiene el resumen estadístico para las dos muestras de datos. Pueden utilizarse otras opciones tabulares, dentro de este análisis, para evaluar si las diferencias entre los estadísticos de las dos muestras son estadísticamente significativas. De particular interés son el sesgo estandarizado y la curtosis estandarizada que pueden usarse para comparar si las muestras provienen de distribuciones normales. Valores de estos estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la normalidad, lo que tendería a invalidar las pruebas que comparan las desviaciones estándar. En este caso, ambos valores de sesgo estandarizado se encuentran dentro del rango esperado. Ambas curtosis estandarizadas se encuentran dentro del rango esperado. Ahora miramos si las varianzas son desconocidas pero iguales Comparación de Desviaciones Estándar hombre mujer
Desviación Estándar 2,06559 Varianza 4,26667 Gl 9 Razón de Varianzas= 1,70667
1,58114 2,5 9
Intervalos de confianza del 95,0% Desviación Estándar de hombre: [1,42079; 3,77096] Desviación Estándar de mujer: [1,08756; 2,88654] Razones de Varianzas: [0,423912; 6,87103] Prueba-F para comparar Desviaciones Estándar Hipótesis Nula: sigma1 = sigma2
Hipótesis Alt.: sigma1 sigma2 F = 1,70667 valor-P = 0,438071 No se rechaza la hipótesis nula para alfa = 0,05. Esta opción ejecuta una prueba-F para comparar las varianzas de las dos muestras. También construye intervalos ó cotas de confianza para cada desviación estándar y para la razón de varianzas. De particular interés es el intervalo de confianza para la razón de varianzas, el cual se extiende desde 0,423912 hasta 6,87103. Puesto que el intervalo contiene el valor de 1, no hay diferencia estadísticamente significativa entre las desviaciones estándar de las dos muestras con un nivel de confianza del 95,0% . También puede ejecutarse una prueba-F para evaluar una hipótesis específica acerca de las desviaciones estándar de las poblaciones de las cuales provienen las dos muestras. En este caso, la prueba se ha construido para determinar si el cociente de las desviaciones estándar es igual a 1,0 versus la hipótesis alternativa de que el cociente no es igual a 1,0. Puesto que el valor-P calculado no es menor que 0,05, no se puede rechazar la hipótesis nula. Ahora que sabemos que las varianzas son iguales r ealizamos el estadístico de prueba correspondiente, con sus intervalos de confianza al 95% Comparación de Medias
Intervalos de confianza del 95,0% para la media de hombre: 77,4 - 1,19739 [76,2026] Intervalos de confianza del 95,0% para la media de mujer: 74,5 - 0,916559 [73,5834] Intervalos de confianza del 95,0% para la diferencia entre las medias suponiendo varianzas iguales: 2,9 - 1,42644 [1,47356] Prueba t para comparar medias Hipótesis nula: media1 = media2 Hipótesis Alt.: media1 > media2 suponiendo varianzas iguales: t = 3,52542 valor-P = 0,0012082 Se rechaza la hipótesis nula para alfa = 0,05. Esta opción ejecuta una prueba-t para comparar las medias de las dos muestras. También construye los intervalos, ó cotas, de confianza para cada media y para la diferencia entre las medias. De particular interés es la cota de confianza para la diferencia entre medias, la cual se extiende por abajo hasta 1,47356. Esta indica el valor más pequeño para la diferencia que es soportado por los datos. También puede usarse una prueba-t para evaluar hipótesis específicas acerca de la diferencia entre las medias de las poblaciones de las cuales provienen las dos muestras. En este caso, la prueba se ha construido para determinar si la diferencia entre las dos medias es igual a 0,0 versus la hipótesis alterna de que la diferencia es mayor que 0,0. Puesto que el valor-P calculado es menor que 0,05, se puede rechazar la hipótesis nula en favor de la alterna.
Con esto demostramos que además de que hay diferencias significativas, decimos también que el promedio de temperaturas más confortable es para hombres que para mujeres. Se presentan algunos anexos gráficos para este problema:
Histograma.
Caja y bigotes.
25. Una compañía de transporte de carga desea escoger la mejor ruta para llevar la mercancía de un depósito a otro. La mayor preocupación es el tiempo de viaje. En el estudio se seleccionaron al azar cinco choferes de un grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron a la ruta B . Los datos obtenidos fueron:
a) ¿Existen diferencias significativas entre las rutas? Plantee y pruebe las hipótesis estadísticas
correspondientes. Empezamos con el resumen estadístico Resumen Estadístico
Recuento Promedio Desviación Estándar Coeficiente de Variación Mínimo
ruta A
ruta B
5 25,0 5,91608 23,6643% 18,0
5 29,0 5,61249 19,3534% 22,0
Máximo Rango Sesgo Estandarizado Curtosis Estandarizada
32,0 14,0 0,110217 -1,00416
35,0 13,0 -0,141996 -1,01913
Esta tabla contiene el resumen estadístico para las dos muestras de datos. Pueden utilizarse otras opciones tabulares, dentro de este análisis, para evaluar si las diferencias entre los estadísticos de las dos muestras son estadísticamente significativas. De particular interés son el sesgo estandarizado y la curtosis estandarizada que pueden usarse para comparar si las muestras provienen de distribuciones normales. Valores de estos estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la normalidad, lo que tendería a invalidar las pruebas que comparan las desviaciones estándar. En este caso, ambos valores de sesgo estandarizado se encuentran dentro del rango esperado. Ambas curtosis estandarizadas se encuentran dentro del rango esperado. Miramos si las varianzas son iguales Comparación de Desviaciones Estándar ruta A ruta B
Desviación Estándar 5,91608 Varianza 35,0 Gl 4 Razón de Varianzas= 1,11111
5,61249 31,5 4
Intervalos de confianza del 95,0% Desviación Estándar de ruta A: [3,54452; 17,0002] Desviación Estándar de ruta B: [3,36263; 16,1278] Razones de Varianzas: [0,115686; 10,6717] Prueba-F para comparar Desviaciones Estándar Hipótesis Nula: sigma1 = sigma2 Hipótesis Alt.: sigma1 sigma2 F = 1,11111 valor-P = 0,921125 No se rechaza la hipótesis nula para alfa = 0,05. Esta opción ejecuta una prueba-F para comparar las varianzas de las dos muestras. También construye intervalos ó cotas de confianza para cada desviación estándar y para la razón de varianzas. De particular interés es el intervalo de confianza para la razón de varianzas, el cual se extiende desde 0,115686 hasta 10,6717. Puesto que el intervalo contiene el valor de 1, no hay diferencia estadísticamente significativa entre las desviaciones estándar de las dos muestras con un nivel de confianza del 95,0% . También puede ejecutarse una prueba-F para evaluar una hipótesis específica acerca de las desviaciones estándar de las poblaciones de las cuales provienen las dos muestras. En este caso, la prueba se ha construido para determinar si el cociente de las desviaciones estándar es igual a 1,0 versus la hipótesis alternativa de que el cociente no es igual a 1,0. Puesto que el valor-P calculado no es menor que 0,05, n o se puede rechazar la hipótesis nula. Como son iguales las varianzas procedemos con el estadístico de prueba pertinente y su intervalo de confianza a 95%. Comparación de Medias
Intervalos de confianza del 95,0% para la media de ruta A: 25,0 +/- 7,34581 [17,6542; 32,3458] Intervalos de confianza del 95,0% para la media de ruta B: 29,0 +/- 6,96884 [22,0312; 35,9688] Intervalos de confianza del 95,0% intervalo de confianza para la diferencia de medias suponiendo varianzas iguales: -4,0 +/- 8,40982 [-12,4098; 4,40982] Prueba t para comparar medias Hipótesis nula: media1 = media2 Hipótesis Alt.: media1 media2 suponiendo varianzas iguales: t = -1,09682 valor-P = 0,304636 No se rechaza la hipótesis nula para alfa = 0,05.
Esta opción ejecuta una prueba-t para comparar las medias de las dos muestras. También construye los intervalos, ó cotas, de confianza para cada media y para la diferencia entre las medias. De interés particular es el intervalo de confianza para la diferencia entre las medias, el cual se extiende desde -12,4098 hasta 4,40982. Puesto que el intervalo contiene el valor de 0, no hay diferencia significativa entre las medias de las dos muestras de datos, con un nivel de confianza del 95,0%. También puede usarse una prueba-t para evaluar hipótesis específicas acerca de la diferencia entre las medias de las poblaciones de las cuales provienen las dos muestras. En este caso, la prueba se ha construido para determinar si la diferencia entre las dos medias es igual a 0,0 versus la hipótesis alterna de que la diferencia no es igual a 0,0. Puesto que el valor-P calculado no es menor que 0,05, no se puede rechazar la hipótesis nula. Se acepta la Ho con un nivel de confiabilidad de 95%, concluyendo que no existen diferencias significativas entre las rutas. A continuación, algunos gráficos:
Grafico caja y bigotes
Gráfico de cuartiles
c) Sugiera otra manera de obtener los datos (diseño alternativo), de manera que se pueda lograr una comparación más efectiva de las rutas. Se podría obtener una muestra más significativa para cada ruta y calcular su desviación estándar y sus respectivos coeficientes de variación, con esto podríamos escoger la ruta con el menor coeficiente de variación ya que sus datos serían más homogéneos
30. El mejor método de inoculación del problema anterior se apli có a dos variedades de maíz en dos localidades. Una vez infectada la mazorca, interesa medir el porcentaje final de la superficie de ésta que fue cubierta por el hongo y el peso en gramos del huitlacoche. Los resultados para la variedad 2 de maíz, obtenidos en 15 mazorcas de Texcoco y en 15 mazorcas de Cela ya son los siguientes:
a) ¿Se puede afirmar que el porcentaje de cobertura del hongo es mayor en Celaya que en Texcoco? Si es mayor en Celaya puesto que el promedio en general de este es de 62,66 % frente a la de Texcoco que es de 38 % b) Utilice un diagrama de dispersión (gráfica tipo X-Y) para ver si existe una relación lineal entre el porcentaje de cobertura de la mazorca con los gramos de huitlacoche.
% texacoco 250 R² = 0,6649
200 o c 150 o c a x e t 100 %
50 0 0
20
40
60
80
100
gramos texacoco
%celaya R² = 0,5886 400 350 300 a 250 y a l e 200 c %150
100 50 0 0
20
40
60
80
100
120
gramos celaya
c) Ignore la cobertura y pruebe la igualdad de la producción promedio de huitlacoche en las dos localidades. Primero hacemos el resumen estadístico Resumen Estadístico
Recuento Promedio Desviación Estándar Coeficiente de Variación Mínimo Máximo Rango Sesgo Estandarizado Curtosis Estandarizada
peso en gramos texcoco
peso en gramos celaya
15 93,3313 58,4853 62,6641% 12,81 203,45 190,64 0,55801 -0,594383
15 143,65 100,257 69,7925% 19,7 346,74 327,04 0,759644 -0,283823
Esta tabla contiene el resumen estadístico para las dos muestras de datos. Pueden utilizarse otras opciones tabulares, dentro de este análisis, para evaluar si las diferencias entre los estadísticos de las dos muestras son estadísticamente significativas. De particular interés son el sesgo estandarizado y la curtosis estandarizada que pueden usarse para comparar si las muestras provienen de distribuciones normales. Valores de estos estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la normalidad, lo que tendería a invalidar las pruebas que comparan las desviaciones estándar. En este caso, ambos valores de sesgo estandarizado se encuentran dentro del rango esperado. Ambas curtosis estandarizadas se encuentran dentro del rango esperado. Miramos si las varianzas son iguales o desconocidas Comparación de Desviaciones Estándar peso en gramos texcoco
Desviación Estándar 58,4853 Varianza 3420,53 Gl 14 Razón de Varianzas= 0,340302
peso en gramos celaya
100,257 10051,5 14
Intervalos de confianza del 95,0% Desviación Estándar de peso en gramos texcoco: [42,8186; 92,237] Desviación Estándar de peso en gramos celaya: [73,4008; 158,115] Razones de Varianzas: [0,114249; 1,01362] Prueba-F para comparar Desviaciones Estándar Hipótesis Nula: sigma1 = sigma2 Hipótesis Alt.: sigma1 sigma2 F = 0,340302 valor-P = 0,0527793 No se rechaza la hipótesis nula para alfa = 0,05. Esta opción ejecuta una prueba-F para comparar las varianzas de las dos muestras. También construye intervalos ó cotas de confianza para cada desviación estándar y para la razón de varianzas. De particular interés es el intervalo de confianza para la razón de varianzas, el cual se extiende desde 0,114249 hasta 1,01362. Puesto que el intervalo contiene el valor de 1, no hay diferencia estadísticamente significativa entre las desviaciones estándar de las dos muestras con un nivel de confianza del 95,0% . También puede ejecutarse una prueba-F para evaluar una hipótesis específica acerca de las desviaciones estándar de las poblaciones de las cuales provienen las dos muestras. En este caso, la prueba se ha construido para determinar si el cociente de las desviaciones estándar es igual a 1,0 versus la hipótesis alternativa de que el cociente no es igual a 1,0. Puesto que el valor-P calculado no es menor que 0,05, no se puede rechazar la hipótesis nula.
Con esto comprobamos que se tienen varianzas desconocidas pero iguales Ahora procedemos a comparar las medias para ver si son diferentes o iguales y sus correspondientes intervalos de confianza Comparación de Medias
Intervalos de confianza del 95,0% para la media de peso en gramos texcoco: 93,3313 +/- 32,3881 [60,9432; 125,719] Intervalos de confianza del 95,0% para la media de peso en gramos celaya: 143,65 +/- 55,5206 [88,1294; 199,171] Intervalos de confianza del 95,0% intervalo de confianza para la diferencia de medias suponiendo varianzas iguales: -50,3187 +/- 61,3885 [-111,707; 11,0699] Prueba t para comparar medias Hipótesis nula: media1 = media2 Hipótesis Alt.: media1 media2 suponiendo varianzas iguales: t = -1,67903 valor-P = 0,104273 No se rechaza la hipótesis nula para alfa = 0,05. El StatAdvisor
Esta opción ejecuta una prueba-t para comparar las medias de las dos muestras. También construye los intervalos, ó cotas, de confianza para cada media y para la diferencia entre las medias. De interés particular es el intervalo de confianza para
la diferencia entre las medias, el cual se extiende desde -111,707 hasta 11,0699. Puesto que el intervalo contiene el valor de 0, no hay diferencia significativa entre las medias de las dos muestras de datos, con un nivel de confianza del 95,0%. También puede usarse una prueba-t para evaluar hipótesis específicas acerca de la diferencia entre las medias de las poblaciones de las cuales provienen las dos muestras. En este caso, la prueba se ha construido para determinar si la diferencia entre las dos medias es igual a 0,0 versus la hipótesis alterna de que la diferencia no es igual a 0,0. Puesto que el valor-P calculado no es menor que 0,05, no se puede rechazar la hipótesis nula. Vemos que no hay diferencia significativa entre las medias de las dos variedades .
d) Es evidente que a mayor cobertura hay una mayor producción de huitlacoche, ¿habría forma de saber con estos datos si a igual cobertura corresponde una producción de huitlacoche semejante en ambas localidades? Argumente su respuesta. No hay manera de saber esto a ciencia cierta
32. Se desea comparar dos proveedores; para ello, se toma una muestra aleatoria de la producción de cada uno de n = 150 piezas, y se les hace en orden aleatorio una prueba. En el caso del primer proveedor se obtuvieron x1 = 11 piezas que no pasaron la prueba, mientras que para el segundo fueron x2 = 22. a) ¿Qué proveedor parece mejor?
Aquel cuyo número de defectos sea menor b) ¿Hay una diferencia significativa entre los dos proveedores? Pruebe la hipótesis correspondiente
a 95% de confianza. Para comprobar esto cogemos el estadístico de comparación siguiente, además tenemos los siguientes datos N1=N2=150
22 1 11 ,2 150 150
Formulamos nuestro Ho,
Tenemos el estadístico de prueba
1122 150150 0,11
11 22 150 150 2,0297 1 1 √ 0,11∗ (10,11) ∗(150 150) Como criterio de rechazo se tiene que se rechaza Ho si
(2,0297) < (1,64) Se rechaza Ho por tanto además de que Hay una diferencia significativa entre los dos proveedores vimos que el proveedor dos posee más defectuosos que el proveedor uno.
33. La prueba actual de un solo disco se tarda 2 minutos. Se propone un nuevo método de prueba que consiste en medir solamente los radios 24 y 57, donde casi es seguro que estará el valor mínimo buscado. Si el método nuevo resulta igual de efectivo que el método actual se podrá reducir en 60% el tiempo de prueba. Se plantea un experimento donde se mide la densidad mínima de metal en 18 discos usando tanto el método actual como el método nuevo. Los resultados están ordenados horizontalmente por disco. Así 1.88 y 1.87 es el resultado para el primer disco con ambos métodos.
a) Pruebe la igualdad de las medias usando l a prueba pareada. ¿Cuál es el criterio de apareamiento? Resumen Estadístico para metodo actual - metodo nuevo
Recuento Promedio Desviación Estándar Coeficiente de Variación Mínimo Máximo Rango Sesgo Estandarizado Curtosis Estandarizada
18 -0,00222222 0,0394902 -1777,06% -0,08 0,06 0,14 -0,672012 -0,600118
Esta tabla muestra los estadísticos de resumen para metodo actual-metodo nuevo. Incluye medidas de tendencia central, medidas de variabilidad y medidas de forma. De particular interés aquí son el sesgo estandarizado y la curtosis estandarizada, las cuales pueden utilizarse para determinar si la muestra proviene de una distribución normal. Valores de estos estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la
normalidad, lo que tendería a invalidar cualquier prueba estadística con referencia a la desviación estándar. En este caso, el valor del sesgo estandarizado se encuentra dentro del rango esperado para datos provenientes una distribución normal. El valor de curtosis estandarizada se encuentra dentro del rango esperado para datos provenientes de una distribución normal. Hipótesis Prueba de Hipótesis para metodo actual - metodo nuevo
Media Muestral = -0,00222222 Mediana Muestral = 0,01 Desviación Estándar de la Muestra = 0,0394902 Prueba t Hipótesis Nula: media = 0 Alternativa: no igual Estadístico t = -0,238745 Valor-P = 0,814158 No se rechaza la hipótesis nula para alfa = 0,05.
Esta ventana muestra los resultados de las pruebas relativas a la población de la cual procede la muestra de metodo actual-metodo nuevo. La prueba-t evalúa la hipótesis de que la media de metodo actual-metodo nuevo es igual a 0,0 versus la hipótesis alterna de que la media de metodo actual-metodo nuevo es no igual a 0,0. Debido a que el valor-P para esta prueba es mayor o igual a 0,05, no se puede rechazar la hipótesis nula, con un nivel de confianza del 95,0% de confianza. b) Encuentre un intervalo para la diferencia de medias usando la desviación estándar de las diferencias. Inteprete. Intervalos de Confianza para metodo actual - metodo nuevo
Intervalos de confianza del 95,0% para la media: -0,00222222 +/- 0,0196381 [-0,0218603; 0,0174158] Intervalos de confianza del 95,0% para la desviación estándar: [0,029633; 0,0592015] Este panel muestra los intervalos de confianza del 95,0% para la media y la desviación estándar de metodo actual-metodo nuevo. La interpretación clásica de estos intervalos es que, en muestreos repetidos, estos intervalos contendrán la media verdadera ó la desviación estándar verdadera de la población de la que fueron extraídas las muestras, el 95,0% de las veces. En términos prácticos, puede establecerse con 95,0% de confianza, que la media verdadera de metodo actual-metodo nuevo se encuentra en algún lugar entre -0,0218603 y 0,0174158, en tanto que la desviación estándar verdadera está en algún lugar entre 0,029633 y 0,0592015. Ambos intervalos asumen que la población de la cual proviene la muestra puede representarse por la distribución normal. Mientras que el intervalo de confianza para la media es bastante robusto y no muy sensible a violaciones de este supuesto, los intervalos de confianza para la desviación estándar son muy sensibles
c) Haga el análisis de los datos ignorando el apareamiento. Compare con los resultados del inciso a), ¿por qué ignorar el apareamiento es incorrecto? Miramos si la varianza son iguales Comparación de Desviaciones Estándar metodo actual metodo nuevo
Desviación Estándar 0,115018 Varianza 0,0132291 Gl 17 Razón de Varianzas= 1,04718
0,112397 0,012633 17
Intervalos de confianza del 95,0% Desviación Estándar de metodo actual: [0,0863079; 0,172428] Desviación Estándar de metodo nuevo: [0,0843411; 0,168499] Razones de Varianzas: [0,39172; 2,79944]
Prueba-F para comparar Desviaciones Estándar Hipótesis Nula: sigma1 = sigma2 Hipótesis Alt.: sigma1 sigma2 F = 1,04718 valor-P = 0,925382 No se rechaza la hipótesis nula para alfa = 0,05. Comparamos las medias
Prueba t para comparar medias Hipótesis nula: media1 = media2 Hipótesis Alt.: media1 media2 suponiendo varianzas iguales: t = -0,0586262 valor-P = 0,953593 No se rechaza la hipótesis nula para alfa = 0,05. Esta opción ejecuta una prueba-t para comparar las medias de las dos muestras. También construye los intervalos, ó cotas, de confianza para cada media y para la diferencia entre las medias. De interés particular es el intervalo de confianza para la diferencia entre las medias, el cual se extiende desde -0,0792544 hasta 0,07481. Puesto que el intervalo contiene el valor de 0, no hay diferencia significativa entre las medias de las dos muestras de datos, con u n nivel de confianza del 95,0%.
Resulta erróneo quitar el apareamiento puesto que se quiere verificar de que existan o no diferencias entre dos métodos que se relacionan entre si . d ) Determine un intervalo de confianza para la diferencia de medias suponiendo muestras independientes. Compare con el inciso b). Comparación de Medias
Intervalos de confianza del 95,0% para la media de metodo actual: 1,96056 +/- 0,0571971 [1,90336; 2,01775] Intervalos de confianza del 95,0% para la media de metodo nuevo: 1,96278 +/- 0,0558937 [1,90688; 2,01867] Intervalos de confianza del 95,0% intervalo de confianza para la diferencia de medias suponiendo varianzas iguales: -0,00222222 +/- 0,0770322 [-0,0792544; 0,07481]
e) ¿Qué se gana con el apareamiento de l os datos en este caso? Puesto que como dice la definición Son aquellas en las que los datos de ambos tratamientos se obtienen por pares, de manera que éstos tienen algo en común y no son independientes f ) ¿Recomendaría usted la adopción del método nuevo? Argumente su respuesta. El método actual tiene mayor tiempo de lectura. 37. Se realizó un experimento para ver si dos técnicos tienen alguna tendencia a obtener diferentes resultados cuando determina la pureza de cierto producto. Cada muestra fue dividida en dos porciones y cada técnico determinó la pureza de una de las porciones. Los resultados se muestran a continuación: a) Estos datos deben analizarse en forma pareada, explique por qué. ambos tratamientos se obtienen por pares, de manera que éstos tienen algo en común y no son independientes.se están comprobando a 2 técnicos bajo un mismo proceso de limpiar un mismo producto b) Formule la hipótesis correcta al problema. Ho: los técnicos obtienen los mismos resultados. Ha: los técnicos no obtienen los mismos resultados. c) Pruebe la hipótesis y obtenga conclusiones. Resumen Estadístico para Col_1 - Col_2
Recuento Promedio Desviación Estándar Coeficiente de Variación Mínimo Máximo Rango Sesgo Estandarizado Curtosis Estandarizada
8 1,1625 0,995615 85,6443% -0,4 2,8 3,2 0,126592 0,0258444
Prueba de Hipótesis para Col_1 - Col_2
Media Muestral = 1,1625 Mediana Muestral = 1,0 Desviación Estándar de la Muestra = 0,995615 Prueba t Hipótesis Nula: media = 0 Alternativa: no igual Estadístico t = 3,30253 Valor-P = 0,0130752 Se rechaza la hipótesis nula para alfa = 0,05. Esta ventana muestra los resultados de las pruebas relativas a la población de la cual procede la muestra de Col_1-Col_2. La prueba-t evalúa la hipótesis de que la media de Col_1-Col_2 es igual a 0,0 versus la hipótesis alterna de qu e la media de Col_1-Col_2 es no igual a 0,0. Debido a que el valor-P para esta prueba es menor que 0,05, se puede rechazar la hipótesis nula con un 95,0% de confianza. Con una confianza del 95 % se puede decir que las basculas no están sincronizadas adecuadamente por lo que pueden arrojar pesos distintos a iguales muestras. A continuación los intervalos de confianza: Intervalos de Confianza para Col_1 - Col_2
Intervalos de confianza del 95,0% para la media: 1,1625 +/- 0,832357 [0,330143; 1,99486] Intervalos de confianza del 95,0% para la desviación estándar: [0,658275; 2,02635] Este panel muestra los intervalos de confianza del 95,0% para la media y la desviación estándar de Col_1-Col_2. La interpretación clásica de estos intervalos es que, en muestreos repetidos, estos intervalos contendrán la media verdadera ó la desviación estándar verdadera de la población de la que fueron extraídas las muestras, el 95,0% de las veces. En términos prácticos, puede establecerse con 95,0% de confianza, que la media verdadera de Col_1-Col_2 se encuentra en algún lugar entre 0,330143 y 1,99486, en tanto que la desviación estándar verdadera está en algún lugar entre 0,658275 y 2,02635 .
d ) Si los técnicos son diferentes, ¿hay alguna evidencia sobre cuál de ellos hace mal el trabajo? No se sabría a ciencia cierta, pues la diferencia entre sus pesos no es tan grande como para tomar una decisión. e) ¿Qué recomendaría para lograr mayor uniformidad en las determinaciones de los dos técnicos? Que a los dos técnicos se les enseñe las mism as técnicas de pureza para que asi pudieran disminuir sus errores. A continuación, algunos gráficos. Gráfico de caja y bigotes
histograma
13. En un problema similar al del ejercicio 11, es necesario garantizar que la resistencia mínima que tiene un envase de plástico en posición vertical sea de 20 kg. Para evaluar esto se han obtenido los siguientes datos mediante pruebas destructivas:
a) Esta variable, forzosamente tiene que evaluarse mediante muestreo y no al 100%, ¿por qué? No se puede obtener al 100% porque no se sabe si todos los envases serán resistentes, Se debe hacer mediante una prueba de muestreo para verificar dicho dato, ya que asi se puede observar de mejor manera el dato requerido, y no inferirlo. el muestreo da una mejor visión del comportamiento de los envases a dicha Fuerza.
b) Haga un análisis exploratorio de estos datos (obtenga un histograma y vea el comportamiento de los datos obtenidos). Como se puede observar en la gráfica, el comportamiento de los envases a la prueba de resistencia, salió superior al límite establecido de 20 kg, por lo que se puede decir que los envases tienen la resistencia adecuada a dicha fuerza. Histograma
c) Estime, con una confianza de 95%, ¿cuál es la resistencia promedio de los envases? Intervalos de Confianza para A.Col_1
Intervalos de confianza del 95,0% para la media: 27,2464 +/- 0,383076 [26,8634; 27,6295] Intervalos de confianza del 95,0% para la desviación estándar: [1,20597; 1,75838] Este panel muestra los intervalos de confianza del 95,0% para la media y la desviación estándar de A.Col_1. La interpretación clásica de estos intervalos es que, en muestreos repetidos, estos intervalos contendrán la media verdadera ó la desviación estándar verdadera de la población de la que fueron extraídas las muestras, el 95,0% de las veces. En términos prácticos, puede establecerse con 95,0% de confianza, que la media verdadera de A.Col_1 se encuentra en algún lugar entre 26,8634 y 27,6295, en tanto que la desviación estándar verdadera está en algún lugar entre 1,20597 y 1,75838. La resistencia promedio de los envases va de 26.85478 y 27.85478, cuya diferencia es igual a 1
d ) Antes del estudio se suponía que m = 25. Dada la evidencia de los datos, ¿tal supuesto es correcto? Prueba de Hipótesis para A.Col_1
Media Muestral = 27,2464 Mediana Muestral = 27,35 Desviación Estándar de la Muestra = 1,43044 Prueba t Hipótesis Nula: media = 25,0 Alternativa: no igual Estadístico t = 11,7521 Valor-P = 0 Se rechaza la hipótesis nula para alfa = 0,05.
Se comprueba que la media no era igual a 25 para este caso 15. Una característica importante en la calidad de la leche de vaca es la concentración de grasa. En una industria en particular se fijó como estándar mínimo que el producto que recibe directamente de los establos lecheros es de 3.0%. Por medio de 40 muestreos y evaluaciones en cierta época del año se obtuvo que X = 3.2 y S = 0.3. a) Estime con una confianza de 90% el contenido promedio poblacional de grasa.
Tenemos la fórmula que es: Para límite superior
Para límite inferior
Tenemos que t de alfa medios de 0,05 a 39 grados de libertad extrapolando es 1, [3.2-1.686(0.474)
View more...
Comments