Laboratorio 1
Short Description
Download Laboratorio 1...
Description
LABORATORIO 1. I PARA HALLAR INTERVALOS DE CONFIANZA 1. Ingrese los datos en una columna (coloque nombre a la variable) 2. Seleccione estadísticas> estadísticas básicas>1_sample Z ( ó 1_sample t) Cuando aparezca el cuadro de dialogo Coloque los valores de C1 en el cuadro samples im column ingresar la desviación estándar en el cuadro estándar deviation ingresar el nivel de confianza (pasar al paso 4) sino ir a **(si el nivel de confianza es diferente de 95%) Seleccionar options cuando aparezca el cuadro de diálogo 1 sample Z ingresar el nuevo nivel de confianza en el cuadro Confidence level 4. Damos aceptar en gráficos y seleccionamos Las tres opciones 5. Colocamos ok a todo II PARA SELECCIONAR UNA MUESTRA ALEATORIA SIMPLE 1. Seleccionar Calc 2. Elegir ramdon data >sample from columns 3. Cuando aparezca el cuadro de dialogo >sample from columns 4. Ingresar n en el cuadro sample 5. Ingresar C1 C2 en el cuadro que se encuentra debajo 6. Ingresar C3 C4 en el cuadro 7. Ok. EJERCICIOS 1. Suponga que la siguiente data corresponde a los ingresos salariales de 50 trabajadores durante una semana en el cual se sabe que el ingreso promedio es de 680 soles con una desviación estándar de 36 soles. 658
670
679
731
710
631
663
654
657
642
688
694
665
600
721
704
617
729
654
615
747
623
710
669
635
641
689
689
710
617
721
689
741
720
670
625
683
700
638
670
702
687
706
725
692
648
674
678
678
678
Obtenga un intervalo de confianza del 95% para la media de los ingresos salariales y sustente una breve interpretación mediante algunos gráficos de interés. 2. En el análisis del tamaño de partículas de oro se tomó una muestra aleatoria de 50 gramos de arenilla de este metal. Las longitudes (en milímetros) se muestran a continuación 1.9 1.4 6.0 1.1
1.2 1.5 1.6 1.8
2.4 0.8 4.4 2.1
3.7 1.7 1.1 2.1
3.6 1.8 2.7 1.8
4.5 2.2 3.1 5.5
0.8 1.8 4.9 1.0
1.9 1.8 2.0 1.5
3.4 3.8 1.7 1.8
1.3 2.0 2.8 2.0
1.6 1.7 1.8 1.1
1.0 5.0 2.9
0.9 3.1 1.5
a. Hallar un muestreo aleatorio simple de 17 partículas de oro b. Hallar un intervalo de confianza del tamaño promedio de partículas de oro con un nivel de confianza del 90% 3. Suponga que los datos que se presentan a continuación representan los precios de un artículo WW (nuevos soles) en 40 establecimientos elegidos al azar en el distrito de Lince 5.2 10.2 7.0 7.1 10.2 8.3 9.4 9.2 5.4 8.1 6.5 7.1 6.6 7.5 7.8 7.8
6.8 8.2
7.2 7.8
8.4 6.6
9.6 5.3
8.7 6.2
7.3 9.1
8.5 8.6
5.7 7.0
6.4 7.7
10.1 8.3
8.2 7.5
9.0 9.8
Hallar un intervalo de confianza del precio promedio del artículo WW con un nivel de confianza del 90%
1
4. Un contratista piensa comprar una gran cantidad de radios a cierto fabricante. Este asegura al contratista que la duración promedio de los radios es de 3600 días con una desviación estándar de 40 días. El contratista decide comprar los radios sólo si una muestra aleatoria de 64 de éstos da como resultado una vida promedio de por lo menos 3600 días. ¿Cuál es la probabilidad de que el contratista adquiera los radios? 5. La tabla muestra los saldos en las tarjetas de crédito de una muestra de 70 familias. Use un nivel de confianza del 95% Saldos en las tarjetas de crédito de una muestra de 70 familias 9430 14661 7159 9071 9691 11032 7535 12195 8137 3603 11448 6525 4078 10544 9467 16805 8279 5239 5604 13659 12595 13479 5649 6195 5179 7061 7917 14044 11298 12584 4416 6245 11346 6817 4353 15415 10376 13021 12806 6845 3467 15917 1627 9719 4972 10493 6191 12591 10112 2200 1135 615 12851 9743 6567 10746 7117 13627 5337 10324 13627 12744 9465 12557 8372 18719 5742 19263 6232 7445 a. Estimar el intervalo de confianza para la media del adeudo en las tarjetas de crédito en la población de familias b. Suponga que se pretende seleccionar una muestra aleatoria simple de 30 familias para hacer un estudio del adeudo del saldo de sus tarjetas de crédito. 6. Se realizó una encuesta sobre ingresos mensuales de jóvenes adultos (entre 21 y 35 años) Para algunos, se podría tratar del público objetivo soñado: ―su consumo está en ascenso. No tienen hijos, viven con sus padres y portan mucho en los gastos del hogar, además d adquirir su propios productos. Cada vez están más bancarizados. Su nivel de sofisticación se eleva con la edad‖ afirma una investigadora de merados. Los datos se registran a continuación. 2117 2312 2069 2418 2165 2002
2214 1927 2983 2189 2140 2088
1882 1667 2429 2019 2315 2394
2458 2302 2204 2179 2452 2004
167 1950 2204 2379 1895 2216
1851 2189 2164 2273 2024 1908
1989 2427 2210 2258 2347
2156 2297 2112 2153 2281
2287 2024 2022 2022 2201
2042 2223 2287 1844 2341
a. Estimar el intervalo de confianza para la media del adeudo en las tarjetas de crédito en la población de familias b. Suponga que se pretende seleccionar una muestra aleatoria simple de 30 familias para hacer un estudio del adeudo del saldo de sus tarjetas de crédito. 7. El instituto de investigación de educación superior de la UCLA cuenta con estadísticas sobre las áreas que son más elegidas por los estudiantes de nuevo ingreso. Las cinco más elegidas son arte y Humanidades(A), administración de Negocios (B), política (P) y ciencias sociales (S).(fuente: The New York Times Almanac) Otras áreas (O) entre las que se encuentra biología, física, ciencias de la computación y educación se agruparon todas en una sola categoría.las siguientes fueron las áreas elegidas por 64 estudiantes de recién ingreso de una muestra. S P P O B E E A B O B O E P O O B S S O O O O O O A O E E B O B P E B S O B O A E B E B A O E O E O A A P O B P B A S O O E O B Hallar un muestreo aleatorio simple de 17 áreas elegidas al azar por los alumnos
2
8. Suponga que estamos interesados en estimar la rapidez de lectura promedio (número de palabras por minuto) de estudiantes egresados de cuarto medio y calcular esto con un 95% de nivel de confianza. Para ello tomamos una muestra al azar de 6 graduados y obtuvimos que sus rapideces fueron: 200, 240, 300, 410, 600, y 450 9. Un cuestionario fue aplicado entre 20 trabajadores de una empresa distribuidora de materiales de construcción obteniendo las siguientes respuestas trabajador Nivel de estudios edad Salario(soles) Años de la empresa 1 Superior universitaria 34 1100 5 2 Superior universitaria 43 1450 8 3 Secundaria 31 750 6 4 Secundaria 37 750 8 5 Secundaria 24 600 3 6 Secundaria 25 600 2 7 Secundaria 27 600 5 8 Secundaria 22 600 2 9 Secundaria 21 960 3 10 Superior técnica 26 960 3 11 Superior técnica 24 540 1 12 Secundaria 26 540 1 13 Secundaria 25 540 1 14 Secundaria 21 540 1 15 Secundaria 22 540 1 16 Secundaria 28 600 2 17 Secundaria 24 600 2 18 Superior técnica 23 860 3 19 Superior técnica 27 860 3 20 Superior universitaria 30 1100 4 a. Hallar un muestreo aleatorio simple de 13 trabajadores con las variables nivel de estudios y salario b. Hallar un intervalo de confianza de años promedio de trabajo en la empresa con un nivel de confianza del 99% 10. Se ha llevado a cabo un estudio para evaluar los volúmenes de venta (miles de soles por día) de los establecimientos comerciales en un distrito de Lima Para ello se eligieron al azar 36 establecimientos encontrándose los siguientes resultados. 11.7 2.1 3.7 15.4 5.4 7.2
5.7 5.8 5.3 2.5 7.4 6.7
10.1 4.6 7.8 4.6 3.2 8.4
8.5 8.7 4.4 7.4 1.5 6.1
6.4 9.1 9.8 12.1 4.5 5.7
4.7 5.2 4.6 6.7 7.7 8.4
a. Hallar un intervalo de confianza de los volúmenes de venta de todos los establecimientos comerciales con un nivel de confianza del 90% 11. Un fabricante produce anillos para los pistones de un motor de automóvil. Se sabe que el diámetro del anillo está distribuido aproximadamente de manera normal, y que tiene una desviación estándar de 0,001 mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de X = 74,036 mm. a) Construya un IC bilateral del 99% para el diámetro promedio del anillo. b) Construya un límite inferior de confianza del 95% para el diámetro promedio del anillo 12. Se utilizan dos máquinas para llenar botellas de plástico con detergente para máquinas lavaplatos. Se sabe que las desviaciones estándar del volumen de llenado son s1 = 0,10 onzas de líquido y s2 = 0,15 onzas de líquido para las dos máquinas, respectivamente. Se toman dos muestras aleatorias, n1 = 12 botellas de la máquina 1 y n2 = 10 botellas de la máquina 2. Los volúmenes promedio de llenado son x1 = 30,87 onzas de líquido y x 2 = 30,68 onzas de líquido. a) Construya un IC bilateral del 90% para la diferencia entre las medias del volumen de llenado. b) Construya un IC bilateral del 95% para la diferencia entre las medias del volumen de llenado. Compare el ancho de este intervalo con el ancho del cálculo en el inciso a).
3
c) Construya un IC superior del 95% para la diferencia de medias del volumen del llenado PARA HACER UNA PRUEBA DE HIPÓTESIS Prueba de hipótesis Supongamos que queremos probar H 1 : 295 / caso 1 H 0 : 295 contra Prueba de hipótesis para la media poblacional (desviación estándar conocida) 1. Ingrese los datos en una columna (coloque nombre a la variable) 2. Seleccione estadísticas> estadísticas básicas>1_sample Z ( ó 1_sample t) 3. Cuando aparezca el cuadro de dialogo Coloque los valores de C1 en el cuadro samples in column 4. ingresar la desviación estándar en el cuadro estándar deviation Ingresar 295 en el cuadro Test mean Seleccionar options Cuando aparezca el cuadro de diálogo 1_sample Z options Ingresar 95 en el cuadro confidence level Seleccionar not equal (para el caso 1 ) Ok ok Prueba de hipótesis para la media poblacional (desviación estándar desconocida) H1 : 7 caso 2 H 0 : 7 contra 1. Ingrese los datos en una columna (coloque nombre a la variable) 2. Seleccione estadísticas> estadísticas básicas> ( 1_sample t) 3. Cuando aparezca el cuadro de dialogo 1_sample t Coloque los valores de C1 en el cuadro samples in column Ingresar 7 en el cuadro Test mean Seleccionar options Cuando aparezca el cuadro de diálogo 1_sample t options Ingresar 95 en el cuadro confidence level Seleccionar greater than en el cuadro alternative Ok ok
Para hallar el estadístico de la prueba z 1. Seleccionar el menú cal 2. Elegir Probability distributions> normal 3. Cuando aparezca el cuadro de dialogo normal distribution: . Seleccionar Cumulative probability Ingresar 0 en el cuadro Mean Ingresar 1 en el cuadro Standard deviation Seleccionar Input Constant Ingresar el valor del estadístico de la prueba (por ejemplo -2.67)) en el cuadro input cosntant >ok Minitab devuelve la probabilidad acumulada 0.0038 que es el valor p de la prueba para la cola inferior. Para una prueba de cola superior se hace valor p = 1- probabilidad acumulada=1-0.0038=0.9962 y para una prueba de hipótesis bilateral es el doble del mínimo de los valores p correspondientes a las colas inferior y superior es decir el valor correspondiente a z= -2.37 es 2(0.0038)=0.0076 Para hallar el valor P a partir del estadístico de la prueba t 1. Seleccionar el menú cal 2. . Elegir Probability distributions> t 3. Cuando aparezca el cuadro de dialogo t distribution: . Seleccionar Cumulative probability Ingresar (grados de libertad por ejemplo 59) en el cuadro Degrees of freedom
4
Seleccionar Input Constant > Ingresar el valor del estadístico de la prueba (por ejemplo -2.67)) en el cuadro input cosntant ok Minitab devuelve la probabilidad acumulada 0.9646 que es el valor p de la prueba para la cola inferior. Para una prueba de cola superior se hace valor p = 1- probabilidad acumulada=1-9646=0.0354 y para una prueba de hipótesis bilateral es el doble del mínimo de los valores p de 0.9646 y 0.0354 para obtener el valor p es 2(0.0354)=0.0708 Para hallar el estadístico de la prueba F Vamos a suponer que el estadístico de la prueba es F=2.40 con 25 y 15 grados de libertad. 1. Seleccionar el menú Cal 2. Elegir Probability distributions> F 3. Cuando aparezca el cuadro de dialogo F distribution: . Seleccionar Cumulative probability Ingresar (grados de libertad1) en el cuadro Numerator Degrees of freedom Ingresar (grados de libertad 2) en el cuadro Denominator Degrees of freedom Seleccionar Input Constant Ingresar (valor de la F calculada) en el cuadro Input Constant > ok Minitab devuelve la probabilidad acumulada 0.9594 que es el valor p de la prueba para la cola inferior. Para una prueba de cola superior se hace valor p = 1- probabilidad acumulada=1-9594=0.0406 y para una prueba de hipótesis bilateral es el doble del mínimo de los valores p de 0.9594 y 0.0406 para obtener el valor p es 2(0.0406)=0.0812 Para hallar el estadístico de la prueba X2 Vamos a suponer que el estadístico de la prueba es X 2 =28.18 con 23 grados de libertad. 1. Seleccionar el menú Cal 2. Elegir Probability distributions> X2 3. Cuando aparezca el cuadro de dialogo Chi -square distribution: . Seleccionar Cumulative probability Ingresar (grados de libertad) en el cuadro Degrees of freedom Seleccionar Input Constant Ingresar (valor de la X2 calculada) en el cuadro Input Constant > ok Minitab devuelve la probabilidad acumulada 0.7909 que es el valor p de la prueba para la cola inferior. Para una prueba de cola superior se hace valor p = 1- probabilidad acumulada=1-0.7909 =0.2091 y para una prueba de hipótesis bilateral es el doble del mínimo de los valores p de 0.7909 y 0.2091 para obtener el valor p es 2(0.2091) = 0.4181 PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE MEDIAS H 1 : 1 2 0 caso 3 H 0 : 1 2 0 contra 1. Ingrese los datos C1 y C2 (coloque nombres a las variables) 2. Seleccione estadísticas> estadísticas básicas> ( 2_sample t) 3. Cuando aparezca el cuadro de diálogo 2-sample t (test and confidence interval) Seleccionar Samples en different columns Coloque los valores de C1 en el cuadro first Ingresar C2 en el cuadro second Seleccionar options 4.Cuando aparezca el cuadro de diálogo 2_sample t -options Ingresar 95 en el cuadro confidence level Seleccionar 0 en el cuadro Test difference Seleccionar not equal en el cuadro alternative Ok Ok
5
PRUEBA DE HIPÓTESIS PARA DOS VARIANZAS POBLACIONALES caso 4 H 0 : 21 22 contra H1 : 21 22 1
1
1
1
1. Ingrese los datos C1 y C2 (coloque nombres a las variables) 2. Seleccione estadísticas> estadísticas básicas> ( 2_variances) 3. Cuando aparezca el cuadro de diálogo 2-variances Seleccionar Samples en different columns Coloque los valores de C1 en el cuadro first Ingresar C2 en el cuadro second Ok 1. Un fabricante afirma que el consumo promedio de gasolina de su motor es menos de 4 galones por tarea fija. Pero los usuarios contradicen al fabricante. Si a usted le piden su opinión estadística aplicando la siguiente muestra al Azar de los consumos (en galones) por tarea de 15 unidades de motor 4.25 3.45 4.05 3.8 3.5 4 3.75 2.5 6.1 2.5 2.5 3.4 3.2 2.8 5 a. ¿Cree usted que los consumidores tienen la razón? Asuma supuestos del método y use la probabilidad de error tipo I igual a 0.05 2. El volumen de negociaciones en la bolsa de Nueva York es más intenso en la primera media hora (en la mañana temprano) y la última media hora (al final de la tarde) de un día de trabajo. A continuación se presentan los volúmenes (en millones de acciones) de 13 días de enero y febrero: 214 163 265 194 180 202 298 212 201 174 171 211 211 La distribución de probabilidad de los volúmenes de negociaciones es aproximadamente normal. 3.Los siguientes datos corresponden a la longitud medida en centímetros de 18 pedazos de cable sobrantes en cada rollo utilizado: 9 3.41 6.13 1.99 6.92 3.24 3.12 7.86 2.01 5.98 4.15 5.05 6.87 1.97 4.01 3.56 8.04 7.37 Basados en estos datos ¿podemos decir que la longitud media de los pedazos de cable es mayor de 4 cm? Suponga población normal y tome el nivel de significancia 0,05. La proposición cuya validez o invalidez queremos probar es "la longitud promedio de los pedazos de cable es como mucho 4 cm." 4. Un agrónomo mide el contenido promedio de humedad en cierta variedad de trigo que fue secado especialmente en una muestra de 16 toneladas: 7.2 7 7.3 7.3 7.5 6.8 6.9 7.3 7.4 7.2 7.3 7.6 7.1 7.4 6.7 7.4 Si el promedio de humedad excede de 7,1 el secado debe continuar. ¿Debería continuarse con el proceso de secado, de acuerdo con esta evidencia? Tome un nivel de significancia del 5%.
5. En el pasado una máquina ha producido arandelas con un grosos de 0.050 pulgadas. Para determinar si la máquina sigue en buenas condiciones de producción, se toma una muestra de 10 arandelas, que resulta tener un grosor medio de 0.053 pulgadas y una desviación típica de 0.03 pulgadas. a. Ensayar la hipótesis de que la máquina esté en buenas condiciones de producción al nivel de significación del 0.05 b. Hallar el valor p de la prueba c. Qué tipo de error se comete? Hallarlo
6
6. Un artículo en la revista Consumer Reports, de noviembre de 1983, comparo varios tipos de baterías. Los promedios de duración de baterías AA alcalinas marca Duracell, Eveready Energizer fueron 4, 1 y 4, 5 horas, respectivamente. Suponga que estos son los promedios de duración poblacionales. a) Sea X la duración promedio muestral de 100 baterías Duracell, e Y la duración promedio muestral de 100 baterías Eveready. ¿Cuál es el valor medio de X - Y (es decir, donde está centrada a distribución de X - Y ¿De qué manera incluyen los tamaños muestrales especificados en su respuesta? b) Suponga que las desviaciones estándar poblacionales de duración son 1,8 horas para baterías Duracell y 2,0 horas para baterías Eveready. Con los tamaños muestrales dados en el inciso a) ¿Cuál es la varianza del estadístico X - Y , y cuál es su desviación estándar? c) Para los tamaños muestrales dados en el inciso a), trace una figura de la curva aproximada de la distribución de X - Y (incluya una escala de medida en el eje horizontal). ¿La forma de la curva sería necesariamente la misma para tamaños muestrales de 10 baterías de cada tipo? Explique. 7. ¿Los estudiantes universitarios hombres se aburren más fácilmente que sus compañeras mujeres? Esta pregunta se examinó en el artículo ―Boredom in Young Adults—Gender and Cultural Comparisons‖ Los autores aplicaron la Escala de propensión al aburrimiento a 97 estudiantes hombres y 148 mujeres de universidades de Estados Unidos. ¿La siguiente información apoya la hipótesis de investigación de que la tasa de aburrimiento es más alta para hombres que para mujeres? Pruebe las hipótesis apropiadas usando un nivel de significancia de 0,05. género Hombres mujeres
Tamaño muestral 97 148
Media muestral 10.40 9.26
Desviación estándar muestral 4.83 4.68
8. Se realizó un experimento para comparar la resistencia a la fractura del acero con níquel maragizado, con el acero de pureza comercial del mismo tipo .Para n1 = 32 especímenes, la resistencia promedio muestral fue de x1 = 65,6 para el acero de alta pureza, muestras que x2 = 59,8 para n2 = 38 especímenes del acero comercial. Debido a que el acero de alta pureza es más costoso, su uso para ciertas aplicaciones puede justificarse sólo si su resistencia a la fractura excede la del acero de pureza comercial en más de 5. Suponga que ambas distribuciones de resistencia son normales. a) Si se supone que S1 = 1,2 y S2 = 1,1, pruebe las hipótesis pertinente usando = 0,001. b) Calcule para la prueba del inciso a) cuando μ1 − μ2 = 6. 9. Se encontró que la desviación estándar muestral de concentración de sodio en sangre entera para n1 = 20 anguilas marinas fue s1 = 40,5, mientras que la desviación estándar muestral de concentración para n2 = 20 anguilas de agua dulce fue s2 = 32,1. Si se supone normalidad de las dos distribuciones, pruebe al nivel 0,10 para ver si la información sugiere cualquier diferencia entre varianzas de concentración para los dos tipos de anguilas. 10. Se cree que la portada y la naturaleza de la primera pregunta de encuestas por correo influyen en la tasa de respuesta. Se probó esta teoría al experimentar con diferentes diseños de portadas. Una portada era sencilla, y la otra utilizó la figura de un paracaidista. Los investigadores especularon que la tasa de devolución sería menor para la portada sencilla. Portada Sencilla paracaidista
Número de envíos 207 213
Número de devoluciones 104 109
¿Esta información apoya la hipótesis de los investigadores? Pruebe las hipótesis pertinentes usando Un nivel de significancia de 0,10, calculando primero un valor P. 11. Una planta industrial utiliza un procedimiento tradicional T de producción. Se propone un procedimiento de producción moderno M. La planta cambiará el procedimiento M sólo si éste resulta más rápido. A fin de tomar la decisión se escogieron dos muestras aleatorias independientes, una de 9 tiempos del proceso T y otra de 10 tiempos del proceso del proceso M resultando los siguientes tiempos en segundos Muestra T: 06 14 08 11 10 18 15 20 13 Muestra M: 12 11 12 10 14 15 10 13 14 12 Al nivel de significación 0.05 ¿Cuál será la decisión a tomar? Asuma los requerimientos del método
7
PRUEBA PARA BONDAD DE AJUSTE Se ingresan las frecuencias observadas y las frecuencias esperadas
1. Seleccionar el menú Cal 2. Elegir calculator 3. Cuando aparezca el cuadro de diálogo calculator Ingresar Chi.square en el cuadro store result in variable Ingresar sum (C1-C2)**2/C2 en el cuadro Expression Ok 4. Seleccionar el menú calc 5. Elegir probabiliy distribution: 6. Elegir Chi square 7. Cuando aparezca el cuadro de dialogo Chi-square distribution: 8. Seleccionar cumulative probability 9. Ingresar 2 en el cuadro Degree of Freedom 10. Seleccionar input column e ingresar Chi square en el cuadro 11. Ok Prueba de independencia Se ingresan los datos en las columnas 1, 2, 3… 1. Selecionar el menú Stat 2. Seleccionar Tables 3. Elegir Chi square Test (Table in worksheet) 4. Cuando aparezca el cuadro de diálogo Chi-square Test Ingresar C1_C3… en el cuadro Columns containing the table ok 1. EJEMPLO 1 Histogramas de frecuencia: Para realizar un histograma de frecuencia se sigue la siguiente secuencia: graph > histogram >options >frecuency >cutpoint ># intervals 10. Para mostrar las frecuencias en la gráfica, ingresar a y activar Ademas en < ingresar a para colocar un título.
De este modo se obtiene la siguiente gráfica.
8
EJEMPLO 2 Considere que la demanda semanal de un producto tiene una distribución normal. Haga una prueba de bondad de ajuste con los siguientes datos, para probar esta hipótesis. Use alpha= 0.10. 18 20 22 27 22 25 22 27 25 24 26 23 20 24 26 27 25 19 21 25 26 25 31 29 25 25 28 26 28 24 Solución Debemos probar: H0: La demanda semanal del producto tiene una distribución normal H1: La demanda semanal del producto no tiene una distribución normal Usando Minitab: Usemos este programa de la siguiente manera: Vamos a clasificarlas a las 30 observaciones en un conjunto de k categorías, de manera que podamos tener O 1, O2, ...., Ok observaciones; es decir, vamos a construir una tabla de frecuencias, donde las frecuencias absolutas será los Oi, las pi será las probabilidades de que un valor Xi esté en un determinado intervalo; es decir, pi = P(LimSup) – P(LimInf). Estas probabilidades las hallaremos usando la distribución normal en el cual hemos estimado dos parámetros: la media con el promedio de la muestra y la varianza con la varianza de la muestra s². De esta forma, al buscar los grados de libertad, debemos usar k-1-2 por ser dos los parámetros que se estimaron. Procedimiento: Para ello usaremos datos agrupados de manera que k representará el número de intervalos. Puesto que tenemos 30 observaciones, hagamos que k = 8. Los siguientes pasos nos permitirán la tabla anterior Paso 1: Ingresamos los datos en la columna C1. Paso 2: Obtención de Estadísticas Descriptiva de los datos observados: - - - C1 - Los resultados son los siguientes: Descriptive Statistics: Demanda Total Variable Count Mean StDev Demanda 30 24.500 3.014 Media = 24.5 Desviación estándar = 3.014 Valor mínimo = 18
Variance Minimum Maximum 9.086 18.000 31.000
Range 13.000
9
Valor máximo = 31 Ancho o Amplitud de intervalo = 13/8 = 1.625 Paso 3: Obtención de las marcas de clase (Xi) (columna C5) que constituyen las observaciones en datos agrupados: Oi : Tabulamos, simplemente. En todo caso, use el procedimiento dado al final del capítulo II, siga paso a paso y con cuidado. Al editar la escala X debe ingresar según se indica en la siguiente figura de la izquierda:
Usando el botón derecho sobre una barra agregue etiquetas. El resto es sencillo para obtener la tabla de frecuencias. La imagen de la derecha muestra lo que se debe obtener:
Paso 4: Obtención de las probabilidades para las columnas Lim. Inf. (C3) y Lim. Sup.(C4). Para ello usamos: i) - - - - 24.5 - 3.014 - C3 - C6 - ii) - - - - 24.5 3.014 - C4 - C7 - Paso 5: Obtención de la columna C8 (P(X = xi):< Calc> - - C8 C7 – C6 Paso 6: La columna C9 es una copia de la columna C5 que son los Oi. Paso 7: Obtención de la columna C10 (Ei): Usamos la calculadora para ingresar la expresión Sum(C9)*C8 Paso 9: Obtención de la columna C11: (Oi-Ei)²/Ei: Usamos la calculadora para ingresar la expresión (Oi-ei)**2/ei Paso 10: Suma de estos valores: Sum(C11) = 6.5307 Paso 11: El valor de Chi – Cuadrado con 7 grados de libertad y 10% de nivel: 9.23636 Puesto que < (5) ; es decir, 6.5307 < 9.23636 (no es mayor que el valor teórico) concluimos que hay suficiente evidencia para afirmar que la demanda semanal de dicho producto tiene una distribución normal (no se rechaza la hipótesis nula). A continuación mostramos la tabla obtenida:
10
C3 LINF 18.000 19.625 21.250 22.875 24.500 26.125 27.750 29.375
C4 LSUP 19.625 21.250 22.875 24.500 26.125 27.750 29.375 31.000
C5 XI 2 3 3 4 11 3 3 1
C6 P(LIMINF) 0.016 0.053 0.140 0.295 0.500 0.705 0.860 0.947
C7 P(LIMSUP) 0.053 0.140 0.295 0.500 0.705 0.860 0.947 0.984
C8 P(x=XI) 0.037 0.088 0.154 0.205 0.205 0.154 0.088 0.037
C9 OI 2 3 3 4 11 3 3 1
C10 EI 1.121 2.627 4.633 6.153 6.153 4.633 2.627 1.121
C11 (OI-EI)2/EI 0.0689 0.053 0.576 0.754 3.818 0.576 0.053 0.013
La siguiente gráfica prueba la afirmación planteada como hipótesis nula. Y como bien, concluimos: Hay evidencia.
EJERCICIOS 1. (Bondad de ajuste a una Binomial) Un estudiante el cual había lanzado en 359 ocasiones cinco monedas iguales al aire (lo que hace un total de 17,950 lanzamientos) obteniendo 464 más caras que cruces. ¿Es este resultado estadísticamente significativo?.En la siguiente tabla se muestran los resultados obtenidos por el estudiante. Número de caras en los cinco lanzamientos 0 1 2 3 4 5 Total de lanzamientos de 5 monedas
Frecuencia observada 100 524 1080 1126 655 105 3590
2. (Prueba de independencia) Un estudio se realizó con 81 personas referente a la relación entre la cantidad de violencia vista en la televisión y la edad del televidente, produjo los siguientes datos
Poca violencia Mucha violencia
16-34 8 18
34-35 12 15
55 o más 21 7
¿Indican los datos que ver violencia n la televisión depende de la edad del televidente a un nivel de significación del 5%?
11
3. Estamos interesados en estudiar la relación entre cierta enfermedad y la adicción al tabaco. Para realizar esto seleccionamos una muestra de 150 individuos, 100 individuos no fumadores y 50 fumadores. La siguiente tabla muestra las frecuencias de enfermedad en cada grupo
Fumadores No fumadores
Padecen la enfermedad 12 25
No padecen la enfermedad 88 25
Realizar un contraste de hipótesis y obtener las conclusiones sobre la relación entre las variables 4.Dada la siguiente tabla X Y Menos de 100 Entre 100 y 300 Más de 300 total
A favor
En contra
indeci sos
Total
3
2
2
7
9
6
7
22
7 19
7 15
2 16
21 50
Aceptaría el partido político que el sueldo medio de los electores explicase el grado de aceptación del programa electoral a un nivel de confianza del 95%.x:columnas y:filas 4. Una compañía de venta de libros quiere saber si el volumen de ventas, V, de sus distribuidores es independiente del carácter C, de los mismos. Para ello, recoge los siguientes datos de una muestra de 250 vendedores: V bajo medio alto C Antipáticos 38 29 9 Normales 30 42 7 simpáticos 32 59 4 Realiza un test de independencia a nivel de significación de α =0,01
ANOVA UNA VÍA Diseño completamente aleatorizado 1. Ingresar en diferentes columnas cada uno de los tratamientos 2. Seleccionar el menú stat >ANOVA> one way (unstacked) 3. Cuando aparezca el cuadro de diálogo One –way Analysis of variance: 4. Ingresar C1…Ck en el cuadro Responses (in separate columns) 5. ok 1. Una compañía textil utiliza diversos telares para la producción de telas. Aunque se desea que los telares sean homogéneos con el objeto de producir tela de resistencia uniforme, se supone que puede existir una variación significativa en la resistencia de la tela debida a la utilización de distintos telares. A su disposición tiene 5 tipos de telares con los que realiza determinaciones de la resistencia de la tela. Este experimento se realiza en orden aleatorio y los resultados se muestran en la tabla siguiente TELARES 1 2 3 4 5
RESISTENCIA 51 49 50 49 56 60 56 56 48 50 53 44 47 48 49 44 43 43 46 47
51 57 45
50
45
46
12
En este experimento, se han considerado 5 tipos de telares y se han realizado 6, 5, 5, 4 y 6 determinaciones de la resistencia de tela manufacturada con cada uno, respectivamente. ¥ La variable de interés o variable respuesta es la resistencia de la tela. ¥ El factor: Los telares ¥ Niveles del factor: 5 ¥ Modelo unifactorial de efectos fijos, no-equilibrado(los tamaños ni de la muestra son diferentes) 2. En una determinada fábrica de galletas se desea saber si las harinas de sus cuatro proveedores producen la misma viscosidad en la masa. Para ello, produce durante un día 16 masas, 4 de cada tipo de harina, y mide su viscosidad. Los resultados obtenidos son: PROVEEDORES A B C D 98 97 99 96 91 90 93 92 96 95 97 95 95 96 99 98
Variable respuesta: viscosidad Factor: Proveedor Tratamientos: 4 Modelo unifactorial de efectos fijos equilibrado
3. Una fábrica de textiles dispone de un gran número de telares. En principio, se supone que cada uno de ellos debe producir la misma cantidad de tela por unidad de tiempo. Para investigar esta suposición se seleccionan al azar cinco telares, y se mide la cantidad de tela producida en cinco ocasiones diferentes. Se obtienen los datos de la tabla adjunta. ¿Del estudio se concluye que todos los telares tienen el mismo rendimiento? TELARES 1 2 3 4 5
PRODUCCIÓN 14.0 14.1 14.2 13.9 13.8 13.9 14.1 14.2 14.1 13.6 13.8 14.0 13.8 13.6 13.9
14.0 14.0 14.0 13.9 13.8
14.1 14.0 13.9 13.7 14.0
Variable respuesta: cantidad de tela Factor: Telares Tratamientos: 5 Modelo unifactorial de efectos aleatorios equilibrado
4. Un partido político desea conocer si existe relación entre el grado de aceptación de su programa electoral(X) y el sueldo medio (Y) expresado en miles de ptas. Para ello selecciona al azar a 50 personas y obtiene los siguientes datos: Para estudiar el efecto de la temperatura en el rendimiento de un proceso químico se produjeron cinco lotes con cada uno de los tres tratamientos .Los resultados se presentan a continuación. Dé la tabla para el análisis de varianza. Use alfa=0.05 para probar si la temperatura afecta el rendimiento medio del proceso.
Temperatura 50°C 60°C 34 30 24 31 36 34 39 23 32 27
70°C 23 28 28 30 31
13
5. En la publicidad de tres pinturas se tiene el mismo tiempo de secado. Para verificar esto, se prueban 5 muestras década una de la pinturas. Se registra el tiempo en minutos necesario para que el secado sea suficiente para la aplicación de una segunda mano. Los datos obtenidos son: Pintura 1 2 3 4 128 144 133 150 137 133 143 142 135 142 137 135 124 146 136 140 141 130 131 153 Con alfa igual a 0.05 como nivel de significancia, realice una prueba para determinar si la media de los tiempos de secado es la misma en todas las pinturas. 6. La empresa Burger King opera 24 horas al día, cinco días a la semana. Los trabajadores cambian de turno cada semana. La gerencia está interesada en saber si hay alguna diferencia en el número de unidades producidas cuando los empleados laboran en diversos turnos. Se seleccionó una muestra de cinco obreros y se registró su producción en cada turno. Al nivel de significancia de 0.05 ¿Se puede concluir que hay una diferencia en la producción media por trabajador? Unidades producidas Empleado Mañana Tarde Noche Tina 31 25 35 Angel 33 26 33 Jordan 28 24 30 Josue 30 29 28 Miguel 28 26 27 7. Una médica que se especializa en el control de peso, recomienda tres dietas. Como un experimento seleccionó al azar a 15 pacientes y les asignó una dieta a cada 5 de ellos. Después de tres semanas e registraron las siguientes pérdidas de peso, en libras. Al nivel de significancia del 0.05 ¿Puede concluirse que existe alguna diferencia de pérdida de peso entre las tres dietas? Plan A B C 5 6 7 7 7 8 4 7 9 5 5 8 4 6 9 8. A continuación aparecen los pesos (en gramos) de una muestra de dulces clasificados de acuerdo a su color. Utilice minitab para determinar si hay una diferencia en los pesos medios de dulces e diferentes colores. Utilice el nivel de significancia de 0.05 Rojo
Naranja
Amarillo
café
Verde
Canela
0.946 1.107 0.913 0.904 0.926 0.926 1.006 0.914 0.922 1.052 0.903 0.895
0.902 0.943 0.916 0.910 0.903 0.901 0.919 0.901 0.930 0.883
0.929 0.960 0.938 0.933 0.932 0.899 0.907 0.906 0.930 0.952 0.939 0.940 0.882 0.906
0.896 0.888 0.906 0.941 0.838 0.892 0.905 0.824 0.908 0.833
0.845 0.909 0.873 0.902 0.956 0.959 0.916 0.822
0.935 0.903 0.865 0.822 0.871 0.905 0.852 0.965 0.898 0.905
14
9. El proyecto académico de un ingeniero es el diseño de un experimento a fin de determinar el rendimiento de 4 variedades de papa sin tener en cuenta la influencia de la fertilidad de las tierras de cultivo. Las 20 parcelas de igual fertilidad que le fueron asignadas los dividió en cuatro grupos de 5 parcelas cada una .A cada grupo de parcelas le asignó una variedad distinta de papa escogida al azar, resultando un diseño completamente aleatorizado. Los rendimientos medidos en Kilogramos de las cinco variedades por parcela sedan en la tabla variedades de papa V1 V2 V3 V4 55 52 53 52 53 58 55 50 60 50 57 51 52 60 51 49 53 52 54 53 a. Defina la variable dependiente, los niveles del factor, el modelo del diseño y los supuestos del modelo. b. Compare descriptivamente las medias de los rendimientos c. Estime el efecto que produce la variedad 3 en el valor medio global del rendimiento. d. Al nivel de significación del 5% ¿se puede inferir que existen diferencias significativas entre las producciones medias de las 4 variedades de papa? 10. Un organismo de investigación quiere comparar los rendimientos en millas por galón, de gasolina regular sin plomo, semi-grado y super Premium. Debido a la diferencia en el funcionamiento de los diferentes automóvile, se seleccionaron siete de ellos y se les trató como bloques. Por lo tanto cada clase de gasolina se probó con cada tipo de vehículo. Al nivel d significancia de 0.05 ¿existe una diferencia en las gasolinas y el los automóviles? automóvil
Reglar
Semi-grado
1 2 3 4 5 6 7
21 23 24 24 26 26 28
23 22 24 26 24 27 25
Super premium 26 25 27 26 30 27 32
11. Los fabricantes de chips de silicio requieren el uso de los llamados ―cuartos limpios‖ en los que el aire se filtra de manera especial para mantener el número de partículas de polvo al mínimo. La Outel Corporation desea asegurarse de que cada uno de sus cinco cuartos limpios tiene el mismo número de partículas de polvo. Se tomaron cinco muestras de aire en cada cuarto. Se midió el ―nivel de polvo‖ en una escala de 1 (bajo) a 10 (alto) al nivel de significancia de 0.05 ¿los cuartos tienen el mismo nivel promedio de polvo? Nivel de polvo (1 a 10) Cuarto 1 Cuarto 2 Cuarto 3 Cuarto 4 Cuarto 5
5 3 1 8 1
6.5 6 1.5 9.5 2
4 4 3 7 3.5
7 4.5 2.5 6 1.5
6 3 4 7.5 3
12. En una ciudad, una cadena de comida rápida está adquiriendo una mala reputación debido a que tardan mucho en servirle a los clientes. Como la cadena tiene cuatro restaurantes en esa ciudad, se tiene la preocupación de si los cuatro restaurantes en esa ciudad, se tiene la preocupación de si los cuatro restaurantes tienen el mismo tiempo promedio de servicio. Uno de los dueños de la cadena ha decidido visitar cada uno de los locales y registrar el tiempo de servicio para cinco clientes escogidas al azar. En sus cuatro visitas vespertinas registró los siguientes tiempos de servicio en minutos Restaurante 1 3 4 5.5 3.5 4 Restaurante 2 3 3.5 4.5 4 5.5 Restaurante 3 2 3.5 5 6.5 6 Restaurante 4 3 4 5.5 2.5 3
15
View more...
Comments