Estadística Inferencial

May 9, 2018 | Author: Arturo Castillo | Category: Analysis Of Variance, Hypothesis, Methodology, Statistics, Scientific Theories
Share Embed Donate


Short Description

Problemario de Estadística Inferencial...

Description

INSTITUTO TECNOLÓGICO DE  REYNOSA

PROFESOR: Ana Maritza Ramírez Govea. MATERIA: Estadística Inferencial II.

Camacho González María Guadalupe (11580004) Castillo Martínez Arturo Salvador (1158001 (11580017) 7) García Barrera Miriam Suhey (115800369 Granados Ramírez Claudia Deyanira (11580042) Hernández Leyva Adriana (11580006 (11580006)) Lores Martínez Tania Grisel (11380931) Medina Carrizales Ana Cecilia (115800299 Pantoja González Eduardo (10380825) Vega Molina Edith Lidieth (11580048) Villarreal Torres Jonathan (11580001)

Camacho González María Guadalupe (11580004) Castillo Martínez Arturo Salvador (1158001 (11580017) 7) García Barrera Miriam Suhey (115800369 Granados Ramírez Claudia Deyanira (11580042) Hernández Leyva Adriana (11580006 (11580006)) Lores Martínez Tania Grisel (11380931) Medina Carrizales Ana Cecilia (115800299 Pantoja González Eduardo (10380825) Vega Molina Edith Lidieth (11580048) Villarreal Torres Jonathan (11580001)

PROBLEMA 1 1. Un psicólogo industrial deseaba hacer un estudio sobre los efectos que producían cinco diferentes incentivos en la producción de los talleres de una gran empresa. Se llevó a cabo un experimento en un departamento de cada uno de los cinco talleres. Tomaron parte en el experimento los empleados del turno de las 11: P. M. a las 7: A. M. El experimento se prolongó durante una semana. De cada taller  participaron diez empleados. Se les prometieron ciertas recompensas si aumentaban la producción durante la semana del experimento. Las recompensa consistían consistían en: (1) dinero, (2) cambio de turno, (3) descanso remunerado, (4) más tiempo para el café y (5) una recompensa especial. El psicólogo se proponía principalmente determinar si las diferentes recompensas tenían o no distintos efectos en el volumen de la producción. El efecto de las recompensas se medía por la diferencia entre el número de artículos producidos durante la semana del experimento y el número promedio de artículos producidos por semana durante el mes anterior a la prueba. Los resultados de este experimento se muestran en la tabla.

a) Usar un   = 0.05 para determinar determinar si los diferentes estímulos influyen influyen en el volumen de producción b) Usar un   = 0.05 y mediante la prueba apropiada determinar que comparaciones de pares de medias son significativamente diferentes. c) Determinar si se cumplen los supuestos del modelo.

Dinero

Cambio de Turno

Tiempo Libre Remunerado

76 70 59 77 59 69 80 78 61

52 52 43 48 43 56 52 53 58

37 26 28 38 25 30 28 25 26

Tiempo Adicional para el Café 19 21 16 23 23 23 14 15 13

Recompensa especial 11 15 23 15 25 18 20 18 20

66

Usar un

 

50

25

16

16

= 0.05 para determinar si los diferentes estímulos influyen en el volumen de producción.

Primeramente asignaremos una variable a cada estímulo:

                   Nuestra hipótesis sería:

                 Ahora, en base a estos tratamientos realizaremos una tabla ANOVA para buscar  una variación en nuestros datos.

Fuente GL SC MC F P Factor 4 20180.5 5045.1 172.88 0.000 Error 45 1313.2 29.2 Total 49 21493.7

Utilizaremos este valor de f para realizar nuestra prueba de igualdad:

Gráfica de distribución F, df1=4, df2=45 172.9

0.8 0.7 0.6      d 0.5     a      d      i     s 0.4     n     e      D

0.3 0.2 0.1 0.05 0.0

2.579 0

 X 

Nuestro valor f cae en la zona de rechazo, por lo que aceptamos la hipótesis alternativa y concluimos que existe una diferente efectividad entre l os estímulos.

Usar un   = 0.05 y mediante la prueba apropiada determinar qué comparaciones de pares de medias son significativamente diferentes.

Agrupar información utilizando el método de Tukey

A B C D E

N 10 10 10 10 10

Media 69.500 50.700 28.800 18.300 18.100

Agrupación A B C D D

Las medias que no comparten una letra son significativamente diferentes.

                       

          

Determinar si se cumplen los supuestos del modelo.

       



Los residuos se definen como la diferencia entre la respuesta observada y la respuesta predicha por el modelo , lo que permite hacer un diagnóstico más directo de la calidad del modelo, ya que su magnitud señala qué tan bien describe los datos el modelo.

Gráfica de probabilidad normal (las respuestas son A, B, C, D, E) 99

95 90 80

    e 70      j     a      t 60     n     e 50     c 40     r     o      P 30 20 10 5

1

-15

-10

-5

0

5

10

Residuo

Podemos apreciar en la gráfica que se cumplen los supuestos de normalidad en el modelo. Aunque no de manera perfecta, nos muestra el acercamiento de nuestro modelo a los resultados obtenidos.

PROBLEMA 2 2. En un estudio sobre la efectividad de diferentes sistemas de comunicación personal, se seleccionaron 44 adultos para formar cuatro grupos. En cada grupo se utilizó un sistema diferente de comunicación para enviar un mensaje complejo de un miembro a otro. Al término de un tiempo determinado, se le administró a cada sujeto una prueba para medir la comprensión del mensaje. La tabla muestra los resultados (codificados para facilitar los cálculos). a) ¿Constituyen estos datos un apoyo de la hipótesis que establece que los sistemas de comunicación tienen diferente efectividad? Usar  un   = 0.01. b) Usar un   = 0.05 y mediante la prueba apropiada determinar que comparaciones de pares de medias son significativamente diferentes.

c) Determinar si se cumplen los supuestos del modelo.

Sistema de Comunicación A

15

6

13

8

8

8

11

5

5

B

8

11

8

10

13

7

10

9

13 11 11

C

14

15

19

13

16

16 13 13 12 20 18

D

16

17

15

18

21

20 24 24 16 21 20

Hipótesis:

              

13 10

a) Responderemos la interrogante construyendo una tabla ANOVA con ayuda del programa minitab. ANOVA unidireccional: A, B, C, D

Fuente

GL

SC

MC

F

P

Factor Error Total

3 40 43

729.18 325.82 1055.00

243.06 8.15

29.84

0.000

Utilizaremos nuestro valor F para realizar la grafica.

Gráfica de distribución F, df1=3, df2=40 29.84

0.8 0.7 0.6      d 0.5     a      d      i     s 0.4     n     e      D

0.3 0.2 0.1 0.0

0.01 0

4.31

 X 

Nuestro valor f cae en la zona de rechazo, por lo que aceptamos la hipótesis alternativa y concluimos que existe una diferente efectividad entre l os sistemas.

b) Para determinar las comparaciones de pares haremos lo siguiente: Intervalos de confianza individuales de Fisher del 95% Todas las comparaciones en parejas

Nivel A B C D

N 11 11 11 11

Media 9.273 10.091 15.364 19.273

Desv. Est. 3.409 1.973 2.693 3.133

Se restó A a:

B C D

Inferior -1.641 3.631 7.540

Centro 0.818 6.091 10.000

Superior 3.278 8.550 12.460

C D

Inferior 2.813 6.722

Centro 5.273 9.182

Superior 7.732 11.641

D

Inferior 1.450

Centro 3.909

Superior 6.369

Se restó B a:

Se restó C a:

SISTEMA D C B A

N 11 11 11 11

Media 19.273 15.364 10.091 9.273

Agrupación A B C C

Las medias que no comparten una letra son significativamente diferentes.

c) Para determinar si se cumplen los supuestos del modelo realizaremos la siguiente gráfica.

Gráfica de probabilidad normal (las respuestas son A, B, C, D) 99

95 90 80

    e 70      j     a      t 60     n     e 50     c 40     r     o      P 30 20 10 5

1

-5.0

-2.5

0.0

2.5

5.0

7.5

Residuo

Podemos apreciar en la gráfica que se cumplen los supuestos de normalidad en el modelo. Aunque no de manera perfecta, nos muestra el acercamiento de nuestro modelo a los resultados obtenidos.

PROBLEMA 3 3. Una cadena de restaurantes piensa que está adquiriendo una mala reputación porque tarda mucho en servir a sus clientes. La cadena tiene 4 restaurantes en esta ciudad y por eso le interesa saber si los 4 tienen el mismo tiempo promedio de servicio. Uno de los dueños ha decidido visitarlos y calcular el tiempo de servicio de 5 clientes seleccionados al azar. En sus 4 visitas al mediodía, registra los siguientes tiempos de servicio en minutos: d) Usando un   = 0.05, ¿tienen todos los restaurantes la misma media del tiempo de servicio? e) Basándose en sus resultados, ¿debe el dueño recomendar alguna política a cualquiera de los gerentes de los restaurantes? f) Usar un   = 0.05 y mediante la prueba apropiada determinar que comparaciones de pares de medias son significativamente diferentes. g) Determinar si se cumplen los supuestos del modelo. Restaurante 1 2 3 4

3 3 2 3

4 3.5 3.5 4

Tiempos 5.5 3.5 4.5 4 5 6.5 5.5 2.5

4 5.5 6 3

a) Usando un   = 0.05, ¿tienen todos los restaurantes la misma media del tiempo de servicio? Primero asignaremos una variable para cada restaurante:

      Plantearemos nuestra hipótesis:

               

Realizaremos una tabla ANOVA para buscar una variación en nuestros datos.

Análisis de varianza para Tiempos, utilizando SC ajustada para pruebas Fuente Restaurante Error Total

GL 3 16 19

SC sec. 2.534 26.872 29.406

SC ajust. 2.534 26.872

MC ajust. 0.845 1.680

F 0.50

P 0.686

Utilizaremos el valor de F para realizar nuestra prueba de igualdad:

Gráfica de distribución F, df1=3, df2=16 0.5

0.8 0.7 0.6      d 0.5     a      d      i     s 0.4     n     e      D

0.3 0.2 0.1 0.0

0.05 0

3.24

 X 

Nuestro valor de F cae en la zona de aceptación, por lo tanto se acepta la hipótesis nula, y se rechaza la hipótesis alternativa, entonces se concluye que todos los restaurantes tienen la misma media de tiempo de servicio.

b) Basándose en sus resultados, ¿debe el dueño recomendar alguna política a cualquiera de los gerentes de los restaurantes?

No es necesaria una nueva política para un restaurante en particular, cualquier  cambio de organización es necesario aplicarse en todos los locales. c) Usar un   = 0.05 y mediante la prueba apropiada determinar que comparaciones de pares de medias son significativamente diferentes.

Como: Agrupar información utilizando el método de Fisher 

C B A D

N 5 5 5 5

Media 4.600 4.100 4.000 3.600

Agrupación A A A A

Las medias que no comparten una letra son significativamente diferentes. Concluimos que ninguna comparación manifiesta una diferencia significativa.

d) Determinar si se cumplen los supuestos del modelo.

Gráfica de probabilidad normal (la respuesta es Tiempos) 99

95 90 80

    e 70      j     a      t 60     n     e 50     c 40     r     o      P 30 20 10 5

1

-3

-2

-1

0

1

2

Residuo

Podemos ver una respuesta cercana aunque no perfecta.

3

PROBLEMA 4 4. Se hace un estudio sobre la efectividad de tres marcas de spray para matar  moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuentan el número de moscas muertas expresando en porcentajes. Se hacen seis réplicas y los resultados obtenidos se muestran a continuación. h) Formule la hipótesis adecuada y aplique el método estadístico. i) Existe diferencia entre la efectividad promedio de los productos en spray.  j) Hay algún spray mejor, Argumente su respuesta. k) Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas l) De ser necesario, aplique los métodos de comparación o pruebas de rangos múltiples.

Marca de Spray 1 2 3

1 72 55 64

2 65 59 74

Numero de Replicas 3 4 67 75 68 70 61 58

5 62 53 51

6 73 50 69

Formule la hipótesis adecuada y aplique el método estadístico. El objetivo del experimento es buscar una diferencia entre las diferentes marcas de insecticidas utilizados para tomar una decisión sobre cuál compuesto utilizar  en su producto. La respuesta a esta interrogante la obtenemos al plantearnos una hipótesis que busque probar (o negar) la igualdad entre las marcas.

             ¿Existe diferencia entre la efectividad promedio de los productos en spray? Responderemos la interrogante construyendo una tabla ANOVA con ayuda del programa minitab. La tabla en minitab se realizará con una columna de tratamientos y otra de resultados como la mostrada a continuación:

MARCA

RESULTADO

A A A A A A B B B B B B C C C C C C

72 65 67 75 62 73 55 59 68 70 53 50 64 74 61 58 51 69

Realizamos nuestro modelo lineal general y obtenemos la siguiente tabla:

Modelo lineal general: RESULTADO vs. MARCA Factor MARCA

Tipo fijo

Niveles 3

Valores A, B, C

Análisis de varianza para RESULTADO, utilizando SC ajustada para pruebas Fuente MARCA Error Total

GL 2 15 17

SC Sec. 296.33 795.67 1092.00

SC Ajust. 296.33 795.67

MC Ajust. 148.17 53.04

F 2.79

P 0.093

Donde nuestro valor de F nos indica un nivel bajo en la diferencia de medias. Para comprobarlo realizamos una gráfica de distribución de probabilidad:

Gráfica de distribución F, df1=2, df2=15 2.79 1.0

0.8      d     a 0.6      d      i     s     n     e      D

0.4

0.2

0.0

0.05 0

3.682

 X 

La línea se encuentra en el área de aceptación por lo que aceptamos la hipótesis nula y concluimos que no existe una diferencia de efectividad.

¿Hay algún spray mejor? Argumente su respuesta En base al resultado anterior (no existe una diferencia en las medias) no podemos concluir que exista un mejor spray que otro, por lo que debemos escoger en base a otros criterios cual sería el indicado. Agrupar información utilizando el método de Tukey y una confianza de 95.0% MARCA A C B

N 6 6 6

Media 69.00 62.83 59.17

Agrupación A A A

Las medias que no comparten una letra son significativamente diferentes. Según el método tukey no hay tratamientos significativamente diferentes.

Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas.

Utilizando la misma tabla y diseño estadístico de los incisos anteriores podemos obtener los intervalos de confianza si ajustamos nuestro menú de opciones al realizar el cálculo.

Tratamiento LímitesC1 A B C

LímitesC2

62.6624794 75.3375206 52.8291461 65.5041873 56.4958127 69.1708539

  { { {

De ser necesario, aplique los métodos de comparación o pruebas de rangos múltiples. Los métodos de comparación no son requeridos si todas las medias son iguales, además, el método de tukey muestra igualdad en los datos. MARCA A C B

N 6 6 6

Media 69.00 62.83 59.17

Agrupación A A A

Las medias que no comparten una letra son significativamente diferentes.

PROBLEMA 5 5. En un experimento en el que se investigó la cantidad de radón liberado en las duchas. Se usó agua enriquecida con radón, y se probaron seis diámetros diferentes de los orificios de las regaderas. Los datos del experimento se presentan en la siguiente tabla. a) ¿El tamaño de los orificios afecta el porcentaje promedio de radón liberado? Use   = 0.05 b) Encuentre el valor P para el estadístico F del inciso a) c) Analice los residuales de este experimento. d) Encuentre un intervalo de confianza de 95% para el porcentaje promedio de radón liberado cuando el diámetro de los orificios es 1,40 e) Use los diversos métodos de comparación o pruebas de rangos múltiples. Diámetro de los orificios

Radón Liberado %

0.37

80

83

83

85

0.51

75

75

79

79

0.71

74

73

76

77

1.02

67

72

74

74

1.40

62

62

67

69

1.99

60

61

64

66

¿El tamaño de los orificios afecta el porcentaje promedio de radón liberado? Use   = 0.05

Sustituiremos el tamaño del orificio por variables latinas para facilitar nuestros cálculos.

A

B

C

D

E

F

80 83 83 85

75 75 79 79

74 73 76 77

67 72 74 74

62 62 67 69

60 61 64 66

De esta manera nuestras hipótesis quedarían de la siguiente forma:

               Ahora podemos realizar un análisis del factor tratamiento con ayuda de minitab: Fuente Factor Error Total

GL 5 18 23

SC 1133.38 132.25 1265.63

MC 226.68 7.35

F 30.85

P 0.000

Y en base a nuestros grados de libertad buscaremos el valor F de nuestra gráfica:

 

Gráfica de distribución F, df1=5, df2=18 30.85

0.8 0.7 0.6      d 0.5     a      d      i     s 0.4     n     e      D

0.3 0.2 0.1 0.05 0.0

0

2.773

 X 

La línea se encuentra en el área de rechazo, por lo que se concluye que no todas las medias son iguales, por lo tanto, el tamaño del hoyo sí importa.

Encuentre el valor P para el estadístico F del inciso En nuestra tabla ANOVA podemos apreciar que: Fuente Factor Error Total

GL 5 18 23

SC 1133.38 132.25 1265.63

MC 226.68 7.35

F 30.85

P 0.000

Nuestro valor “P” es cero (o al menos muy pequeño para ser calculado), cuando nuestro valor de p es menor a nuestro nivel de significancia aceptamos la hipótesis alternativa.

Analice los residuales de este experimento

Gráfica de probabilidad normal (las respuestas son A, B, D, C, E, F) 99

95 90 80

    e 70      j     a      t 60     n     e 50     c 40     r     o      P 30 20 10 5

1

-5.0

-2.5

0.0

Residuo

Los residuos cumplen un supuesto de normalidad.

2.5

5.0

Encuentre un intervalo de confianza de 95% para el porcentaje promedio de radón liberado cuando el diámetro de los orificios es 1,40 El valor que buscamos corresponde a la letra latina E, por lo que buscaremos los límites de confianza en este tratamiento:

TRAT

REST

E

62

LímitesC1

LímitesC2

62.1526456 67.8473544

Por lo que nuestro CI es:

   {

Use los diversos métodos de comparación o pruebas de rangos múltiples. Agrupar información utilizando el método de Tukey

A B C D E F

N 4 4 4 4 4 4

Media 82.750 77.000 75.000 71.750 65.000 62.750

Agrupación A A B B B C C

Las medias que no comparten una letra son significativamente diferentes.

Agrupar información utilizando el método de Fisher 

A B C D E F

N 4 4 4 4 4 4

Media 82.750 77.000 75.000 71.750 65.000 62.750

Agrupación A B B C C D D

Las medias que no comparten una letra son significativamente diferentes.

Información de agrupación utilizando el método de Bonferroni y una confianza de 95.0% TRATAMIENTO A B C D E F

N 4 4 4 4 4 4

Media 82.75 77.00 75.00 71.75 65.00 62.75

Agrupación A A B B B C C

Las medias que no comparten una letra son significativamente diferentes.

Agrupar información utilizando el método de Sidak y una confianza de 95 .0% TRATAMIENTO A B C D E F

N 4 4 4 4 4 4

Media 82.75 77.00 75.00 71.75 65.00 62.75

Agrupación A A B B B C C

Las medias que no comparten una letra son significativamente diferentes.

De los cálculos podemos obtener las siguientes comparaciones para fisher:

                    

        

             

         

Para el resto tenemos las siguientes comparaciones:

                        

            

         

      

PROBLEMA 6 6. Se describe un experimento para determinar el efecto de los vacíos de aire sobre la resistencia porcentual conservada del asfalto. Para los fines del experimento, los vacíos de aire se controlan en tres niveles: bajo (2-4%), medio (4-6%) y alto (6-8%). Los datos se presentan en la tabla siguiente:

a)

b) c) d)

¿Hay evidencia que apoye la afirmación de que l a presencia de oxígeno durante la preparación afecta la temperatura de transición media? Utilice un   = 0.05. ¿Cuál es el valor P para la prueba F del inciso anterior  Analice los residuales de este experimento. Aplique el método de la LSD en el experimento Utilice un   = 0.05. ¿Qué métodos de preparación difieren? Nivel del vacío de aire Bajo Medio Alto

Resistencia conservada % 106 80 78

90 69 80

103 94 62

90 91 69

79 70 76

88 83 85

92 87 69

95 83 85

A) Utilice α=0.05 para saber si la presencia de oxigeno afecta durante la preparación a la temperatura de transmisión media. Primero asignaremos una variable para cada estímulo:

                   

Plantearemos nuestra hipótesis:

Realizaremos una tabla ANOVA para buscar una variación en nuestros datos.

Fuente Factor Error Total

GL 2 21 23

SC 1230.3 1555.7 2786.0

MC 615.1 74.1

F 8.30

P 0.002

Utilizaremos el valor de F para realizar nuestra prueba de igualdad:

Gráfica de distribución F, df1=2, df2=21 8.3 1.0

0.8      d     a 0.6      d      i     s     n     e      D

0.4

0.2

0.0

0.05 0

3.47

 X 

Nuestro valor de F cae en la zona de rechazo, por lo tanto se rechaza la hipótesis nula y se acepta la hipótesis alternativa, entonces se concluye que existe diferencia en el efecto de los vacíos de aire sobre la resistencia porcentual conservada del asfalto, así que hay evidencia en que se apoye la afirmación de que la presencia de oxígeno durante la preparación afecta la temperatura de transición media.

B) Valor p para la prueba f Fuente Factor Error Total

GL 2 21 23

SC 1230.3 1555.7 2786.0

MC 615.1 74.1

F 8.30

P 0.002

P=0.002

C) Analizar residuales del experimento

̂        

̂

Los residuos se definen como la diferencia entre la respuesta observada y la respuesta predicha por el modelo , lo que permite hacer  un diagnóstico más directo de la calidad del modelo, ya que su magnitud señala qué tan bien describe los datos el modelo.

Gráfica de probabilidad normal (las respuestas son A, B, C) 99

95 90 80

    e 70      j     a      t 60     n     e 50     c 40     r     o      P 30 20 10 5

1

-20

-10

0

10

20

Residuo

Analizando nuestra gráfica nos damos cuenta que se cumplen los supuestos de normalidad en el modelo. Aunque no de manera perfecta, nos muestra el acercamiento de nuestro modelo a los resultados obtenidos.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF