examen final estadística uc3m

October 18, 2017 | Author: Cristina Martindi | Category: Confidence Interval, P Value, Probability And Statistics, Physics & Mathematics, Mathematics
Share Embed Donate


Short Description

Descripción: 18 de enero 2010...

Description

Examen Final

Estad´ıstica II 18 de Enero de 2010

Contesta a los siguientes ejercicios en las hojas de examen de la Universidad. No olvides poner tu nombre y tu grupo reducido en todas las hojas. Emplea hojas distintas para los diferentes ejercicios.

1. El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una distribuci´ on normal. Para una muestra aleatoria de 15 clientes se obtuvieron los siguientes tiempos (en minutos): 5 6,2 4,8 5,2 5,2 6,4 4,9 5,3 4,2 5 5,9 5,1 6 4,9 5 a) (0,5 puntos) Calcula estimaciones insesgadas para la media y varianza. b) (1 punto) Halla un intervalo de confianza al 95 % para el tiempo medio que se tarda en cobrar a los clientes. c) (1 punto) ¿Podr´ıamos rechazar la hip´otesis de que el tiempo medio que se tarda en cobrar a los clientes es de 5,4 minutos, a un nivel de significaci´on del 5 %? Razona tu respuesta. d ) (0,5 puntos) ¿Cu´ al ser´ıa la respuesta a la pregunta del apartado anterior si cambiamos el nivel de significaci´ on del 5 % al 1 %? Soluci´ on. a) Las estimaciones son x ¯ = s2x =

79,1 = 5,2733 15 4,9693 = 0,35495 14

b) El intervalo de confianza es 

sx x ¯ ∓ tα/2,n−1 √ n



0,59578 ≡ 5,2733 ∓ 2,145 √ 15 



≡ (4,9434; 5,6033)

c) No podr´ıamos rechazar H0 : µ = 5,4, porque 5,4 est´a contenido en el intervalo anterior, a un nivel de confianza del 95 %. d ) Al aumentar el nivel de confianza, si mantenemos todo lo dem´as igual, aumenta la amplitud del intervalo, luego si 5,4 est´a contenido en el intervalo a un 95 %, tambi´en lo estar´ a a un 99 %. Por tanto no podemos rechazar H0 : µ = 5,4 a un nivel de significaci´ on de 1 %. 2. Un anuncio televisivo de una compa˜ n´ıa de seguros fue emitido en dos versiones: una de duraci´on normal (30 segundos) y otra de duraci´on reducida (24 segundos). En una muestra aleatoria simple de 60 personas que vieron la versi´on normal, 15 de ellas recordaban la marca de la compa˜ n´ıa aseguradora 2 d´ıas despu´es. En otra muestra aleatoria simple de 75 personas que vieron la versi´ on reducida, independiente de la anterior, 30 de ellas recordaban la marca 2 d´ıas despu´es. Para un nivel de significaci´ on del 5 %, contrasta la hip´otesis de que la proporci´on verdadera de recuerdo entre espectadores de la versi´on normal, pn , es menor que la proporci´ on verdadera de recuerdo entre los espectadores de la versi´on reducida, pc . En tu respuesta debes incluir:

a) (0,5 puntos) La especificaci´ on de las hip´otesis nula y alternativa para este contraste. b) (1 punto) La expresi´ on de la regi´on cr´ıtica o del p-valor en funci´on del estad´ıstico del contraste. c) (1 punto) Los c´ alculos necesarios para evaluar si los datos pertenecen a la regi´ on cr´ıtica, o para obtener el p-valor. d ) (0,5 puntos) Tu conclusi´ on sobre el contraste. Soluci´ on. a) H0 : pn ≥ pc ⇔ pn − pc ≥ 0

vs.

H1 : pn < pc ⇔ pn − pc < 0

b) Estad´ıstico del contraste (aproximado): Pˆn − Pˆc − (pn − pc ) q

Pˆ0 (1 − Pˆ0 )

q

1 n1

+

∼ N (0, 1)

1 n2

La regi´ on cr´ıtica corresponde a: R = {z : z < zα } = {z : z < −1,645} El p-valor se obtiene del valor del estad´ıstico para los valores muestrales, bajo la hip´ otesis nula, pˆn − pˆc q z=p pˆ0 (1 − pˆ0 ) n11 + n12 calculando para Z ∼ N (0, 1), p-valor = P(Z ≤ z) c) Valor del estad´ıstico: pˆn = 15/60 = 0,25 pˆc = 30/75 = 0,4 pˆ0 = (15 + 30)/(60 + 75) = 45/135 = 0,33 pˆn − pˆc p z = p pˆ0 (1 − pˆ0 ) 1/n1 + 1/n2 0,25 − 0,4 p = p = −1,8371 0,33(0,67) 1/60 + 1/75 Para la regi´ on cr´ıtica R = {z : z < −1,645}, el valor z = −1,84 pertenece a R, y por tanto rechazamos la hip´otesis nula al 5 % de significaci´ on. Equivalentemente, p-valor = P(Z ≤ −1,84) = P(Z > 1,84) = 0,0331 Como el p-valor es menor que α = 0,05, rechazamos la hip´otesis nula a este nivel. d ) Conclusi´ on: Para el nivel de significaci´on indicado, disponemos de evidencia suficiente para concluir que la tasa de recuerdo de la marca es mayor entre los espectadores de la versi´ on reducida.

3. Una empresa de comida r´ apida est´a interesada en conocer la relaci´on existente entre el n´ umero de folletos publicitarios repartidos semanalmente (x) y el beneficio en euros por las ventas a domicilio (y). Los resultados de ajustar un modelo de regresi´on lineal entre ambas variables observadas durante 20 semanas se muestran a continuaci´on: Regression Analysis - Linear model: Y = a + b*X ----------------------------------------------------------------------------Dependent variable: Ventas Independent variable: No. folletos ----------------------------------------------------------------------------Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------Intercept 1083,83 42,0395 25,7812 0,0000 Slope 1,0584 0,0644815 16,414 0,0000 ----------------------------------------------------------------------------Analysis of Variance ----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------Model 446354,0 1 446354,0 269,42 0,0000 Residual 29821,0 18 1656,72 ----------------------------------------------------------------------------Total (Corr.) 476175,0 19

 



     













Para los datos observados se tiene la informaci´on siguiente: x ¯ = 636,5,

y¯ = 1757,502,

s2X = 20971,3,

cov(x, y) = 22196,02

Adem´ as, si yˆi = βˆ0 + βˆ1 xi y ei = yi − yˆi , se tiene que 20 X i=1

(ˆ yi − y¯)2 = 446354,

20 X

e2i = 29821

i=1

a) (0,5 puntos) Determinar la recta de regresi´on de las ventas sobre el n´ umero de folletos. b) (1 punto) Calcular un intervalo de confianza al 95 % para la pendiente de la recta de regresi´ on. c) (1 punto) Contrastar la hip´otesis de que la pendiente de dicha recta es distinta de cero con un nivel de significaci´on del 5 %. ¿Podr´ıa afirmarse que la venta del producto depende linealmente del n´ umero de folletos publicitarios repartidos? d ) (1 punto) Estimar el valor del beneficio promedio en euros para aquellas semanas en las que se repartan 550 folletos publicitarios. Calcular un intervalo de confianza al 95 % para dicha estimaci´ on. e) (0,5 puntos) Calcular e interpretar el valor del coeficiente de determinaci´on R2 . Soluci´ on.

a) Consideramos las variables X =

N´ umero de folletos repartidos semanalmente

Y

Ventas semanales en euros

=

Estimamos un modelo de regresi´on simple: yi = β0 + β1 xi + ui , donde yi son las ventas de la semana i-´esima y xi representa el n´ umero de folletos repartidos esa semana. En la tabla de resultados podemos observar que la estimaci´ on del intercepto (intercept) es βˆ0 = 1083,83 y la estimaci´on de la pendiente (slope) es βˆ1 = 1,0584. Luego la recta de regresi´on es: yˆi = 1083,83 + 1,0584xi b) El intervalo de confianza para β1 tiene la forma, s

βˆ1 ± tn−2,α/2

s2R (n − 1)s2X

Si observamos la tabla de resultados obtenemos la estimaci´on de la pendiente y su error est´ andar: βˆ1 = 1,0584 s

s2R (n − 1)s2X

= 0,06448

Como tn−2,α/2 = t18,0,025 = 2,101, el intervalo de confianza para β1 al 95 % es: s

βˆ1 ± tn−1,α/2

s2R = 1,0584 ± 2,101 × 0,06448 = [0,9229; 1,1939] (n − 1)s2X

c) Por el apartado anterior, sabemos que al no contener al cero el intervalo de confianza al 95 % para la pendiente, β1 , podemos rechazar la hip´otesis nula del contraste: H0 : β1 = 0 H1 : β1 6= 0 con un nivel de significaci´ on del 5 %. Alternativamente, podr´ıamos haber observado el p-valor de dicho contraste, basado en el estad´ıstico t, que seg´ un la tabla de resultados es pr´ acticamente cero y por tanto, rechazamos la hip´otesis nula ya que α = 0,05 es mayor que el p-valor. Por u ´ltimo, otra alternativa habr´ıa sido observar el p-valor de dicho contraste en la tabla ANOVA, basado en el estad´ıstico F, que al ser un contraste equivalente da lugar al mismo p-valor, que es pr´acticamente cero. En cualquier caso, concluimos que la venta del producto depende linealmente del n´ umero de folletos publicitarios repartido. d ) Seg´ un la ecuaci´ on de la recta de regresi´on obtenida en el apartado a), el valor del beneficio medio en euros para aquellas semanas en las que se repartan 550 folletos publicitarios ser´ a: yˆ0 = 1083,83 + 1,0584 × 550 = 1665,95 mil euros

El intervalo de nivel α para dicha recaudaci´on promedio viene dado por: yˆ0 ± tn−2,α/2

v u u ts2

R

1 (x0 − x ¯)2 + n (n − 1)s2X

!

La varianza residual, s2R , la obtenemos de la tabla ANOVA: s2R =

SCR 29821 = = 1656,72 n−2 18

Como tn−2,α/2 = t18,0,025 = 2,101, el intervalo de confianza al 95 % para el beneficio medio es: yˆ0 ± tn−2,α/2

v u u ts2

R

1 (x0 − x ¯ )2 + n (n − 1)s2X s

!

1 (550 − 636,5)2 = 1665,95 ± 2,101 1656,72 + 20 19 × 20971,3 



= [1643,5; 1688,4]

e) A partir de la tabla ANOVA obtenemos que: SCM 446354 = = 0,93737 SCT 476175 Luego, el coeficiente de determinaci´on es R2 = 93,737 %, lo cual significa que el modelo de regresi´ on explica el 93,737 % de la variaci´on de las ventas.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF