Guia de Problemas de estadistica

July 17, 2018 | Author: GianMarco Gutierrez Vargas | Category: Probability, Probability Density Function, Regression Analysis, Mathematical Analysis, Scientific Modeling
Share Embed Donate


Short Description

Descripción: Estadistica Aplicada...

Description

Guia de Problemas 1.

Los siguientes datos son la inversión neta (millones (millones de u.m.) y la tasa de interés. Período 1 2 3 4 5 6 7 Inversión 12. 12.50 10.00 7.00 4.50 4.00 3.00 3.50 Interés 2.50 3.00 4.00 5.00 5.50 6.00 7.00 Se plantean dos modelos: Potencia: Y = A X

B

y

Lineal: Y = a + bX

a) Obtenga la ecuación de estimación estimación para cada modelo. modelo. b) Calcule sus medidas medidas de bondad de ajuste. ¿Es discernible esta medida para elegir el mejor modelo? ¿Por qué sí o Por qué no? c) En el caso lineal, pruebe Ho: E[Y/X=6]=4 frente a la alternativa que es menor d) ¿Cuál es la potencia de la prueba en c) si E[Y/X=6]=3.4? 2.

3.

De los siguientes modelos, modelos, ¿cuáles son intrínsicamente intrínsicamente lineales? Justifique

Un investigador pretende estudiar los gastos realizados por un conjunto de familias que viven en la zona  A y zona B con el objeto de analizar las posibilidades de venta de un determinado producto. Para ello recoge datos del gasto mensual y del ingreso familiar mensual de 12 familias, especificando además su tamaño. Famil Fa mil ia

Gasto s (miles de Gasto nuevos sol es)

1 2 3 4 5 6 7 8 9 10 11 12

7.3 3.1 3.2 8.6 12.5 4.4 5.2 2.9 12.9 3.5 3.5 7.8

Ingreso (miles de nuevos soles) 21 11 9 18 62 23 28 10 89 24 12 47

Tamaño

3 4 5 4 4 3 6 5 3 2 4 3

Zona  A=0 B=1 1 0 0 1 1 0 1 0 1 0 0 1

 A partir de esta información se plantea un modelo de regresión múltiple. a) Halle las ecuaciones normales. ¿Existe una solución única? ¿Por qué? b) Muestre la ecuación de estimación del gasto en función del ingreso, del tamaño familiar familiar y de la zona. Interprete. c) ¿Al menos uno de los predictores es importante para describir los gastos familiares? d) Calcule las medidas de bondad de ajuste apropiados para este modelo. Interprete. e) ¿Cuál es la respuesta media para los gastos familiares de la zona A y Zona B respectivamente? f) Se afirma que los gastos dependen sólo del ingreso y no del tamaño tamaño ni de la zona. Plantear la la hipótesis nula en el modelo del apartado b) que permita contrastar este supuesto. ¿Se puede aceptar esta afirmación? g) ¿Se puede simplificar el modelo por presencia de una o más variables innecesarias?

h) ¿E cierto que si una familia tiene un ingreso de 30000 nuevos soles con un tamaño de cuatro y es de la zona B, su gasto real es de 7000 nuevos soles? 4.

Sea X el tiempo que se necesita para terminar el mantenimiento preventivo diario de un sistema (medido en fracciones de hora), e Y, el tiempo que demora en llevarse a cabo una prueba inmediatamente después de terminar el mantenimiento (medido también en fracciones de hora) . El mantenimiento preventivo empieza a las 7:00 a.m. y terminada la prueba el sistema queda disponible durante todo el día.  Asuma que la función de densidad conjunta de X e Y está dada por:

⎧81 y ⎪  f  ( x, y ) = ⎨13 ⎪⎩0

; 0 <  x +  y ; otro

< 1 ,0 <  x < 2 / 3

caso

a) Si en un día dado, la prueba del sistema duró 15 minutos, ¿Cuál será la probabilidad de que el mantenimiento preventivo haya sido terminado antes de las 7:30 a.m. b) Si en un día dado, el mantenimiento preventivo se ha terminado a las 7:30 a.m. ¿Cuál será la probabilidad de que el sistema quede disponible antes de las 7:45 a.m? c) ¿Son las variables independientes? 5.

Se realizaron pruebas de laboratorio para determinar el contenido de asfalto sobre la estabilidad y la permeabilidad de concreto asfaltado de clasificación abierta. Se prepararon 4 especimenes de concreto con cada uno de los siguientes contenidos de asfalto (porcentaje del peso total de la mezcla): 3,4,5,6,7 y 8. Se determinó la permeabilidad al agua de cada espécimen de concreto haciendo fluir sobre el espécimen agua al que se le extrajo el aire y midiendo la pérdida de agua. Las mediciones de permeabilidad (en pulgadas por hora) para los 24 especimenes de concreto se muestran en la siguiente tabla: Contenido Permeabilidad de asfalto en pulgadas por en % hora 3 1189 3 840 3 1020 3 980 4 1440 4 1227 4 1022 4 1293 5 1227 5 1180 5 980 5 1210 6 707 6 927 6 1067 6 822 7 853 7 900 7 733 7 585 8 395 8 270 8 310 8 208 a) Haga un gráfico que le permita visualizar la relación entre las dos variables en estudio. ¿Se podría pensar en una relación lineal?. b) Ajuste un modelo de regresión simple a los datos (interprete el valor estimado de la pendiente) y determínese si el modelo tiene indicios de falta de ajuste. c) ¿Cuál es la probabilidad de rechazar la hipótesis Ho:E[¨Y/X=6]=800 cuando el verdadero valor de la respuesta es 850, cuando se tiene una probabilidad α=.0.05?

d) ¿Los siguientes modelos: Y = bo * (e**(b1 * X)), Y = bo * (X**b1) son intrínsicamente lineales? ¿Por qué? e) Pruébese la significación de los modelos dados en (d), utilizando el estadístico t-Sudent y estadístico F respectivamente. f) Probar si la correlación en el siguiente modelo es significativo :Y = bo + (b1 / X). g) Para los modelos propuestos en (d) encuéntrese la predicción individual al 95% si el contenido de asfalto en 6% ¿Cuál de los modelos es más preciso? 6.

Se realiza un experimento para observar el efecto de un aumento en la temperatura (°C) sobre la potencia de un antibiótico. Las potencias observadas a las temperaturas correspondientes en 15 especímenes fueron: Potencia Temperatura

38 32 19 26 43 27 23 14 29 19 21 33 45 49 52 30 50 70 50 30 70 70 90 30 90 90 50 10 10 10

Para los modelos tentativos: i) Y =

ii) Y = β0.Xβ .ε 1

β0 + β1X + ε

a) Obtener los estimadores de MCO e interprete sus resultados. b) Determine la significación de los modelos. Para el modelo que corresponda:

c) ¿Cuál es el I.C. al 95% que incluye al verdadero parámetro β1 en (ii)? d) Suponga que un lote de antibióticos se almacena a 60 durante el mismo tiempo que el periodo experimental. Haga una predicción de la potencia de lote al final del periodo mediante un I.C. al 95% en (i). e) Probar: Ho: β1 = 0.70 vs. Ha: β1 < 0.70 en (ii). f)  Al probar: Ho: E(Y/x = 50) = 32 vs. E(Y/x = 50) > 32 al 5% en (i). Encuentre la potencia de la prueba cuando el grado de falsedad es uno. g) Pruebe la adecuabilidad del modelo de regresión lineal simple. h) Determine el modelo apropiado entre los propuestos. Justifique su respuesta. i) Pruebe Ho:β0 + β1 = 2 en (i). 7.

La determinación de pérdida de abrasión es difícil, mientras que es relativamente sencillo medir la dureza mediante una máquina de dureza Rock-well. Por tanto sería conveniente si se pudiera predecir la pérdida de abrasión de una medida de dureza. Se llevó a cabo una prueba y se obtuvieron datos de 30 observaciones. Indique la dureza por X y la pérdida por Y. Los datos se resumen como sigue: (6 Pts.)  X  = 70.27 



= 175.4

∑(  X  −  X  ) = 4300 , ∑( Y  − Y  ) ∑(  X  −  X  )( Y  − Y  ) = −22946  ˆ  2

i i

2

= 225011

2

= 3663

i

i

σ  

a) Pruebe la hipótesis de que la pendiente es igual a –5, usando un nivel de significación de 0.01. b) Si la pendiente es igual a –7, ¿cuál es la probabilidad de aceptar la hipótesis en (a). c) Encuentre un intervalo confidencial con una probabilidad del 95% de que el valor de pérdida de abrasión correspondiente a una dureza de 72 caerá en él. 8.

De un grupo de tres profesores, dos graduados y un alumno debe seleccionarse al azar una comisión de dos personas. Sean X el número de profesores e Y el Número de graduados en la comisión. a) Hallar la función de probabilidad conjunta de (X,Y) b) Hallar E(E(X/Y)

9.

Sea X el tiempo que se necesita para terminar el mantenimiento preventivo diario de un sistema (medido en fracciones de hora), e Y, el tiempo que demora en llevarse a cabo una prueba inmediatamente después de terminar el mantenimiento (medido también en fracciones de hora). El mantenimiento preventivo empieza a las 7:00 a.m. y terminada la prueba el sistema queda disponible durante todo el día.  Asuma que la función de densidad conjunta de X e Y está dada por:

⎧81 y ⎪  f  ( x, y ) = ⎨13 ⎪⎩0

; 0 <  x +  y ; otro

< 1 ,0 <  x < 2 / 3

caso

a) Si en un día dado, la prueba del sistema duró 15 minutos, ¿Cuál será la probabilidad de que el mantenimiento preventivo haya sido terminado antes de las 7:30 a.m. b) Si en un día dado, el mantenimiento preventivo se ha terminado a las 7:30 a.m. ¿Cuál será la probabilidad de que el sistema quede disponible antes de las 7:45 a.m.? c) ¿Son las variables independientes? 10. De un gran lote de impresoras que contiene impresoras descompuestas se escogen al azar cuatro. Se clasifica cada impresora según el daño, leve o severo, se tiene 10% con daño leve y 5% con daño severo. Sea X el número de impresoras con daño leve y sea Y el número de impresoras con daño severo. a) Obtener la distribución de probabilidad conjunta de X e Y. b) ¿Cuál es la probabilidad de encontrar 2 inpresoras con daño severo? Son las distribuciones independientes? 11. Sea la variable aleatoria (X; Y), donde X es el número de kilogramos de naranjas, e Y el número de kilogramos de manzanas, ambos vendidos al día en una frutería, cuya función de densidad es:

a) Obtener la función de distribución de (X; Y). b) Calcular la probabilidad de que un día se vendan, entre naranjas y manzanas, menos de 20 kilogramos. 12. Se está interesado en explicar la relación existente entre el tiempo de impresión de un trabajo sobre el número de páginas del trabajo. Hacer el estudio en base a los datos obtenidos en el muestreo y que son los de la tabla adjunta. Páginas 1 1 2 2 3 3 4 4 5 5 Tiempo 22.53 14.70 24.59 31.80 30.01 41.32 29.03 45.00 52.55 69.50 Páginas 6 6 7 7 8 8 9 9 10 10 Tiempo 65.39 57.48 85.33 66.73 83.82 75.38 82.90 105.73 79.82 90.83 a) Ajustar un modelo de RLS. Interpretar los parámetros estimados. b) Se afirma que la verdadera varianza residual es 120, ¿apoyan los datos esta afirmación? c) ¿Es la variable independiente importante para explicar a Y? ¿se debe remover al intercepto del modelo? d) ¿Es el modelo adecuado? e) Probar la hipótesis de que el promedio de tiempo de impresión de un trabajo que tiene 8 hojas es 63. f) Probar la hipótesis Ho:ρ=0 vs Ha: ρ≠0.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF