Problem Set 3 Inferencia Estadistica
Short Description
Descripción: Inferencia...
Description
Problem Set #3 Inferencia Estadistica
Robinson Dettoni Hidalgo Emiliano Fucks Jara Cliff Bahamondes Poblete November 22, 2015
1. Si X1 , X2 , ..., Xn constituye una muestra aleatoria, obtener las funciones de verosimilitud de las siguientes distribuciones: (a) De Poisson con parametro λ. (b) Exponencial con parametro θ. (c) Normal con parametros µ y σ. (d) Binomial con parametros n y p. (e) Gama con parametros β y θ. 2. Para un determinado nivel de ingresos, el Departamento de Hacienda sabe que las cantidades declaradas por concepto de deducciones medicas (X1 ), contribuciones caritativas (X2 ) y gastos varios (X3 ) son variables aleatorias independientes normalmente distribuidas con medias $400, $800 y $100 y desviaciones estándar $100, $250 y $40, respectivamente. (a) ¿Cual es la probabilidad de que la cantidad declarada por concepto de estas tres deducciones, no sea mayor que $1600? 1
(b) Si una persona con este nivel de ingresos declara por concepto de estas deducciones un total de $2100, ¿que tal probable es tener una cantidad igual o mayor a este monto bajo las condiciones dadas? 3. Para cierta prueba de aptitud se sabe con base en la experiencia que el numero de aciertos es 1000 con una desviación estándar de 125. Si se aplica la prueba a 100 personas seleccionadas al azar, aproximar las siguientes probabilidades que involucran ¯ a la media muestral X. ¯ < 1015) (a) P(985 < X ¯ < 1040) (b) P(960 < X ¯ > 1020) (c) P(X ¯ < 975) (d) P(X 4. Un inspector de aduana de pesos y medidas visita una planta de empacado para verificar que el peso neto de las cajas sea el indicado en éstas. El gerente de la planta asegura al inspector que el peso promedio de cada caja es de 750 gr con una desviación estándar de 5 gr. El inspector selecciona, al azar, 100 cajas y encuentra que el peso promedio es de 748 gr. Bajo estas condiciones, ¿qué tan probable es tener un peso de 748 o menos? ¿Qué actitud debe tomar el inspector? 5. En la fabricación de cojinetes para motores, se sabe que el diámetro promedio es de 5 cm con una desviación estándar igual a 0.005 cm. El proceso es vigilado en forma periódica mediante la selección aleatoria de 64 cojinetes, midiendo sus correspondientes diámetros. El proceso no se detiene mientras la probabilidad de que la media muestral se encuentre entre dos límites especificados sea de 0.95. Determinar el valor de los límites. 6. En la producción de cierto material para soldar se sabe que la desviación estándar de la tensión de ruptura de este material es de 25 libras. ¿Cuál debe ser la tensión de 2
ruptura promedio del proceso si, con base en una muestra aleatoria de 50 especímenes, la probabilidad de que la media muestral tenga un valor mayor de 250 libras es de 0.95? 7. Para un gerente de planta es muy importante controlar la variación en el espesor de un material plástico. Se sabe que la distribución del espesor del material es normal con una desviación estándar de 0.01 cm. Una muestra aleatoria de 25 piezas de este material da como resultado una desviación estándar muestral de 0.015 cm. Si la varianza de la población es (0.01)2 cm2 , ¿qué puede usted concluir con respecto a la variación de este proceso? 8. Si se tiene una muestra aleatoria de n = 16 de una distribución normal con media y 2
varianza desconocidas, obtener P ( Sσ2 ≤ 2.041) 9. Si se tiene una muestra aleatoria de n = 21 de una distribución normal con media y 2
varianza desconocidas, obtener P ( Sσ2 ≤ 1.421) 10. Durante los 12 meses pasados el volumen diario de ventas de un restaurante fue de $2000. El gerente piensa que los próximos 25 días serán típicos con respecto al volumen de ventas normal. Al finalizar los 25 días, el volumen de ventas y su desviación estándar promedio fueron de $1800 y $200, respectivamente. Si usted fuese el gerente, ¿tendría alguna razón para creer, con base en este resultado, que hubo una disminución en el volumen de ventas promedio diario? 11. La variación en el número de unidades diarias de cierto producto, el cual manejan dos operadores A y B, debe ser la misma. Con base en muestras de tamaño nA = 16 días y nB = 21, el valor calculado de las desviaciones estándar muestrales son de sA = 8.2 unidades y sB = 5.8 unidades. Si el número de éstas, manejadas por los dos operadores, por día, son dos variables aleatorias independientes que se encuentran aproximadas, en forma adecuada, por distribuciones normales, ¿existe alguna razón para creer que las varianzas son iguales? ¯ y S 2 son estimadores insesgados de µ y σ 2 . De una explicación de lo 12. Demuestre que X 3
que significa que un estimador sea insesgado. 13. De un experimento binomial se observan x éxitos en n ensayos independientes. Se proponen las siguientes dos estadísticas como estimadores del parámetro de proporción p: T1 =
X n
y T2 =
X+1 . n+2
(a) Obtener y comparar los Errores Cuadraticos Medios (ECM) para T1 y T2 . (b) Hacer una gráfica del ECM para T1 y T2 como funciones de p para n = 10 y n = 25. ¿Es alguno de estos estimadores uniformemente mejor que el otro?. (c) Demuestre que T1 es un estimador consistente de p. Explique que significa que un estimador sea consistente. 14. Suppose our dataset is a realization of a random sample X1 , X2 , ..., Xn from a uniform distribution on the interval [−θ, θ] where θ is unknown. (a) Show that T = n3 [X12 + X22 + X32 + ... + Xn2 ] is an unbiased estimator for θ2 . √ (b) Is T also an unbiased estimator for θ? If not, argue whether it has positive or negative bias. 15. Suppose the random variables X1 , X2 , ..., Xn have the same expectation µ. For which constants a and b is T = a1 X1 + a2 X2 + a3 X3 + ... + an Xn an unbiased estimator for µ? 16. Consider the following dataset of lifetimes of ball bearings in hours. 6278, 3113, 5236, 11584, 12628, 7725, 8604, 14266, 6125, 9350, 3212, 9003, 3523, 12888, 9460, 13431, 17809, 2812, 11825, 2398. One is interested in estimating the minimum lifetime of this type of ball bearing.The dataset is modeled as a realization of a random sample X1 , X2 , ..., Xn . Each random variable Xi is represented as Xi = δ + Yi , where Yi has an Exp(λ) distribution and δ > 0 is an unknown parameter that is supposed to model the minimum lifetime. The objective is to construct an unbiased estimator for δ. It is known that: 4
E[Mn ] = δ +
1 nλ
¯n] = δ + and E[X
where Mn = minimum of X1 , X2 , ..., Xn and X¯n = (a) Check that T =
n (X¯n n−1
1 λ
X1 +X2 +X3 +...+Xn . n
− Mn ) is an unbiased estimator for λ1 .
(b) Construct an unbiased estimator for δ. (c) Use the dataset to compute an estimate for the minimum lifetime δ. You may use that the average lifetime of the data is 8563.5. 17. Given are two estimators S and T for a parameter θ. Furthermore it is known that V ar(S) = 40 and V ar(T ) = 4. (a) Suppose that we know that E[S] = θ and E[T ] = θ + 3. Which estimator would you prefer, and why? (b) Suppose that we know that E[S] = θ and E[T ] = θ + a for some positive number a. For each a, which estimator would you prefer, and why? ¯ n and Y¯m be the sample means of two independent random samples of size n 18. Let X (respectively m) from the same distribution with mean µ. We combine these two estimators to a new estimator T by putting ¯ n + (1 − r)Y¯m T = rX where r is some number between 0 and 1. (a) Show that T is an unbiased estimator for the mean µ. (b) Show that T is the most efficient when r = n/(n + m). 19. We throw an unfair coin repeatedly until heads comes up for the first time. We repeat this experiment three times (with the same coin) and obtain the following data:
5
First experiment: heads first comes up in 3rd throw Second experiment: heads first comes up in 5th throw Third experiment: heads first comes up in 4th throw. Let p be the probability that heads comes up in a throw with this coin. Determine the maximum likelihood estimate pˆ of p. 20. Let X1 , X2 , ..., Xn be iid with pdf f (x|θ) = 1θ , 0 ≤ x ≤ θ, θ > 0. Estimate θ using both the method of moments and maximum likelihood. Calculate the means and variances of the two estimators. Which one should be preferred and why? 21. Let be x1 , x2 , ..., xn a dataset that is a realization of a random sample from a U (α, β) distribution (with α and β unknown, α < β). Determine the maximum likelihood estimates for α and β. 22. Suppose that x1 , x2 , ..., xn is a dataset, which is a realization of a random sample from a normal distribution. (a) Let the probability density of this normal distribution be given by fµ (x) =
1 2 √1 e− 2 (x−µ) 2π
for −∞ < x < ∞
Determine the maximum likelihood estimate for µ.
(b) Now suppose that the density of this normal distribution is given by fσ (x) =
1 2 √1 e− 2 (x) σ 2π
for −∞ < x < ∞
Determine the maximum likelihood estimate for σ. 23. Suppose that x1 , x2 , ..., xn is a dataset, which is a realization of a random sample from a Rayleigh distribution, which is a continuous distribution with probability density function given by 6
2
fθ (x) =
x x − 2θ2 e 2 θ
for x ≥ 0
In this case what is the maximum likelihood estimate for θ? 24. El tiempo total de procesamiento para programas en tarjetas perforadas de computadoras se define como el tiempo que transcurre desde que se lee la primera tarjeta hasta que se imprime la última línea, y está constituido por tres componentes; el tiempo de espera de entrada, el tiempo utilizado por el procesador central y el tiempo de espera de salida. Los siguientes datos son los tiempos totales de procesamiento, en minutos, para una muestra aleatoria de 15 programas similares:
12.5, 5.2, 6.8, 3.6, 10.9, 12.8, 7.8, 8.6, 6.3, 6.9, 18.2, 15.4, 9.2, 10.3, 7.3.
Supóngase que el tiempo total de procesamiento está modelado, en forma adecuada, por una distribución gama con α = 3 (a) Obtener el estimador de máxima verosimilitud para el parámetro de escala θ. (b) El método de momentos, ¿daría un estimado diferente de θ al determinado en el inciso a)? (c) Mediante la respuesta del inciso a), calcular la probabilidad de que el tiempo de procesamiento sea mayor a 20 minutos. 25. Un fabricante de fibras sintéticas desea estimar la tensión de ruptura media de una fibra. Diseña un experimento en el que se observan las tensiones de ruptura, en libras, de 16 hilos del proceso seleccionados aleatoriamente. Las tensiones son:
20.8, 20.6, 21.0, 20.9, 19.9, 20.2, 19.8, 19.6, 20.9, 21.1, 20.4, 20.6, 19.7, 19.6, 20.3 20.7.
Supóngase que la tensión de ruptura de una fibra se encuentra modelada por una distribución normal con desviación estándar de 0.45 libras. Construir un intervalo de 7
confianza estimado del 98% para el valor real de la tensión de ruptura promedio de la fibra. 26. Con respecto al ejercicio anterior, ¿cuáles de las siguientes proposiciones son apropiadas para la interpretación del intervalo de confianza? (a) En la probabilidad de que la tensión promedio verdadera se encuentre, los límites de confianza son de 0.98. (b) Aproximadamente el 98%, de todos los intervalos de confianza calculados con base en repetidas muestras de tamaño, 16 obtenidas en el proceso de fabricación de las fibras incluirán el verdadero valor promedio de la tensión de ruptura. (c) La probabilidad de que la tensión de ruptura para cualquier fibra se encuentre fuera de los límites de confianza de 0.02. 27. Una tienda de donas se interesa en estimar su volumen de ventas diarias. Supóngase que el valor de la desviación estándar es de $50. (a) Si el volumen de ventas se encuentra aproximado por una distribución normal, ¿cuál debe ser el tamaño de la muestra para que con una probabilidad de 0.95 la media muestral se encuentre a no más de $20 del verdadero volumen de ventas promedio? (b) Si no es posible suponer que la distribución es normal, obtener el tamaño necesario de la muestra para la pregunta a
8
View more...
Comments