Apuntes de Muestreo doctor marco

Share Embed Donate


Short Description

Descripción: Apuntes muestreo doctor marco...

Description



UNIVERSIDAD NACIONAL AUTÓNOMA DE HONDURAS MAESTRÍA EN INVESTIGACION ECONOMICA Y SOCIAL MIES

MUESTREO CUANTITATIVO MMI-204 SIMPLE, ESTRATIFICADO, SISTEMÁTICO Y POR CONGLOMERADOS Profesor: Dr. Marco Antonio Ramos Espinal 14 mar. 17

TABLA DE CONTENIDO 1

TÉRMINOS TÉCNICOS ......................................................................................................................... 3

2

MUESTREO ALEATORIO SIMPLE (MAS) ....................................................................................... 3 2.1 2.2 2.3 2.4 2.5

3

ESTIMACION SOBRE LA MEDIA Y EL TOTAL DE UNA POBLACIÓN ...................................... 3 TAMAÑO DE MUESTRA PARA EL ESTUDIO DE LA MEDIA Y EL TOTAL ............................... 4 ESTUDIO DE LA PORCIÓN ............................................................................................................... 4 MUESTREO CON PROBABILIDADES PROPORCIONALES AL TAMAÑO ........................................................ 5 EJERCICOS ............................................................................................................................................. 5

MUESTREO ALEATORIO ESTRATIFICADO .................................................................................. 6 3.1 ESTIMACIÓN DE LA MEDIA ............................................................................................................ 6 3.2 ESTIMACIÓN DEL TOTAL (Τ)........................................................................................................... 7 3.3 TAMAÑO DE LA MUESTRA PARA ESTUDIO DE LA MEDIA Y DEL TOTAL ............................ 7 3.4 ESTUDIO DE LA PORCIÓN ............................................................................................................... 8 3.4.1 Tamaño de la muestra y distribución........................................................................................... 9 3.5 EJERCICIOS ............................................................................................................................................. 9

4

ESTIMACIÓN DE RAZÓN Y REGRESIÓN ...................................................................................... 11 4.1 4.2 4.3 4.4 4.5

5

ESTIMACIÓN DE RAZÓN USANDO MUESTREO IRRESTRICTO ALEATORIO ............................................... 11 SELECCIÓN DEL TAMAÑO DE MUESTRA ................................................................................................ 12 ESTIMACIÓN DE RAZÓN USANDO MUESTREO ESTRATIFICADO .............................................................. 13 ESTIMACIÓN DE REGRESIÓN ................................................................................................................. 13 EJERCICIOS ........................................................................................................................................... 14

MUESTREO SISTEMÁTICO............................................................................................................... 16 5.1 ESTUDIO DE LA MEDIA.......................................................................................................................... 16 5.2 PROPORCIÓN ........................................................................................................................................ 16 5.3 EJERCICIOS ........................................................................................................................................... 17

6

MUESTREO POR CONGLOMERADOS ........................................................................................... 18 6.1 ESTUDIO DE LA MEDIA ......................................................................................................................... 18 6.2 TAMAÑO DE LA MUESTRA PARA LA MEDIA ........................................................................................... 19 6.3 ESTUDIO DE LA PORCIÓN...................................................................................................................... 19 6.3.1 Selección del tamaño de muestra para estudiar la porción ...................................................... 19 6.4 EJERCICIOS ........................................................................................................................................... 19

7

MUESTREO POR CONGLOMERADOS EN DOS ETAPAS........................................................... 21 7.1 7.2 7.3 7.4 7.5

ESTIMADOR INSESGADO DE LA MEDIA POBLACIONAL Y DEL TOTAL POBLACIONAL ............................. 22 ESTIMACIÓN DE RAZÓN DE UNA MEDIA POBLACIONAL ....................................................................... 23 ESTIMACIÓN DE UNA PROPORCIÓN POBLACIONAL ................................................................................ 24 SELECCIÓN DEL TAMAÑO DE MUESTRA ................................................................................................ 24 EJERCICIOS ........................................................................................................................................... 26

8

BIBLIOGRAFÍA ..................................................................................................................................... 29

9

ÍNDICE DE MATERIAS ....................................................................................................................... 29

Dr. Marco Antonio Ramos Espinal (mar-17)

2



1 TÉRMINOS TÉCNICOS Término Elemento Población Unidades de muestreo Marco Una muestra

Definición Es un objeto en el cual se toman las medidas Es una colección de elementos, acerca de los cuales deseamos hacer alguna inferencia Son colecciones no traslapadas de elementos de la población que cubren la población completa Lista de unidades de muestreo Es una colección de unidades seleccionadas de un marco o de varios marcos

2 MUESTREO ALEATORIO SIMPLE (MAS) 2.1 ESTIMACION SOBRE LA MEDIA Y EL TOTAL DE UNA POBLACIÓN Estadistico Promedio

Media

Total

Estimador de la desviación Estimador del error basado en dos desviaciones

Dr. Marco Antonio Ramos Espinal (mar-17)

3



2.2 TAMAÑO DE MUESTRA PARA EL ESTUDIO DE LA MEDIA Y EL TOTAL Estadistico Tamaño de muestra, usando aproximadamente un 95% de confianza

Para el estudio de la media1

Para el estudio del Total

2.3 ESTUDIO DE LA PORCIÓN Estadístico Promedio

porción

Estimador de la desviación

Tamaño de muestra necesario para estudiar la porción con dos desviaciones, 95% de confianza

1

Si no se conoce la desviación de la población se usa la de la muestra

Dr. Marco Antonio Ramos Espinal (mar-17)

4



2.4 Muestreo con probabilidades proporcionales al tamaño Estadistico

Media

Total

Promedio

Estimador de la desviación

Estimador del error basado en dos desviaciones

2.5 Ejercicios 2 1) Las autoridades de un parque están interesadas en la proporción de personas que acampan y consideran que el espacio es adecuado. Las autoridades decidieron tomar una muestra irrestricta aelatoria de n=30 de los primeros N=300 grupos que visitan el campo. Sea xi=0 si el jefe del i-ésimo grupo muestreado considera que el espacio no es adecuado para acampar, y xi= 1 que si, use los datos de la siguiente tabla para estimar la proporción de personas que acampan y considera que el espacio dispinible es adecuado. Establezca también un límite de error para la estimación. Respuesta xi Persona muestreada 1 1

2

2

0





30



Total

25

Compilado de Richard L. Scheaffer, 1987

Dr. Marco Antonio Ramos Espinal (mar-17)

5



2) 3)

4)

5)

6)

R/ p=5/6, e=0.1313 Use los datos del ejercicio anterior para determinar el tamaño de muestra requerido para estimar p con un límite de error igual a 0.05, R/ n=128 Una muestra irrestricta aleatroria de n=100 medidores de agua es controlada dentro de una comunidad para estimar el consumo promedio de agua por casa, durante un periodo estacional seco. La media y la varianza muestrales fueron 12.5 y 1252 respectivamente. Si suponemos que hay N=10,000 casas dentro de la comunidad, estime el promedio de consumo diario verdadero y establezca un límite para el error de estimación. , R/ media=12.5 e=7.04 Usando los datos del ejercicio anterior, estime el total de galones de agua usados diariamente en periodo seco. Establezca un límite para el error de estimación., R/ total=125,000 e=70,412.50 El departamento de caza y pesca está interesado en la dirección de sus programas futuros de caza. Para mantener un potencial mayor de caza futura, el departamento de sea determinar la proporción de cazadores que buscan cualquier tipo de ave de caza. Se obtuvo una muestra irrestricta aleatoria de n=1000 de los N=99,000 cazadores con permiso. Suponga que 430 indicaron que cazaron aves. Estime la proporción de cazadores con permiso que buscan aves de caza y establezca un límite del error. R/ pl=0.43 e=0.0312 Usando los datos del ejercicio anterior, determine el tamaño de muestra que el departamento debe obtener para estimar la proporción de cazadores de aves de caza, dado un límite de error de estimación e=0.02. R/ pl=0.43 n=2392

3 MUESTREO ALEATORIO ESTRATIFICADO Definición: Una muestra aleatoria estratificada es la obtenida mediante separación de los elementos de la población en grupos que no presenten traslapes, llamados estratos, y la selección posterior de una muestra aleatoria simple de cada estrato. Sea: L= número de estratos Ni= número de unidades muestrales en el estrato i N= número de unidades muestrales en la población =N1+N2+N3+…+NL

3.1 ESTIMACIÓN DE LA MEDIA

Dr. Marco Antonio Ramos Espinal (mar-17)

6



𝑠2

=

1

𝐿

𝑁2 𝑖=1

𝑁2𝑖

1 𝑒𝑟𝑟𝑜𝑟 = 2 𝑠 - = 2 𝑁-

𝑠2𝑖 𝑛𝑖

𝑁𝑖 − 𝑛𝑖 𝑁𝑖 /

𝑁..01

𝑁. − 𝑛. 𝑁.

𝑠.𝑛.

3.2 ESTIMACIÓN DEL TOTAL (τ) /

𝜏 = 𝑁(𝜇567 ) = 𝑁1 𝑥1 + 𝑁- 𝑥- + ⋯ + 𝑁/ 𝑥/ =

𝑁. 𝑥. .01

/

𝑁.-

𝑒𝑟𝑟𝑜𝑟 = 2 .01

𝑁. − 𝑛. 𝑁.

𝑠.𝑛.

3.3 TAMAÑO DE LA MUESTRA PARA ESTUDIO DE LA MEDIA Y DEL TOTAL / - 𝑠. .01 𝑁. 𝑤 . 𝑛= ; 𝑝𝑎𝑟𝑎 𝑒𝑙 𝑐𝑎𝑠𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝐵 / 𝑁 + .01 𝑁. 𝑠. 4 / - 𝑠. .01 𝑁. 𝑤 . 𝑛= ; 𝑝𝑎𝑟𝑎 𝑒𝑙 𝑐𝑎𝑠𝑜 𝑑𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝐵 / 𝑁 + .01 𝑁. 𝑠. 4𝑁 -

Con B= límite de error de la estimación definido por el investigador, 𝑛. = 𝑛𝑤. , 𝑐𝑜𝑛 𝑖 = 1, 2, 3, … , 𝐿, 𝑦 𝑤. 𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑜 𝑐𝑜𝑚𝑜 𝑙𝑎 𝑓𝑟𝑎𝑐𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Adicionalmente si se conoce el costo para obtener una observación individual del estrato iésimo, el tamaño de muestra se puede calcular:

Dr. Marco Antonio Ramos Espinal (mar-17)

7



𝑛=

𝑛=

𝑁P 𝑠P / / P01 .01 𝑁. 𝑠. 𝑐P 𝐵𝑁+ /.01 𝑁. 𝑠.4

𝑁P 𝑠P / / P01 .01 𝑁. 𝑠. 𝑐. 𝑐P 𝐵𝑁+ /.01 𝑁. 𝑠.4𝑁 -

𝑐. ; 𝑝𝑎𝑟𝑎 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑟 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎

; 𝑝𝑎𝑟𝑎 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑟 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

Y la asignación para cada estrato es: 𝑁. 𝑠. 𝑐. 𝑛. = 𝑛 ; 𝑝𝑎𝑟𝑎 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑟 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑁P 𝑠P / P01 𝑐. Si se supone que el costo es igual para todos los estratos, tenemos (Asignación de Neyman) 𝑛=

𝑁-𝐷

/ .01 𝑁. 𝑠. + /.01 𝑁. 𝑠.-

𝑁. 𝑠. / P01 𝑁. 𝑠. Si se supone, tanto el costo como las desviaciones iguales para todos los estratos, 𝑛. = 𝑛

𝑛=

𝑁-𝐷

Y la asignación: 𝑛. = 𝑛

/ .01 𝑁. 𝑠. + /.01 𝑁. 𝑠.-

𝑁. / P01 𝑁.

=𝑛

𝑁. 𝑁

3.4 ESTUDIO DE LA PORCIÓN 1 1 𝜋= 𝑁1 𝑝1 + 𝑁- 𝑝- + 𝑁T 𝑝T + ⋯ + 𝑁/ 𝑝/ = 𝑁 𝑁 𝑠- =

𝑒𝑟𝑟𝑜𝑟 = 2

Dr. Marco Antonio Ramos Espinal (mar-17)

1 𝑁-

𝑠-

/

𝑁..01

1 =2 𝑁-

/

𝑁. 𝑝U .01

𝑁. − 𝑛. 𝑝U 𝑞U 𝑁. 𝑛. − 1 /

𝑁..01

𝑁. − 𝑛. 𝑝U 𝑞U 𝑁. 𝑛. − 1

8

3.4.1 Tamaño de la muestra y distribución

𝑛=

/ 𝑁. 𝑝U 𝑞U .01 𝑤. 𝐵 𝑁+ /.01 𝑁. 𝑝U 𝑞U 4

𝑛. = 𝑛

𝑁.

𝑝U 𝑞U 𝑐.

/ P01 𝑁P

𝑝P 𝑞P 𝑐P

3.5 Ejercicios 1) Una corporación desea obtener información acerca de la efectividad de cierta máquina. Se va a entrevistar por teléfono a un número de jefes de división para pedirles que califiquen la maquinaría usando una escala numérica. Las divisiones están en Norteamérica, Europa y Asia y por esa razón se usa muestreo estratificado. Los costos son mayores para las entrevistas de los jefes de división localizados fuera de Norteamérica. La corporación desea estimar la calificación promedio usando un límite de error de la estimación de 0.632455532. Calcular el tamaño de muestra y la asignación apropiada. R, n=26, n1=16, n2=7, n3=3 Estrato I Estrato II Estrato III C1=$9 S12=2.25 N1=112

C2=$25 S22=3.24 N2=68

C3=$36 S32=3.24 N3=39

2) Una escuela desea estimar la calificación promedio que puede ser obtenido en un examen de comprensión de lectura para estudiantes de sexto grado. Los estudiantes de la escuela son agrupados en tres estratos, los que aprenden rápido en el estrato I, y los que aprenden muy lento en el estrato III. La escuela decide esta estratificación porque de esta manera se reduce la variabilidad en las calificaciones del examen. El sexto grado contiene 55 estudiantes en el estrato I, 80 en el estadio II, y 65 en el estrato III. Una muestra aleatoria estratificada de 50 estudiantes es asignada proporcionalmente y produce muestras aleatorias de n1=14, n2=20 y n3=16 de los estratos I, II y III. El examen se aplica a la muestra de estudiantes y se obtienen los resultados que se muestran a continuación. Estime la calificación promedio para este grado y establezca un límite para el error de estimación. Estrato I Estrato II Estrato III 80 68 72 85 90 62 61

92 85 87 91 81 79 83

85 48 53 65 49 72 53 68

82 75 73 78 69 81 59 52

42 36 65 43 53 61 42 39

Dr. Marco Antonio Ramos Espinal (mar-17)

32 31 29 19 14 31 30 32

9

Estrato I Estrato II Estrato III 71 59

61 42

R/ media 59.99 3) Una psicóloga que está trabajando con un grupo de adultos con retraso mental, desea estimar su tiempo de reacción promedio a cierto estímulo. Ella considera que varones y mujeres probablemente presentarán una diferencia en tiempos de reacción, por lo que desea estratificar en base a sexos. El grupo de 96 personas tiene 43 varones. En estudios previos de este tipo de investigaciones se ha encontrado que los tiempos presentan una amplitud de variación de 5 a 20 segundos para varones y de 3 a 14 segundos para mujeres. Los costos de muestreo son los mismos para ambos estratos. Encuentre el tamaño de muestra para estimar el tiempo promedio de reacción con un límite de 1 segundo. R/ n= 29 4) Un ayuntamiento municipal está interesado en ampliar las instalaciones de un centro de atención diurna para niños con retraso mental. La ampliación va incrementar los costos de asistencia a los niños del centro. Se va a realizar una encuesta por muestreo para estimar la proporción de familias con niños afectados que utilizarán las instalaciones adquiridas ampliadas. Las familias están divididas en aquellas que usan las instalaciones y aquellas que no lo hacen. Algunas familias viven en la ciudad donde se encuentra localizado el centro y otras viven en las áreas rurales o suburbanas de los alrededores. Entonces se usa muestreo estratificado con personas en la ciudad que usan las instalaciones, personas de los alrededores que las usan, personas en la ciudad que no las usan y personas en los alrededores que no las usan, formando estratos 1, 2, 3 y 4, respectivamente. Aproximadamente 90% de los que usan las instalaciones y 50% de los que no las usan van utilizar las nuevas instalaciones. Los costos de efectuar la observación de un cliente es de $4 y de $8 para uno que no lo es. La diferencia en el costo resulta de la dificultad de localizar a quienes no usan las instalaciones. Registros existentes nos dan N1=97, N2=43, N3=145, N4=68. Encuentre el tamaño de muestra aproximado y la asignación necesaria para estimar la proporción poblacional con un límite de 0.05 para el error de la estimación. R/ n=158, n1=39, n2=17, n3=69, n4=33 5) Un guardabosques quiere estimar el número total de acres plantados de árboles en los ranchos de un estado. Ya que el número de acres de árboles varía considerablemente con respecto al tamaño del rancho, decide estratificar con base en el tamaño de los ranchos. Los 240 ranchos en el estado son puestos en una de 4 categorías de acuerdo al tamaño. Una muestra estratificada de 40 ranchos, seleccionada mediante asignación proporcional, produce los resultados del número de acres plantados de árboles que se muestran a continuación. Estime el número total de acres plantados de árboles en los ranchos del estado y fije un límite para el error de estimación. Estrato I 0-200 acres Estrato II 201400 acres Estrato III 401-600 acres Estrato IV más de 601 acres

N1=86 n 1=14 ; 97,67,42,125,25,92,105,86,27,43,45,59,53,21 N2=72, n2=12; 125,155,67,96, 67, 256, 47, 310, 236, 220, 352, 142,190 N3=52, n2=9; 142, 256, 310, 440, 495, 510, 320, 320, 396, 196 N4=30, n4=5; 167, 655, 220, 540, 780

Dr. Marco Antonio Ramos Espinal (mar-17)

10



4 ESTIMACIÓN DE RAZÓN Y REGRESIÓN En ocasiones es supremamente importante el estudio de la relación entre variables, sucede con mucha frecuencia en los estudios económicos, sociales, dentro de las organizaciones, etc. En esos casos se debe medir dos variables o más.

4.1 Estimación de razón usando muestreo irrestricto aleatorio ¿Cómo se estima una media µx, 𝛕y o R poblacionales con el uso de la medición de dos variables, yi y otra xi?, suponiendo que se toma una muestra irrestricta aleatoria de tamaño n de una población que tiene un tamaño N. Razón Parámetro Poblacional Fórmulas R



Varianza estimada de r

Límite de error, basado en dos desviaciones Para el total 𝛕y Parámetro Poblacional Total, poblacional

Fórmulas



Varianza estimada de total poblacional Límite de error, basado en dos desviaciones Dr. Marco Antonio Ramos Espinal (mar-17)









11

Para la media poblacional 𝛍x Parámetro Poblacional media, poblacional

Fórmulas



Varianza estimada de media poblacional Límite de error, basado en dos desviaciones





4.2 Selección del tamaño de muestra A continuación la fórmula para la determinación del tamaño de muestra para estimar el parámetro de la población R, µy o 𝛕y con un error determinado. Parámetro Poblacional Fórmulas R

se puede tomar una muestra preliminar n´y calculamos:

si también µx es desconocida usamos la media de x, calculada con las observaciones de la muestra preliminar µy Dr. Marco Antonio Ramos Espinal (mar-17)

12

Parámetro Poblacional 𝛕y

Fórmulas





4.3 Estimación de razón usando muestreo estratificado Parámetro Poblacional media

Fórmulas



Varianza estimada de total poblacional



4.4 Estimación de regresión

Parámetro Poblacional media, poblacional

Fórmulas



Varianza estimada de media poblacional Límite de error, basado en dos desviaciones Dr. Marco Antonio Ramos Espinal (mar-17)







13



4.5 Ejercicios 1) Una encuesta de consumo fue realizada para determinar la razón de dinero gastado en alimentación con el ingreso por año, para las familias de una pequeña comunidad. Una muestra irrestricta aleatoria de 14 familias fue seleccionada de entre 150, los datos se muestran a continuación. Estime R y un límite para el error de estimación. R/ r=0.14672, e =0.01024544 Familia Ingreso total, x Cantidad Gastada en alimentos, y 1

25100

3800

2

32200

5100

3

29600

4200

4

35000

6200

5

34400

5800

6

26500

4100

7

28700

3900

8

28200

3600

9

34600

3800

10

32700

4100

11

31500

4500

12

30600

5100

13

27700

4200

14

28500

4000

2) Un guardabosques está interesado en estimar el volumen total de árboles en una venta de madera. Registra el volumen de cada árbol en una muestra irrestricta aleatoria. Además, mide el área basal de cada árbol marcado para la venta, luego usa un estimador de razón del volumen total. El guardabosque decide tomar una muestra Dr. Marco Antonio Ramos Espinal (mar-17)

14

irrestricta aleatoria de n=12 de los N=250 árboles marcados para la venta. Denótese por xi el área basal y yi por el volumen en pies cúbicos para un árbol, el área basal para los 250 arboles 𝛕x=75 pies cuadrados. Use los datos de la tabla siguiente para estimar 𝛕y el volumen total en pies cúbicos de los arboles marcados para la venta y establezca un límite para el error de estimación. R/ ty=1589.552, e =100.111

Árbol 1 2 3 4 5 6 7 8 9 10 11 12

Pies cuadrados, área basal xi 0.3 0.5 0.4 0.9 0.7 0.2 0.6 0.5 0.8 0.4 0.8 0.6

Volumen yi 6 9 7 19 15 5 12 9 20 9 18 13

3) Un investigador tiene una colonia de N=763 ratas que han sido sometidas a un fármaco tipo. El tiempo promedio para atravesar correctamente el laberinto bajo la influencia del fármaco tipo fue de µx=17.2 segundos. Al investigador ahora le gustaría someter a un nuevo fármaco a una muestra aleatoria de 11 ratas. Estime el tiempo promedio requerido para atravesar el laberinto bajo la influencia del nuevo fármaco, establezca un límite para el error de estimación. R my=17.58918, e=0.2710168 Fármaco tipo (xi) Nuevo Fármaco (yi)

14.3 15.7 17.8 17.5 13.2 18.8 17.6 14.3 14.9 17.9 19.2 15.2 16.1 18.1 17.6 14.5 19.4 17.5 14.1 15.2 18.1 19.5

4) Un investigador está investigando un nuevo complemento nutritivo para el ganado. A mediados del estudio de dos meses, el experimentador se interesó en estimar el peso promedio para el rebaño completo, compuesto por N=500 novillos. La muestra irrestricta aleatoria de n=12 novillos fue seleccionada del rebaño y se pesó. Los datos del ganado y los de un estudio previo se muestran en la tabla. Suponga que µx del

Dr. Marco Antonio Ramos Espinal (mar-17)

15

estudio previo =880 libras. Estime la media de y y encuentre un límite de predicción. µy=1003.28, e = 71.88055 Novillo Del 1 al 12 Peso (815,919,690,984,200,260,1323,1067,789,573,834,1049) estudio previo x Peso (897,992,752,1093,768,828,1428,1152,875,642,909,1122) actual y

5 MUESTREO SISTEMÁTICO Definición: Una muestra obtenida al seleccionar aleatoriamente un elemento de los primeros k elementos en el marco de colecciones no traslapadas de elementos de la población que cubren la población completa, y después cada k-ésimo elemento, se denomina muestra sistemática de 1 en k.

5.1 Estudio de la media 𝜇6U6 = 𝑠7-

𝑛

𝑠- 𝑁 − 𝑛 = 𝑛 𝑁

𝑒𝑟𝑟𝑜𝑟 = 2

𝑛=

• .01 𝑋.

𝑠- 𝑁 − 𝑛 𝑛 𝑁

𝑁𝑠 𝐵𝑁−1 + 𝑠4

5.2 Proporción 𝜋567 = 𝑠- =

Dr. Marco Antonio Ramos Espinal (mar-17)

• .01 𝑦.

𝑛

𝜋567 (1 − 𝜋567 ) 𝑁 − 𝑛 𝑛−1 𝑁

16



𝑒𝑟𝑟𝑜𝑟 = 2

𝜋6U6 (1 − 𝜋6U6 ) 𝑁 − 𝑛 𝑛−1 𝑁

5.3 Ejercicios 1) La gerencia de una compañía privada está interesada en estimar la porción de empleados que favorecen una nueva política de inversión. Una muestra sistemática de 1 en 10 es obtenida de los empleados que salen del edificio al final de una día de trabajo en particular. Use los datos que se muestran a continuación para estimar p, la porción a favor de la nueva política y establezca una límite para el error de estimación, suponga N=2000 Empleado muestreado 3 13 23 … 1993

Respuesta 1 0 1 …. 1 200

𝑋𝑖 = 132 𝑖=1

R/ πest=0.66, error=0.0637141 2) La sección de control de calidad de una empresa usa el muestreo sistemático para estimar la cantidad promedio de llenado de latas de 12 onzas que sale de una línea de producción. Los datos de la tabla representan una muestra sistemática de 1 en 50 de la producción de un día. Estime la media y establezca un error para la estimación. Suponga N=1800 12 11.91 11.87 12.05 11.72 11.85

11.97 11.98 12.01 11.87 11.93 11.98

12.01 12.03 11.98 11.91 11.95 11.87

12.03 11.98 11.87 11.93 11.97 12.02

12.01 12 11.90 11.94 11.93 12.02

11.80 11.83 11.88 11.89 12.05 12.04

R/ media estimada 11.94 onzas, error=0.02592 3) Use los datos del ejercicio anterior para determinar el tamaño de la muestra requerido para estimar la media dentro de 0.03 unidades. R/ n=27.02 aprox 28 Dr. Marco Antonio Ramos Espinal (mar-17)

17

4) La patrulla de caminos de un estado en particular está interesada en la proporción de automovilistas que portan su licencia. Se instala un puesto de verificación en una carretera principal y se detiene al conductor de cada séptimo vehículo. Use los datos de la tabla para estimar la proporción de conductores que portan su licencia. Establezca un límite para el error de estimación. Suponga que N=2800 autos pasan por el puesto de verificación durante el periodo de muestreo. Automóvil 1 2 3 … 400

Respuesta 1 1 0 …. 1 400

𝑋𝑖 = 324 𝑖=1

R/ πest=0.81, error=0.03636

6 MUESTREO POR CONGLOMERADOS 6.1 Estudio de la Media N=número de conglomerados en la población n=número de conglomerados seleccionados en una muestra aleatoria mi=número de elementos en el conglomerado i, i=1,2,3,…,N • 1 𝑚= 𝑚. = 𝑡𝑎𝑚𝑎ñ𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑐𝑜𝑛𝑔𝑙𝑜𝑚𝑒𝑟𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑛 .01



𝑀=

𝑚. = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 .01

𝑀=

𝑀 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑐𝑜𝑛𝑔𝑙𝑜𝑚𝑒𝑟𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 (𝑠𝑒 𝑝𝑢𝑒𝑑𝑒 𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑟 𝑐𝑜𝑛 𝑚) 𝑁

𝑿𝒊 = 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑖 − é𝑠𝑖𝑚𝑜 𝑐𝑜𝑛𝑔𝑙𝑜𝑚𝑒𝑟𝑎𝑑𝑜 • .01 𝑋. • .01 𝑚. 𝜇567 𝑚. )-

𝜇567 = 𝑠- =

𝑁−𝑛 𝑁𝑛𝑀-

Dr. Marco Antonio Ramos Espinal (mar-17)

• .01(𝑋.

− 𝑛−1

; 𝑀 𝑠𝑒 𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎 𝑐𝑜𝑛 𝑚

18



𝑒𝑟𝑟𝑜𝑟 = 2

𝑠-

𝑠•-

=2

=

• .01(𝑋.

− 𝜇567 𝑚. )𝑛−1

𝑁−𝑛 𝑁𝑛𝑀• .01(𝑋.

− 𝜇567 𝑚. )𝑛−1

6.2 Tamaño de la muestra para la media 𝑁𝑠•-

𝑛= 𝑁

𝐵- 𝑀+ 𝑠•4

6.3 Estudio de la Porción 𝑝=

• .01 𝑎. • .01 𝑚.

𝑎. = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑛 𝑒𝑙 𝑐𝑜𝑛𝑔𝑙𝑜𝑚𝑒𝑟𝑎𝑑𝑜 𝑖 𝑞𝑢𝑒 𝑝𝑜𝑠𝑒𝑒𝑛 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠

𝑠- =

𝑒𝑟𝑟𝑜𝑟 = 2

𝑁−𝑛 𝑁𝑛𝑀-

𝑠-

=2

• .01

𝑎. − 𝑝𝑚. 𝑛−1

𝑁−𝑛

• .01

𝑁𝑛𝑀-

-

𝑎. − 𝑝𝑚. 𝑛−1

-

6.3.1 Selección del tamaño de muestra para estudiar la porción 𝑁𝑠• -

𝑛= 𝑁 Con 𝑠•- =

𝐵- 𝑀+ 𝑠•4 • .01(𝑎.

− 𝑝𝑚. )𝑛−1

6.4 Ejercicios 1) Un fabricante de sierras de cinta quiere estimar el costo de reparación promedio mensual para las sierras que ha vendido a ciertas industrias. El fabricante no puede obtener un costo de reparación de cada sierra, pero puede obtener la cantidad total Dr. Marco Antonio Ramos Espinal (mar-17)

19

gastada en reparación y el número de sierras que tiene cada industria. Entonces decide usar muestreo por conglomerados en cada industria como conglomerado. El fabricante selecciona una muestra aleatoria de n=20 de N=96 industrias a las que da el servicio. Los datos sobre el costo total de reparaciones por industria y el número de sierras por industria se presentan en la tabla. Estime el costo promedio de reparación por sierra y establezca un límite para el error de estimación. Industria Número de sierras 1 3 2 7 3 11 4 9 5 2 6 12 7 14 8 3 9 5 10 9

Costo total e reparación ($) 50 110 230 140 60 280 240 45 60 230

Industria Número de sierras 11 8 12 6 13 3 14 2 15 1 16 4 17 12 18 6 19 5 20 8

Costo total e reparación ($) 140 130 70 50 10 60 280 150 110 120

R/ media estimada 19.7307, error 1.78 2) Considerando los datos del ejercicio anterior, ¿cuántos conglomerados debe seleccionar en la muestra si quiere que el límite de error de estimación sea de $2? R/ n=16.56 apro 17 3) Una industria está revisando su política de jubilación y quiere estimar la proporción de empleados que apoyan la nueva política. La industria consisten en 87 plantas separadas localizadas en todo el país. Ya que los resultados deben ser obtenidos rápidamente y con poco dinero, la industria decide usar muestreo por conglomerados con cada planta como conglomerado. Se selecciona una muestra aleatoria de 15 plantas y se obtienen las opiniones de los empleados en estas plantas a través de un cuestionario. Los resultados se presentan en la tabla. Estime la proporción de empleados en la industria que apoyan la política de jubilación y establezca un límite para el error de estimación. Industria Número de empleados

1 2 3 4 5 6 7

51 62 49 73 101 48 65

Número de empleados que apoyan la nueva política 42 53 40 45 63 31 38

Dr. Marco Antonio Ramos Espinal (mar-17)

Industria Número de empleados

9 10 11 12 13 14 15

73 61 58 52 65 49 55

Número de empleados que apoyan la nueva política 54 45 51 29 46 37 42

20

8

49

30







R/ p=0.70911087, error=0.048135 4) Usando los datos del ejercicio anterior, ¿cuántas plantas deben ser muestreadas para tener un límite de error estimación de 0.08? R/ n=6.1016, apro 7

7 Muestreo por Conglomerados en dos etapas Para seleccionar una muestra: 1) Primero se obtiene un marco que liste todos los conglomerados de la población 2) Se selecciona una muestra aleatoria de conglomerados usando el muestreo a aleatorio simple. 3) Obtenemos marcos que listen todas las unidades de cada uno de los conglomerados seleccionados 4) Finalmente seleccionamos una muestra aleatoria de elementos de cada uno de esos marcos. Usamos: N: n: Mi: mi:

número de conglomerados en la población es el número de conglomerados seleccionados en una muestra irrestricta aleatoria es el número de elementos en el conglomerado i es el número de elementos seleccionados en una muestra aleatoria del conglomerado i

Dr. Marco Antonio Ramos Espinal (mar-17)

21



7.1 Estimador Insesgado de la media poblacional y del total poblacional Parámetro Poblacional media, poblacional

Fórmulas

Varianza estimada de media poblacional Límite de error, basado en dos desviaciones Sb2

Si2









Dr. Marco Antonio Ramos Espinal (mar-17)

22



Parámetro Poblacional total, poblacional

Fórmulas

Varianza estimada de media poblacional Límite de error, basado en dos desviaciones



7.2 Estimación de Razón de una Media Poblacional

Parámetro Poblacional media, poblacional

Fórmulas



Varianza estimada de media poblacional Límite de error, basado en dos desviaciones Sr2 Si2







Dr. Marco Antonio Ramos Espinal (mar-17)

23



7.3 Estimación de una proporción poblacional Parámetro Poblacional proporcion, poblacional

Fórmulas



Varianza estimada de proporción poblacional Límite de error, basado en dos desviaciones Sr2



qi



7.4 Selección del tamaño de muestra Tenemos que seleccionar los valores para las n y todas las mi, además la mejor selección para estos valores depende de dos fuentes de variación: 1) La que existe entre los conglomerados 2) la se encuentra entre los elementos dentro de conglomerados El principio general es asignar los recursos de la muestra a la componente con la variación más grande, o sea, si las mediciones en los conglomerados son homogéneas pero las medias de estos varían grandemente de un conglomerado a otro, muestreamos muchos conglomerados con pocas mediciones de cada uno, por otro lado, si las mediciones en conglomerados varían grandemente, pero las medías de estos son homogéneas, muestreamos pocos conglomerados y muchas mediciones de cada uno. Los supuestos: Dr. Marco Antonio Ramos Espinal (mar-17)

24



la varianza se puede aproximar:

la b corresponde a las varianzas entre las medias verdaderas de conglomerados, y la w las varianzas entre elementos dentro de los conglomerados. El costo asociado con el muestreo de conglomerados es c1 y el costo asociado con el muestreo de cada conglomerado es c2, el costo total es:

El valor de m que minimiza está dado por:

Después que se ha determinado m, m se encuentra mediante la expresión de la varianza, si la varianza es fija o mediante la ecuación del costo si el costo es fijo. si usamos:

Dr. Marco Antonio Ramos Espinal (mar-17)

25



Entonces con estos valores, podemos usar y luego con para encontrar el valor óptimo de n para una varianza fija.

7.5 Ejercicios 1) Un fabricante de prendas de vestir tiene 90 plantas localizadas en todo el país y quiere estimar el número medio de horas que las máquinas de coser estuvieron sin funcionar por reparación en los meses pasados. Debido a que las plantas están dispersas, el fabricante decide utilizar muestreo por conglomerados, especificando cada planta como un conglomerado de máquinas. Cada planta contiene muchas máquinas y el verificar los registros de reparación de cada máquina implicaría mucho tiempo, por lo que se usa el muestreo por conglomerados en dos etapas. Se dispone de tiempo y dinero suficiente para muestrear n=10 plantas y aproximadamente un 20% de las máquinas de coser de cada planta. Usando los datos de la tabla siguiente estime el tiempo sin funcionar promedio por máquina y establezca un límite para el error de estimación. El fabricante sabe que tiene un total de 4500 máquinas en todas las plantas. 2

Planta

Mi

mi

Tiempo sin funcionar (horas)

Media xi

Si

1

50

10

5,7,9,0,11,2,8,7,3,5

5.40

11.38

2

65

13

4,3,7,2,11,0,1,9,4,3,2,1,5

4

10.67

Dr. Marco Antonio Ramos Espinal (mar-17)

26

2

Planta

Mi

mi

Tiempo sin funcionar (horas)

Media xi

Si

3

45

9

5,6,4,11,12,0,1,8,4

5.67

16.75

4

48

10

6,4,0,1,0,9,8,4,6,10

4.80

13.29

5

52

10

11,4,3,1,0,2,8,6,5,3

4.30

11.12

6

58

12

12,11,3,4,2,0,0,1,4,3,2,4

3.83

14.88

7

42

8

3,7,6,7,8,4,3,2

5

5.14

8

66

13

3,6,4,3,2,2,8,4,0,4,5,6,3

3.85

4.31

9

40

8

6,4,7,3,9,1,4,5

4.88

6.13

10

56

11

6,7,5,10,11,2,1,4,0,5,4

5

11.80

R/ media 4.80, error de estimación 0.037094 2) Estime la cantidad total de tiempo sin funcionar durante el mes pasado para todas las máquinas del ejercicio 1, establezca un límite para el error de estimación. R/ total=21,605.31, error de estimación=1733.4 3) Usando los datos del ejercicio 1, estime el tiempo promedio por máquina sin funcionamiento y establezca un límite para el error. R/ media 4.60 y estimación del error es 0.049306 4) En el ejercicio 1 se quiere estimar la proporción de máquinas que han sido retiradas del proceso debido a reparaciones mayores. Las proporciones muéstrales de las maquinas que requieren reparaciones mayores se presentan en la siguiente tabla: Planta

Mi

mi

Proporción de máquinas que requieren reparaciones mayores

1

50

10

0.4

2

65

13

0.38

3

45

9

0.22

4

48

10

0.30

5

52

10

0.50

6

58

12

0.25

7

42

8

0.38

Dr. Marco Antonio Ramos Espinal (mar-17)

27

Planta

Mi

mi

Proporción de máquinas que requieren reparaciones mayores

8

66

13

0.31

9

40

8

0.25

10

56

11

0.36

R/ p=0.34, error de estimación 0.056 5) Un plan para asegurar la calidad en una fábrica de baterías requiere muestrear n baterías para luego muestrear m placas con polaridad positiva de cada acumulador seleccionado. La medición de interés es el grosor de las placas positivas en milésimas de pulgada. El investigador desea seleccionar n y m de manera que la varianza del grosor medio por placa sea 0.5. El costo por seleccionar una batería y dividirlo es 6 veces el costo de medir una placa. Estudios preliminares con baterías similares en la fábrica dieron para n=40 y m=50, s2w=3, s21=3.4. Use esos datos para determinar m y n que satisfagan las condiciones de varianza dada. R/ m aproximadamente 3, n aproximadamente 8

Dr. Marco Antonio Ramos Espinal (mar-17)

28



8 Bibliografía

Scheaffer, R., Mendenhall, W., & Ott, L. (1987). Elementos de Muestreo. México, México: Grupo Editorial Iberoamericada.

9 ÍNDICE DE MATERIAS Asignación de Neyman, 7 Dr. Marco Antonio Ramos Espinal (mar-17)

conglomerados, 18, 19, 20 29

costo para obtener una observación, 7

Dr. Marco Antonio Ramos Espinal (mar-17)

muestra aleatoria, 6, 9, 18, 19, 20 muestra sistemática, 16, 17

30

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF