Unidad 5. Muestreo Sistemático

June 14, 2018 | Author: Sergio Polanco | Category: Sampling (Statistics), Estimator, Variance, Probability And Statistics, Scientific Method
Share Embed Donate


Short Description

Descripción: TÉCNICAS DE MUESTREO...

Description

Técnicas de Muestreo

UNIDAD 5 MUESTREO SISTEMÁTICO El muestreo irrestricto aleatorio (m.i.a) y el muestreo aleatorio estratificado (m.a.e) requieren de un trabajo detallado en el proceso de selección de la muestra. Porque las unidades de muestreo en el marco adecuado deben de ser numeradas de modo que un mecanismo de aleatorización, como una tabla de números aleatorios, pueda utilizarse para seleccionar unidades específicas de la muestra. Un diseño de muestreo que se utiliza frecuentemente porque simplifica el proceso de selección de la muestra es el muestreo sistemático (m.s).

5.1.-PRESENTACIÓN DEL MUESTREO SISTEMATICO El muestreo sistemático es un proceso de selección regular cuyo punto de inicio es aleatorio, tomando un elemento de los k primeros elementos y posteriormente la selección de cada késimo elemento, este tipo de muestreo es mas fácil de realizar y esta menos expuesto a errores del encuestador. La muestra sistemática se define como una muestra obtenida al seleccionar aleatoriamente un elemento de los primeros k elementos en el marco y después cada k-ésimo elemento se denomina muestra sistemática de 1 en k. Por ejemplo, suponga que va a seleccionarse una muestra de n nombres de una larga lista; una forma sencilla de seleccionarlos es, eligiendo un intervalo apropiado (dependiendo de n) y seleccionar los nombres a lo largo de la lista. De ese modo si k=10, se escoge un numero aleatorio entre los 10 primeros elementos, suponga que fue el 4 (selección aleatoria), el siguiente elemento sería el 14 luego el 24 y así sucesivamente se toma una observación cada 10 elementos. Las ventajas del muestreo sistemático son las siguientes: 1

El muestreo sistemático es fácil de realizarse en el campo y por su forma de llevarse a cabo está menos expuesto a los errores de selección que cometen los investigadores.

2

El muestreo sistemático puede proporcionar mayor información informaci ón por unidad de costo que la que proporciona el muestreo irrestricto aleatorio ya que se extiende más uniformemente sobre toda la población y por lo tanto puede proporcionar mayor información que una muestra equivalente en tamaño, tomada con muestreo irrestricto aleatorio.

Técnicas de Muestreo

Una consideración importante en el muestreo sistemático es que su precisión depende del orden de las unidades de muestreo en el marco, ya que si estas están dispuestas de manera aleatoria entre todos los demás entonces la ventaja se pierde y resulta equivalente al irrestricto aleatorio. Otros ejemplos del uso del muestreo sistemático se dan cuando se realiza la selección de cada k- esimo cuestionario de un censo, para su validación; cada k-esimo renglón de un libro para su revisión; o cada k-esima manzana de mapas numerados. Las ventajas mencionadas se acentúan cuando se le encarga a un enumerador la selección de las unidades de muestreo. Su instrucción puede consistir en que liste las viviendas de una manzana y que seleccione posteriormente las unidades numeradas r, r+k, r+2k etc. (r es el punto de partida). También puede servir para supervisar el trabajo de un enumerador, durante el levantamiento de cuestionarios en un censo, de modo que cada décimo cuestionario sea verificado. La ventaja de que el muestreo sistemático produce muestras proporcionales se puede apreciar al seleccionarla de una lista de nombres en orden alfabético producirá aproximadamente la misma proporción de nombres de cada letra, o también en el caso de los auditores que requieren muestrear de una larga lista ordenadas en el tiempo, de cuentas para comprobar el cumplimiento de los procedimientos de contabilidad. Los investigadores de mercado y los encuestadores, que regularmente muestrean personas en movimiento, frecuentemente utilizan un diseño sistemático, por ejemplo a cada vigésimo cliente en un mostrador de pago se le puede preguntar su opinión acerca del sabor, color o textura de un producto alimenticio o a cada décima persona que aborde un autobús se le puede pedir que responda un cuestionario acerca del servicio del autobús. Los ingenieros agrónomos pueden muestrear sistemáticamente parcelas de terreno para estimar proporción de árboles enfermos o para estudiar patrones de crecimiento. Todas estas muestras son sistemáticas.

5.2.-OBTENCIÓN DE UNA MUESTRA SISTEMATICA Los métodos para seleccionar los datos en un muestreo irrestricto aleatorio y en un muestreo sistemático son muy diferentes, en el primer caso se seleccionan con una tabla de números aleatorios y en el sistemático solamente el primer elemento se selecciona al azar entre los primeros k elementos y luego se seleccionan los demás de 1 en k hasta que se complete la

Técnicas de Muestreo

muestra. Las muestras sistemáticas se seleccionan de 1 en 3 o de 1 en 5 en general de 1 en k, ahora ¿cómo se selecciona el número k? Sabiendo que N es conocido y se puede determinar el tamaño de “n”, entonces k debe de ser un número aleatorio menor o igual que N/n o sea:

k  ≤

 N  n

Posteriormente se selecciona cada k-esimo elemento a partir del punto de inicio hasta completar el tamaño de muestra n Cuando N es desconocido la selección de k generalmente se supone para poder obtener una muestra de tamaño “n” pero si “k” se selecciona muy grande, el tamaño de “n” que se requiere no se podrá obtener utilizando una muestra sistemática de 1 en k de la población.

Ejemplo. En una preparatoria de 2998 estudiantes repartidos en tres grados se desea conocer la opinión de los estudiantes sobre la utilidad del evento “feria del libro” que se realiza cada fin de curso. Se puede tener la lista de los estudiantes ordenados por grado, si optamos por un muestreo irrestricto aleatorio, posiblemente obtengamos mayor cantidad de estudiantes de primer grado cuya opinión será muy diferente a la de los estudiantes del segundo y del tercer grado, ya que por las fechas en las que se realiza el evento, los estudiantes del primer grado no tienen ninguna experiencia previa y esto daría una estimación deficiente y alejada de la realidad, en cambio con un muestreo sistemático se tendrían elementos proporcionales de los tres grados. Si seleccionamos una muestra del 10% de los estudiantes, tendremos un intervalo muestral de k=10. Si el número al azar entre 1 y 10 es 4 los estudiantes con los números: 4, 14, 24, 34, 44, 54,……2994 conformarán la muestra. Si el número seleccionado al azar es el 9, entonces la muestra se integraría con los estudiantes listados con los números 9, 19, 29, 39, 49, 59,……2989 En la primera muestra se tienen 300 estudiantes y en la segunda solamente 299. El tamaño de la muestra puede diferir en una unidad cuando N no es exactamente divisible entre k. Observe que no se podrá seleccionar exactamente a k cuando el tamaño de la población es desconocido. Podemos determinar un tamaño de muestra n aproximada, pero debemos

Técnicas de Muestreo

suponer el valor de k necesario para obtener un tamaño de muestra n. Si se selecciona un valor de k muy grande, el tamaño de muestra n requerida no se obtendrá usando una muestra sistemática de 1 en k de la población. Este resultado no presenta problema si el experimentador puede volver a la población y realizar otra muestra sistemática de 1 en k hasta obtener el tamaño requerido. Sin embargo en algunas situaciones, obtener una segunda muestra sistemática es imposible. Por ejemplo, tomar una muestra sistemática de 1 en 40 compradores de periódicos, es prácticamente imposible, si el tamaño de la muestra es de n=90 compradores y no se obtiene en el tiempo que los compradores pasan por la esquina.

5.3.-ESTIMACIÓN DE UNA MEDIA, DE UN TOTAL Y DE UN PROPORCIÓN POBLACIONAL Sabemos que el objetivo de las encuestas por muestreo es estimar uno o más parámetros de la población. Para estimar una media poblacional se puede utilizar la media muestral  y de una muestra sistemática.

Estimador de la media poblacional µ n

µ ˆ =  y  s =



 y

i

i=1

n

Varianza estimada de  y s 2

 s 2   N  − n  ˆ V ( y s ) =   n    N   

en donde

 s 2 =

  n    ∑  y i  n 2  y i −   i =1   ∑ n i =1 n −1 n

o también

 s 2 =

∑  y

2 i

− n y 2

i =1

n −1

Limite para el error de estimación  s 2   N  − n  2 vˆ( y s ) = 2    Con una probabilidad del 95% n    N    Cuando N se desconoce se elimina el factor de corrección por población finita (c.p.f) de las ecuaciones anteriores.

Técnicas de Muestreo

Estimación de un total poblacional La estimación de un total poblacional requiere del conocimiento del total de elementos N de la población, de manera semejante a lo que se hizo en el muestreo irrestricto aleatorio y en el aleatorio estratificado, para estimar

τ 

en el muestreo sistemático, se utiliza la siguiente

relación:

Estimador del total poblacional τ :

τ ˆ s =  N y s Varianza estimada de τ  s : 2 2 ˆ 2   s    N  − n  ˆ ˆ V (τ  s ) = V ( N  y s ) =  N  V ( y s ) =  N     n  N         

Límite para el error de estimación: 2    s  N  − n  ˆ ( N  y ) = 2  N       B = 2 V    s  n   N   con el 95% de confianza        2

Es importante notar que se necesita conocer el valor de N para poder estimar τ cuando se usa un muestreo sistemático.

Estimador de una proporción poblacional Es común que se desee estimar una proporción poblacional con base en los datos de una muestra sistemática, en este caso al igual que en el muestreo irrestricto aleatorio las

ˆ s   son similares a la de la media muestral propiedades de la proporción  p

 y s , considerando

que las respuestas se miden de la siguiente manera: yi = 1 si el elemento muestreado posee la característica de interés yi = 0, si no posee la característica Por lo que el estimador es el promedio de las respuestas 0 y 1 de la muestra.  Así el estimador de una proporción poblacional es: n

∑ y  pˆ s =  y s =

i =1

n

i

Técnicas de Muestreo

Varianza estimada de  pˆ  s es:  pˆ qˆ   N  − n  V ˆ ( pˆ s ) =  s s   n − 1    N   

en donde:

qˆ s = 1 − pˆ  s

Límite para el error de estimación es:  pˆ qˆ   N  − n   B = 2 V ˆ ( pˆ s ) = 2  s s   n − 1    N   

con el 95% de confianza

Recuérdese que cuando el tamaño de la población es desconocido entonces se omite el cpf, suponiendo a N relativamente grande con respecto a “n”.

Observación Una observación pertinente en la estimación de los parámetros anteriores, es que la varianza de  y s es idéntica a la varianza estimada de

 y ,

obtenida por muestreo irrestricto aleatorio,

esto no implica que las varianzas poblacionales sean iguales, ya que la varianza de  y  esta dada por la relación:

σ  2   N  − n  V ( y ) =   n   N  − 1  y la varianza de  y s  esta dada por la relación:

V ( y s ) = en donde

 ρ   es

σ 2 n

[1 + (n − 1) ρ ]

una medida de la correlación entre los pares de elementos dentro de la

misma muestra sistemática.

•  Cuando  ρ   está cercano a uno, significa que los elementos muestrales son muy parecidos con respecto a la característica que se esta midiendo y por lo tanto la varianza de la media muestral sistemática será mayor que la que produciría el muestreo irrestricto aleatorio.



Si

 ρ  

es negativo entonces se pensaría que los elementos muestrales son

extremadamente diferentes y así el muestreo sistemático podría ser mejor que el irrestricto aleatorio, una observación importante es que

 ρ   no

puede ser tan

negativamente grande como para que la varianza pueda ser negativa.

Técnicas de Muestreo



Por último si  ρ  esta cercano a cero y N lo bastante grande el muestreo sistemático es aproximadamente equivalente al irrestricto aleatorio.

Es importante señalar que un estimador insesgado de V ( y s ) no puede ser obtenido usando solamente los datos de una muestra sistemática, sin que esto implique que nunca se pueda estimar la V ( y s ) , ya que en ocasiones el muestreo sistemático es equivalente al irrestricto aleatorio y pueden usarse las estimaciones de la varianza. El éxito del muestreo sistemático con relación al irrestricto aleatorio o con respecto al estratificado, depende mucho de las propiedades de la población. En algunas poblaciones el muestreo sistemático es extremadamente preciso y en otras resulta menos preciso, ya que dependiendo de la población y de algunos valores de n, la V ( y s ) puede incrementarse aun al tomar una muestra grande, por lo tanto, es muy difícil dar

un consejo general respecto a las distintas situaciones en donde se pueda utilizar un muestreo sistemático, para ello es necesario conocer la estructura de la población para usarlo de manera efectiva.  Ahora, es importante aclarar que la correlación que se da entre los pares de elementos dentro de una muestra sistemática depende del tipo de población de donde se seleccione la muestra. Para ello se consideran tres tipos de poblaciones: 1

Población aleatoria

2

Población ordenada

3

Población periódica

La población aleatoria es aquella en que sus elementos están ordenados al azar. Cuando una muestra sistemática se selecciona de una población aleatoria, se espera que sus elementos sean heterogéneos y que no tengan correlación entre valores vecinos con  ρ  = 0   por lo que la varianza de  y s es aproximadamente igual a la de  y , por lo que ambos

tipos de muestreo resultan equivalentes. La población ordenada  es aquella cuyos elementos están ordenados en magnitud de acuerdo a algún esquema. Cuando una muestra sistemática se selecciona de una población ordenada, es generalmente

Técnicas de Muestreo

heterogénea con  ρ  ≤ 0  y si N es grande puede demostrarse que V ( y s ) ≤ V ( y ) por lo que una muestra sistemática de una población ordenada proporciona mas información que una muestra irrestricta aleatoria por unidad de costo. Por ejemplo una lista de las cuentas por cobrar pueden estar ordenadas de mayor a menor cantidad, así la estimación de la muestra sistemática podría tener una varianza menor (generalmente inestimable) que la de de una m.i.a; ya que barre con todos los valores de las cuentas. Como no podemos obtener una estimación de V ( y s ) con base en los datos de una muestra, una estimación conservadora de dicha varianza es:

 s   N  − n  V ( y s ) =   n    N    2

La población periódica es aquella cuyos elementos tienen variación cíclica. Cuando una muestra sistemática es seleccionada de una población periódica, la efectividad del muestreo sistemático depende del valor de k. Los elementos de este tipo de muestra pueden ser homogéneos (  ρ  > 0 ) y cuando esto se da V ( y s ) ≥ V ( y )  y en este caso el muestreo sistemático proporciona menos información que el

irrestricto aleatorio por unidad de costo. Una forma de abatir este problema es cambiando varias veces el punto de inicio aleatorio y de esta manera se reduce la posibilidad de seleccionar observaciones con la misma posición relativa en una población periódica. Lo anterior tiene el efecto de mezclar los elementos de la población y al mismo tiempo el de seleccionar una sola muestra sistemática. Esto nos permite suponer que la muestra obtenida es equivalente a una muestra sistemática obtenida de una población aleatoria, entonces la varianza

V ( y s ) puede aproximarse usando la

relación:

ˆ ( y ) = V   s

 s 2   N  − n 

  n    N   

Si hay una variación periódica en la población debemos de tener cuidado en el uso del muestreo sistemático. Por ejemplo si los hombres y las mujeres se alternan en una lista y



es par, la muestra sistemática solo tendrá hombres o solo mujeres, por lo que la estimación no sería representativa del parámetro.

Técnicas de Muestreo

Ejercicio 1 La sección de control de calidad de una empresa usa el muestreo sistemático para estimar la cantidad promedio de llenado de latas de 12 onzas que sale de una línea de producción. Los datos de la tabla adjunta representan una muestra sistemática de 1-en-50 de la producción de un día. Estime µ y establezca un límite para el error de estimación. Suponga que N = 1800 Cantidad de llenado (en onzas) 12.00

11.97

12.01

12.03

12.01

11.80

11.91

11.98

12.03

11.98

12.00

11.83

11.87

12.01

11.98

11.87

11.90

11.88

12.05

11.87

11.91

11.93

11.94

11.89

11.72

11.93

11.95

11.97

11.93

12.05

11.85

11.98

11.87

12.05

12.02

12.04

Solución: La estimación de µ esta dada por n

∑ y  y s =

i

i =1

=

n

430.01 36

= 11.94onzas

Para estimar el límite para el error de estimación, primero se calcula s n

∑  s = 2

  n    ∑ yi  2  y −   i =1   i

i =1

n −1

2

2

n

=

5136.57 − 184908 .6 35

36 = 0.2199 = .0063 35

Suponemos que la población de latas en una línea de producción, es una población aleatoria, entonces la varianza la estimaremos con:  s 2   N  − n  .0063  1800 − 36  ˆ V ( y s ) =  =   = 0.00017 n    N    36   1800  

Y el límite para el error de estimación al 95% de confianza, sería: 2 V ˆ ( y s ) = 2 .00017 = .0262

Técnicas de Muestreo

En resumen estimamos que el promedio de llenado de latas de 12 onzas es de 11.94 onzas, y el límite para el error de estimación con un 95% de confianza es de 0.0262 por lo que la verdadera media del parámetro se debe de encontrar en el siguiente rango de valores (11.91,11.97) onzas.

Ejercicio 2 La empresa del caso anterior desea estimar el total de líquido utilizado en la línea de producción que se muestreo. Estime el total poblacional de la producción de un día con un límite para el error de estimación.

τ ˆ s =  N  y s = 1800 (11 .94 ) = 21492 .onzas  Ahora el límite para el error de estimación al 95% de confianza sería:

ˆ ( N  y ) = 2  N 2V  ˆ ( y ) = 2 (1800) 2 (0.00017) = 46.94 2 V   s s

Ejercicio3 La gerencia de una compañía constructora está interesada en estimar la proporción de sus empleados de albañilería que favorecen una nueva política de la empresa de realizar los pagos de sus salarios mensualmente, a diferencia de la política anterior de pagos semanales. Se cuenta con una lista de los empleados referidos, en orden alfabético por lo que suponen que el comportamiento es el de una población aleatoria. Realizan una muestra sistemática de 1 en 10 de los empleados y los resultados de la encuesta para conocer quienes son los que favorecen la nueva política se dan en la tabla adjunta; estime la proporción de ellos sabiendo que se cuenta con 2000 trabajadores de albañilería y establezca un límite para el error de estimación. Empleado muestreado

Respuesta

3

1

13

0

23

1

:

:

:

:

1997

1 200

∑ y i =1

i

= 132

Técnicas de Muestreo

Respuesta:  pˆ = 0.66 , B=0.0637.

5.4.-TAMAÑOS DE MUESTRA PARA ESTIMAR MEDIAS TOTALES Y PROPORCIONES Para determinar el número de observaciones requeridas para estimar una media poblacional con un límite para el error de estimación B determinado, se encuentra despejando n de la relación siguiente:

 B = 2 V (θ ˆ s ) Para cualquiera de los estimadores θ ˆ s  (media, total o proporción poblacional) basados en un muestreo sistemático. Pero esta ecuación involucra a σ s2 y ρ que deben de ser conocidas o al menos poderlas estimar de estudios previos, en estas notas utilizaremos la fórmula para calcular n que se uso en el muestreo irrestricto aleatorio, pero considerando que esta fórmula podría dar una muestra muy grande cuando la población es ordenada y una muestra muy pequeña para poblaciones periódicas. Recuérdese que las varianzas de

 y s y de  y son

equivalentes cuando la población es aleatoria. Tamaño de muestra requerido para estimar una media poblacional  µ con un límite para el error de estimación de B:

n=

 N σ 2 ( N  − 1) D + σ 2

en donde:  D  =

 B 2 4

Nota: σ2  puede aproximarse con s 2, a partir de una muestra piloto o por estudios previos   Rango similares o bien σ 2 ≈ . En cualquier caso n será un valor aproximado. Si N es grande, 4

como comúnmente ocurre, el (N-1) puede ser reemplazado por N. Para determinar el tamaño de muestra requerido para estimar un total poblacional  τ  con un límite para el error de estimación de B:

n=

 N σ  2 ( N  − 1) D + σ  2

 D = en donde:

 B 2 4 N  2

El tamaño de muestra requerido para estimar una  proporción poblacional p con un límite para el error de estimación de B, será:

Técnicas de Muestreo

n=

 Npq ( N  − 1) D +  pq

  en donde:

q = 1- p

 D =

y

 B 2 4

Hay ocasiones en donde se desconoce el valor de p y se estima de estudios previos pero cuando estos no existen lo ideal es suponer un valor de p=0.5 que nos proporcionará un tamaño de muestra conservador, que será probablemente mayor que el requerido. En general para determinar el tamaño de muestra n se necesita conocer el error de estimación B, la varianza σ 2 y el nivel de confianza 1-α.

Ejercicio 4. Usando la información del ejercicio 1 determine el tamaño de muestra requerido para estimar µ con un límite para el error de estimación de 0.015 unidades. Solución: Si B= 0.015

 D =

entonces:

B2 4

=

(0 .015 ) 2 4

= 0 .00005625

Como σ2 No se conoce se estima con s 2  Asi:

n=

 N σ 2 ( N  − 1) D + σ 2

=

1800(0.0063) (1799)(0.00005625) + 0.0063

= 105.49 ≈ 106 latas

Ejercicio 5. Determine el tamaño de muestra requerido para estimar

τ , con los datos del ejercicio 2, con

un límite para el error de estimación de 30 unidades. Resp. n=87 latas

Ejercicio 6. Para la situación referida en el ejercicio 3, determine el tamaño de muestra requerido para estimar p con un límite para el error de estimación del 5%. ¿Qué tipo de muestra sistemática deberá de obtenerse? Resp. n=305 albañiles

5.5.- MUESTREO SISTEMÁTICO REPLICADO. Este tipo de muestreo permite al experimentador estimar la media y un total poblacional con sus respectivas varianzas sin hacer ningún supuesto acerca de la naturaleza de la población. Recordemos que no se puede estimar la varianza de

con base en la información contenida

en una sola muestra sistemática, a menos que el muestreo sistemático genere una muestra aleatoria. Sin embargo en la mayoría de los casos el muestreo aleatorio sistemático no es

Técnicas de Muestreo

equivalente al irrestricto aleatorio, entonces es aconsejable utilizar un método alternativo para estimar la varianza V ( y S  ) , este método alternativo es el muestreo sistemático

replicado. Este método consiste en seleccionar varias muestras sistemáticas o replicas y así poder estimar la media poblacional �, como el promedio de todas las medias muestrales

, la

estimación de la varianza V ( y S  )  utilizando el cuadrado de las desviaciones de cada una de las medias muestrales individuales alrededor de su media poblacional. Para seleccionar n S muestras sistemáticas replicadas se separan más los elementos de cada muestra. Por lo que 10 muestras de 1 en 50 (n S=10, k’=50) de 6 mediciones cada una, contiene el mismo número de mediciones que una sola muestra de de 1 en 5 (k=5) conteniendo n=60 mediciones. El punto de inicio para cada una de las n S  muestras sistemáticas es seleccionado aleatoriamente de entre los primeros k’ elementos. Los elementos restantes en cada muestra son obtenidos adicionando k’, 2k’ y así sucesivamente, al punto de inicio hasta que el número total por muestra, n/n S es obtenido.

Ejemplo. Si tenemos una población de N=960 elementos y queremos seleccionar una muestra sistemática de 60 elementos entonces k  =

960 60

= 16  o sea una muestra de 1 en 16

elementos, se selecciona un número al azar de los primeros 16 elementos y este sería el punto de inicio de la muestra.  Ahora si queremos seleccionar 10 muestras sistemáticas replicadas de esa misma población, primero seleccionamos un valor de k’, de manera que k’=kn S, en donde n S es el número de muestras

sistemáticas

que

queremos

seleccionar.

Así

para

nuestro

ejemplo

k’=10k=10(16)=160. Inmediatamente después seleccionamos 10 números aleatorios entre 1 y 160 y la constante k’=160, es la que se le adiciona a cada uno de estos 10 números que serán los puntos de inicio aleatorio de las muestras, hasta que se obtienen 10 muestras de tamaño 6, por ello siempre obtendremos 60 elementos. Una selección de 10 números aleatorios entre 1 y 160 es:

73, 42, 81, 145, 6, 21, 86, 17, 112, 102

Técnicas de Muestreo

Si se utilizan como puntos de inicio entonces las muestras quedarían así: Punto de inicio 2º elemento 3º elemento

6º elemento

aleatorio

muestral

muestral

muestral

6

166

326

………

806

17

177

337

………

817

21

181

341

………

821

42

202

362

………

842

73

233

393

………

873

81

241

401

………

881

86

246

406

………

886

102

262

422

………

902

112

272

432

………

912

145

305

465

………

945

Es común que n S=10 ya que permite obtener suficientes medias muestrales para obtener una ˆ) estimación satisfactoria de V (µ 

Las formulas para estimar � S con nS muestras sistemáticas se dan a continuación:

Estimador de la media poblacional

usando nS muestras sistemáticas de 1 en k’ µ ˆ =

n  s



i=1

en donde

 y

i

n

s

representa el promedio de la i-ésima muestra sistemática.

Varianza estimada de n s

∑ ( y   N  − n 

ˆ ( µ  ˆ) =  V 

i

ˆ )2 − µ 

 i =1    N    n s (n s − 1)

El límite para el error de estimación al 95% de confianza es: ˆ)  B  = 2 V ˆ ( µ 

Técnicas de Muestreo

También se puede utilizar el muestreo sistemático replicado para estimar un total poblacional

τ, si N es conocida, con las siguientes relaciones: Estimador del total poblacional

usando nS muestras sistemáticas de 1 en k’

τ ˆ =  N  µ ˆ =

n  s

 y i



i=1

n

s

Varianza estimada de : n s

ˆ) ( y − µ  ∑   N  − n 

2

i

ˆ (τ ˆ) =  N 2V  ˆ ( µ  ˆ ) =  N 2  V 

 i=1    N    n s (n s − 1)

El límite para el error de estimación al 95% de confianza es:  B  = 2 V ˆ (τ ˆ)

Ejercicio 7 Un parque estatal cobra la admisión por automóvil en lugar de por persona y un funcionario del parque quiere estimar el número promedio de personas por automóvil para un día efectivo en particular durante el verano. El funcionario sabe por experiencia que entrarán al parque alrededor de 400 automóviles y quiere muestrear 80 de ellos. Para obtener una estimación de la varianza, utiliza el muestreo sistemático replicado con 10 muestras de 8 automóviles cada una. Usando los datos que se presentan en la tabla, estime el número promedio de personas por automóvil y establezca un límite para el error de estimación Punto de

Segundo

Tercer

Cuarto

Quinto

Sexto

Séptimo

Octavo

elemento

elemento

elemento

elemento

elemento

elemento

elemento

2(3)

52(4)

102(5)

152(3)

202(6)

252(1)

302(4)

352(4)

3.75

14.06

5(5)

55(3)

105(4)

155(2)

205(4)

255(2)

305(3)

355(4)

3.38

11.42

7(2)

57(4)

107(6)

157(2)

207(3)

257(2)

307(1)

357(3)

2.88

8.29

13(6)

63(4)

113(6)

163(7)

213(2)

263(3)

313(2)

363(7)

4.62

21.34

26(4)

76(5)

126(7)

176(4)

226(2)

276(6)

326(2)

376(6)

4.50

20.25

31(7)

81(6)

131(4)

181(4)

231(3)

281(6)

331(7)

381(5)

5.25

27.56

35(3)

85(3)

135(2)

185(3)

235(6)

285(5)

335(6)

385(8)

4.50

20.25

40(2)

90(6)

140(2)

190(5)

240(5)

290(4)

340(4)

390(5)

4.12

16.97

45(2)

95(6)

145(3)

195(6)

245(4)

295(4)

345(5)

395(4)

4.25

18.06

inicio aleatorio

Técnicas de Muestreo 46(6)

96(5)

146(4)

196(6)

246(3)

296(3)

346(5)

396(3)

Totales

4.38

19.18

41.63

177.41

Los datos del número de personas por automóvil y i está en el paréntesis.

El valor de k en una muestra sistemática sería:

 N 

k  =

n

=

400 80

= 5

Entonces para 10 muestras n S=10 el valor de k’ será: k’=10k=10(5)=50 Por lo que se escogen 10 números aleatorios entre el 1 y el 50 que fueron: 13, 35, 2, 40, 26, 7, 31, 45, 5, 46 Los automóviles con estos números forman los puntos de inicio aleatorio para las muestras sistemáticas. Observe en la tabla la cantidad muestra (fila),

es el promedio de personas por automóvil para la primera

es el promedio para la segunda muestra y así sucesivamente entonces la

estimación de µ será:

ˆ = µ 

n  s

∑ i =1

 y i ns

=

( 3 . 75 + 3 . 38 + ..... + 4 . 38 10

= 4 . 16

Realicemos ciertos cálculos previos para estimar la varianza

  1   n 2 2 ˆ  ( ) − = −  y i µ   y i y i  ∑ ∑ ∑  n s   i =1   i =1 i =1 n s

ns

2

s

Sustituyendo: n s

∑ ( y

i

ˆ ) 2 = 177 .41 − − µ 

i =1

Por lo tanto la varianza estimada de

1 10

( 41 .63) 2 = 4.104

será:

n s

∑ ( y   N  − n 

ˆ )2 − µ 

 400 − 80   4.104  = = 0.0365  i=1      N    n s (n s − 1)   400    10(9) 

ˆ ( µ  ˆ) =  V 

i

Entonces el límite para el error de estimación sería:

 B = 2 0.0365 = 0.38

Técnicas de Muestreo

Por lo que decimos que nuestra mejor estimación del promedio de personas por automóvil es de 4.16 personas, por lo que con un 95% de confianza podemos decir que el verdadero valor del parámetro se encuentra en el intervalo (4.16±0.38)

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF