Diseños de muestreo-Probabilísticas muestreo-Probabilísticas Por conglomerados
Marco Teórico
El muestreo por co nglomerados presenta distinciones importantes respecto al diseño aleatorio simple y estratificado. Una característica distintiva dice relación con la naturaleza de los conglomerados. Un conglomerado es una unidad de muestreo compuesta por dos o más elementos de la población. En muestreo por conglomerados la inferencia no se realiza a partir de la observación directa de los elementos que componen la población. En efecto, la unidad de muestreo es el conglomerado y éste está compuesto de dos o más elementos. Los elementos que componen los conglomerados son heterogéneos y los conglomerados son unidades de muestreo parecidas entre sí. Para generar conglomerados se requiere de una variable que agrupe los elementos en grupos compuestos por elementos con puntuaciones distintas. Por ejemplo, para estudiar consumo de sustancias psicoactivas en una universidad se puede establecer que cada curso es un conglomerado en el entendido que en cada uno de ellos hay distintos valores en el indicador de consumo. Nótese que el razonamiento razonamiento para la constitución de conglomerados es inverso al utilizado utilizado para generar estratos. Los estratos están compuestos por elementos parecidos y los conglomerados por elementos por elementos distintos en la variable medida. La lógica que subyace al muestreo por conglomerados se sustenta en el hecho que todos los conglomerados son parecidos y, en consecuencia, resulta razonable elegir sólo algunos de ellos para obtener los valores que permitan inferir a la población. En el límite si todos los conglomerados son iguales es suficiente seleccionar sólo uno para estimar el parámetro poblacional. Una ventaja del muestreo por conglomerados es que no se requiere de un marco muestral que incluya a todos los elementos de la población. En efecto, sólo es necesario disponer del listado de elementos que componen cada conglomerado seleccionado para conformar la muestra. La Desventaja del muestreo muestreo por conglomerados es que el error es mayor que cuando cuando se utilizan otras técnicas de muestreo. En el ámbito del muestreo por conglomerados cabe diferenciar entre conglomerados sin submuestreo y con submuestreo. Esta distinción es relevante, dado que la realización de submuestreos en los conglomerados da lugar al muestreo por etapas. El conglomerado sin submuestreo se conoce como conglomerado en una etapa y se caracteriza porque se seleccionan todos los elementos que componen el conglomerado elegido. Según el número de elementos cabe distinguir entre conglomerados de igual y distinto tamaño. Normalmente los conglomerados serán de distinto tamaño.
Por ejemplo, serán conglomerados de distinto tamaño las ciudades de un país, las manzanas de una ciudad o las viviendas de las manzanas. Los conglomerados de igual número de elementos no son comunes, sin embargo, permiten ilustrar el uso de las fórmulas e introducir en la complejidad del muestreo por conglomerados de distinto tamaños. Un ejemplo de conglomerados con mismo número de elementos son los cigarrillos de cajetillas. Desde otra perspectiva se distingue entre conglomerados naturales y de áreas. Un conglomerado natural puede ser la sucursal de un banco en la que se estudia satisfacción laboral y conglomerado por área es una zona censal donde se indaga respecto a consumo de televisión.
Muestreo por conglomerado sin submuestreo. Igual Tamaño
Selección de las unidades de muestreo
El muestreo por conglomerados puede ser la única alternativa viable de selección probabilística en condiciones de marco muestral defectuoso. Por ejemplo, que no incluya el listado de todos los elementos de la población. La división de la población en conglomerados de elementos de los cuales se seleccionan sólo algunos de éstos permite disponer de un marco muestral referido sólo a los conglomerados elegidos. En cada conglomerado que compone la muestra la selección de elementos se realiza mediante muestreo aleatorio simple. Establecer el número adecuado de conglomerados para maximizar la precisión y minimizar el costo no es tarea fácil. La experiencia enseña que pocos conglomerados compuestos de muchas unidades presentan la ventaja de la sencillez y el costo, sin embargo, resultan menos precisos que un número mayor de conglomerados más pequeños. Definir en forma inequívoca número y tamaño de los conglomerados en una situación concreta no siempre es sencillo. Elemento central para una adecuada definición es constatar que la varianza dentro de los conglomerados es alta y la varianza entre conglomerados es pequeña. Nótese que en un muestreo por conglomerados una unidad puede ser un conglomerado y en otra aplicación ésta puede ser un elemento. Por ejemplo, una vivienda en un estudio sobre consumo de televisión puede ser un conglomerado desde los elementos son las personas y la misma vivienda en un estudio de calidad de los conductos de gas puede ser un elemento donde los conglomerados son las manzanas. En general las unidades de muestreo asumen distintos papeles en función del diseño de muestras en ejecución. Una ciudad puede ser entendida como un conglomerado de manzanas o como un elemento en una muestra de ciudades.
Precisión de la estimación
En general el muestreo por conglomerados es más económico respecto al muestreo aleatorio simple por ahorro en la configuración del marco o en la selección de las unidades últimas de muestreo. Sin embargo, la precisión normalmente es menor por la tendencia natural a la mayor homogeneidad de los elementos dentro de cada conglomerado. La presencia de homogeneidad de elementos dentro de cada conglomerado da lugar a una varianza del estimador superior a la que corresponde al muestreo aleatorio simple. Para medir la homogeneidad dentro de los conglomerados se utiliza el coeficiente de correlación intraconglomerado rho (ρ). Un valor positivo expresa que los elementos dentro del conglomerado son similares. En términos de varianza implica que la varianza dentro de los conglomerados es menor que la varianza entre conglomerados. En virtud del proceso de agrupación en conglomerados el valor de ρ será normalmente positivo.
El coeficiente intraconglomerado ρ será negativo cuando los elementos dentro de cada conglomerado presenten mayor dispersión que la obtenida mediante muestreo aleatorio simple. En tal caso las medias de los conglomerados serán similares entre sí. En términos de varianza implica que la varianza dentro de conglomerados es mayor que la varianza entre conglomerados. La varianza dentro de conglomerados mide la dispersión de los valores del conglomerado respecto a la media del conglomerado correspondiente. Se designa como :
La varianza entre conglomerados mide la dispersión de las medias de los conglomerados respecto a la media general. Se designa como :
Ejemplo
Para mostrar el comportamiento del coeficiente ρ se presentan dos poblaciones con tres conglomerados cada uno.
La población 1 presenta mayor dispersión dentro de los conglomerados y menor variación entre las medias de los conglomerados. Nótese que los elementos dentro de cada conglomerado son más distintos que la heterogeneidad de elementos que se obtendría mediante selección aleatoria. En consecuencia, el diseño por conglomerados resulta más eficiente que el muestreo aleatorio simple. Los valores del coeficiente ρ correspondientes a este ejemplo serán negativos. La población 2 presenta mayor dispersión entre los conglomerados, dado que los conglomerados dentro de sí son relativamente homogéneos. Los elementos de cada conglomerado son más parecidos que los que se obtendrían mediante selección aleatoria. En consecuencia, el diseño por conglomerado resulta menos preciso que el muestreo aleatorio simple. Los valores del coeficiente ρ obtenidos de estos datos serán positivos. El coeficiente ρ puede asumir diversas expresiones siendo una de las más sencillas la que se presenta a continuación
A modo de referencia se pueden establecer las siguientes desigualdades:
Ρ > 0 más preciso el muestreo aleatorio simple
Ρ < 0 más preciso el muestreo de conglomerados
Ρ = 0 igual precisión ambos muestreos
Conglomerados de igual tamaño
Todos los conglomerados pueden tener el mismo número de elementos. No es común en la investigación mediante encuesta. Si además no hay submuestreo se trata del muestreo por conglomerados más simple. Cabe destacar que los conglomerados que participan en la muestra son seleccionados en forma aleatoria. Los elementos dentro de cada conglomerado también.
Muestreo estadístico Diseño y Aplicaciones, Manuel Vivanco, Imprenta salesianos SA chile, primera edición, 2005 http://www.webdelprofesor.ula.ve/cjuridicas/mayol/doc_archivos/conglomerados.pdf
Veamos ahora la expresión de los estimadores cuando trabajamos con esta técnica de muestreo:
Thank you for interesting in our services. We are a non-profit group that run this website to share documents. We need your help to maintenance this website.