Cea, Ma. Ángeles (2004) - Métodos de Encuesta
Short Description
Download Cea, Ma. Ángeles (2004) - Métodos de Encuesta...
Description
Consulte nuestra página web: www.sintesis.com En ella encontrará el catálogo completo y comentado
MÉTODOS DE ENCUESTA TEORÍA Y PRÁCTICA, ERRORES Y MEJORA
M. a Ángeles Cea D'Ancona
,. UNIVERSIDAD ALBERTO HURTADO BIBLIOTECA
v{~~ -JO/t. 6'tbS}]1
~ EDITORIAL SINTESIS
.(
A mis hijos Irene y Adrián por su paciencia y beneplácito
Reservados todos los derechos. Está prohibido, bajo" las sanciones penales y el resarcimiento civil previstos en las leyes, reproducir, registrar transmitir esta publicación, íntegra o parcialmente, por cualquier" sistema de recuperación y por cualquier medio, sea mecánico, electrónico, magnético, electroóptico, por fotocopia o por cualquier otro, sin la autorización previa por escrito de Editorial Síntesis, S. A.
°
© M. a Ángeles Cea D'Ancona © EDITORIAL SÍNTESIS, S. A. Vallehermoso, 34 - 28015 Madrid Teléf.: 91 5932098 http://www.sintesis.com Depósito Legal: M. 42.101.2004 ISBN: 84-9756-250-X Impreso en España - Printed in Spain
r
ÍNDICE
INTRODUCCIÓN
11
CAPÍTULO 1: LA ENCUESTA COMO ESTRATEGIA DE INVESTIGACIÓN SOCIAL 1.1. 1.2. 1.3. 1.4. 1.5.
Orígenes de la encuesta Características esenciales de la encuesta: sus posibilidades y límites Articulación de la encuesta con otras estrategias de investigación Fases de la encuesta Errores en la aplicación de la encuesta 1.5.1. Errores de "no observación" 1.5.2. Errores de observación o de medición Lecturas complementarias Ejercicios propuestos
13 28 30 33 40 41 43 45 46
CAPÍTULO 2: LA ELECCIÓN DEL MÉTODO DE ENCUESTA: SU EFECTO DIFERENCIAL EN LOS ERRORES DE ENCUESTA 2.1. Encuesta cara a cara 2.2. Encuesta telefónica 2.3. Encuesta autoadministrada .. 2.4. Combinación de métodos de encuesta .. Lectura.s complementarias Ejercicios propuestos
51 64 80 93 99 99
u
lV1eroaos ae encuesta
indice
CAPÍTULO 3: EL DISEÑO DE LA MUESTRA Delimitación del universo de estudio La elecciÓn del marco muestral y su repercusión en el error de no cobertura El tamaño de la muestra La selección de las unidades de la muestra: métodos de muestreo probabilísticos y no probabilísticos 3.4.1. Muestreo aleatorio simple 3.4.2. Muestreo aleatorio sistemático 3.4.3. Muestreo aleatorio estratificado 3.4.4. Muestreo aleatorio por conglomerados 3.4.5. Muestreo de áreas y rutas aleatorias 3.4.6. Métodos de selección de individuos en una misma vivienda 3.4.7. Muestreo por cuotas 3.4.8. La aplicación de otros muestreos no probabilísticos en la investigación mediante encuesta 3.4.9. La especificidad de la encuesta telefónica 3.5. El error muestral, uno de los integrantes del error total de encuesta Lecturas complementarias Ejercicios propuestos 3.1. 3.2. 3.3. 3.4.
102 105 115 124 125 130 132 140 149 158 165 170 173 177 187 188
CAPÍTULO 4: EL DISEÑO DEL CUESTIONARIO 4.1. De los conceptos teóricos a los indicadores empíricos: el error de especificación 4.2. La formulación de las preguntas: sus efectos en el error de medición 4.2.1. Recomendaciones para la redacción de las preguntas 4.2.2. El formato de la pregunta: abierto versus cerrado 4.2.3. La especificidad de la medición de actitudes 4.3. La ubicación de las preguntas en el cuestionario 4.4. La presentación del cuestionario 4.5. La prueba del cuestionario y su redacción final.................................................. Lecturas complementarias :..................................... Ejercicios propuestos
CAPÍTULO 5: LA ADMINISTRACIÓN DEL CUESTIONARIO 5.1. La contribución del entrevistador a los errores de encuesta 5.1.1. Características sociodemográficas 5.1.2. Factores psicológicos 5.1.3. Actuación inadecuada del entrevistador 5.2. La supervisión del trabajo de campo 5.2.1. Revisión de los cuestionarios 5.2.2. Verificación de los cuestionarios 5.2.3. Observación del desarrollo de la entrevista 5.3. La no respuesta 5.3.1. Factores que inciden en la participación en la encuesta 5.3.2. La reducción del error de no respuesta
. .. . . . .. .. .. . . .
192 208 218 241 262 280 286 298 307 307
5.3.2.1. Actuaciones preventivas para la reducción de la tasa de no respuesta 5.3.2.2. Ajustes estadísticos de la no respuesta: la ponderación y la imputación Lecturas complementarias Ejercicios propuestos
. .. . .
CAPÍTULO 6: EL TRATAMIENTO DE LA INFORMACIÓN 6.1. La preparación de los datos para su análisis 6.1.1. Edición de los cuestionarios 6.1.2. Codificación de las respuestas 6.1.3. Grabación de los datos 6.2. El análisis de los datos de encuesta 6.2.1. La exploración univariable 6.2.2. La elaboración de tablas 6.2.3. Opciones analíticas multivariables 6.3. La calidad de los datos de encuesta y su evaluación 6.3.1. La validez de los datos de encuesta 6.3.2. La comprobación de su fiabilidad 6.4. La redacción del informe de los resultados de la encuesta Lecturas complementarias Ejercicios propuestos
. .. . . . . . .. .. .. .. . . .
ANEXO. Tabla de números aleatorios
.
BIBLIOGRAFÍA
.
INTRODUCCIÓN
Hoy día son pocas las personas que no saben qué es una encuesta, aunque sea de forma aproximada. La televisión, la radio y la prensa suelen hacerse eco de las encuestas que despiertan su interés, ya sea por su temática, su ámbito de ejecución o por sus hallazgos sorprendentes. En las citas electorales es cuando las encuestas adquieren un especial protagonismo y, también, cuando más se pone en cuestión la metodología de éstas, sobre todo, si yerran en el pronóstico electoral. Entonces se suceden los debates sobre las encuestas, se indaga en las causas de sus "fallos", se destacan las buenas y las malas prácticas de encuesta y aumenta el escepticismo hacia ellas, haciéndose común el comentario "las encuestas siempre fallan". Pero, ¿por qué fallan?, ¿cuáles son los errores?, ¿cómo superarlos? Éstas son las cuestiones más generales que han espoleado esta monografía. Ciertamente, del título y del índice del libro el lector ya habrá vislumbrado su contenido. No trata de la encuesta en singular, sino de los métodos de encuesta en plural. De sus especificidades, coincidencias y complementariedades. Es un libro ambicioso, más extenso de lo inicialmente programado, por el deseo de ofrecer una visión panorámica y pormenorizada de la metodología de encuesta, en cada una de sus fases, y especificando por método de encuesta. El libro está estructurado en seis capítulos, de extensión dispar, en función de la complejidad de los contenidos temáticos que se abordan. Los dos primeros tienen un carácter más genérico. El capítulo 1 presenta la encuesta como estrategia de investigación social fundamental én la metodología cuantitativa. Si bien, precisa de un uso articulado con otras estrategias de investigación. Se describe la génesis y el desarrollo de la encuesta, sus potencialidades y límites, destacándose los distintos errores que deterioran su calidad y la consiguiente significatividad de la información que aporta.
12
Métodos de encuesta
La elección del método de encuesta a aplicar tiene un efecto diferencial en los errores de encuesta. De ello se habla en el capítulo 2. En él se destacan las ventajas y los inconvenientes de cada método, su empleo combinado, cómo pueden resolverse sus debilidades y la aportación de los avances tecnológicos en la reducción de los distintos errores de encuesta, aparte de reducir sus costes económicos y temporales. Los cuatro capítulos siguientes abordan aspectos concretos en la ejecución de la encuesta, desde sus preámbulos hasta la redacción del informe, con el que se concluye su realización. Todas las fases de la encuesta son decisivas en su desarrollo y no están exentas de errores, que pueden empañar los esfuerzos realizados en estadios precedentes y posteriores. Para comprender mejor su incidencia y qué los origina, los errores de encuesta se analizan en la fase en que aparecen. Los errores de no cobertura y de muestreo, en el capítulo 3, dedicado al diseño de la muestra. Allí se insiste en la concepción del error total de encuesta. Los errores de especificación (debidos a la no correspondencia de la pregunta con los objetivos de la encuesta) y de medición (ocasionados por la redacción de la pregunta, sus opciones de respuesta, su ubicación en el cuestionario) en el capítulo 4. El capítulo 5 trata de la contribución del entrevistador a los diversos errores de encuesta; de cómo pueden solventarse con una adecuada selección, formación y supervisión de los entrevistadores. Se hace mención específica al error de no respuesta, en los distintos métodos de encuesta, y a las diferentes actuaciones preventivas y paliativas de dicho error. El capítulo 6 se ocupa de los errores de medición debidos al tratamiento de la información. Además, ofrece una visión genérica de posibilidades analíticas con datos de encuesta. Concluye con el análisis conjunto de los distintos errores de encuesta y su incidencia en la calidad. Sin duda, esta calidad depende, también, de los recursos (económicos, materiales y humanos) con los que se cuente. Aquí nos ocupamos de los aspectos más técnicos de la calidad de la encuesta, relacionados con el diseño y su ejecución. Por ello, en cada fase se destaca la teoría (qué debe hacerse), la práctica (qué se hace), los errores que surgen por actuaciones "impropias", en cada método, y recomendaciones para su mejora. Cada capítulo concluye con una selección de referencias bibliográficas, a modo de lecturas complementarias, y una propuesta de ejercicios. Con su realización puede comprobarse si realmente se han asimilado los contenidos esenciales del capítulo. Para ayudar a la comprensión de los contenidos teóricos, éstos se acompañan de ejemplos ilustrativos y de referencias a estudios teóricos y empíricos. La intención última es contribuir a un mejor conocimiento de las debilidades de los distintos métodos de encuesta y los modos de prevenirlas.
1 LA ENCUESTA COMO, ESTRATEGIA DE INVESTIGACION SOCIAL \
En la metodología cuantitativa, la encuesta continúa siendo la estrategia más popular en la investigación social. A ello contribuyen sus amplias posibilidades para la obtención de información, diversa, de un conjunto amplio de la población. Pero la calidad y la consiguiente significatividad de los datos de encuesta están supeditadas al rigor aplicado en su diseño y ejecución, al control de los distintos errores que puedan darse en su realización. A la descripción p0f1!lsmorizada de cada una de las fuentes de error en la encuesta, y su resolución propia, se dedican los capítulos siguientes. Este primer capítulo quiere, en cambio, ofrecer una visión general de la encuesta, que ayude en la contextualización de los posteriores. La calidad de la encuesta ha de comprobarse no de forma aislada, sino mediante la conjunción de cada una de sus partes. Por ello, este texto comienza con una presentación genérica de la encuesta para después proceder al detalle, por separado, de sus integrantes. En su presentación no puede faltar una breve descripción de sus orígenes, ni de las características que la diferencian de las demás estrategias de investigación social.
1.1. Orígenes de la encuesta .L.a. ne~esidad de ~ecabar información de la población se remonta a los orígenes de la cIvIlizacIón. Los pnmeros recuentos "censales" datan de los tiempos del emperador Yao en ~hi~a y, con post~rioridad,de las civilizaciones asiria, egipcia, griega y romana. Su fmalIdad era esencIalmente tributaria y militar. El conocer los recursos humanos y económicos de los que se disponía, con fines bélicos y de fiscalidad. Pero no es
14
Métodos de encuesta
hasta el siglo XVII cuando estas "cuantificaciones" adquieren carácter científico, gracias a los avances en el campo de la estadística. En especial, al desarrollo de la teoría de la probabilidad (por Galilei, Fermat, Pascal o Bernoulli); y a la aportación de dos escuelas estadísticas principales: los aritméticos políticos ingleses (Graunt, Petty, Davenant, King, Halley) y la escuela estadística alemana (Seckendorff, Conring, Achenwall). Movidos por el deseo de aplicar modelos estadísticos al conocimiento de la realidad social. En el siglo XVIII aparecen las primeras investigaciones sociales empíricas, de la mano de los llamados reformadores sociales. Un conjunto de profesionales de distintas áreas de conocimiento (médicos, ingenieros, naturistas), unidos por un mismo propósito: aportar evidencia empírica de los problemas sociales de su época, consiguientes al desarrollo de la Revolución Industrial y al rápido crecimiento de las ciudades. Su finalidad era eminentemente política: movilizar a la opinión pública para exigir medidas concretas de reforma social. De ahí su denominación de "reformadores sociales". La recogida de información a través de parroquias y de las inspecciones fiscales, que hasta entonces había imperado, ahora se muestra insuficiente. Con la Revolución Industrial las parroquias dejaron de existir como unidades administrativas y comienza a promoverse la realización de encuestas sociales, desde distintas sociedades estadísticas que fueron creándose en varios estados europeos. Principalmente, en Inglaterra, Francia y Alemania. Se pedía la cumplimentación de un cuestionario "estandarizado", más sobre aspectos objetivos (o de hechos) que subjetivos (actitudes, opiniones, valores). Incluía información variada sobre las condiciones de vida y de vivienda de la clase trabajadora, preferentemente. También, de su práctica religiosa, escolarización, hábitos de higiene y de salud, en general. Los "entrevistadores", o personas responsables de su administración, obtenían la información mediante la observación "directa" de los barrios obreros y la proporcionada "verbalmente" por los propios afectados o por terceros (empresarios, personal escolar, sanitario, religiosos). En el desarrollo de los censos de población (el primero data de 1801 en Inglaterra y Francia; en España, de 1857) y en la elaboración de los "cuestionarios" tuvo una gran repercusión -destacada por Kovaliova (1989) y Garrigós (2003)- el estudio de John Sinclair, The statistical account of Scotland (1791-1825). Una monumental investigación, de 21 volúmenes, sobre los problemas de la población rural en Escocia. La información se obtuvo de un cuestionario diseñado ex profeso. Contenía 116 preguntas referentes a diversas características sociodemográficas de la población (sexo, edad, ocupación, mortalidad, práctica religiosa), de su entorno (orografía, recursos minerales y agrícolas) y de la actividad económica de la región (desempleo, producción agrícola, ganadera). Para su realización, el autor contó con la colaboración del clero escocés, que le proporcionó información de 881 parroquias de Escocia. Pero no es a esta investigación, sino a la realizada por Charles Booth, de 1889 a 1897 (Labour and the life of the people of London. Macmillan and Co. Londres, 1902-1903), a la que Easthope (1974) sitúa en los orígenes de la encuesta moderna. Esta investigación fue realizada y financiada por el mismo Booth, un acaudalado naviero británico. Describe, con minuciosidad, las condiciones de vida de la población traba-
Capítulo 1: La encuesta como estrategia de investigación social
15
jadora londinense. La información se obtiene del uso combinado de distintas fuentes de datos: el Censo de Población británico de 1881; informes policiales, de organizaciones de beneficencia, de inspectores escolares y sanitarios; la observación directa, por el mismo autor, de varios barrios obreros, donde vivió durante algún tiempo; la realización de entrevistas a hombres de negocios ya asistentes escolares (school attendance officers), para indagar en las condiciones de vida de los escolares y de sus familias. Además, procedió a la selección aleatoria de representantes de familias de los diferentes grupos sociales, excluyendo al inferior. I A Booth se le reconoce el acierto de perfeccionar "la metodología de sondeos, rechazando la ayuda de los intermediarios -observadores de la clase media- y apelando directamente a los obreros, cuya situación estudiaba" (Kovaliova, 1989: 131). El hecho de haber entrevistado directamente a las familias le convierte en "uno de los primeros en llevar a cabo una encuesta mediante entrevista cara a cara" (De Leeuw y Collins, 1997: 199). Además, se le atribuye la introducción de "un estándar científicamente definido de necesidades básicas con respecto a los que medir la incidencia de la pobreza" (Plat, 2000: 85). En 1901, también en la editorial Macmillan, se edita una investigación similar llevada a cabo por uno de los seguidores de Booth: Benjamín Seebohm Rowntree. El estudio de la pobreza ahora se circunscribe a la ciudad de York, de donde era originario el autor. Se edita con el título Poverty. A study of town life. El cuestionario que se aplicó incluyó, igualmente, información descriptiva variada, referida a las condiciones de trabajo (salarios, jornada laboral) y de vida (características de las viviendas, condiciones de higiene, de salubridad, necesidades alimenticias), de las clases sociales más desfavorecidas en la Inglaterra de finales del siglo XIX. Distinguió la pobreza primaria (familias que carecían de recursos para cubrir las necesidades mínimas) de la secundaria (que disponían de recursos suficientes, pero los malgastaban, quedándose en la pobreza). Otra aportación notoria fue la obra de Fréderic Le Play, Les ouvriers européens (su primera edición, de 36 monografías, data de 1855; la segunda, en seis volúmenes, de 1877 a 1879, e incluye 57 monografías de familias). Una investigación que ha sido calificada por Nisbet (1966: 61) como "el primer trabajo sociológico genuinamente científico del siglo XIX", Y que puede encontrarse recensionada en la monografía de Garrigós (2003). Destaca por la elección de la familia como unidad de observación. Le Play describe las características externas y "morales" (sentimientos, valores, deseos) de varias familias obreras (de trabajadores de la industria, la agricultura, la artesanía y el comercio), con las que convivió, él o sus colaboradores (también ingenieros de minas), en sus viajes por varios países europeos (España, Inglaterra, Francia, Suiza, Austria, Hungría, Prusia, los Países Nórdicos e, inclusive, Rusia). Un total de 22 familias, en cuya selección se primó que fuesen "representativas" de una población concreta. Los "encuestadores" o colaboradores debían permanecer con la familia de 8 a 10 días. Durante ese tiempo de convivencia cumplimentaban un cuestionario con preguntas referidas a vivienda (muebles, utensilios, animales domésticos, propiedades familiares), hábitos alimenticios y de trabajo de los miembros de la familia. Esta infor-
.lU
lVi eloaos
ae encuesta
mación recabada mediante observación directa, por los colaboradores, se complementó con la obtenida de la interacción y entrevista a los integrantes de la familia. También se interrogó a personalidades de la localidad, de gran ayuda para la selección de familias "representativas". Otro de los defensores de extraer la información de los propios trabajadores, para saber de sus condiciones de vida y de trabajo, fue Karl Marx. A él se le atribuye la primera encuesta por correo, que data de 1880. Cuando envía 25.000 cuestionarios a obreros franceses, pensaba que éstos eran quienes mejor podrían describir sus condiciones sociolaborales. No obstante, la respuesta a esta primera iniciativa fue mínima. La investigación quedó paralizada. Más éxito tuvo otro de los padres fundadores de la sociología: Max Weber. Aunque su obra fue determinante en el desarrollo de la metodología cualitativa, realizó una importante contribución empírica al desarrollo de la encuesta. Principalmente, en dos aspectos metodológicos clave: la correcta selección de los informantes y la mejora del cuestionario. Sus aportaciones han sido resaltadas por Lazarsfeld y Oberschall (1965), y cabe sintetizarlas en las cuatro que se exponen a continuación. 1. Su participación en una investigación sobre las condiciones del trabajo rural en Alemania, promovida por la Verein für Sozialpolitik, una asociación creada en 1892 por un grupo de profesores universitarios, preocupados por el creciente antagonismo de los trabajadores alemanes (organizados en sindicatos socialistas) hacia el Estado alemán. Además de solicitar reformas sociales, querían minimizar la influencia del pensamiento marxista en los trabajadores. Algo más de 3.000 terratenientes recibieron un cuestionario detallado para que describiesen su situación particular. El 700/0 lo respondió. Asimismo, se enviaron 600 cuestionarios a personas que se creía ofrecerían una visión más general. Aproximadamente el 500/0 lo devolvió rellenado. Era costumbre de esta asociación clasificar las respuestas por región geográfica y pedir a cada miembro que, voluntariamente, realizase cada serie. Weber hizo el informe de Prusia del Este, en 1892, y fue el único que efectuó un análisis comparativo. Comparó su material con los resultados de estudios anteriores. El propósito era proporcionar una perspectiva histórica. De este estudio Weber criticó que sólo se utilizase, como informantes, a los terratenientes; además del contenido del cuestionario: demasiado énfasis en las condiciones materiales de los trabajadores y escaso análisis de los aspectos subjetivos. 2. En 1893 Weber lleva a cabo otra encuesta, sobre trabajadores del campo, encargada por el Congreso Social Evangélico. Éste demandaba un mayor conocimiento de las condiciones de vida de los grupos de población de renta más baja. Envió 10.000 cuestionarios a clérigos por dos razones principales: una, el Congreso tenía un registro central de todas las parroquias; dos, pensaba que éstos podrían mejor informar de problemas psicológicos. El cuestionario fue más breve que el de la encuesta anterior. Se centró más en la movilidad social y laboral, y en los orígenes de los distintos grupos de campesinos. También, quiso conocer las actitu-
Capítulo 1: La encuesta como estrategia de investigación social
17
des de los trabajadores hacia formas no tradicionales de trabajo. Le fueron deyueltos 1.000 cuestionarios. Los resultados de esta investigación se publicaron en periódicos y en informes del Congreso Social Evangélico. 3. En 1907 Weber participó en una serie de investigaciones, efectuadas por Verein für Sozialpolitik, sobre la selección y adaptación de los trabajadores en las grandes industrias. Esta vez la información ~e obtuvo combinando datos disponibles, en las oficinás de las fábricas seleccionadas, con observación participante y entrevistas "directas" a los trabajadores. Para estas entrevistas se diseñó un cuestionario de 27 preguntas relativas a la ocupación de los padres, actividades de tiempo libre, elección ocupacional o metas en la vida. 4. Sobre esta misma temática, en 1908 Weber realiza un estudio detallado de la productividad de los trabajadores en una fábrica textil, que pertenecía a la familia de su esposa. Los resultados los publica en un informe que titula La consideración de los aspectos psicofísicos del trabajo en la industria textil en Alemania al Este del Elba. Este estudio destaca por su cuidadoso análisis estadístico de los resultados: la tabulación cruzada. También, porque demuestra que las personas de renta baja pueden ser "buenos" informantes. Otro ejemplo ilustrativo de la prevalencia de los sondeos a la población trabajadora en la investigación empírica alemana es el estudio de Adolf Levenstein, de 1912, con el título genérico La cuestión obrera. Describe la situación de los obreros de la industria alemana, a partir de los resultados de una encuesta por correo, enviada a 8.000 obreros, de tres categorías (de la industria minera, metalúrgica y textil), de ocho regiones industriales, a razón de 1.000 cuestionarios por cada región, desde 1907 a 1911. Para aquel entonces, obtuvo un porcentaje de cuestionarios devueltos elevado: el 63% de los enviados. Pero la encuesta carecía de rigurosidad. Presentaba serios errores (Lazarsfeld y Oberschall, 1965; Kovaliova, 1989), desde la óptica actual. De ellos destacan los referidos a la población analizada. En un principio, los cuestionarios se enviaban a amigos y conocidos entre los obreros. Después se pedía, a quienes respondían, que lo distribuyesen entre sus conocidos o amigos. El cuestionario incluía 26 preguntas clasificadas en cuatro apartados. Uno, de datos personales: nombre, edad, ocupación, estado civil, número de hijos, ingresos (remuneración, duración,jomadalaboral). Dos, de actitud ante el trabajo: cansancio, monotonía, tipo de remuneración que preferían, los pensamientos durante el trabajo, esperanzas y deseos relacionadoscon el trabajo. Tres, de asuntos culturales y políticos: lectura, intereses políticos, creencias religiosas. Y cuatro, de problemas relacionados con el ocio. En su análisis, Levenstein siguió la recomendación de Weber, publicada en su artículo, de 1909, "Zur methodik sozialpsychologischer enqueten und ihrer bearbeitung" ("Sobre la metodología de las encuestas socio--psicológicas y sobre su análisis"). En él le pedía que hiciese un análisis estadístico de sus datos, indicándole la manera de hacerlo. Levenstein siguió su asesoramiento, aunque se negó a que su codificación y tabulación fuese comprobada por estudiantes y profesores universitarios, como le pedía
'''-.
18
Métodos de encuesta
Weber. A destacar, su uso de tipologías en la clasificación de los obreros. Si bien, Lazarsfeld y Oberschall (1965: 191) puntualizan: Puede legítimamente considerarse uno de los más tempranos esfuerzos para estudiar las actitudes. Pero ni él ni Weber hicieron explícita la idea de que las actitudes pueden medirse, que los materiales de cuestionario pueden ser combinados para formar variables a lo largo de los cuales clasificar a la gente.
Ninguna de las encuestas sociales aquí expuestas se adecuan a lo que hoy se entiende por encuesta ("encuesta por muestreo"). Más bien se asemejaban a censos. Intentaban cubrir las poblaciones totales de las comunidades que se analizaban. Aunque tienen un importante valor como primera aproximación al estudio empírico de la sociedad de su tiempo. En concreto, de la situación de la clase trabajadora. Los avances de la encuesta precisó de aportaciones varias, procedentes de distintos ámbitos de conocimiento. En 1883, Galton delimita (en Inquiries into the human faculty) algunos requisitos básicos de los cuestionarios. Éstos han de cubrir los objetivos de la investigación siendo, al mismo tiempo, fáciles de entender y de contestar. Pero los beneficios más notorios proceden del área de la estadística, de la aplicación de la teoría de la probabilidad en la selección de las unidades de observación. Arthur L. Bowley, el primer profesor de estadística en la London School of Economics and Political Science, fue quien introdujo el muestreo probabilístico en la práctica de encuesta. A él se le atribuye la primera encuesta que se realiza mediante selección aleatoria de los informantes. Se trata de la investigación que realiza junto con A. R. Burnett-Hurt, financiada por organizaciones caritativas, y que publica en 1915 con el título Livelihood and poverty (en la editorial londinense Bell). En publicaciones precedentes había defendido la necesidad de aplicar muestras aleatorias representativas en la investigación mediante encuesta. A destacar: • "Presidential address to the Economic Section of the British Association for the Advancement of Science", de 1906 (Journal ofthe Royal Statistical Society, 69: 540-558). • "Working class households in Readings", de 1913 (Journal olthe Royal Statistical Society, 76: 672-691). • O su texto sobre la medición de los fenómenos sociales, de 1915, The nature and purpose of the measurement 01 social phenomena (~ S. King and Son, Ltd., Londres), con el que contribuyó a la definición de los parámetros de calidad de los datos de encuesta, además de al desarrollo de la encuesta por muestreo. Aunque fue A. N. Kiaer (el director de Norwegian Bureau of Statistics de Oslo) quien primero defendió la exigencia de que la encuesta se hiciera sobre muestras representativas, en 1897, en su libro Representative method ofstatistical surveys (en la editorial Kristinia, de Oslo). En él expone que, de la información extraída de una muestra relativamente pequeña de la población, pero cuidadosamente seleccionada
Capítulo 1: La encuesta como estrategia de investigación social
19
mediante algún procedimiento aleatorio, pueden estimarse los parámetros poblacionales, sin necesidad de elaborar un censo completo de la población, como hasta entonces se creía. Si bien, ello exige que la muestra sea "representativa";.que constituya una representación en miniatura de la población de estudio. Además, propone un procedimiento para evaluar los resultados de encuesta: la replicación. El repetir la operación de muestreo, el extraer una serie de submuestras comparables. Dos años ántes, en 1895 introdujo, por vez primera, el término investigación representativa, en un informe para el Instituto Nacional de Estadística (ISI: International Statistical Institute) que, a finales del siglo XIX, era el centro de debate para estadísticos oficiales. La propuesta de Kiaer de aplicar la estratificación en la selección aleatoria de la muestra fue posteriormente desarrollada por Jerzy Neyman, en 1934. En un artículo, ya clásico: "On the different aspects of the representative method: the method of stratified sampling and the method of purposive selection" (Journal ofthe RoyalStatistical Society, 97: 558-606). Junto con la estratificación óptima y el muestreo por conglomerados, en él desarrolla el muestreo en poblaciones finitas, la distribución muestral (la serie de resultados posibles en el diseño de la muestra) y el error de muestreo (o variabilidad de las estimaciones muestrales). Demuestra que este último puede medirse calculando la varianza del estimador. A partir de los años cuarenta del siglo xx se diferencia el error de muestreo del error total de encuesta. Con posterioridad, la replicación adquiere un nuevo desarrollo de la mano del estadístico hindú ~ C. Mahalanobis. En dos de sus publicaciones principales, de 1944 ("On the large scale sample surveys". Royal Society Phil. Trans. B., 231: 329-451) y de 1946 ("Recent experiments in statistical sampling in the Indian Statistical Institute". Journal ofthe Royal Statistical Society, 19: 325-378), aboga por el uso de la replicación. A lo que denomina "interpenetrar muestras", para medir la precisión de estimaciones derivadas de una encuesta. En esta última publicación también enfatiza la necesidad de incluir los "errores humanos" (la variabilidad introducida por entrevistadores, codificadores y supervisores), junto a los de muestreo, en la estimación de la precisión de una encuesta. La aportación de estos estadísticos notorios es continuada por la publicación de célebres manuales de muestreo. Entre los cuales sobresalen: • F. Yates (1949): Sampling techniques ofcensuses and surveys. Griffin. Londres. • W. E. Deming (1950): Sorne theory of sampling. Wiley. Nueva York. • M. H. Hansen, W. N. Hurwitz y W. G. Madow (1953): Sample survey methods and theory. Wiley. Nueva York. • W. G. Cochran (1953): Sampling techniques. John Wiley and Sonso Nueva York. • ~ \Z Sukhatme (1953): Sampling theory ofsurveys with applications. The lndian Society of Agricultural Statistics. Nueva Delhi. • L. Kish (1965): Survey sampling. John Wiley and Sonso Nueva York. En todos ellos se mide el efecto del diseño de la muestra en la imprecisión de las estimaciones de encuesta. El primero, destaca por su influencia en la Encuesta Mun-
lY.l.t;;tUUU~·
ue encueSla
dial de Población de 1950. Pero, el primer manual de Cochran (segunda edición en 1963, tercera en 1977) fue, de acuerdo con O'Muircheartaigh (1997: 7) el de mayor éxito, "el más matemático y menos influido por intereses no estadísticos y no de muestreo". No obstante, habría asimismo que destacar el texto igualmente clásico de Kish de 1965 (de gran repercusión en España), que ha tenido una nueva edición, aún reciente, de 1995, en la misma editorial. Desde la psicología, la aportación al desarrollo de la investigación mediante encuesta se focaliza en la medición de los conceptos teóricos, en su fiabilidad y validez. Entre las primeras publicaciones que comprueban los efectos de cambiar la formulación de la pregunta mediante experimentos destacan: • A. Hobson (1916): "The use of the correspondence method in original research". Journal o/ the American Statistical Association, 15: 210-218. Contrasta diferentes tipos de cuestionarios y.su formulación en encuestas por correo. • B. Muscio (1917): '·'The influence of the form of a question". The British Journal of Psychology, 8: 351-389. Sobre medición de actitudes fueron clave las aportaciones de los siguientes investigadores, quienes demuestran que no sólo lo objetivo, sino también lo subjetivo (las actitudes), puede medirse con preguntas estandarizadas, en un formato de encuesta: • E.S. Bogardus (1925): "Measuring social distances". Journal of AppliedSociology, 9: 299-308 / (1933): "A social distance scale". Sociology and Social Research, 17: 265-271. • L. L. Thurstone (1928): "Attitudes can be measured". American Journal of Sociology, 33: 529-544/ (1931): The measurement o/social attitudes. University of Chicago Press. Chicago. • L. L. Thurstone y E. J. Chave (1929): The measurement o/attitudes. University of Chicago Press. Chicago. • R. Likert (1932): "A technique for the measurement of attitudes". Archives of Psychology, 140: 44-53. • L. Guttman (1944): "A basis for scaling qualitative data". American Sociological Review, 9: 139-150/ (1947):-"The Cornell techniques for scales and intensity analysis". Educational and Psychological Measurement, 7: 247-280. • C. E. Osgood y E H. Tannembaum (1955): "The principIe of congruence in the prediction of attitude change". Psychological Bulletin, 62: 42-55. • C. E. Osgood, G. J. Suci y E H. Tannenbaum (1957): The measurement o/meaning. University of Illinois Press. Urban II!. A finales de los años veinte y principios de los treinta del siglo xx comienzan a aparecer, en Estados Unidos, empresas de investigación de mercados para la investigación comercial y la realización de sondeos preelectorales. Precisamente fue el acierto en la
Capítulo 1: La encuesta como estrategia de investigación social
21
predicción de un resultado electoral, las elecciones presidenciales de 1936, lo que supuso un. fuerte impulso a la encuesta mediante muestreo. Una macroencuesta, por correo, para la revista The Literary Digest (que defendía la práctica de a mayor número de personas encuestadas, mejor es la predicción), a miles de suscriptores con teléfono fracasó en su predicción electoral, frente a una encuesta más modesta bajo la dirección de Gallup y Crossley. Esta última encuesta predijo la victoria de Roosevelt, tras sólo con haber entrevistado a 1.500 votantes norteamericanos, elegidos al azar, y establecidas unas cuotas por edad y sexo. Mostró que una muestra pequeña, pero cuidadosamente extraída, podía reflejar mejor la realidad social que una gran encuesta de "una muestra parcial, con poco o ningún esfuerzo para alcanzar porcentajes de respuesta razonables" (Rossi, Wrigth y Anderson, 1983: 5). Los encuestados para The Literary Digest no fueron aleatoriamente seleccionados del conjunto de electores norteamericanos, sino extraídos del listín telefónico de suscriptores a la revista y de propietarios de automóviles. Ello introdujo un importante sesgo en los resultados del sondeo. Según estimaciones de Biemer y Lyberg (2003), en aquellas fechas sólo un 350/0 de los hogares norteamericanos disponían de teléfono. Además, esta población se caracterizaba por ser desproporcionadamente republicana. Lo que explica la preferencia de sus sondeados por el republicano Landon. Se excluyó a las personas de nivel de renta más bajo, que fueron quienes más votaron por el programa de recuperación económica defendido por Roosevelt. A este importante error de cobertura hay que sumar otros, igualmente decisivos, com~ el relacionado con el bajo porcentaje de respuesta obtenido. Tan sólo un 220/0 de los diez millones de cuestionarios enviados fueron contestados y devueltos por correo. A partir de entonces, los sondeos realizados por Gallup, Crossley y Ropper adquieren un mayor protagonismo en el análisis de la opinión pública. Comienzan a expandirse los institutos de opinión pública en Estados Unidos y Gran Bretaña. Asimismo, Gallup volvió a acertar en su pronóstico electoral, con muestreo por cuotas, en las elecciones presidenciales de 1940 y 1944. Pero no en 1948, debido a la no correspondencia de los datos del Censo de Población de Estados Unidos de 1940, utilizado para el muestreo por cuotas, con la población real de 1948. La Segunda Guerra Mundial supuso, además de pérdida de población, el desplazamiento de habitantes del campo a las ciudades, donde se registró una mayor preferencia por los demócratas. En el período de 1936 a 1949 Gallup llevó a cabo aproximadamente 400 experimentos sobre los efectos de la redacción de preguntas en cuestionarios. Muchos de estos experimentos fueron diseñados por Hadley Cantril, quien en 1940 crea The Office of Public Opinión Research, en la Universidad de Princeton. Quería que éste se convirtiera no sólo en centro de referencia en el estudio de la opinión pública y de las técnicas a seguir en su análisis, sino también en un archivo de sondeos de opinión para cualquier investigador que estuviese interesado. Junto con sus colaboradores publica, en 1944, en la editorial de la Universidad de Princeton, un compendio de estudios sobre el diseño de la encuesta, su ejecución y análisis, y que titula Gauging public opinion. De los temas en él tratados destacan, en especial, los referidos a la formulación de la§ preguntas, su significado, el efecto de las baterías de preguntas y la medición de la in-
22
Métodos de encuesta
tensidad de las opiniones. Además, se analizan los sesgos debidos al entrevistador y a su formación. Por aquel entonces, Paul E Lazarsfeld funda The Bureau of Applied Social Research, en la Universidad de Columbia. Anteriormente había creado The Office of Radio Research, en la Universidad de Newark. En 1944, Lazarsfeld publica, en la editorial de la Universidad de Columbia, una investigación que había realizado junto con H. Gaudet y B. Berelson: The people's choice: how the voter makes up his mind 'in a presidential compaing. Esta publicación adquiere una gran trascendencia en la investigación social por ser pionera en tres aspectos clave para la investigación mediante encuesta: 1. El estudio de la conducta de voto mediante encuesta por muestreo (desde la sociología académica). 2. La aplicación de una encuesta panel (un mismo cuestionario se pasa a la misma muestra de individuos en varias fechas sucesivas). La investigación tiene por objetivo principal el análisis de las intenciones de voto de los electores del condado de Erie (Ohio), en las elecciones presidenciales de 1940. Para ello, los autores pasaron tres veces un mismo cuestionario a una muestra de electores extraída al azar. La primera vez, antes del nombramiento de los electores. La última, momentos antes de la elección. Mediante este seguimiento de la muestra querían comprobar el efecto de la campaña electoral en la intención de voto. Unas mismas personas son seguidas en el transcurso de la campaña electoral. A su vez, utilizaron otras tres muestras como grupos de control, con el propósito de comprobar los efectos de aplicar varias veces el mismo cuestionario a la muestra principal. 3. El análisis de datos de encuesta. En concreto, por su introducción de las tablas cruzadas, de más de dos variables, y por su contribución a la realización de tipologías. Pese a los aciertos de esta investigación, se observan algunas debilidades metodológicas. Rossi, Wright y Anderson (1983: 6) critican la no aplicación de modelos de inferencia estadística. Ninguna prueba de significatividad estadística ni estimación de intervalos de confianza aparecen en la monografía del estudio. Asimismo, censuran el procedimiento de muestreo seguido: "visitar cada cuatro viviendas". Durante la Segunda Guerra Mundial se crea The National Opinion Research Center (NüRC) y un departamento de investigación del ejército norteamericano. Este último bajo la dirección de Samuel A. Stouffer de 1941 a 1945. Entre sus colaboradores estaban los sociólogos Louis Guttman, Edwards A. Suchman, Robin Williams, Shirley Star o John Clausen; junto con los psicólogos Carl Hovland, Arthur Lumsdaine y William Bennet, quienes después proseguirían su andadura en distintos departamentos universitarios. Este equipo investigador llevó a cabo una investigación, de gran envergadura, sobre la moral, opiniones y actitudes del soldado americano durante la Segunda Guerra Mundial: The American Soldier (1949). Éste es el nombre comúnmente utilizado en
Capítulo 1: La encuesta como estrategia de investigación social
23
referencia al susodicho estudio. Sus resultados fueron publicados por la editorial de la Universü)ad de Princeton en cuatro volúmenes, de 1947 a 1950, bajo el título genérico Studies in social psychology in World War ll. Su propósito inicial era eminentemente práctico: proporcionar información a las autoridades gubernamentales de las opiniones y actitudes de su personal militar. Pero acabó teniendo una gran repercusión en el desarrollo de la metodología de encuesta. En especial, en el diseño de las encuestas autocumplimentadas (a una muestra aleatoria de 5.000 soldados se les pidió que rellenasen un cuestionario diseñado al efecto), en la práctica de formular varias preguntas para medir un mismo concepto teórico y en el análisis de los datos de encuesta. Robert K. Merton y Paul F. Lazarsfeld (1950), quienes habían estado muy próximos al equipo investigador, aunque formalmente no participaron en el estudio, se refieren a esta investigación como el primer trabajo que capacita al lector no especializado en la investigación socio-psicológica, para aprender los detalles de los métodos más avanzados en el campo, relativamente nuevo, de las encuestas de actitudes. Platt (1996) destaca su contribución a la consideración de la encuesta como el método líder en la recogida de información. Pese a los contenidos dados por Hovland, Lumsdaine y Sheffield, y a los comentarios repetidos de Stouffer sobre la superioridad del método experimental. La monografía de Merton y Lazarsfeld (1950) sobre la investigación tuvo mucho que ver en ello, por la orientación que se hizo de la encuesta y de su accesibilidad. En los años cincuenta aparecen dos monografías sobre la entrevista, de gran influencia en la práctica de encuesta mediante entrevista: • H. Hyman y colaboradores (1954): Interviewing in social research. Chicago University Press. Chicago. Analiza cómo las expectativas del entrevistador afectan a los datos de encuesta. • R. L. Kahn y C. F. Cannell (1957): The dynamics of interviewing: theory, techniques and cases. John Wiley and Sonso Nueva York. Destaca la responsabilidad del entrevistador en el resultado de la encuesta. Ambas consolidan los fundamentos de la entrevista de encuesta, llamada la entrevista estandarizada. Del entrevistador se espera que se convierta en un "instrumento neutral"; en un profesional que se limite a leer las preguntas del cuestionario tal y como están redactadas, sin implicar ningún favoritismo, sorpresa o satisfacción hacia alguna respuesta concreta. "El entrevistador 'ideal' es descrito como una persona bastante estructurada, reforzado por una formación rigurosa y con ninguna característica de rol extra que pudiese ser saliente para las preguntas que se formulan" (O'Muircheartaigh, 1997: 13). Pero no fueron éstas las primeras monografías sobre la entrevista de encuesta. En 1934 aparece una edición revisada (en la editorial Harper, de Nueva York) de How to interview, de w. ~ Bingham y B. ~ Moore. En esta publicación se defiende, igualmente, la necesidad de estandarizar la actuación del entrevistador en la encuesta. Además, se multiplican los artículos en los que se analizan los efectos de la actuación del
24
Métodos de encuesta
entrevistador en los resultados de encuesta, y se establecen pautas para su mejora. Algunos de los más citados son:
• S. A. Rice (1929): "Contagious bias in the interview". American Journal of Sociology, 35: 420-423. Analiza posibles influencias de los entrevistadores que "contaminan" la encuesta. . • J. Wechsler (1940): "Interviews and interviewers". Public Opinion Quarterly, 4: 258-260. Sobre el papel de los entrevistadores durante la entrevista. • D. Katz (1942): "Do interviewers bias poll results?". Public Opinion Quarterly, 6: 248-268. Comprueba el efecto diferencial del estatus de los entrevistadores. Los llamados de "cuello blanco" registran una mayor proporción de actitudes y opiniones conservadoras que los de "cuello azul" o de clase trabajadora. • D. Williams (1942): "Basic instructions for interviewers".- Public Opinion Quarterly, 6: 634-641. Detalla las instrucciones seguidas por los entrevistadores que trabajan para The National Opinion Research Center (NORC). . • M. T. Orne (1969): "Demand characteristics and the concept of quasI-controls", en R. Rosenthal y R. L. Rosnow, Artifacts in behavioral research. Academic Press. Nueva York. Analiza cómo las características de la demanda afectan a la conducta de los entrevistadores y los entrevistados. Ésta es la época de mayor expansión de la encuesta como estrategia metodol?gica. Coincide con los años de hegemonía delfuncíonalísmo en la sociología norteamencana. Wells y Picou (1981) ponen cifras a dicha expansión: el 48,2% de l~s. artículos publicados en la revista The American Sociological Review, de 1936 a 1949, utilIZan la encuesta. Entre 1950 y 1964 el porcentaje asciende al 70,50/0. Entre 1965 y 1978, hasta el 80,30/0 . L~s métodos de interpretación descienden, por el contrario, del 50,4 al 27 y 17,1 %, ~~spectI vamente. En la revista American Political Scíence Review, WaW.ke (1979) contabilIZa que la mitad de los 180 artículos sobre comportamiento político se basan en datos de encuesta. Un 20% complementa la encuesta con otras estrategias de investigación. Asimismo, se suceden las publicaciones que tratan de los "errores" ~e .l~ encuesta y, en general, de la calidad de sus dato~. Cronol~gicamen~e, d.esde sus 1ll1CIOS hasta el momento presente, una selección abreVIada de dIchas publicaCIones, de acuerdo con su impacto en la literatura de encuesta, incluye las siguientes: • J. L. Gillin (1915): "The social survey and its further developme~t".Journalof the American Statistical Association, 14: 603-610. Alerta de los peligros de la falta de control de la calidad de la encuesta. • W. E. Deming (1944): "On errors in surveys". American Sociological Review, 9: 359-369. Lista trece factores que pueden afectar a la calidad de la encuesta. Incluye los errores de muestreo, los debidos a la act~ación del entre~sta~or, al procedimiento seguido en la recogida de datos, al dIseño del cuestIonarlo, a la no respuesta, a la codificación y procesamiento de la información, además de los errores de interpretación.
Capítulo 1: La encuesta como estrategia de investigación social
25
• H. J. Parry y H. M. Crossley (1950): "Validity of responses to survey questions". Public Opinion Quartely, 14: 61-80. Sobre la validez de la medición mediante encuesta. • M. H. Hansen, W. N. Hurwitz y W. G. Madow(1953): Sample survey methods, vol 11. Wiley. Nueva York. Diferencia los errores variables de los sesgos sistemáticos, y propone el concepto de error total de encuesta. • C. F. Cannell y"F: J. Fowler (1963): "Comparison of a self enumerative procedure and a personal interview: a validity study". Public Opinion Quartely, 27: 250-264. Comprueba la validez de la entrevista personal frente al procedimiento "autoenumerativo". • S. Sudman y N. Bradburn (1974): Response efffects in surveys: a review and synthesis. Aldine Publishing Co. Chicago. Un texto clave sobre los efectos de respuesta, en el que se proponen pautas o actuaciones en su resolución. • H. Schuman y S. Presser (1981): Questions and answers in attitudes surveys. Academic Press. Nueva York. A partir de investigación propia (experimentos), complementada por la llevada a cabo por otros investigadores, analizan los efectos debidos a la forma de la pregunta, su redacción y contexto en los resultados de encuesta. • R. M. Groves (1989): Survey errors and survey costs. John Wiley. Nueva York. Un clásico, en la actualidad, que ofrece una revisión comprehensiva de los errores de encuesta y sus causas, relacionándolos con los costes de la investigación. Reconoce que el "coste" es un componente esencial de la calidad de los datos. • L. E. Lyberg y colaboradores (1997): Survey measurement and process control. John Wiley and Sonso Nueva York. Una compilación de artículos sobre las diversas fuentes de error de medición y sus efectos en la calidad de la encuesta. • E E Biemer y L. E. Lyberg (2003): Introduction to survey quality. John Wiley and Sonso Nueva Jersey. Sintetiza las distintas fuentes de error de la encuesta, insistiendo en su visión conjunta. En los últimos años la literatura sobre metodología de encuesta ha crecido enormemente, como puede verse en la bibliografía adjunta al final del libro. Aunque algo extensa y limitada al mundo anglosajón e hispano, no recoge ni siquiera toda la producción habida hasta el presente. En los capítulos siguientes se irá, no obstante, informando de estudios notorios específicos a los distintos aspectos de la encuesta, en cada una de sus fases, y podrá mejor comprobarse cuál es el estado actual de la investigación sobre la encuesta. Además de la decisiva aportación de las nuevas tecnologías en su desarrollo y expansión. Para concluir, se hace una sucinta referencia a los orígenes de la encuesta en España. Se destaca la siguiente relación de fechas de estudios clave, aunque pocos cumplen el rigor metodológico que en la actualidad se exige a la encuesta. • La gran encuesta, a escala nacional, de 1901 a 1902, sobre temas antropológicos y sociales, promovida por la Sección de Ciencias Morales y Políticas del Ateneo
26
Métodos de encuesta
de Madrid. Trata de las costumbres populares y de los tres hechos más característicos de la vida: nacimiento, matrimonio y defunción. R. Salina fue el promotor de la encuesta, pero contó con la colaboración de Puyol, Bernardo de Quirós, García Herreros, Pedregal y Camarón. Fueron devueltos al Ateneo 289 cuestionarios debidamente cumplimentados, distribuidos entre las .distintas provincias españolas. Con anterioridad, y desde 1882, las distintas sociedades antropológicas españolas habían editado cuestionarios, de ámbito local, que ayudasen a la recogida de datos (Lisón, 1968). En 1895, J. Costa dirigió en el Ateneo La encuesta sobre tutela social y, en 1901, promovió, también en el Ateneo, La encuesta sobre oligarquía y caciquismo como forma actual de gobierno en España. Esta última encuesta contó con la colaboración de Pardo Bazán, G. Azcárate, Ramón y Cajal, Unamuno, Pi y Margall. . • En 1904 se crea el Instituto de Reformas Sociales. Desde él se promueven vanos estudios "reformistas" sobre la sociedad española. Destaca la investigación relativa al trabajo en las minas, de 1910, o la primera encuesta a escolares, de Eugenio d'Ors, de 1921. • La encuesta a estudiantes universitarios de Madrid realizada por Manuel Fraga Iribarne y Tena Artigas en 1949. Sus resultados se publican en 1953, en la Revista de Educación y la Revista Internacional de Sociología. • La encuesta a estudiantes universitarios españoles de José Luis Pinillos, de 1955. La primera que incluye preguntas de índole política. • La encuesta a estudiantes de la Universidad de Valencia, de Francisco Murillo Ferrol y José Jiménez Blanco, de 1956. • La encuesta sobre la familia española, de Enrique Gómez Arboleya y Salustiano del Campo, de 1957. La muestra la integran 127 estudiantes en Madrid y 112 en Salamanca. En 1959 se publica con el título Para una sociología de la familia española. • La encuesta sobre la profesión médica en España, de José Mariano López Cepero, Amando de Miguel, Luis González Seara y José Castillo (con el asesoramiento de Juan J. Linz). La muestra la componen 500 médicos, una muestrade élites y un panel de estudiantes de Medicina. • La encuesta a empresarios de Juan Linz (con la colaboración de Amando de Miguel), de 1959. Financiada por la Escuela de Organización Industrial de ~a drid. La muestra la forman 460 empresarios. Algunos de los resultados prIncipales del estudio se publican en 1966 con el título Los empresarios ante el poder público . • La primera encuesta de juventud, de 1960 (aunque el período de investigación se extiende de 1958 a 1965). Dirigida por José Mariano López-Cepero, un colaborador de Enrique Gómez Arboleya. Contó con un amplio equipo investigador, entre quienes se encuentra el propio Gómez Arboleya (que se incorpora tardíamente), José Bugeda, José Castillo, Luis González Seara, Juan J. Linz y Amando de Miguel. En el más reciente informe sobre juventud (A. de Miguel,
Capítulo 1: La encuesta como estrategia de investigación social
27
2000), se detalla la relación de todos los participantes en la investigación, sus avatares y los resultados principales del estudio. Esta encuesta, junto a las realizadas por una parte de su equipo investigador (las encuestas a médicos y empresarios antes citadas), representan "el punto de arranque fundamental del análisis 'empírico' de la realidad social española, con nuevos métodos importados en esa época fundamentalmente de Estados Unidos, Francia y tJran Bretaña. Aunque las tres encuestas se llevan a cabo desde Madrid" (J. de Miguel, 1999: 188). • La encuesta a amas de casa, de Juan José Castillo, de 1962, relativa a hábitos de consumo. En 1963 se crea, a instancia de Manuel Fraga Iribarne, el Instituto de la Opinión Pública (que en 1976 se transforma en el actual Centro de Investigaciones Sociológicas). Un centro oficial de investigación sociológica empírica, con clara hegemonía de la investigación mediante encuesta. Dispone de un banco de datos de libre acceso a toda persona interesada en alguna de sus encuestas. La Revista Española de la Opinión Pública se convierte en un medio de difusión de referencia de la investigación en España. Después se transformaría en la Revista Española de Investigaciones Sociológicas (REIS). En la esfera privada comienzan a aparecer institutos de investigación de mercados y de sociología aplicada. En 1958 se crea el Instituto ECO, vinculado a Jesús Ibáñez. En 1965 surge DATA, unido a la figura de Amando de Miguel y Juan J. Linz. Bajo la dirección de Amando de Miguel se realiza el primer informe FOESSA, en 1966, y el segundo, en 1970. Ambos informes son calificados por Lamo de Espinosa (1992: 127-128), como "la prueba de madurez de la sociología española". En concreto, el segundo Informe FOESSA (1970) "se convierte en el mejor de los estudios sociológicos globales y, sin duda, el estudio sociológico sobre la estructura social española más avanzado para la época" (J. de Miguel, 1999: 195). Si bien, padece de problemas de censura al e~iminarse, en su publicación, el capítulo quinto sobre "vida política y asociativa", capItulo que ahora puede leerse en una reciente publicación de Amando de Miguel (2003) sobre el final del franquismo, en el que incluye fragmentos de su diario personal sobre su paso por la cárcel en los últimos años de la dictadura. La serie de informes FOESSA prosigue en años posteriores, pero bajo la dirección de otros investigadores y sin una periodicidad concreta. En el tercero, la encuesta se realiza en 1973, aunque el informe se publica en 1976. El cuarto, entre 1981-1983, dirigido por Juan Linz. El quinto, de mayo a junio de 1995, bajo la dirección conjunta de Miguel Juárez. Con la instauración de la democracia, la encuesta paulatinamente va adquiriendo un mayor protagonismo en la investigación social empírica en España. En 1979, año de elecciones, en España se gastaron ~OOO millones de pesetas en encuestas de opinión (según estimaciones de López Pintor, 1982). Veinte años después, la facturación de estudios cuantitativos asciende a 18.953 millones de pesetas. En el año 2000 a 22.882 millones (Alós, 2001).
28
Métodos de encuesta
1.2. Características esenciales de la encuesta: sus posibilidades y límites La encuesta se presenta como la estrategia de investigación caracterizada por la aplicación de un procedimiento estandarizado para la obtención de informació~ (oral y/o escrita), de una muestra amplia de sujetos. La muestra debe ser representatIva de la población de interés. La información se limita a la delineada por las preguntas que componen el cuestionario precodificado diseñado al efecto. Entre sus características definitorias destacan: a) Su adecuación al estudio de un amplio abanico de cuestiones: aspectos objetivos (de hechos) y subjetivos, no directamente observables (actitudes, valores, opiniones), del presente, pasado y futuro. b) La información se obtiene de las respuestas verbales (oral o escritas) pronunciadas por los encuestados (observación "indirecta"). Por esta razón, cabe la posibilidad de que la información recabada no sea un fiel reflejo de la realidad que se analice. De ahí la exigencia de comprobar "siempre" la veracidad de los datos, antes de su interpretación. c) Para que las respuestas puedan compararse, ha de seguirse un procedimiento estandarizado en la recogida y en el análisis de los datos. La estandarización se justifica por la necesidad de proceder a una medición "científica" de los fenómenos sociales. Ello exige que las diferencias en las respuestas se deban a divergencias entre los encuestados y no a una aplicación diferencial de la encuesta, en cualquiera de sus fases. Han de formularse las mismas preguntas, en el mismo orden, a cada uno de los encuestados. Asimismo, cuando medie la intervención de entrevistadores en la recogida de información, ha de evitarse que su actuación sea desigual con los entrevistados. La estandarización restringe los errores de medición que, como después se verá, afectan directamente a la calidad de la encuesta. d) Las respuestas se agrupan y cuantifican para, con posterioridad, examinar (mediante técnicas estadísticas de análisis) las relaciones entre ellas. El interés del investigador va más allá del individuo del que obtiene la información. Se extiende a la población a la que éste pertenece. Por ello es necesario que la muestra observada sea "representativa" de dicha población. En el tercer capítulo se insiste en la exigencia de seguir un riguroso procedimiento aleatorio de selección de la muestra. Incide, directamente, en la validez externa (o posibilidad de generalización de los resultados de la encuesta) y en la validez de conclusión estadística (o significatividad estadística de los resultados). Ambas están afectadas por el tamaño de la muestra y por el procedimiento seguido en la elección de las unidades que la componen.
Al protagonismo de la encuesta en la investigación social (cuantitativa) contribuye las muchas posibilidades que ofrece al investigador. Comparada con otras estrategias de inv'estigación, la encuesta permite:
Capítulo 1: La encuesta como estrategia de investigación social
29
a) La obtención de información variada de un conjunto amplio de personas, uoicadas en distintas áreas geográficas, en un plazo de tiempo relativamente breve. Depende del método de encuesta aplicado (mediante entrevista personal, telefónica, autoadministrada o una combinación de varios), como se verá en el capítulo 2. Aunque su coste sea elevado, generalmente es inferior al necesario en la materialización de otras estrategias de investigación para la consecución del mismo volumen de información. b) La comparación de datos obtenidos en encuestas· realizadas en fechas, países o áreas geográficas diferentes. Siempre que las encuestas sean "comparables", en su diseño (muestra, cuestionario) y aplicación. Esta posibilidad de la encuesta, propiciada por la estandarización que la define, amplía su utilidad en la investigación social. Parafraseando a López Pintor (1989: 360), la utilidad de la encuesta aumenta "cuanto mayor sea la posibilidad de poder comparar los datos (obtenidos) con otros similares y anteriores en el tiempo o procedentes simultáneamente de otras poblaciones". La consulta de bancos de datos de encuesta es de gran utilidad para la realización de estudios comparativos y de tendencias (longitudinales). c) La generalización de sus resultados, dentro de los límites marcados en el diseño y en cada fase de la ejecución de la investigación. d) La evaluación de la calidad de sus resultados, del cumplimiento de los criterios de validez y de fiabilidad. Dependerá de la magnitud y variedad de los errores que se detecten en su ejecución. Agrupados en los llamados errores de no observación (de no cobertura, de muestreo y de no respuesta) y de observación o medición, como se verá en el apartado 1.S.
Pese a sus ventajas, la encuesta se enfrenta a una serie de obstáculos que impiden su autosuficiencia como estrategia de investigación: a) Al obtener la información de declaraciones verbales, su empleo no se recomienda en poblaciones con dificultades para la comunicación verbal (niños pequeños, personas analfabetas o con escasos recursos lingüísticos). b) La información que se recoge está condicionada por la formulación de las preguntas y la veracidad de las respuestas dadas por los encuestados. e) La mediación del entrevistador (ett-encuestas mediante entrevista cara a cara y telefónica) puede provocar efectos de carácter reactivo en las respuestas de los entrevistados. Los problemas de reactividad pueden, no obstante, reducirse con un buen diseño del cuestionario, junto con una adecuada selección y formación de los entrevistadores (capítulo S). d) Al predominar, en la investigación social usual, las encuestas transversales (la recogida de información se produce en un único momento en el tiempo) sobre las encuestas panel (o encuestación repetida en una misma muestra en tiempos diferentes), y carecer de un control experimental a priori, pueden confundirse simples correlaciones entre variables con verdaderas relaciones causales. Si bien
30
Métodos de encuesta
Capítulo 1: La encuesta corno estrategia de investigación social
31
esta inexactitud puede, en parte, reducirse mediante el uso de técnicas analíticas multivariables (control a posteriori). e) La realización de una encuesta precisa de la organización de un trabajo de campo (para la recogida de información) complejo y costoso. De manera especial, cuando se abarcan segmentos amplios y espaciados de población mediante entrevista personal o cara a cara.
Años más tarde, Sieber (1973) destaca los beneficios mutuos de dicha integración, tanto en las fases exploratorias de la investigación (la elaboración del marco teórico del estudio, el diseño de la muestra y del cuestionario), como en las de verificación (en la validación e interpretación de los resultados de la encuesta). De las contribuciones del trabajo de campo a la investigación mediante encuesta resaltan las siguientes:
El cuadro 1.1 resume las ventajas e inconvenientes principales de la encuesta como estrategia de investigación social.
a) La estructura te6ric~ que guía el análisis de encuesta puede derivarse, total o plenamente, del trabajO de campo cualitativo. Ello exige que éste preceda (en el diseño de la investigación) a la encuesta. b) Los resultados de la encuesta pueden ser validados mediante el recurso a observaciones y entrevistas informales. De manera especial, cuando los resultados que se obteng~n de la encuesta sean inesperados o sorprendentes; o cuando la encuesta conSIga un bajo porcentaje de respuesta. Para que el trabajo de campo cumpla la función de aclaración de los resultados de la encuesta, ésta ha de precederle en el tiempo. c) L.as relaciones ~stadísticas, obtenidas con la encuesta, pueden interpretarse mediante referencIas a observaciones y entrevistas informales. d) El trabajo de campo también ayuda a la identificación de los sujetos más adecuados para ser encuestados. ~ veces, existen suj~tos especiales cuya existencia se descubre gracias a que pr~vIam:~te se ha ~eahzado un trabajo de campo exploratorio. Ello posibilita su mclUSlOn en el dIseño de la muestra a ser encuestada. e) El trabajo de campo contribuye, igualmente, a la elaboración del cuestionario:
CUADRO 1.1. Ventajas e inconvenientes de la encuesta Ventajas
Inconvenientes
• Permite abarcar un amplio abanico de cuestiones (objetivas y/o subjetivas) en un mismo estudio. • Facilita la comparación de resultados, al basarse en la estandarización y cuantificación de las respuestas. • Los resultados del estudio pueden generalizarse dentro de los límites marcados en el diseño y la ejecución de la investigación. • Posibilita la obtención de una información "significativa", cuando no acontezcan graves errores en su realización. • Ventaja económica: puede conseguirse un volumen importante de información a un relativo mínimo coste económico y temporal.
• No recomendable en poblaciones con dificultades para la comunicación verbal. • La información se restringe a la proporcionada por el individuo (a preguntas generalmente cerradas, con opciones de respuesta previamente fijadas). • La mediación del entrevistador puede provocar efectos reactivos en las respuestas. • La carencia de referencias contextuales y vitales de los encuestados limita la interpretación de los resultados. • Acusa imprecisión para el estudio de la causalidad. • El desarrollo de una encuesta amplia resulta complejo y costoso (principalmente en encuestas cara a cara).
1.3. Articulación de la encuesta con otras estrategias de investigación
Algunos de los límites de la encuesta pueden solventarse con el uso complementario de otras estrategias de investigación. En 1955 Vidich y Shapiro defienden la necesidad de integrar la encuesta con el trabajo de campo cualitativo (observación participante, entrevistas informales y uso de datos disponibles). La encuesta contribuye a la generalización de los hallazgos del trabajo de campo. "Sin los datos de encuesta, el observador sólo puede realizar conjeturas sobre su área de ignorancia'" (Vidich y Shapiro, 1955: 31).
• En la formulación de los ítems (o preguntas) que forman el cuestionario. • Clarificando aquellas preguntas que hayan quedado confusas. , En ESp'.aña, I?áñ:~ (1989) se suma a quienes defienden que ha de hacerse -lo que el llama-: mveStIg~clO.n estructural" (normalmente.algún grupo de discusión) como f~se preVIa a la.r~~aclón .de una encuesta. El objetivo es evitar que la encuesta se conVIerta en la opmlOn de qUIen redacta el cuestionario. La indagaci?n_cualitativa ?rev~a a la encuesta proporciona información, de gran ayuda, pa:~ el dISeno ~~l cuestlOnarlO: qué preguntas incluir y qué lenguaje emplear en su redacclOn para fac!htar la comunicación con la población de estudio. Fuller y colaboradores (1993) anaden otras dos contribuciones del grupo de discusión al diseño del cuestionario: a) Ayuda a la identificación de los conceptos teóricos relevantes. b) Colabora en la formulación de hipótesis.
Pero, también ha de destacarse la gran utilidad de la indagación cualitativa en la interpretación y validación de los resultados de encuesta. Desde su experiencia en la
32
Capítulo 1: La encuesta como estrategia de investigación social
Métodos de encuesta
investigación social comparada, Allardt (1990) defiende que por medio de datos cuantitativos el investigador es capaz de explorar los fenómenos estudiados. Si bien, para que los resultados obtenidos sean más interpretables, es preciso que se efectúen estudios cualitativos, mediante los cuales pueda profundizarse en el tema de estudio. En el mismo sentido se pronunció, con anterioridad, Walker (1988: 22), para quien "la investigación cualitativa más generalmente puede ayudar a interpretar, ilustrar y cualificar las relaciones determinadas estadísticamente". Y ésta viene siendo cada vez más extendida en la investigación sociológica contemporánea en los distintos ámbitos de conocimiento. La comprensión de las relaciones estadísticas entre variables precisa de información más detallada de las experiencias vitales de las personas y de su contexto sociofamiliar. Información no siempre obtenida con la aplicación exclusiva de la encuesta. A la inversa, la encuesta favorece -siguiendo a Sieber (1973)- al trabajo de campo cualitativo: a) Identificando los casos relevantes e irrelevantes para ser posteriormente ana-
lizados mediante indagación cualitativa. b) Demostrando la generalidad de las observaciones de campo.
c) Verificando las interpretaciones de campo. d) Aclarando las observaciones "mal interpretadas" o "inexplicables". Por ejemplo, proporcionando información de informantes o individuos que fueron, previamente, pasados por alto.
33
En general, cuando se conjugan estrategias de investigación que provocan un grado diferente de reactividad, en los sujetos observados, se obtienen mejores resultados, si las estrategias que generan mayor reactividad (caso de la encuesta mediante entrevista cara a cara) se aplican con anterioridad a las "no reactivas" (como el uso de fuentes documentales y estadísticas). • Dividir la muestra en submuestras, o extraer varias muestras, y en cada una de ellas aplicar una técnica diferente de recogida de información. De esta forma puede evitarse el efecto directo de un método sobre otro, al no exponerse a los mismos sujetos a más de un método. Para que no acontezcan sesgos derivados del conocimiento, por parte de los integrantes de una de las muestras, de las experiencias de investigación de las otras muestras (si pueden comunicarse entre ellos), conviene aplicar cada técnica de recogida de información de manera escalonada. O bien, proceder de forma rápida y simultánea en las distintas muestras. El requisito de la independencia no es, por el contrario, imprescindible, cuando la finalidad de la articulación metodológica es exploratoria: una primera aproximación a fenómenos poco conocidos, con el propósito de identificar variables relevantes y, a partir de ellas, extraer hipótesis a comprobar en indagaciones empíricas posteriores. El cuadro 1.2 resume ventajas e inconvenientes de la articulación de la encuesta con otras estrategias de investigación.
1.4. Fases de la encuesta
Asimismo, el uso de datos disponibles también puede contribuir a la mejora de la encuesta. Tanto en las fases previas (en la elaboración del marco teórico y en la operacionalización del problema de estudio), como en las posteriores (en la interpretación de sus resultados). Además, son imprescindibles en los estudios comparativos, tanto transversales como longitudinales. Pese a los grandes beneficios de la articulación de la encuesta con otras estrategias de investigación, ha de insistirse en la exigencia de que: a) Mediante las diversas estrategias se estén midiendo, realmente, los mismos con-
ceptos teóricos, si se quiere comparar sus resultados. b) Se practiquen de forma independiente unas de otras. Cuando la finalidad de la
articulación metodológica es comprobar la validez de los resultados, la clave está en garantizar la independencia en todo el proceso. Para ello es de gran utilidad seguir alguna de las actuaciones recomendadas por Brewer y Hunter (1989):
• Realizar la recogida de datos escalonadamente. De manera que la información que sea más vulnerable a la influencia del investigador, o de los sujetos analizados, sea recabada primero.
Todo proceso de investigación comienza con unalase inicial de formulación del problema de investigación. "No importa en qué problema quieras trabajar y no importa qué método eventualmente vayas a utilizar, tu trab'ajo empírico deberá comenzar con una consideración cuidadosa del problema de investigación" (Simon, 1978: 98). A veces, es la propia entidad o institución que financia la investigación quien propone el problema o tema de estudio. En otras ocasiones, es el propio investigador quien lo sugiere, en respuesta a sus inquietudes intelectuales o a intereses atribuidos a quienes se espera que financien la encuesta. Sea como fuere, la idea o problema de investigación se presenta, al principio, vaga y genérica. El investigador deberá, después, precisarla y configurarla en un diseño de la investigación. Para lo cual tendrá que adentrarse en el campo concreto de conocimiento donde se ubique el problema en cuestión. A tal fin, una actuación exigida es la revisión bibliográfica. Ésta ha de ser exhaustiva, refiriéndose no sólo al tema concreto de estudio, sino también a otros con él relacionados, que puedan orientar en su indagación. Esta revisión de temas relacionados adquiere mayor relevancia, cuando apenas se encuentre bibliografía (teórica y metodológica) específica del tema en cuestión. Ya sea por su carácter novedoso, ya por su escasa repercusión en la trayectoria investigadora precedente.
34
Métodos de encuesta
Capítulo 1: La encuesta como estrategia de investigación social
CUADRO 1.2. Ventajas e inconvenientes de la articulación de la encuesta con otras estrategias de investigación Ventajas
Inconvenientes
• Al cubrir más dimensiones de la realidad social, se consigue una información más profunda y diversificada. • Mejora la configuración del marco teórica de la investigación y su operacionalización (la identificación de conceptos teóricos y su traducción en hipótesis). • Enriquece el diseño del cuestionario: qué preguntas incluir y cómo redactarlas. • Ayuda a la identificación de sujetos de ÍUterés para ser encuestados (diseño de la muestra). • Amplía la interpretación y validación de los datos de encuesta (cuando se llega a los mismos resultados).
• Supone un mayor coste económico y temporal que obtener la información por una única vía. • Mayor dificultad para repetir la investigación. • Precisa de un equipo investigador con formación adecuada en las distintas metodologías. • La aplicación de una técnica de recogida de información anterior puede sesgar los datos que se recaben por otras técnicas posteriores(1). • Problemas de comparabilidad de los resultados, al estar afectados por diferentes fuentes de error (si éstas no han sido debidamente controladas). • La incompatibilidad metodológica de algunos métodos(2).
(1) Bien porque la experiencia alcanzada con el primer método puede llevar al investigador a utilizar el segundo de forma diferente, e inclusive mejor; bien debido a la influencia en los sujetos (a la que ya se ha hecho mención). (2) La principal objeción a la combinación metodológica con frecuencia se expresa en términos de "pertinencia epistemológica". Autores como Blaikie (1991) consideran a ésta la barrera fundamental para integrar formas de conocimiento que él califica "incompatibles".
El propósito de dicha revisión bibliográfica Dankhe (1989) lo resume en uno fundamental: obtener información para, a partir de ella, analizar y discernir si la teoría existente y la investigación previa sugieren una respuesta (aunque sea parcial) a las preguntas de investigación, o una dirección a seguir en su estudio. Más concretamente, la revisión bibliográfica contribuye a: a) La estructuración de la idea originaria del proyecto de investigación. Lo contextualiza en una determinada perspectiva teórica y metodológica. b) Inspirar cómo diseñar la encuesta, considerando la experiencia de otras encuestas similares. Se quiere:
• Prevenir posibles errores cometidos en estudios anteriores.
35
• No ser redundantes. Bien planteando otros interrogantes para cubrir aspectos menos observados; bien tratando el mismo tema, pero dándole un enfoque diferente. Excepto que se quiera realizar un estudio comparativo. Éste precisa de la replicación exacta del estudio anterior, con el cual se pretende comparar los resultados. En todo caso, con la encuesta se desea avanzar en el conocimiento del problema de investigación. • Extraer ideas para el diseño de la muestra y del cuestionario. En el capítulo 4 se insiste en la importancia de revisar encuestas que hayan abordado el tema de estudio, antes de proceder a redactar las preguntas del cuestionario. Además de la exigida revisión bibliográfica, la concreción y estructuración del problema de investigación requiere el complemento de indagaciones exploratorias. Puede consistir en: a) Discutir el tema con amigos, colaboradores o con expertos en dicho tema. Éstos pueden aportar ideas de qué aspectos tratar y cómo llevar a cabo la investigación. b) Entrevistas a algunos de sus protagonistas (aquellos implicados en el problema a investigar). De ellos se busca recabar información que ayude al diseño de la encuesta. Pueden incluso aportar datos discordantes con preconcepciones del ¡ investigador. Los investigadores pueden encontrar que algunas consideraciones que pensaban eran importantes parecen ser irrelevantes a la gente con la que está hablando (Sheatsley, 1983: 203).
Ya se insistió en el apartado 1.3 en la gran aportación de la metodología cualitativa (entrevistas en profundidad, grupos de discusión, observación participante, uso de documentos) en las fases previas de la encuesta. También, en las posteriores. De manera especial, en la configuración del marco teórico, el diseño de la muestra (la identificación de los sujetos más adecuados para ser encuestados) y del cuestionario (la determinación de los conceptos teóricos y los indicadores más relevantes en su medición, y qué presencia tendrán en el cuestionario). Con la indagación exploratoria se busca la familiarización con el problema de investigación y la metodología a aplicar en su análisis. De lo exhaustivo que se sea en esta fase inicial de la investigación depende el buen resultado de la encuesta. Como se irá viendo en los distintos capítulos del libro, muchos de los errores de encuesta pueden obviarse dedicando más tiempo y recursos a esta fase exploratoria inicial, de la que resulta la configuración del marco teórico de la investigación. A veces se partirá de una teoría. Otras veces, se decidirá imbricar el problema de estudio en varias perspectivas teóricas para, de este modo, poder cubrir sus aspectos varios. Máxime cuanto más complejo sea el problema de investigación. Pero, en más ocasiones de las deseables, el marco teórico de la encuesta se fundamenta en genera-
36
Métodos de encuesta
lizaciones empíricas. Es decir, en proposiciones que han sido comprobadas en indagaciones precedentes, si bien no han logrado cristalizar en una perspectiva teórica determinada. En cualquier caso, el marco teórico contribuye a: a) Proporcionar un marco de referencia en la interpretación de los resultados de la investigación. b) Concretar los objetivos de la encuesta. Incluye los generales (que expresan la finalidad principal de la encuesta, lo que se pretende analizar) y los especificas (más concretos, relacionados con cada dimensión del problema de estudio). Es extremadamente importante precisar qué se quiere con la encuesta. Los objetivos han de ser claros, no ambiguos. De esta forma se evitan errores de especificación. Cuanto más claros estén los objetivos del estudio, más fácil será la traducción de conceptos a preguntas concretas y pertinentes en el cuestionario. Además, téngase presente que la adecuación del cuestionario suele medirse en relación con los objetivos de la investigación, junto con las características de la población que se analiza. c) Formular las hipótesis: realizar previsiones a partir de descubrimientos aún no verificados (Lazarsfeld, 1973a). Las hipótesis representan respuestas probables que el investigador avanza a las preguntas iniciales de la investigación. Suelen formularse como proposiciones en las que se afirma o niega la existencia de relación (esperada), al menos entre dos variables, en una situación determinada. Generalmente se recomienda extraer más de una hipótesis para poder abarcar los aspectos varios del objeto de estudio (incluidos en el marco teórico). Además, han de ser concretas y estar relacionadas con los objetivos de la investigación. Las hipótesis contienen conceptos que han de operacionalizarse, traducirse en preguntas concretas en un cuestionario (como se verá en el capítulo 4). También hacen referencia, aunque genérica, a las unidades de observación, contextualizándolas espacial y temporalmente (capítulo 3). Las unidades pueden ser individuales o agregados (hogares, empresas, instituciones). En la encuesta, lo más habitual es el individuo. De él se extrae información sobre sus características personales y de.su entorno sociocultural.
La elección de una población u otra puede tener implicaciones significativas en el contenido de la encuesta y en sus costes (económicos y temporales). Por esta razón, Hakim (1994) recomienda que la población de estudio se establezca en los objetivos de la investigación, porque ésta determina la información a extraer y la naturaleza de los resultados del estudio. La delimitación de la población (jóvenes, amas de casa, jubilados, profesores universitarios) afecta a todo el diseño de la encuesta. Desde la elección del método de encuesta a aplicar, el diseño de la muestra y del cuestionario, hasta la administración del cuestionario. Los días y horas más adecuados para la realización del trabajo de campo. Especialmente, cuando la encuesta es mediante entrevista personal o telefónica.
Capítulo 1: La encuesta como estrategia de investigación social
37
La elección del método de encuesta (mediante entrevista personal, telefónica, por corr~o u otra forma autoadministrada) está afectada por los objetivos de la investigación y la población a estudiar. También, por los recursos económicos y el plazo de tiempo que se disponga para su ejecución. Además de la continuidad que quiera darse a la encuesta. Éstos son los tres elementos clave que marcan cualquier proceso de investigación: a) Los objetivos del estudio. b) Los recursos económicos, humanos, materiales, que la hagan factible. c) El tiempo concedido para su realización.
En la encuesta la conjunción de estos tres elementos determina el·tamaño de la muestra y el procedimiento a seguir en su selección (capítulo 3). Asimismo, en la elección del método de encuesta (capítulo 2), el diseño del cuestionario (capítulo 4), la ejecución y supervisión del trabajo de campo (capítulo 5) y en el análisis de la información (capítulo 6), como refleja la figura 1.1, que resume las fases esenciales de la encuesta. Graves (1989) analiza el coste como una restricción del diseño de la encuesta. Pero, a su vez, considera su efectividad como un componente de la calMad del diseño. En la figura 1.1 puede, asimismo, verse que la elección del método de encuesta se ubica entre los factores que determinan la encuesta. En función de qué método de encuesta se elija, se diseña la muestra y se elabora el cuestionario. De la muestra se exige que sea representativa de la población de interés. Del cuestionario, que se adecue a los objetivos de investigación, a las peculiaridades de la población a encuestar (nivel educativo, conocimiento del tema, interés) y a los conceptos a medir. Éstos han de traducirse en preguntas apropiadas, que sean fáciles de comprender por las personas a quienes van dirigidas. Una vez confeccionado, el cuestionario ha de ser chequeado o pretestado, antes de pasarse a la muestra seleccionada para la encuesta. Se puede pasar a expertos para que evalúen en qué medida el cuestionario se ajusta a los objetivos de investigación y puede considerarse un instrumento "válido" y "fiable" en la medición del problema de estudio. Aunque la opinión "especializada" puede ser de gran ayuda, es imprescindible pretestar el cuestionario en la población a la que está dirigido (amas de casa, jubilados, estudiantes, profesores universitarios). No es necesario que la muestra sea elevada. Normalmente, los pretests se realizan con menos de 100 casos. Tampoco se requiere que éstos se elijan siguiendo procedimientos aleatorios, al no estar dirigidos a la inferencia estadística y generalización de los hallazgos de la indagación. Sólo se precisa que compartan las mismas características de la población de estudio. En el pretest se comprueba la adecuación del cuestionario: la redacción de las preguntas (si éstas son fácilmente comprendidas y provocan las respuestas"esperadas), su disposición conjup.ta en el cuestionario (si la ubicación de las preguntas puede ser causa de alguno de los errores de respuesta), las instrucciones que en él se den o el formato de las preguntas filtro. La finalidad principal es identificar cualquier problema que pue-
38
Capítulo 1: La encuesta como estrategia de investigaci6n social
Métodos de encuesta
1) Formulaci6n del problema: elaboración del marco teórico y definición de los objetivos de la encuesta
J
Consulta a expertos
~I
Indagación exploratoria. cualitativa con sus protagomstas Formulación de hipótesis
~
I
2) Operacionalizaci6n del problema de investigaci6n
I
Operacionalización de conceptos teóricos clave
I
I I
'--
3) Diseño de la encuesta
r--
I~
f) g) h)
Diseño de la muestra
I~
i)
Elaboración del cuestionario
I~
Pretest cuestionario I~
l-.j
4) Administraci6n del cuestionario
r-----
Selección y formación de entrevistadores (encuesta personal y telefónica)
I~
El trabajo de campo: la
I~
I recogida de información
~I
I
Elección método de encuesta
~I
~
Supervisión del trabajo de campo
Objetivos Recursos Plazo temporal
~
Preparación de los cuestionarios para el anális.i~: codificación de las preguntas abiertas, depuraclOn de los cuestionarios, grabación de los datos (excepto en modos informatizados)
It
5) Tratamiento de la informaci6n
a) b) c) d) e)
\
Delimitación de la población de estudio
~I
da afectar al correcto desarrollo de la encuesta. Ya referido a la administración del cuestionario, ya a las peculiaridades de la población que va a responderlo (capítulo 4). Tras su realización, el ínvestigador puede volver a las fases anteriores en el diseño de la encuesta, a su revisión (objetivos, muestra, cuestionario), teniendo presente los resultados del pretest o precomprobación del cuestionario. Además, proporciona información para las fases posteriores (admínistración del cuestionario, codificación, grabación y análisis de los datos). En concreto, del pretest puede extraerse información referida a:
R eVlSlon .., bibliográfica
~I
.1
Análisis de los datos
I
Evaluación de los datos de encuesta Redacción del informe
Figura 1.1. Fases esenciales de la encuesta.
39
...
La redacción del cuestionario. La idoneidad del marco muestral empleado en la investigación. La variabilidad de la población respecto al tema de estudio. La adecuación del método de encuesta elegido para la recogida de información. El porcentaje aproximado de no respuesta que se obtendrá en la encuesta. De especial relevancia en la encuesta por correo. La codificación de las preguntas abiertas del cuestionario. La preparación de los entrevistadores (en encuestas personales y telefónicas). El coste aproximado del trabajo de campo, en términos económicos y temporales (período de tiempo que se precisa para su realización). El plan de análisis.
Concluida la redacción final del cuestionario, procede su administración a la muestra que se ha diseñado para la encuesta. Esta fase de recogida de información,conocida como trabajo de campo, es la más delicada y costosa en el desarrollo de la encuesta. Su coste aumenta dependiendo de la complejidad de la encuesta y de la amplitud y peculiaridades de la muestra a la que se pasa el cuestionario. De mayor relevancia en encuestas cara a cara (mediante entrevista personal). Cuando media la presencia de entrevistadores, previamente ha de procederse a su selección y formación para la encuesta en cuestión. En el capítulo 5 se analiza la influencia en la calidad de la encuesta de la actuación de los entrevistadores, de sus habilidades para localizar, motivar y registrar las respuestas de los encuestados. Además, se exponen distintas estrategias para reducir la no respuesta, de gran relevancia en la calidad de los datos de encuesta. El correcto cumplimiento del trabajo de campo ha de ser supervisado, bien in situ (encuestas telefónicas), bien después de rellenarse los cuestionarios. Con ello se quiere evitar errores que afecten a la calidad de la información recabada. A la supervisión le sigue la fase de edición y de procesamiento de los datos. Se procede al cierre de las preguntas abiertas (si las hubiere), al chequeo y la depuración de los cuestionarios y a su grabación, salvo que se haya empleado un modo informatizado en la recogida de información. El capítulo 2 trata de los distintos métodos de encuesta, destacándose las diferencias entre ellos. Especial referencia se hace a los nuevos métodos informatizados de encuesta. Con la información ya grabada y depurada se procede a su análisis estadístico. Primero exploratorio, mediante gráficos y estadísticos univariables. Le sigue el análisis bi-
40
Métodos de encuesta
variable, generalmente a través de tablas de contingencia o del cruce de los atributos de dos o más variables. A veces se incluyen terceras y cuartas variables, a modo de variables de control. Es deseable que la fase analítica concluya con la aplicación de alguno de los modelos de análisis multivariable, que permita un estudio de las interrelaciones conjuntas entre la serie de variables. En el capítulo 4 se insiste en la importancia de prever qué análisis estadísticos piensan realizarse antes de proceder a redactar las preguntas. Esta previsión facilitará bastante las posibilidades analíticas de los datos de encuesta. De ellos se exige que sean "significativos" desde la vertiente estadística, pero también desde la lógica sustantiva. Han de ser interpretables y tener un significado lógico, que responda a los objetivos e hipótesis principales de la investigación. , La encuesta concluye con la redacción del informe. Este cumple la función de presentación, de comunicación, de la investigación materializada. De él se exige que sea una exposición pormenorizada del estudio, en cada una de sus fases, y del alcance de sus resultados. Su redacción ha de ser objetiva, transparente y lo más fidedigna posible respecto a los contenidos de la investigación:
Capítulo 1: La encuesta como estrategia de investigación social
41
CUADRO 1.3. Errores en el desarrollo de una encuesta Errores de "no observación". No representatividad de la población en la muestra finalmente observada, por errores de:
1. No cobertura ·2. Muestreo 3. No respuesta
Errores de "observación" o medición. Desviaciones de las respuestas obtenidas de los valores "verdaderos", debido a:
1. El método de encuesta. 2. El diseño del cuestionario. 3. La intervención del entrevistador. 4. La actitud del encuestado. 5. El tratamiento de la información.
El informe tiene que dar cuenta del cómo, cuándo y con qué resultados se han cumplido los objetivos del proyecto. Un informe debe explicar los procesos seguidos, las divergencias o cambios en lo proyectado (si los hubiere) y la confirmación o refutación de las hipótesis de partida que dieron lugar al proyecto de investigación (Alvira, 1995: 246-247).
Representa, en suma, la síntesis, la culminación del ejercicio investigador, en forma de documento para su lectura y evaluación. Documento del que se exige que sea "honesto" sobre los hallazgos del estudio y que ofrezca el suficiente detalle que haga posible su replicación. La especificación de los "límites" de la investigación se estima crucial para la interpretación de la información aportada y para su credibilidad. La documentación debería ser tan detallada que un equipo de investigación debería ser capaz de replicar un estudio basado en la documentación oficial (Biemer y Lyberg, 2003: 364).
1.5. Errores en )a aplicación de la encnesta
La calidad de la encuesta y sus posibilidades de inferencia dependen de su diseño y de cómo éste se ejecute en cada una de sus fases. En el apartado 1.1 se reseñó el interés creciente, por parte de los metodólogos de encuesta, en la detección y tratamiento de los errores que en ella pueden darse y que deterioran su calidad. El cuadro 1.3 ofrece una tipología de los distintos errores que pueden surgir en una encuesta. Éstos se agrupan atendiendo a si se deben a "no observación" o si se trata de errores de "observación" o de medición. A continuación se detalla en qué consiste cada tipo de error.
1.5.1. Errores de "no observación"
Propiciados por la no obtención de información de toda la variedad de unidades que componen la población objeto de estudio. Ello afecta a la representatividad de la muestra finalmente observada; es decir, de las unidades de las que se extrae la información. Esta carencia de representatividad de la muestra puede deberse a tres tipos de errores: de no cobertura, de muestreo y de no respuesta. Error de no cobertura
Se refiere a la idoneidad del marco muestral (o listado que incluye a las unidades de la población) utilizado para la selección aleatoria de las unidades muestrales, si cubre a todos los integrantes de la población de interés. La no cobertura surge por la utilización de listados con erróneas inclusiones u omisiones de las unidades de la población. Debido bien a su no actualización (el registrar datos no recientes), bien a la existencia de duplicidades (en especial, cuando el marco muestral es una combinación de una serie de listados), bien a su no correspondencia con el objeto de estudio. Por ejemplo, en una investigación sobre las condiciones de vida de la población mayor en España, el emplear para la extracción de la muestra los listados de usuarios de centros de día y de residencias, públicas y privadas, supondría la existencia de errores de
~y..a.JL"""'"
UNIVERSIDAD
42
Métodos de encuesta
no cobertura cuando se pretendiese analizar al conjunto de la población española mayor
de 65 años. No cuando el estudio se limitase a la población atendida en dichos centros.
La influencia del error de no cobertura (el no haber dado a todos los integrantes de la población la oportunidad de participar en la investigación) en la calidad de la encuesta depende de: a) La proporción de población no cubierta en el marco muestral. b) Las diferencias entre las características de la población cubierta y la no cubierta. En la medida en que los "no incluidos" en el marco muestral presenten características diferentes de los incluidos, las estimaciones de la encuesta estarán sesgadas. Error de muestreo Normalmente éste es el error más medido en la investigación mediante encuesta. Es el aspecto de la calidad de la encuesta examinado a través de estadísticos inferenciales aplicados a resultados de encuesta muestral de los que se obtienen conclusiones sobre diferencias significativas en la población (Dillman, 1991: 227).
Toda encuesta presenta error muestral porque únicamente se extrae información de una parte de la población. A su vez, ésta tan sólo representa una de todas las posibles muestras que pueden extraerse de la misma población. Por lo que siempre habrá alguna divergencia entre los valores obtenidos de la muestra (estimaciones m uestrales) y los correspondientes valores poblacionales (parámetros poblacionales). Su magnitud depende del tamaño de la muestra y de su representatividad. Si todos los integrantes de la población han tenido igual probabilidad de ser seleccionados para la muestra. En el capítulo 3 se analizan los efectos diferenciales, en el error muestral, debidos al tamaño de la muestra, el procedimiento seguido en la elección de las unidades muestrales, la heterogeneidad de la población y el nivel de confianza adoptado en la inferencia de las estimaciones muestrales. Error de "no respuesta" Lamentablemente, este tipo de error también está presente en la generalidad de las encuestas, aunque en distinta magnitud. ·Se debe a que no se ha recabado información de todas las unidades que componen la muestra inicial del estudio. Bien por su no localización, bien por su negativa a participar en la encuesta, en su totalidad o parcialmente (no se responde a algunas de las preguntas del cuestionario). A esto último se llama no respuesta de ítem. Se diferencia entre: a) No respuesta total o de unidad. Supone la exclusión de la unidad de la muestra original en toda la encuesta. No se ha podido establecer contacto con la misma o ésta ha rehusado a participar en la investigación.
ALBERTO HURTADO BIBLIOTECA
Capítulo 1: La encuesta como estrategia de investigación social
43
b) No. respuesta de ítem. La unidad muestral sí participa en la encuesta, pero opnte contestar a algunas de las preguntas del cuestionario. Puede deberse a su desconocimiento sobre el tema que se le pregunta, a la complejidad de la pregunta, al temor o inhibición que le produce dar una respuesta a determinadas cuestiones o, simplemente, porque quiere acabar de rellenar el cuestionario lo más pronto posible y no quiere dedicar tiempo a meditar algunas de las preguntas del cuestionario. El e~ecto de la no respuesta en la calidad de la encuesta depende, igualmente, de la magnItud que represente en la muestra inicial. También, de las características diferenciales e~tre qui.enes r~spo?den y aquellos q~e no lo hacen. De manera especial, cuando sus dIferenCIas estan dIrectamente relaCIonadas con el problema de investigación. La no respuesta de ítem sí es proporcionada en la generalidad de las encuestas (los "no sabe/no contestan"~. No sucede así con la no respuesta total (o de unidad). Son escasas las encuestas que Informan de la proporción y las características de las unidades de la muestra no contactados o que se negaron a participar en el estudio. Esta información es imprescindible en el análisis de la calidad de la encuesta. Afecta a la "representati:idad" de !os datos en ella aportados. En el capítulo 5 se exponen algunas de las actuaCIones habItuales en su reducción y control.
1.5.2. Errores de observación o de medición Conciernen a la adecuación de la información que se ha recabado en la encuesta a su correspondencia con los valores "verdaderos" en la población. Algunos auto;es --como Bradbum, (1983)- emplean el término "errores de respuesta" en referencia a esta va~edad de err~res d~ en~uesta. Otros -Groves (1989), por ejemplo- prefieren, en cambIO, reservar dICho termIno para aludir a errores asociados con el encuestado con el cuestionario o con la actuación del entrevistador. En general, los errores de obs;rvación pueden deberse al método de encuesta aplicado, al diseño del cuestionario la intervención del entrevistador, la actitud del encuestado y el tratamiento de la inforr:zación. Método de encuesta Su p~rtinencia en la c?nsecución de los objetivos de la investigación. En el capítul~ 2 s..e vera que, ante un mIsmo problema de investigación, la aplicación de uno u otro metodo afecta a los resultados de la encuesta. Tanto en su cantidad como en su calidad. No se consigue la mima cantidad y calidad de información cuando el cuestionario se r~sponde, precipitadamente, a la salida del metro o por teléfono (mientras se está reah~ando alguna tarea doméstica ~ de otro orden), que cuando se cumplimenta (por él nnsmo o con ayuda de un entreVIstador) tranquilamente en el domicilio del encuestado por ejemplo. '
44
Métodos de encuesta
Cada método de encuesta presenta unas ventajas y unos inconvenientes. El investigador deberá valorarlos en su decisión de cuál utilizar, consciente de los errores a los que son más vulnerables.
Capítulo 1: La encuesta como estrategia de investigación social
45
errónea comprensión; de su desconocimiento del tema sobre el que se le pregunta; su precipi,tación en la respuesta; o la presencia de errores de memoria, también tratados en el capítulo 4. En él se proponen algunas actuaciones referidas al diseño y la administración del cuestionario, que contribuyen a reducir su incidencia en la encuesta.
Cuestionario Tratamiento de la información
Sudman y Bradburn (1974) destacan el diseño del cuestionario como la principal fuente de error en las estimaciones de encuesta. Fowler y Mangione (1990) lo consideran una vía clave en la minimización de los efectos debido a la entrevista. El formato de la pregunta y de sus opciones de respuesta (en preguntas cerradas), así como su ubicación en el cuestionario, pueden afectar a la respuesta, a su validez. Puede haber errores de especificación, debidos a la no correspondencia de la pregunta con el concepto que trata de medir. Pero, también, pueden darse otros tipos de errores, como el llamado de aquiescencia o tendencia al acuerdo indistintamente del contenido de la pregunta. Esta variedad de error y otros debidos al diseño del cuestionario se analizan en el capítulo 4 donde, además, se dan propuestas para su corrección. Entrevistador
La intervención del entrevistador (cuando la encuesta no es autoadministrada), en la captación de información, puede tener efectos no deseados en la calidad de las respuestas. No sólo afecta su forma de administrar el cuestionario: cómo formula las preguntas, registra las respuestas, sus reacciones ante dificultades que tenga el encuestado para responder (aclaraciones), o su reacción a respuestas que éste pronuncie, y si le concede tiempo suficiente para contestar las preguntas. También, puede influir en la respuesta sus propias características personales, como se verá en el capítulo 5. La introducción de mejoras en el diseño del cuestionario y la estandarización de la actuación del entrevistador se avanzan como posibles remedios para limitar los errores debidos al entrevistador. Encuestado
La actitud del encuestado que, deliberadamente o no, proporciona información incorrecta. La falta de veracidad en su respuesta puede deberse a la imagen que de él mismo quiera proyectar, en busca de aprobación soci.al. El capítulo 4 incluye el sesgo llamado de deseabilidad social y propuestas para evitarlo. Como son el motivar al encuestado a responder con sinceridad, el aleatorizar las respuestas, o el crear las condiciones para que todas las respuestas se perciban como igualmente aceptables. Además, se explicitan varias recomendaciones para la formulación de las preguntas y su disposición en el cuestionario, que ayudan a una mejor captación de lo "latente" y no sólo de lo "manifiesto". La falta de veracidad en la respuesta puede, asimismo, resultar de la incapacidad involuntaria del encuestado para proporcionar información "correcta". Como consecuencia de una mala redacción de la pregunta (confusa, ambigua), que favorece su
Comprende la edición, la codificación de preguntas abiertas, la grabación de los datos en el ordenador, la ponderación y la imputación de respuestas, la tabulación de los datos y su modelado estadístico. Errores que resultan de actuaciones incorrectas por parte de los procesadores y los analistas de datos. El personal que codifica las respuestas puede desviarse de los criterios fijados. También pueden cometerse errores en la grabación de los datos, en el cálculo de los coeficientes de ponderación (que compensan estadísticamente los errores de no observación: de muestreo, de no cobertura, de no respuesta), en la tabulación y demás análisis estadísticos, tratados en el capítulo 6. Todo ello incide en la calidad de la encuesta, en la existencia de errores en las respuestas, con la consiguiente imagen distorsionada de la realidad social que se analiza. En palabras de uno de los autores que más han contribuido al análisis de los errores de encuesta: Las omisiones más importantes son aquellas que surgen de las respuestas a las preguntas de encuesta que han sido obtenidas por los entrevistadores: la codificación, la edición, la imputación y otras actividades del procesamiento de datos que siguen a la fase de recogida de datos (Groves, 1989: 12).
Hasta aquí la reseña de los principales errores que repercuten, negativamente, en la calidad de la encuesta. En los capítulos que siguen se irá desgranando y analizando cada uno de ellos. Para ayudar en su comprensión, cada variedad de error se incluye en el momento del desarrollo de la encuesta'en que puede aparecer, como resultado de incorrecciones en su diseño' y/o en su ejecución. Aunque se comparte una visión conjunt~ d~ la encuesta, de las interrelaciones entre sus distintas fases y entre los errores C?nsIguIentes..Una mala decisión inicial puede tener una repercusión negativa inmedIata en la calldad de la encuesta. También afecta a actuaciones posteriores. Por esta razón se precisa analizar con precisión las repercusiones de decisiones incorrectas que afectan al error total de encuesta.
LECTURAS COMPLEMENTARIA'S Bericat, E. (1998): La integración de los métodos cuantitativos y cualitativos en la investigación social. Ariel Sociología. Madrid. Biemer, E ~ y Lyberg, L. E. (2003): lntroduction to survey quality. John Wiley and Sonso Nueva Jersey.
112
Métodos de encuesta
El error de no cobertura afecta a la "representatividad" de la muestra. Las estimaciones muestrales únicamente serán inferibles a la población incluida en el marco muestra/. En la medida en que ésta coincida con la población de interés, su repercusión en la calidad de los datos de encuesta será menor. De ahí que se insista en la recomendación, ya destacada por Fowler (1988: 22), de Cuando se informen resultados, el investigador debe decir a los lectores a quién se dio y a quién no se dio una oportunidad de ser seleccionado, cómo aquellos omitidos diferían de los otros y si había o no algunas personas muestreadas para quienes las oportunidades de selección no eran conocidas.
Los remedios ante el error de no cobertura inevitablemente exigen tener información sobre el marco de muestreo, en qué medida incluye al conjunto de la población de interés. Para ello se precisa disponer de datos de la población de estudio en su conjunto, aparte de la proporcionada en el marco muestra!. En concreto, las actuaciones comunes son: a) En la definición de la población de estudio, restringirse a aquella incluida en el marco muestral. Porque el·error de no cobertura desaparece cuando ambas po-
blaciones coinciden. Por ejemplo, si en un estudio sobre delincuencia sé piensa únicamente utilizar el listado de personas recluidas en centros penitenciarios, como marco muestral, limitar el ámbito de la encuesta a la población reclusa, en la actualidad y/o en fechas precedentes. Depende de los objetivos de la encuesta. En el caso de que así se procediese, no habría error de no cobertura en la medida en que el listado cumpliese los requisitos anteriormente señalados de comprehensividad, actualización, omisiones e inclusiones erróneas y duplicidades. En cambio, sí habría error de no cobertura, y de gran magnitud, si únicamente se utilizase, como marco muestral, el listado de población reclusa y se quisiese generalizar los resultados de la encuesta al conjunto de la población delincuente. No sólo no describiría a la población delincuente "no oficial", la aún no censada. Ni siquiera al conjunto de la población delincuente oficial. Se excluye a aquellos que, aun habiendo sido detenidos por agentes de control social (policía, guardia civil), no han sido juzgados por tribunales de justicia. Y, si lo han sido, no se les ha aplicado la pena máxima de reclusión en un centro penitenciario.
b) Conocer los criterios seguidos en la elaboración del marco muestral, en la clasificación de las unidades de la población, y la periodicidad en su actualización. El acceso a esta información contribuye a calibrar la incidencia del marco muestral en el error de no cobertura. Por ejemplo, en datos referidos a la población inmigrante, averiguar qué población incluye dicho marco: si se restringe, exclusivamente, a la población con permiso de residencia o, también, abarca a la no regularizada; si los oriundos de otros países de la Unión Europea están incluidos (debido al acuerdo de libertad de fronteras entre los paí-
Capítulo 3: El diseño de la muestra
113
ses miembros); si incorpora a aquellos que acaban de obtener la nacionalidad españo~a, etc. En suma, habría que definir qué se considera inmigrante. Además, adviértase que en el estudio de la población inmigrante, la actualización del marco es un requisito prioritario, al encontrarse esta población más expuesta a ·cambios en su situación, por la propia "transitoriedad" que caracteriza a la experiencia migratoria.
c) Utilizar "conjuntamente" varios marcos de muestreo, cuando se prevea que un único marco no cubre a toda la población de interés. Por ejemplo, si se quiere analizar a la población delincuente oficial, utilizar datos procedentes de la Dirección General de la Policía, de los Tribunales de Justicia y de la Dirección General de Instituciones Penitenciarias.
Cuando se utilicen varios marcos de muestreo combinadamente, es exigida la eliminación de duplicidades, además de los chequeos por inclusiones erróneas. La supresión de duplicidades (unidades de población repetidas) se agiliza bastante si los marcos muestrales están en soporte magnético. Mediante un programa informático se "casan" los datos incluidos en los distintos marcos: nombre, dirección, teléfono, DNI y demás referidos a las unidades de población que incluye cada marco muestral. d) Identificar las ((omisiones" del marco muestral y utilizarlas como variables de cuota en el diseño de la muestra. Para ello se precisa información complementaria, que ayude a calibrar la cobertura del marco. Por ejemplo, para comprobar en qué medida los directorios de los colegios profesionales de sociólogos "cubren" al conjunto de licenciados y doctores en sociología, puede accederse a los registros de las distintas facultades de sociología en España, en un período de tiempo concreto. De la comparación de los distintos listados, podría conocerse la proporción de licenciados que están colegiados. Pero, si además se desea acceder a más información referida a las características diferenciales entre los sociólogos colegiados y aquellos no colegiados, podría extraerse (mediante alguno de los procedimientos aleatorios descritos en el apartado 3.4) una muestra de cada marco muestra!.. A ambas muestras se les pasaría el mismo cuestionario, ya mediante entrevista (personal o telefónica) o por correo. Recuérdese que en encuestas a poblaciones especializadas (como es el colectivo de licenciados en sociología), la encuesta por correo da mejores resultados que cuando ésta se dirige a la población en general. Asimismo, supondría un abaratamiento en los costes económicos de la investigación. Aunque no en los temporales, al precisar de un mayor plazo de tiempo para la ejecución del trabajo de campo que los otros métodos de encuesta. Las respuestas en ambas muestras se compararían, para comprobar si los sociólogos colegiados difieren de los no colegiados. Esta información es clave, si quiere estimarse la incidencia del error de no cobertura en los resultados de la encuesta. En qué medida las estimaciones muestrales obtenidas en la muestra extraída del directorio de sociólo~os colegiados logra representar al conjunto de los sociólogos españoles (si ésta constItuyese la población de interés), y no exclusivamente a los colegiados.
114
Capítulo 3: El diseño de la muestra
Métodos de encuesta
En referencia a la encuesta telefónica, Keeter (1995) propone el uso de "hogares transitorios". Por ellos se entiende aquellos que han experimentado un cambio en su situación de usuario de telefonía fija: o acaban de incorporarse al directorio telefónico (si éste fuese el marco muestral) o han dejado de estar registrados. El acceso a esta población en parte permite conocer las características de los hogares "sin teléfono". Aunque el 57% de los hogares sin teléfono por él analizados eran "transitorios", el mismo autor reconoce que éstos no logran representar, plenamente, al conjunto de los hogares sin teléfono. De todas formas, cuando se quiera extraer información de la población no cubierta en encuestas telefónicas, puede optarse por aplicar, conjuntamente, otros métodos de encuesta (cara a cara e, inclusive, por correo). Por correo, si se dispone de un marco muestral que incluya el nombre y la dirección completa del conjunto de la población. Permitiría conocer la cobertura telefónica y las características diferenciales de la población con y sin teléfono (estén o no registrados en el listín telefónico) en las variables concretas que se analizan. Indudablemente, ello supondría incrementos en los costes de la investigación. Aunque éstos podrían amortizarse, si la información referida a la población no cubierta por el marco muestral pudiese utilizarse en encuestas posteriores, pero próximas en el tiempo. e) Ajustes post-encuesta para compensar "en parte" los errores de no cobertura. Como en el error de no respuesta (subapartado 5.3.2), los efectos del error de no cobertura pueden reducirse mediante la ponderación. Para ello se precisa disponer de información complementaria "actualizada", bien de otras encuestas que incluyan a los "no cubiertos", bien de datos censales. En la medida en que las variables utilizadas en la ponderación estén relacionadas con el problema de investigación y diferencien a la población cubierta de la no cubierta, se conseguirá mejorar las estimaciones muestrales. En caso contrario, no. Habitualmente, las variables más utilizadas en ·la ponderación son las proporcionadas en los registros censales. Preferiblemente, las relativas a estatus social (educación, ocupación, ingresos), edad, género, hábitat, etnia. Si la elegida está relacionada con la variable de estudio, se habrá conseguido reducir la incidencia del error de no cobertura y la obtención de mejores estimaciones. muestrales. Con la ponderación se persigue "equilibrar" la muestra, adecuarla a la población de estudio, "ponderando", es decir, dando un mayor peso a las unidades de población "menos cubiertas" en el marco muestral. Como indica Wert (2000: 208), en referencia a la encuesta telefónica, Si no se introduce un factor ·de equilibrio o una cuota ad hoc, dadas las diferencias de equipamiento.telefónico que se dan en los distintos grupos de estatus, se podría esperar una diferencia resultante en la distribución por estatus de una muestra en encuestas telefónicas en la que la sobrerrepresentación de la clase alta y media-alta fuera de 2·a 3 puntos, la clase media estaría sobrerrepresentada en un punto y la clase media-baja y baja tendría una subrepresentación en la muestra telefónica de entre 3 y 4 puntos.
115
El coeficiente de ponderación resulta de la estimación del peso de la población cubierta en el marco respecto del conjunto de la población de interés, en la variable analizada. Se obtiene dividiendo el porcentaje de la población total entre el porcentaje de la población cubierta, en cada categoría de la variable elegida para la ponderación. Obviamente, la variable seleccionada debe diferenciar a la población cubierta de la no cubierta. Las estimaciones muestrales se multiplicarían por los coeficientes de ponderación respectivos. De la ponderación se habla con más detenimiento en los subapartados 3.4.3 (en referencia a la ponderación de muestras estratificadas no proporcionales) y 5.3.2 (como estrategia para la reducción del error de no respuesta). En este último subapartado se incluyen distintos métodos de ponderación. Éstos son extensibles a los ajustes por no cobertura, sustituyendo la tasa de no respuesta por la de no cobertura, razón por la cual se recomienda su lectura. Aunque se insiste en que estos ajustes "post-encuesta" no logran eliminar los errores de no cobertura, únicamente compensan, y sólo en parte, su efecto en las estimaciones muestrales.
3.3. El tamaño de la muestra
A la elección del marco muestral sigue la determinación de cuántas unidades de la incluir en la muestra. En esta decisión interviene una conjunción de factovarios, que cabe resumir en los seis siguientes:
'IJ'V'~""'A""''''''-'''''''''
a) El tiempo y los recursos disponibles para la realización de la encuesta. b) La modalidad de muestreo seleccionada en orden a alcanzar los objetivos esenciales de la investigación. c) La diversidad de los análisis de datos previstos. d) La varianza o heterogeneidad poblacional. e) El margen de error máximo admisible para la estimación de los parámetros poblacionales. f) El nivel de confianza de las estimaciones muestrales.
tiempo y los recursos disponibles
Sin duda, dos componentes esenciales en cualquier investigación son el tiempo y recursos (económicos, materiales y humanos), concedidos al equipo investigador, la materialización del estudio propuesto. En función de cuánta sea la dotación económica y los plazos temporales para cada fase de la investigación, el tamaño final de la muestra se verá aumentado o mermado. Además, repercute directamente en el método de encuesta finalmente elegido. Disponer de pocos recursos puede llevar a reducir el tamaño de la muestra, a elegir el método de encuesta más económico (la encuesta au-
116
Capítulo 3: El diseño de la muestra
Métodos de encuesta
tocumplimentada con preferencia a la encuesta cara a cara y telefónica, como se vio en el capítulo 2), y a rebajar la dificultad en la selección de las unidades de la muestra. En la encuesta telefónica, por ejemplo, la muestra puede ser más amplia (que en la encuesta cara a cara) y abarcar a distintos grupos de población, al ser su coste menor. Lo mismo sucede en la encuesta por correo (capítulo 2). En encuestas a poblaciones específicas, como profesionales (profesores, sociólogos, médicos, jueces) u organizaciones (universidades, hospitales, empresas), el mayor esfuerzo en su contactación y en el logro de su cooperación suele ir acompañado de una reducción en el tamaño de la muestra. Mayor que cuando la encuesta es a la población en general y si se trata de una encuesta cara a cara. No necesariamente cuando se recurre a la encuesta por correo, que suele alcanzar mayor éxito (medido en porcentaje y cal~dad de las respuestas) en poblaciones con un nivel cultural superior.
117
En el análisis multivariable, la repercusión del tamaño de la muestra en la signide las estimaciones muestrales depende del número de variables incluidas en el análisis. En regresión múltiple, por ejemplo, cuando se aplican procedimientos secuenciales de estimación de parámetros poblacionales, se aconseja que al menos 40 casos por cada variable independiente o predictora (Tabachnick y Fidell, 1989; Cea D'Ancona, 2002a/2004a). En caso contrario, habrá que eliminar variables independientes o proceder a su agrupación para garantizar la debida proporcionalidad de casos por variables. Para análisis bivariables, como el habitual en el análisis de datos de encuesta, de tablas de contingencia (o cruces de variables), también se precisa de un tamaño muestral elevado. Especialmente, si las variables comprenden un número amplio de categorías y se quiere ver la incidencia de terceras y de cuartas variables en la relación entre dos variables. Cuanto más se segmente la muestra, mayor tamaño muestral se precisa para que las estimaciones muestrales satisfagan los criterios de significatividad estadística. ficativid~d
La modalidad de muestreo seleccionada
La elección de uno o varios métodos de muestreo depende, igualmente, de la conjunción de los tres determinantes clave de cualquier proceso de investigación: los objetivos, los recursos y el tiempo disponible para su ejecución. Además, cada método de muestreo conlleva unas exigencias específicas en tamaño y selección de la muestra. En general, los métodos no probabilísticos, no enfocados a la inferencia estadística, se asocian a tamaños muestrales inferiores a los exigidos en los métodos probabilísticos. Estos últimos persiguen la consecución de muestras "representativas", razón por la cual precisan de un mayor tamaño muestral, porque éste incide en un menor error muestral, que afecta a la significatividad estadística de las estimaciones muestrales. En cada agrupación hay variaciones entre las diferentes modalidades de muestreo. Dentro de los muestreos probabilísticos, el aleatorio estratificado precisa de un mayor tamaño muestral que los otros modos. El error muestral es también menor. En los no probabilísticos, el muestreo por cuotas suele ir acompañado de tamaños muestrales mayores que el muestreo estratégico o el llamado bola de nieve. También, por las características de las investigaciones en que suelen aplicarse, no tan enfocadas a la inferencia estadística.
La diversidad de los análisis de datos previstos
Cuando se proyecta cualquier investigación, antes de diseñar la muestra y la estrategia a seguir en la obtención de información, hay que anticipar la variedad de análisis para la consecución de los objetivos de la investigación. Si el equipo de investigación cree de' interés la aplicación de alguna (o varias) técnicas estadísticas multivariables, deberá procurar que la muestra sea aleatoria e incluya un número elevado de casos. Ello contribuye a la reducción de los errores de predicción y al aumento, consiguiente, del poder predictivo del modelo obtenido.
La varianza o heterogeneidad poblacional
Si la muestra pretende ser una representación, a pequeña escala, de la población de estudio, en su tamaño también incidirá la varianza poblacional. Cuanto más heterogénea sea una población, mayor será su varianza poblacional. En consecuencia, se precisará de un mayor tamaño muestral para que cada uno de sus diversos integrantes tengan representación en la muestra. En universos homogéneos, caracterizados por una baja varianza poblacional, se reducen, en cambio, las exigencias en el tamaño de muestra. Se precisan menos casos para representar a la población. El conocimiento de la homogeneidad o heterogeneidad poblacional resulta, por tanto, primordial en la decisión del tamaño muestral. Si bien, no siempre resulta factible. Precisa de la existencia de algún estudio previo sobre esa misma población y aún tenga vigencia. Esta información puede obtenerse de encuestas que se repiten con una cierta periodicidad (los barómetros del Centro de Investigaciones Sociológicas, los eurobarómetros de la Unión Europea, la Encuesta de Población Actidel INE), siempre que ambas poblaciones (la del estudio previo y aquella de la encuesta que se proyecta) coincidan. Quiere decir, que tengan proximidad temporal, abarquen la misma población y traten la misma temática. En caso contrario, las estimaciones de la varianza poblacional en las variables de interés no serán aplicables en cálculo del tamaño muestral. También, puede utilizarse la información proporcionada en el pretest del cuestionario (apartado 4.5) en la estimación de la varianza poblacional. El conocimiento de la varianza poblacional siempre supondrá una reducción del tamaño de la muestra porque, cuando se desconoce, se aplica el supuesto de máxima heterogeneidad del universo. Éste es el supuesto más desfavorable y de práctica habitual en la investigación social. El desconocimiento de la varianza poblacional supone tomar el producto de las probabilidades P (de aparición de un suceso) y Q (que indica
118
Métodos de encuesta
Capítulo 3: El diseño de la muestra
la no ocurrencia del suceso o evento; siendo su valor igual a "1 - P") como equivalente a la varianza poblacional, en igual magnitud. Ambas probabilidades valdrían 0,50. Como puede verse en el cuadro 3.1, ello implica un mayor tamaño muestral (con el consiguiente incremento de los costes de la encuesta), que cuando se parte del conocimiento de los valores reales de dichas proporciones en la población, y éstos se alejan del valor 0,50. Como ilustración, en el cuadro 3.1 se incluyen tamaños muestrales correspondientes a poblaciones infinitas (mayores de 100.000 unidades), al nivel de confianza más empleado (2o-sigma- o unidades z, de desviación típica, que supone una probabilidad de acierto en la estimación de los parámetros poblacionales del 95,5% ), para distintos valores de P y Q (expresados en porcentajes) y limites de error establecidos. En él puede observarse que el tamaño muestral aumenta, conforme los valores de P y Q se aproximan al valor de 50 (que significa máxima heterogeneidad poblacional), indistintamente del margen de error fijado. Por ejemplo, para un margen de error de ±2,5%, el tamaño de la muestra para una población de más de 100.000 unidades es de 576 unidades si P = 10 Y Q =90. Si P YQ fuesen, respectivamente, 30 y 70, la muestra aumentaría más del doble. Exactamente, a 1.344 unidades. Para el supuesto de máxima heterogeneidad (P y Q igual a 50), el tamaño de la muestra sería de 1.600 unidades. Es decir, casi el triple del supuesto inicial de elevada homogeneidad poblacional (P =10 Y Q = 90). Este incremento reduce, no obstante, las posibilidades de errar en la estimación de los parámetros poblacionales para las variables de estudio. Por esta razón se adopta este supuesto de máxima heterogeneidad, siempre que se desconozca el valor de la varianza poblacional en las variables que se analizan.
119
CUADRO 3.1. Tamaño muestral para poblaciones infinitas a un nivel de confianza del 95,5% (2 a) Valores estimados de P y Q (%)
Límites de error (%) para ±2a
0,1 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 5,0
1199
.
10/90
20/80
30/70
40/60
50/50
39.600 1.584 396 176 99 63 44 32 25 16
360.000 14.400 3.600 1.600 900 576 400 294 225 144
640.000 25.600 6.400 2.844 1.600 1.024 711 522 400 256
840.000 33.600 8.400 3.733 2.100 1.344 933 686 525 336
960.000 38.400 9.600 4.267 2.400 1.536 1.067 784 600 384
1.000.000 40.000 10.000 4.444 2.500 1.600 1.111 816 625 400
5
Los tamaños muestrales incluidos en el cuadro 3.1 se han obtenido aplicando la fórmula habitual para el cálculo del tamaño muestral en universos infinitos y a un nivel de confianza de 2o(que implica un 95,5% de probabilidad de acierto en la estimación de
4,5
4
3,5
4PQ
parámetros poblacionales): n = - 2 E Donde E representa el error muestral o error típico. Las fórmulas del tamaño muestral se comentan al final de este apartado.
Error (%)
El margen de error máximo admisible
En el cuadro 3.1 puede también observarse la correspondencia entre el error y el tamaño muestral. Los incrementos en el tamaño de la muestra repercuten en una mayor precisión en la estimación de los parámetros poblacionales, con la consiguiente reducción del error de muestreo. Por el contrario, en muestras pequeñas, el error aumenta, manteniéndose constante la varianza poblacional. La figura 3.1 representa, de forma gráfica, la relación negativa existente entre el error y el tamaño de la muestra. Para su elaboración se han tomado los valores que apa-
Tamaño muestra) (unidades)
Figura 3.1. Representación gráfica de la relación entre las variables error y tamaño muestral para P = Q = 50 Ynivel de confianza del 95,5%.
120
Capítulo 3: El diseño de la muestra
Métodos de encuesta
recen en el cuadro 3.1, correspondientes a la situación más habitual en la práctica investigadora: desconocimiento del valor de la varianza poblacional (P = Q = 50). Como puede observarse, conforme aumenta el tamaño de la muestra, desciende el error muestral. Si el tamaño de la muestra se amplía, por ejemplo, de 816 a 2.500 unidades, el error disminuye del 3,5 al ±2%. También se advierte que a partir del 2% de error se disparan los aumentos en tamaño de la muestra para alcanzar una misma ganancia en reducción del error muestral. Pasar del 2 all % de error supone un incremento de 2.500 a 10.000 unidades en la muestra, con el consiguiente aumento de los costes de la encuesta (económicos y temporales). A cambio, sólo se logra una leve mejora en la precisión de la estimación de los parámetros poblacionales (una unidad porcentual). En consecuencia, el investigador deberá encontrar un punto intermedio entre el tamaño y el error muestral, ante la tendencia observada en muestras grandes a proporcionar mínimos incrementos en adecuación en la estimación de parámetros poblacionales. En los diseños muestrales probabilísticos el error muestral interviene en el cálculo del tamaño de la muestra. El investigador fija a priori el error de las estimaciones de los datos de la encuesta proyectada, sopesando la precisión que desea con los costes que supondría la reducción del error muestral. Errores comprendidos entre ±2,5 y 2% son los más frecuentes en la investigación social. No es deseable errores superiores a ±4 %.
El nivel de confianza de la estimación
Un último elemento que interviene en la decisión del tamaño de la muestra -aunque igualmente sólo en diseños probabilísticos- es el nivel de confianza que el investigador concede a sus estimaciones de los parámetros poblacionales. Como su nombre indica, el nivel de confianza expresa el grado de "confianza" (o de "probabilidad") de que las estimaciones muestrales se ajusten a la realidad. Tres son los niveles de confianza comunes en la investigación social. Corresponden a áreas bajo la curva normal acotadas por distintos valores de desviación típica (denominada sigma (a) en referencia a la desviación poblacional). De ellos el más habitual es 20, que supone un 95,5% de probabilidad de acertar en la estimación muestral. La distribución normal se aplica en estadística inferencial para la estimación de la probabilidad de que un determinado evento acontezca. Representa una curva perfectamente simétrica, en forma de campana, que admite infinitos valores (unidades Z o unidades de desviación típica). El área total bajo la curva normal es 1 (dado que la probabilidad siempre es un valor positivo comprendido entre Oy 1). En función de cuál sea el valor Z variará la probabilidad concedida al evento en cuestión. Si se toma una unidad de desviación típica, la probabilidad de acierto en la estimación es de 68,3% (véase figura 3.2). Con dos unidades de desviación, la probabilidad de acierto se incrementa hasta el 95,5%. La plena seguridad en la estimación (exactamente un 99,7% ) se adquiere si se fijan en tres las unidades de desviación típica. Pero
"-3, -¡a -t
68;%
:t
121
0
+1 +fO
~95,5%~ 99,7%
Figura 3.2. Niveles de probabilidad en el área bajo la curva normal.
no es éste el nivel de confianza usual en la práctica investigadora, sino el 95,5% (equivalente a 20). La pregunta inmediata es ¿por qué? La respuesta se encuentra en el cuadro 3.2. En él se ejemplifica cómo (para una misma varianza poblacional) varía el tamaño de la muestra, dependiendo del nivel de confianza adoptado. Incrementos mínimos en nivel de confianza (del 95,5% de probabilidad de acierto al 99,7%) suponen aumentar la muestra a algo más del doble. Si para un error de ±2% y varianza P = Q = 50, el tamaño de la muestra es de 2.500 unidades, para un nivel de confianza CUADRO 3.2. Tamaño muestral para poblaciones infinitas a un nivel de confianza del 95,5% (20) y 99,7% (30) Valores estimados de P y Q (%)
Límites de error (%)
Nivel de confianza (%)
10/90
20/80
30/70
40/60
50/50
±1,0
95,5 99,7
3.600 8.100
6.400 14.400
8.400 18.900
9.600 21.600
10.000 22.500
±2,0
95,5 99,7
900 2.025
1.600 3.600
2.100 4.725
2.400 5.400
2.500 5.627
±2,5
95,5 99,7
576 1.296
1.024 2.304
1.344 3.024
1.536 3.456
1.600 3.600
±3,0
95,5 99,7
400 900
711 1.600
933 2.100
1.067 2.400
1.111 2.500
±4,0
95,5 99,7
225 506
400 900
525 1.181
600 1.350
625 1.406
122
Métodos de encuesta
Capítulo 3: El diseño de la muestra
de 99,70/0, la muestra pasaría a estar integrada por 5.627 unidades. La ganancia en precisión es ínfima, mientras que los costes de la encuesta (en tiempo y dinero) supondrían más del doble de los presupuestados para un nivel de confianza del 95,50/0. Todos los aspectos referidos participan en el cálculo del tamaño de una muestra probabilística. La fórmula genérica para una muestra aleatoria (simple o sistemática) sería la siguiente, cuando el universo o población estuviese compuesto por más de 100.000 unidades:
123
a) Si la encuesta se realizase en el conjunto de las universidades españolas, para un error máximo de ±2,50/0. Se carece de información previa sobre la varianza poblacional. Para un nivel de confianza del 95,5%, el tamaño de la muestra sería:
z
2pO 2 2 X 50 x 50 . n = -E = = 1.600 unidades 2 2,5 2 Elevar el nivel de confianza al 99,70/0 supondría, como es usual, incrementar el tamaño de la muestra en más del doble. Exactamente a 3.600 unidades.
o
Z2pO
n = -= 2 E
Donde: Z
= valor de la variable aleatoria normal típica en el área bajo la curva nor-
mal. Representa las unidades de desviación típica correspondientes al nivel de confianza elegido (2a o 3a). El nivel de confianza que el in'"""' vestigador tiene en que sus estimaciones se ajusten a la realidad. S2 = varian~a poblacio~al estin:!ada. Equivale al producto de las proporciones p y Q, siendo Q = 1- P (o 100 - p, en términos porcentuales). E = error máximo permitido que el investigador establece a priori. La precisión buscada en .la estimación de los parámetros poblacionales.
b) Si se parte de la predicción (a partir de un sondeo efectuado con anterioridad) de que el 680/0 de los estudiantes son favorables a la reducción de los años de licenciatura, los tamaños muestrales serían 1.393 y 3.133, respectivamente.
Z 2 pQ 2 2 n = -E = 2
n
Si el universo estuviese integrado por 100.000 unidades o menos, se trataría de una población finita. En este caso, habría que introducir un factor de corrección, quedando las fórmulas transformadas de la siguiente manera:
Z 2S2N . E2(N -1) + Z2S2
n=-------
o
siendo N el tamaño de la población. En muestras aleatorias estratificadas y por conglomerados se introducen otras variaciones que se comentarán cuando se describan ambas modalidades de muestreo (subapartados 3.4.3 y 3.4.4).
3 2 x50x50 . 2 = 3.600 unidades 2,S
=
Z2pO
-E · 2
=
x 68 x 32
2,S2
32x 68 x 32 2,5 2
= 1.393 unidades
=
3.133 unidades
El tamaño muestral preciso ha descendido, al tener información previa sobre la "'varianza poblacional en la variable que se analiza. Todo conocimiento sobre varianza poblacional va a conllevar un descenso en tamaño muestral porque su desconocimiento implica calcular el tamaño de la muestra para el supuesto más desfavorable: 'máxima heterogeneidad poblacional. Es decir, P = Q = 50. La mitad de la población co~parte una opinión y la otra mitad la contraria. El descenso será tanto mayor, cuan~o·.más homogénea sea la población. e) Si la encuesta se hiciese en una universidad en la que están matriculados 86.729 alumnos:
n= n=
Z 2P O N 2 2 2
2
~~ =
SO x 50 x 86.724 (2,S2 x 86.723) + (2 2 x 50 x SO)
=
1 571 unidades .
=
2 2 x 68 x 32 x 86.724 (2,5 2 X 86.723) + (2 2 x 68 x 32)
=
1.371 unidades
E (N -1) + Z pQ
Z 2 PON
~~
E 2 (N -1) + Z 2 pQ
..
X
(
d) Si la encuesta se circunscribiera a la facultad de Ciencias Políticas y Sociología, donde están matriculados 5.112 alumnos: Se quiere conocer la opinión de los estudiantes universitarios españoles sobre la reforma universitaria para la convergencia con Europa. Calcular el tamaño de la muestra para los supuestos siguientes:
)
n
=
Z 2 pQN
~ ~ =
E 2 (N -1) + Z 2 pQ
2 2 xSOx50x5.112 . = 1.219 unidades (2,S2 x 5.111) + (2 2 x 50 x 50)
124
Capítulo 3: El diseño de la muestra
Métodos de encuesta
_
Z 2PON
n - e(N -1) + Z 2 pO
_
-
2
2 x 68 x 32 x 5.112 (2,5 2 x5.111) + (2 2 x68 x 32)
=
125
b) La dificultad para estimar el error muestra/. No proporciona medidas de precisión de las estimaciones muestrales. c) La introducción desesgos en el proceso de elección de la muestra. Esto redunda en riesgos superiores de invalidez de los hallazgos de la investigación.
1.095 unidades
En el ejemplo puede constatarse que, cuanto más pequeña es la población de ~stu dio, mayor tamaño muestral se precisa, en proporción, para un mismo nivel de conftanza y error típico (o precisión de la estimación).
3.4. La selección de las unidades de la muestra: métodos de mnestreo probabilísticos y no probabilísticos La representatividad de la muestra no es sólo función de la magnitud de su !a~año (que afecta a los errores de estimación), también está determinada ~or el proced~ento seguido en la selección de las unidades que compondrán la muestra: SI todos los IDlembros de la población tienen la misma probabilidad de ser elegidos para formar la muestra. Los procedimientos a seguir en la selección son varios, como puede verse en el cuadr~ ~.3. ~n mismo diseño muestral puede incluir dos o más métodos de muestreo. Una clasifIcaclOn básica entre los métodos diferencia entre métodos de muestreo probabilísticos y no probabilísticos. Depende de si la selección de las unidades de la muestra se efectúa mediante algún procedimiento aleatorio o se aplican otros criterios diferentes al az~r. . / Los métodos de muestreo probabilísticos se fundament~n en la aleatonzac~o~ como criterio para la selección de las unidades de la muestra. Esta no depende del JUlcio o determinismo humano, sino del "azar". Ello posibilita que: a) Cada unidad de la población del marco muestral tenga la misma probabilidad (conocida a priori) de participar en la muestra. b) La elección de cada unidad sea independiente de las demás. c) El cálculo de la precisión de las estimaciones muestrales (el error muestral) respecto a los parámetros poblacionales pueda hacerse dentro de unos márgen~s de probabilidad específicos. Sólo en las muestras probabilísticas pued~ cuantificarse la proporción del error total de encuesta que se debe a vananza de muestreo. Esto la adecua a propósitos de inferencia estadística: estimación de parámetros y comprobación de hipótesis (pruebas de significatividad).
En los métodos de muestreo no probabilísticos la elección de las unidades de la muestra se realiza, por el contrario, sin que medie el "azar". La conveniencia, el juicio o detenninismo humano, u otros criterios subjetivos, son los que intervienen en el proceso de selección. Ello da cabida a discrecionalidades por parte del equipo investigador y repercute en: a) La desigual probabilidad de las unidades de la población para formar parte de la muestra.
)
En consecuencia, se adecuan a investigaciones no dirigidas a la inferencia esta• dística: a) La indagación exploratoria (estudios piloto, el pretest del cuestionario). b) Estudios cualitativos, más interesados en profundizar en la información aportada que en su representatividad estadística. c) Investigaciones sobre población "marginal" (prostitutas, drogadictos, homosexuales, inmigrantes ilegales e, incluso, miembros menos "marginales" como parejas cohabitantes, por ejemplo), de las que no se dispone de un registro exhaustivo que abarque a toda la población y facilite su localización. Lo cual complica la aplicación de diseños muestrales probabilísticos.
Pese a ello, el muestreo no probabilístico presenta dos ventajas notorias que le hacen atractivo en la práctica investigadora. Una, no precisa de la existencia de un marco muestral, a diferencia de los métodos de muestreo probabilísticos. Dos, su ejecución resulta más sencilla y económica. El cuadro 3.3 incluye la variedad de métodos de muestreo. Aunque hay que precisar que no forman compartimentos estanco. Un mismo diseño muestral puede compaginar diferentes variedades de muestreo en las distintas fases de su desarrollo. La elección de un método u otro depende de la confluencia de cuatro factores básicos: a) La dotación económica de la investigación. b) El período de tiempo programado para su ejecución. c) La existencia de un marco muestral válido que haga factible la selección muestral aleatoria. d) El grado de precisión que el investigador quiere dar a la indagación.
3.4.1. Muestreo aleatorio simple
Constituye el prototipo de muestreo, en referencia al cual se estiman las fórmulas básicas para el cálculo del tamaño y del error de la muestra. Es de fácil realización. Como muestreo probabilístico su ejecución exige la existencia de un marco muestral que cumpla las condiciones expuestas en el apartado 3.2. Ha de ser un marco nominativo, que proporcione información que ayude a contactar a las unidades de la población que sido aleatoriamente elegidas (nombre, dirección, número de teléfono). Además, cada unidad de la población del marco ha de tener un número de identificación y que éste siga un orden consecutivo. En caso de que no figure anexo al marco, el investi-
126
Capítulo 3: El diseño de la muestra
Métodos de encuesta
CUADRO 3.3. Métodos de muestreo Métodos de muestreo probabilístico
1. Muestreo aleatorio simple 2. Muestreo aleatorio sistemático 3. Muestreo aleatorio estratificado • Estratificación proporcional • Estratificación no proporcional: afijación simple, óptima y otras no proporcionales 4. Muestreo aleatorio por conglomerados: monoetápico, bietápico y polietápico 5. Muestreo de áreas y rutas aleatorias 6. Métodos de selección de personas en una misma vivienda • • • •
No selección: primera persona que contesta Método de Kish de selección aleatoria Método de selección de cuota sistemática Método del cumpleaños
127
dades de la población de interés (jóvenes que han dejado de ser estudiantes universitarios o personas mayores que ya no asisten a centros de la tercera edad, por ejemplo), bien porque no se ha podido contactar con ellos, o bien porque han rechazado participar en la encuesta. Si las sustituciones han sido previstas con antelación, no se precisa de nuevo volver al marco muestral y repetir el procedimiento de selección aleatoria de la muestra para las sustituciones. La elección de las unidades de la muestra puede hacerse sin reemplazamiento (cuando cada unidad de la población puede ser elegida sólo una vez) o con reemplazamiento (si participa en elecciones sucesivas). Lo habitual es que el proceso de selección se efectúe sin reemplazamiento. Cuando el marco muestral se halla en soporte magnético, se agiliza bastante el procedimiento de selección aleatoria de la muestra mediante algún programa informático. En este caso, es el programa de ordenador configurado el que ejecuta todas las tareas correspondientes a: a) Numerar consecutivamente a cada uno de los integrantes del marco muestral. b) Generar la serie de números aleatorios. e) Seleccionar e imprimir la lista de las unidades finalmente elegidas para formar la muestra. Aquellas a las que correspondan los números que han surgido al azar.
Métodos de muestreo no probabilístico
1. Muestreo por cuotas 2. Muestreo estratégico o de "juicio" 3. Muestreos circunstanciales: de "voluntarios", "bola de nieve"
gador deberá asignárselo, antes de proceder a la extracción aleatoria de los integrantes de la muestra. Ésta se hará de acuerdo a una serie de números que han sido seleccionados siguiendo algún procedimiento aleatorio. Una tabla de números aleatorios, mediante generación aleatoria de números mediante algún programa informático específico, u otro procedimiento que garantice que: a) Cada unidad de la población tenga la misma probabilidad de participar en la muestra. Esta probabilidad viene determinada por la fracción de muestreo. Se define como el cociente entre el tamaño de la muestra y la población total en el marco muestral. Es decir, n/N. b) La selección muestral sea totalmente aleatoria hasta alcanzar el tamaño muestral fijado. No obstante, se aconseja extraer un número mayor de unidades que las inicialmente prefijadas en el tamaño de la muestra para agilizar la inevitable realización de "sustituciones" de integrantes originales de la muestra. Es totalmente improbable que todas las unidades de la población elegidas para formar la muestra acaben participando en la encuesta. Bien porque han dejado de ser ur-
Si el uso del ordenador no resulta viable, se recurre al procedimiento tradicional: utilizar una tabla de números aleatorios. Estas tablas comprenden múltiples combinaciones de números extraídos al azar (o por sorteo), de forma que cada dígito tiene igual probabilidad de figurar en cualquier punto de la tabla. La actuación, en este caso, sería: a) Elegir aleatoriamente un punto de partida: una columna o una fila cualquiera de la tabla. Puede comenzarse por cualquier lugar y moverse en cualquier direétión (hacia arriba, hacia abajo, a la derecha o a la izquierda). La única condición que se exige es que la elección no responda a un conocimiento previo de la distribución de los números en la tabla. Ello introduciría sesgos en la muestra. b) El número de dígitos extraídos de la tabla ha de corresponder con el número de dígitos de la población contenida en el marco muestral. Por ejemplo, si el marco estuviese compuesto por 10.000 unidades (5 dígitos), habría que n,~erar a cada unidad ~e la población con 5 dígitos: desde el primero (00001) hasta el últ1ll10 (10.000), correlativamente. A continuación, se escogerían números con 5 dígitos, desconsiderándose aquellas cifras que superen la última unidad poblacional numerada en el listado (10.000).
e) La unidad de la población del marco al que pertenezca el número extraído pasará a formar parte de la muestra. Salvo que en el marco no se adjunte información que permita su localización (dirección postal, teléfono).
128
Capítulo 3: El diseño de la muestra
Métodos de encuesta
Supóngase que va a realizarse una encuesta a licenciados en Ciencias Políticas y Sociología. El equipo investigador elige tomar como marco de muestreo el directorio de "colegiados" (en el Ilustre Colegio Nacional de Doctores y Licenciados en Ciencias Políticas y Sociología). A fecha de la investigación hay registrados un total de 6.428 colegiados. Para un margen de error de ±2,5% y un nivel de confianza de 95,5% la muestra estaría integrada por 1.281 colegiados. Si se tomase el número de colegiado como número de identificación, no habría que asignar a cada unidad de la población un número consecutivo. En caso contrario, sí. Para la extracción de las unidades de la muestra puede seguirse el sistema tradicional de una tabla de números aleatorios o el sistema más rápido de generación informatizada de números de forma aleatoria. En cualquier caso los números elegibles han de ser inferiores o iguales al tamaño total de la población del marco. En este ejemplo, todo número igualo menor de 6.428. En una tabla, la extracción de números se comenzaría por una fila o columna de la tabla elegida al azar. En el cuadro 3.A figura un extracto de la tabla de números aleatorios adjunta en el Anexo. Del cuadro se deduce que la decisión tomada ha sido comenzar en la primera columna, escogiendo los cuatro primeros dígitos, continuar hacia abajo hasta el final de la columna, e ir alternando los cuatro primeros con los cuatro últimos dígitos. El procedimiento continúa hasta que, al menos, se alcanza el tamaño de la muestra fijado. Se decide extraer 120 colegiados más para posibles sustituciones de la muestra inicial. Descartando los números superiores a la cifra de 6.428 (número total de colegiados en el marco muestral), los sujetos seleccionados serían aquellos cuyo número de identificación (número de colegiado) se correspondiese con las cifras siguientes: 3.435, 631, 6.211, 4.753,2.485,5.516,6.040,2.820,5.993,3.648,2.479, 1.472,5.565,5.336,4.992,724,4.489, 4.281,4.105, 1.726, así se proseguiría hasta completar al menos el tamaño muestral. La probabilidad de selección de cada unidad de la población en el marco muestral es n 1.281 0,199, al ser la fracción de muestreo = N = 6.428 = 0,199
129
La exigencia de disponer de un listado de la población de interés y que cada unidad de la población del marco esté numerada consecutivamente hace desaconsejable este procedimiento de selección muestral en poblaciones de elevada magnitud. Por ejemplo, sería totalmente impracticable el manejar un listado con todos los hogares de un país, no cuando se trata de un municipio específico y pequeño. La selección aleatoria de las unidades de la muestra se agiliza y es más practicable cuando el marco muestral está en soporte magnético y se sigue un procedimiento informático de generación de números aleatorios. El muestreo aleatorio simple se aplica, preferentemente, en poblaciones pequeñas o circunscritas a un espacio delimitado, no en poblaciones espacialmente desperdigadas, si la encuesta es mediante entrevista cara a cara. Encarecería bastante el trabajo de campo, tanto en tiempo como en dinero. No en los otros métodos de encuesta (telefónica y por correo), que se beneficiarían, por el contrario, de una muestra más heterogénea que en otros métodos de muestreo (como el aleatorio por conglomerados, por ejemplo). Enviar a un entrevistador a una barriada apartada u otro núcleo de población aislada para hacer una o dos entrevistas y, después, desplazarse a otro lugar para realizar otra es impracticable, por el elevado coste que ello supone en tiempo (la razón de número de entrevistas por día será menor) y dinero (desplazamiento, dietas). En cambio, la mayor dispersión de la muestra consiguiente a este método de muestreo no supondrá un coste añadido si la encuesta es telefónica o por correo. Apenas habría variaciones en los costes del trabajo de campo con una muestra dispersa y, por el contrario, se ganaría en representatividad. Cuanto más heterogénea y dispersa sea la muestra, más probable es la consecución de una muestra "representativa": que toda la variedad que forma la población de estudio esté "representada" en la muestra. Las ventajas y los inconvenientes principales del muestreo aleatorio simple se resumen en el cuadro 3.4.
CUADRO 3.4. Ventajas e inconvenientes del muestreo aleatorio simple
Ventajas
Inconvenientes
• Facilidad de los cálculos estadísticos. • Elevada probabilidad de lograr equiparabilidad entre las características de la muestra y las correspondientes a la población. • Consecución de una muestra autoponderada (igual probabilidad de selección de cada unidad de la población del marco muestral).
• Requiere listar y enumerar consecutivamente a las unidades de la población del marco muestral. • En muestras y poblaciones de considerable magnitud resulta un método de selección muestral monótono y arduo. Especialmente, cuando se emplean procedimientos manuales, no informatizados. • La dispersión alcanzada en la muestra repercute negativamente en los costes de la investigación en encuestas mediante entrevista personal.
CUADRO 3.A. Extracto de una tabla de números aleatorios
96754 34357 06318 6211 1 47534
17676 86040 37403 52820 09243
55659 53364 49927 07243 67879
44105 71726 57715 79931 00544
47361 45690 50423 89292 23410
34833 66334 67372 84767 12740
98614 24856 96887 90801 55165
75993 03648 12479 21472 77312
84460 44898 80621 42815 83666
62846 09351 66223 77408 36028
59844 98795 86085 3739 O 28420
14922 18644 78285 76766 70219
)
130
Capítulo 3: El diseño de la muestra
Métodos de encuesta
3.4.2. Muestreo aleatorio sistemático Una variedad de muestreo probabilístico con frecuencia descrito como "muestreo aleatorio pseudosimple" (Sudman, 1983: 170). Pero, siempre y cuando el marco muestral esté aleatoriamente ordenado. Otros autores prefieren considerarlo "una forma de muestreo por conglomerados" (Lohr, 2000: 43), aunque matizando "desde el punto de vista tecnológico". Esta consideración responde a la imposibilidad de que dos unidades del marco muestral consecutivas sean extraídas para constituir la muestra. Excepto, lógicamente, que el coeficiente de elevación fuese "1". Lo cual es bastante improbable. Pero, ¿en qué consiste el muestreo aleatorio sistemático? ¿Qué diferencias y similitudes tiene con otros métodos de muestreo? Como el muestreo aleatorio simple, el sistemático exige la existencia de un marco muestral nominativo, que incluya datos de identificación que posibiliten la contactación de las unidades de población que aleatoriamente han sido elegidas para integrar la muestra. Aunque no precisa que éste sea un listado, ni que esté numerado. Pueden ser fichas de alumnos, papeletas, expedientes de pacientes, incluso la propia presencia física de unidades de la población (por ejemplo, personas que salen de una discoteca, bajan de un avión o entran en un centro comercial). Del muestreo aleatorio simple difiere en el procedimiento seguido en la extracción de la muestra. Sólo la primera unidad de la muestra se elige al azar. Mediante una tabla de números aleatorios, por sorteo, pidiendo a alguien que diga al azar un número o cualquier otro procedimiento que garantice la igual probabilidad de selección de los números incluidos en el coeficiente de elevación. Una vez calculado el tamaño de la muestra, para unos niveles de probabilidad y de error determinados, se procede a la estimación del coeficiente de elevación. Se divide el tamaño de la población en el marco muestral entre el tamaño de la muestra (N / n). De esta forma se secciona el marco en distintas agrupaciones, dependiendo del tamaño muestral, para que todas sus unidades tengan igual probabilidad de ser seleccionadas, desde el inicio hasta el final del marco muestral. El coeficiente de elevación expresa el número de veces que la muestra se halla contenida en la población del marco muestral. El número aleatoriamente elegido, con la única condición de que sea inferior al coeficiente de elevación, determina la elección de los siguientes. A él se va sumando, sucesivamente, el coeficiente de elevación hasta completar el tamaño de la muestra. Para agilizar el trabajo de campo, se recomienda extraer un "excedente" de unidades muestrales para las sustituciones (de aquellos a quienes no ha podido contactarse o han rechazado participar en la encuesta). Este excedente se consideraría previo a la extracción de la muestra, en la estimación del coeficiente de elevación. Ello evitaría I!e.ner que "volver" al marco muestral para buscar sustitutos a los no respondientes. ~n caso contrario, habría que repetir, de nuevo, el proceso para la selección de los susti~ tutos, garantizando su elección aleatoria. Es decir, habrá que calcular un nuevo coeficiente de elevación. A ser posible, considerando sólo las unidades de la población en el marco no seleccionadas en la fase inicial de extracción de la muestra (muestreo aleatorio sin reemplazamiento). Éstos se dividirán entre el número total de unidades que
131
aún se precisan para completar la muestra. En consecuencia, la nueva selección sistemática de unidades muestrales para "sustituir" a los no respondientes se restringirá a aquellos que queden para ser elegidos. Por esta razón, habría que eliminar del marco muestral a los ya contactados, antes de repetir el proceso de selección.
~i la selec.ci.ón de licenciados en Ciencias Políticas y Sociología colegiados, del ejemplo antenor, se hiCiese de forma aleatoria sistemática, en principio la actuación sería la siguiente:
a) Se calcula el intervalo de selección, determinado por el coeficiente de elevación = N 6.428 = 1.281 = 5,018. El marco quedaría seccionado en 1.281 conglomerados de
n
5 unidades (por el efecto del redondeo quedarían 23 unidades). b) Mediante un procedimiento aleatorio se elige un número igualo inferior a "5". Por ejemplo, el "~" ..L~ unid~d de la población en el marco a la que corresponda dicho número constltUlra la pnmera unidad elegida para formar la muestra. e) La extracción de las 1.280 unidades de la muestra restantes se hará sumando "siste~áticament~" el coeficiente de elevación a los números elegidos a partir del primer numero extr~ldo al azar. AI41e seguiría el 9, 14, 19,24,29,34,39, hasta completar las 1.281 u~ldades de la muestra. En consecuencia, se estaría eligiendo 1 unidad cada 5, a part~r del arranque aleatorio marcado por el número 4. O sea, todos los números terminados en 4 y en 9.
Para que .la m~~s,tra extraída. se asemeje a una muestra aleatoria simple es condique la dlSposlclOn de las umdades de población en el marco muestral sea "alea. Es decir, que su orden no siga un criterio que pueda estar relacionado con el probJlerrla de investigación. . Por eje~plo, en un l~stado de alu~nos se descartaría su ordenamiento por calificación ~edla en el ex~~dlente ~~adémlco porque no es aleatoria. Sí se aceptaría, por el c.ontrar~o: su ordenaclOn alfabetica, por el primer apellido, u otro criterio como los úl~~os dlg1~OS ~e su DN.I (D~cumento Nacional de Identificación). Cualquiera de estos ultImos cntenos permite eliminar la introducción de sesgos debidos a la periodicidad constante marcada por el coeficiente de elevación.
Las ventajas y los inconvenientes principales del muestreo aleatorio sistemático se en el cuadro 3.5.
re~;unlen
132
Capítulo 3: El diseño de la muestra
Métodos de encuesta
CUADRO 3.5. Ventajas e inconvenientes del muestreo aleatorio sistemático Inconvenientes
Ventajas o
o
Fácil aplicación. No precisa del uso continuo de una tabla de números aleatorios u otro procedimiento de asignación aleatoria. No exige que el marco muestral sea un listado. El marco puede adoptar formas varias: fichas, papeletas, expedientes, incluso la presencia física de unidades de la población.
o o
Necesita del recuento constante de las unidades de la población. Antes de la selección muestral, hay que desordenar el marco muestral (si éste se encuentra ordenado de acuerdo con algún criterio que favorezca la mayor representación de determinados segmentos de la población en la muestra).
3.4.3. Muestreo aleatorio estratificado Un método de muestreo probabilístico muy aplicado cuando se dispone de información sobre características de la población de interés. Consiste en la clasificación de la población del marco muestral en grupos o "estratos" mutuamente excluyentes (que son internamente homogéneos y diferentes de los otros grupos), con respecto a las características registradas en el marco muestral. Con ello se persiguen tres metas principales: a) Garantizar la presencia en la muestra de determinados grupos de población que, por su menor representación en la población, tienen escasa probabilidad de ser elegidos para formar la muestra por otros procedimientos aleatorios (simple, sistemático u otros). Y, en cambio, su estudio es de interés. Por ejemplo, en una encuesta sobre la calidad de la enseñanza universitaria, si no se clasifica previamente a la población por universidades, facultades y/o curso académico, en función del ámbito de estudio, no se asegura que los grupos de población menos numerosos (alumnos de universidades, de facultades o de cursos con un menor número de alumnos, como son los de doctorado) tengan suficiente presencia en la muestra, que posibilite su análisis separado. Y es objetivo de la encuesta el captar el estado de opinión de los distintos grupos de población afectados, no limitándose a aquellos que, por contar con un mayor volumen de población, tienen más probabilidad de ser elegidos en la muestra.
b) Poder aplicar diferentes métodos aleatorios para la selección de la muestra e, inclusive, métodos de encuesta, en los distintos grupos de población, dependiendo de la dificultad para su contactación.
133
c) La consecución de estimaciones de parámetros poblacionales más precisas en los distintos grupos de población, al reducirse su variabilidad. Siempre que se consigan grupos (o estratos) internamente muy homogéneos y diferentes de los otros grupos, en variables clave en la explicación del problema de investigación. De no ser así, se obtendrán estimaciones de similar precisión a la alcanzada sin proceder a la estratificación. La efectividad de la estratificación (medida en reducción del error muestra!) depende de cómo afecte la variable elegida para la estratificación al fenómeno que se estudia. Y, cuando se utilice más de una variable para la estratificación, es mejor que sean variables poco correlacionadas entre sí para conseguir grupos heterogéneos unos respecto de otros. Es condición que los estratos se formen de acuerdo con variables que se prevé afecten a la varianza de las variables cuya variabilidad quiere analizarse. Por ejemplo, por curso académico, si se espera que la opinión sobre la calidad de la enseñanza universitaria varía en función de los años cursados en la universidad. La estratificación por conveniencia de variables no relacionadas con el problema de investigación no contribuye, por el contrario, a la obtención de estimaciones de parámetros poblacionales más precisas porque su error muestral sea pequeño. Como la elección de las variables de estratificación está condicionada a aquellas incluidas en el marco muestral, las de uso más común son las variables sexo y edad. Éstas son las más presentes en la mayoría de los marcos muestrales. A ellas se suman otras variables sociodemográficas (como ocupación o estudios), cuando están presentes en el marco muestral. En estudios de ámbito nacional e internacional, primero se procede a la estratificación por ubicación geográfica: ámbito territorial (país, comunidad autónoma, provincia, municipio), tipo de hábitat (urbano, semiurbano, rural) o tamaño de hábitat (número de habitantes). Después, se realizan otras estratificaciones, en función de los objetivos de la encuesta y de la información proporcionada en los marcos muestrales que se utilicen para la extracción de la muestra. De acuerdo con Lynn y Lievesley (1991), para la mayoría de los objetivos de investigación no se precisa diferenciar tres o cuatro estadios o fases de estratificación. Tampoco se requiere la adopción de las mismas variables de estratificación para todas las muestras. Puede alcanzarse una mayor eficacia siguiendo un esquema de estratificación distinto para las variables incluidas en los diversos estadios de estratificación. De haber distintas fases en la estratificación, el orden de las variables dependerá de su relevancia en la explicación del problema de investigación. Como la primera variable de estratificación es la que más discrimina, en la primera fase de la estratificación ha de elegirse la variable de mayor relevancia. En la segunda fase, la segunda más importante y, así, consecutivamente, debido al poder decreciente de la estratificación. Las variables elegidas han de ser categóricas. En caso contrario, habrá que proceder a su categorización. Una vez clasificada la población en estratos, se afija la muestra en cada estrato. Por afijación se entiende la distribución del tamaño muestral global entre los estratos diferenciados. Existen distintas formas de realizar dicha distribución. Éstas se agrupan en dos amplias modalidades de estratificación: proporcional y no proporcional.
134
Métodos de encuesta Capítulo 3: El diseño de la muestra
Estratificación proporcional
Para la afijación simple se divide el tamaño total de la muestra entre el número de estratos. La cantidad obtenida expresará las unidades a observar en cada estrato.
Como su nombre indica, la afijación o distribución de la muestra se hace "proporcional" al peso relativo del estrato en el conjunto de la población. De modo que, a aquellos estratos que reúnan un mayor número de unidades de población les corresponderá un tamaño muestral superior al de aquellos que representen un porcentaje inferior. Por lo que la distribución de la muestra entre los estratos guarda correspondencia con el peso o representación de éstos en la población de estudio. Éste es el criterio de afijación más aplicado en la investigación mediante encuesta. Para su cálculo se multiplica la proporción que representa el estrato en la población por el tamaño de la muestra a afijar.
• Afijaci~n óptima. En la distribución de la muestra se considera, además del peso relativo deJ estrato en la población, su variabilidad (o heterogeneidad) respecto a la variable utilizada para la estratificación. De modo que, a los estratos de mayor peso poblacional y heterogeneidad les corresponderá un tamaño muestral superior al de aquellos más homogéneos y de menor volumen de población. Por ejemplo, la consideración de las zonas rurales como más homogéneas que las urbanas lleva al lNE (Instituto Nacional de Estadística) a "cargar" la mu~str~ ~n esta~ últimas, como indica Rodríguez Osuna (1991: 28). Su reahzaclOn preCisa del conocimiento previo de la varianza poblacional, respecto de las variables empleadas para la estratificación, en cada estrato. Esta información es difícil de conocer (los marcos muestrales no la proporcionan). A ~en?s que se haya analizado, con anterioridad, a la misma población (en un estudiO piloto ex profeso o en investigaciones periódicas). Esto explica su escasa práctica, pese a su consideración de "óptima". Sobre todo, cuando los estratos presentan distinta varianza. En caso contrario, se obtendría una distribución de la muestra similar a la proporcional. Para su cálculo se multiplica, en cada estrato, la proporción (o el porcentaje) q~e ~~pr~s~nta el estrato e.n el conjunto de la población por la varianza (o la desVlaClOn tlplca) ~orrespondiente. Después, se suman todos los productos y se calcula la proporCión que representa cada producto en el total. A continuación, cada una de estas proporciones se multiplica por la muestra a afijar. De este producto resulta el número de unidades de la población a observar en cada estrato. • Otr,a varie.dad de affjación ~o proporcional es aquella que se aplica cuando, por algun motivo, se qUiere realIZar un número determinado de entrevistas en un estrato concreto y el resto se afija "proporcionalmente" en los otros estratos. Aunque el tamaño muestral restante se distribuya en los demás estratos de acuerdo a su proporcionalidad, la distribución del conjunto de la muestra en los estratos ha ~lterado ~u debida proporcionalidad en el conjunto de la población (como se vera en el ejemplo de la ponderación).
Estratificación no proporcional
La que se hace, cuando la representación de los estratos en la muestra global no es proporcional a su peso en el conjunto de la población. Por el contrario, se ha dado una probabilidad desigual de selección en cada estrato. Bien porque se quiere analizar, con un mayor detalle, unos estratos concretos a los que proporcionalmente les correspondía un tamaño muestral inferior, bien para propiciar la representatividad de estimaciones muestrales en todos los estratos, o bien porque se considera la variabilidad en cada estrato, aparte de su peso en el conjunto de la población, entre otras causas. Las principales opciones de estratificación no proporcional son: • Afijación simple. Consiste en asignar el mismo tamaño muestral a cada estrato, indistintamente del peso que tenga en la población de estudio. La finalidad es que todos los estratos tengan la misma representación en la muestra, que posibilite la consecución de estimaciones muestrales igualmente significativas en cada uno de los estratos. Esta equidistribución del tamaño de la muestra conlleva, no obstante, un inconveniente importante: favorece a los estratos de menor volumen de población en menoscabo de aquellos de mayor magnitud. Se les adjudica un tamaño muestral superior al que les correspondería por su volumen de población. Para análisis por separado de cada estrato, esta mayor asignación de tamaño muestral contribuye al logro de estimaciones muestrales estadísticamente significativas en estratos que, por su menor presencia en la población, no la tendrían, si la muestra hubiese sido distribuida de forma proporcional a su peso real en la población. Pero, para el análisis conjunto de los estratos, habría que proceder a la previa ponderación de la muestra, para devolverla su debida proporcionalidad, como después se verá. En todos los estratos se ha administrado el mismo número de cuestionarios, cuando a unos les hubiese correspondido más y a otros menos, en función de su peso en la población.
135
..
. En la .Faculta~ de Ciencias Políticas y Sociología de la Universidad Complutense de Madnd se ~U1ere ~eahza.r una encuesta ~ara conocer el grado de satisfacción de los alumnos por en.s~nanza Impartida. Para garantizar que en la muestra estén representados alumnos de distintos cursos académicos, incluidos los alumnos de doctorado, se decide estratificar la
Capítulo 3: El diseño de la muestra
137
136· Métodos de encuesta población por curso. En un estudio previo se obtuvo que el 57% de los 5.014 al.umno.~ matriculados estaban satisfechos por la enseñanza recibida. Si bien, el grado de satlsfacclon se reducía al 41% entre los alumnos de primer curso y aumentaba hasta el 72% entre los de quinto curso. Para un error máximo de ±2% y un nivel de confianza del 95,5%, se obtiene un tamaño muestral de 1.646 alumnos a entrevistar. Su distribución en los estratos, de acuerdo con los tres criterios principales de afijación (simple, proporcional y óptima) se da en el cua-
dro 3.B.
Z 2PON - E 2 (N -1) + Z 2 pO
n_
2
=
(2
2
2
x 57 x 43 x 5.014 5.013) + (2 2 x 57 x 43)
x
=
1.646 unidades
Afijación óptima:
(A)
(B)
(C)
(D)
(E)
Porcentaje Población
Varianza
(A) x(B)
Proporción (C)
Afijación óptima
18,0 15,8 17,8 15,3 26,3 6,8 100,0
(O) x 1.646
.
2.419 2.499 2.139 2.275 2.016 2.449
43.542,0 39.484,2 38.074,2 34.807,5 53.020,8 16.653,2
0,193 0,175 0,169 0,154 0,235 0,074
317,68 288,05 278,17 253,48 386,81 121,80
2.451
225.581,9
1,000
1.645,99
CUADRO 3.B. Distribución de la muestra en estratos Afijación Curso
Varianza
Población
Simple
Proporcional
Óptima
Primero Segundo Tercero Cuarto Quinto Doctorado
903 792 891 769 1.316 343
2.419 2.499 2.139 2.275 2.016 2.449
274 274 274 274 274 274
296 260 293 252 433 112
318 288 278 253 387 122
Total
5.014
2.451
1.644
1.646
1.646
Afijación simple:
1.~46
Afijación proporcional:
=
274,33 unidades en cada estrato
0,180 0,158 0,178 0,153 0,263 0,068
x x x x x x
1.646 = 296,28 1.646 = 260,07 1.646 = 292,99 1.646 = 251,84 1.646 = 432,90 1.646 = 111,93
Si se considera la proporción que representa cada estrato, en el conjunto de la población la encuesta se hará a más alumnos matriculados en quinto curso (a 433 alumnos elegido~ aleatoriamente) y a menos de doctorado (112 alumnos). Estos últimos representan tan sólo el 6,8% de los alumnos inscritos en dicha facultad, mientras que el 26,3% son de quinto curso.
De acuerdo con la afijación óptima, también habría que encuestar a más alumnos de quinto curso, aunque en menor cuantía que si la afijación es proporcional. Exactamente, a 387 alumnos, que serán elegidos aleatoriamente de entre los matriculados en dicho curso académico. Ello se debe a que es el estrato de mayor volumen de alumnos matriculados en la facultad (el 26,3% de los 5.014 alumnos inscritos). Aunque su presencia en la muestra se reduce, respecto a la estratificación proporcional (de 433 pasa a 387 unidades muestrales), por ser el estrato de mayor homogeneidad de los diferenciados atendiendo a la variable de clasificación elegida: curso académico. Es decir, el de menor varianza poblacional (2.016). Por el contrario, aumenta la presencia en la muestra de los estratos más heterogéneos. Éstos obtienen una mayor presencia en la muestra que los estratos más homogéneos. Tanto más, cuanto mayor es la conjunción de heterogeneidad y proporción que representa en el conjunto de los alumnos de dicha facultad. De todas formas, compárense las cifras obtenidas con los tres tipos de afijación expuestas en el cuadro 3.B.
Cuando se realiza una estratificación no proporcional y se quieren estimaciones para el conjunto de la población (no para los estratos por separado), previamente ha de procederse a la ponderación de la muestra. Quiere esto decir, que ha de devolverse a la muestra final su debida proporcionalidad en el conjunto de la población; que su presencia sea acorde con su peso en la población total. Por el contrario, no se precisa de la ponderación, cuando sólo se realizan análisis individuales (de cada estrato por separado) o comparativo (de unos estratos respecto de otros). Por ponderación comúnmente se entiende el proceso de asignación de "pesos" a cada estrato de manera que logre compensar la desigual probabilidad de selección que, con la estratificación no proporcional, se ha dado a cada unidad de la población que compone el estrato. Mediante ella se quieren corregir las discrepancias entre la muestra y la población. Para ello se divide el porcentaje o proporción que representa el estrato en la población (de acuerdo con los datos censales tomados de referencia) entre el porcentaje o proporción que representa en la muestra, obteniéndose los "pesos" o coeficientes de ponderación. Éstos se multiplicarán por cada estimación muestral de los
138
Métodos de encuesta
estratos correspondientes para la obtención de estimaciones en la muestra en su conjunto. Para ello se sumarán los productos del coeficiente de ponderación por la estimación muestral en cada estrato, dividiéndose la suma total de los productos por el tamaño total de la muestra. En los ficheros de datos de la mayoría de los paquetes estadísticos se fijan los pesos a asignar a cada estrato o subconjunto de la población. El programa automáticamente cumplimentará la ponderación, antes de proceder a la tabulación conjunta y posterior análisis de la información obtenida. En la muestra "real", no en la ponderada, será en la que después se calculen los errores de muestreo y la consiguiente precisión de las estimaciones muestrales, como se verá en el apartado 3.5.
Para ilustrar el cálculo de los coeficientes de ponderación, se plantea el supuesto de una estratificación no proporcional consistente en afijar una porción determinada de la muestra total en un estrato concreto. El resto de la muestra se asignaría de forma proporcional entre los demás estratos. En el ejemplo anterior se decide incrementar la presencia en la muestra de los alumnos de doctorado para tener una base muestral mayor que contribuya a la significatividad de las estimaciones muestrales. En vez de seleccionar a 112 estudiantes de doctorado, como habría que hacer siguiendo la afijación proporcional, se opta por incrementar las unidades de la muestra en este estrato a 200. Las 1.446 unidades de la muestra restantes se distribuirán entre los cinco estratos que quedan de forma proporcional a su peso en el conjunto de la población, excluyendo a los alumnos de doctorado. Ello supondrá una dismihución del número de entrevistas a realizar en estos cinco estratos, al haberse aumentado la presencia en el total de la muestra de los alumnos de doctorado, como puede verse en el cuadro 3.C. Para análisis segmentados de los alumnos de cada curso académico no se precisa de la ponderación. Sí para dar estimaciones muestrales para la población en su conjunto. Exige "equilibrar" la muestra, devolverle su debida proporcionalidad, de acuerdo con la proporción "real" que representa cada estrato diferenciado en el conjunto de la población, antes de proceder al análisis conjunto de la muestra. Los coeficientes de ponderación se calculan dividiendo el porcentaje que representa cada estrato en la población entre el porcentaje que representa en la muestra extraída de forma no proporcional (al haberse asignado un mayor número de entrevistas en el sexto estrato que las debidas por su peso "real" en la población total). Como en el último estrato las unidades de la muestra son 200, en vez de 112 que le hubiese correspondido por representar sólo el 6,84% de los alumnos matriculados en dicha facultad, el coeficiente de ponderación es inferior a "1". Exactamente, 0,563 porque el número de unidades de la muestra, en dicho estrato, se tia casi duplicado. Lo que ha supuesto una reducción de la presencia en la muestra final de los cinco estratos restantes. Por esta ra-
Capítulo 3: El diseño de la muestra
139
CUADRO 3.C. Cálculo de los coeficientes de ponderación en una muestra estratificada no proporcionalmente
Curso
Población
.
(A) Porcentaje población
(B)
Afijación no Afijación proporcional proporcional'
Coeficiente Porcentaje ponderación muestra no (AlB) proporcional
Primero Segundo Tercero Cuarto Quinto Doctorado
903 792 891 769 1.316 343
18,01 15,80 17,77 15,34 26,25 6,84
296 260 293 252 433 112
280 245 276 238 407 200
17,01 14,88 16,77 14,46 24,73 12,15
Total
5.014
100,01
1.646
1.646
100,00
1,059 1,062 1,060 1,061 1,061 0,563
• Afijación no proporcional consistente en extraer 200 unidades de la muestra ent~e los alumnos d.e doctorado. Las 1.446 unidades de la muestra restantes se distribuyen de forma proporcional entre los CinCO estratos. Para ello se calcula, de nuevo, la proporción que representa cada uno de los cinco estratos rest~ntes en el conjunto de los alumnos, excluidos los de doctorado. Es decir, entre los 4.671 alumnos de los cinco cursos de licenciatura. La proporción así obtenida (por ejemplo, 903/4.671 =0,1933 Y 792/4.671 = 0,1696, etc.) se multiplica por la muestra que queda por afijar en estos cinco estratos: 1.446. Por ejemplo, 0,1933 x 1.446 = 280 Y 0,1696 x 1.446 = 245. En su conjunto es una afijación no proporcional po~que se ~a alterado el ~~ so real de cada estrato en la población total de interés. Los alumnos de doctorado tienen mas representaclon en la muestra que la correspondiente a su peso en el conjunto de la población y ello ha supuesto una reducción de la muestra en los cinco estratos restantes.
zón sus coeficientes de ponderación son mayores de "1". Tanto más, cuantas menos unidades de la muestra se les ha asignado en relación con aquellas que debería habérseles asignado mediante una estratificación proporcional. Los coeficientes de ponderación también deberían calcularse con otros modos de estratificación no proporcional: la afijación simple y la óptima. El proceso habría sido el mismo. La división entre el porcentaje de la población real entre el porcentaje de la muestra. Los coeficientes de ponderación obtenidos se introducen en el paquete estadístico al uso para que, antes del cálculo de las estimaciones muestrales en el conjunto de la población, se sumen los distintos productos de los coeficientes de ponderación por las estimaciones muestrales en cada estrato y, después, se dividan por el tamaño total de la muestra. De esta forma se obtienen estimaciones "equilibradas" para el conjunto de la muestra.
Una vez delimitadas cuántas unidades de población extraer en cada estrato para formar la muestra, se procede a su elección por alguno de los procedimientos aleatorios que garantice la igual probabilidad de todos los integrantes del estrato para integrar la muestra. A diferencia del muestreo por cuotas, en el estratificado la selección de las unidades finales de la muestra se hace siguiendo procedimientos aleatorios (muestreo simple, sistemático, rutas aleatorias y otros incluidos en el subapartado 3.4.6), y no cri-
140
Capítulo 3: El diseño de la muestra
Métodos de encuesta
terios subjetivos. Ésta es la diferencia principal entre ambos métodos de muestreo, como se verá en el subapartado 3.4.7. Por último, el cuadro 3.6 resume las ventajas y los inconvenientes más destacados en el muestreo aleatorio estratificado. De las mencionadas, destacan sus beneficios en precisión de las estimaciones muestrales y para la organización del trabajo de campo. La creación de estratos o grupos de población de acuerdo con una característica, o conjunción de ellas (preferiblemente relacionadas con el problema de investigación), no sólo permite garantizar la presencia en la muestra de los distintos grupos de población, cuya variabilidad trata de analizarse. También, posibilita la aplicación de distintos marcos muestrales en cada estrato, de diferentes métodos de muestreo e, incluso, de encuesta, en consonancia con la dificultad en su contactación. Para cada estrato se extrae una muestra diferente. Las estimaciones globales para el conjunto de la población se obtienen de la conjunción de la extraída en cada estrato, tras haber sido "ponderada", sólo cuando se ha procedido a una estratificación no proporcional. Es condición que los estratos no se solapen, que comprendan al conjunto de la población de interés y que las unidades que constituyen el estrato sean muy homogéneas, respecto de la variable de estudio. De esta forma, la variabilidad dentro del estrato se reduce, obteniéndose estimaciones de parámetros poblacionales más precisas.
CUADRO 3.6. Ventajas e inconvenientes del muestreo aleatorio estratificado Ventajas
Inconvenientes
• Obtención de estimaciones muestrales más precisas, al reducirse el error muestral. • Garantiza la presencia, en la muestra, de distintos grupos de población en variables clave para el problema de investigación. • Pueden utilizarse distintos marcos muestrales, métodos de muestreo y de encuesta en cada estrato, en función de la información disponible y de la dificultad de acceso a los distintos grupos de población. • Facilita la organización del trabajo de
• Requiere más información del marco muestral que el muestreo aleatorio simple (para identificar a la población de cada estrato). Lo cual puede resultar costoso. • Supone cálculos estadísticos de cierta complejidad.
campo.
3.4.4. Muestreo aleatorio por conglomerados
Un método de muestreo probabilístico de gran aplicación en la encuesta personal a poblaciones espacialmente dispersas, debido a su menor coste, es el muestreo aleatorio por conglomerados. Como en el muestreo aleatorio estratificado, en el de con-
141
glomerados también se procede a la selección aleatoria de conjuntos de población. Pero ahora ~e les llama "conglomerados", en vez de "estratos". Los conglomerados pueden ser demarcaciones territoriales de la población de interés (país, comunidad autónoma, municipio, distrito, áreas censales, viviendas). También, organizaciones o instituciones (colegios, hospitales, tribunales, centros penitenciarios), e incluso conglomerados artificiales como, por ejemplo, las urnas electorales. Se trata de extraer, mediante algún procedimiento aleatorio, una muestra de conglomerados y, en los elegidos, seleccionar, igualmente al azar, las unidades que compondrán la muestra. Al igual que el muestreo estratificado, el de conglomerados implica la agrupación de las unidades de la población (ahora en conglomerados) como fase previa a la extracción de la muestra. Si bien, difiere del muestreo estratificado en varios aspectos importantes: a) En el muestreo estratificado la unidad de muestreo es unitaria (el individuo). En el muestreo por conglomerados, el conglomerado (o conjunto de individuos). b) En el muestreo estratificado se procede a la extracción muestral en todos los grupos o estratos formados de acuerdo con las variables (o conjunción de variables) de estratificación. En el muestreo por conglomerados se extrae una muestra aleatoria de conglomerados. Los integrantes de los conglomerados elegidos constituirán la muestra. c) En el muestreo estratificado se busca la homogeneidad dentro del estrato y la heterogeneidad entre los estratos. Los grupos se forman para crear grupos de población internamente homogéneos respecto de la(s) variable(s) de interés. Lo que contribuye a la precisión de las estimaciones muestrales. En el muestreo por conglomerados es a la inversa. El error muestral disminuye, conforme aumenta la heterogeneidad dentro del conglomerado. Como sólo se seleccionan algunos de los conglomerados existentes, se busca que los elegidos sean internamente heterogéneos. Es decir, que constituyan una adecuada representación de la variedad de los componentes de la población. Pero, como esto no siempre es posible, al tratarse generalmente de divisiones naturales de la población, el muestreo por conglomerados resulta en pérdida de precisión de las estimaciones muestrales. Tanto más, cuanto menos heterogéneas sean las unidades que compongan el conglomerado.
Pese a ello, se opta por la conglomeración principalmente para abaratar los costes de la encuesta. En encuestas a hogares mediante entrevista cara a cara, por ejemplo, los costes del trabajo de campo en tiempo y dinero (dietas a los entrevistadores, costes de desplazamiento y demás) se desorbitan, conforme aumenta la dispersión espacial de las unidades de la población a ser entrevistadas. Con la conglomeración se busca reducir los desplazamientos de los entrevistadores, haciendo un mayor número de entrevistas en un mismo espacio territorial delimitado. Por ejemplo, si en un bloque de viviendas (la unidad de muestreo primaria o conglomerado) se entrevista a 10 familias (la unidad de muestreo secundaria), en vez de a
142
Métodos de encuesta
una sola familia y las nueve restantes se eligen de otros bloques de viviendas (porque se ha procedido a un muestreo aleatorio simple o sistemático), sin duda se ahorra en tiempo y dinero en la ejecución del trabajo de campo. Pero, a cambio de incrementar el error muestral, al ser más probable la homogeneidad entre las 10 familias aleatoriamente extraídas de un mismo bloque que de 10 bloques diferentes. Lo mismo sucedería si hubiese que entrevistar "cara a cara" a médicos de centros de salud. Es más barato extraer una pequeña muestra aleatoria de centros de salud y, en los centros seleccionados, entrevistar a un mayor número de médicos, que enviar a un entrevistador a centros de salud dispersos para sólo realizar una o dos entrevistas.
El ahorro en costes económicos y temporales en la ejecución del trabajo de campo en la encuesta cara a cara, junto con la dificultad de elaborar una lista exhaustiva de todos los integrantes de la población de estudio, son las dos principales razones para la aplicación de un muestreo aleatorio por conglomerados. Para la selección de los conglomerados pueden seguirse las recomendaciones destacadas por Sudman (1976): a) Los conglomerados han de estar bien definidos y didimitados. Cada unidad de la población sólo puede pertenecer a un único conglomerado. b) El número de elementos que componen el conglomerado ha de ser conocido previamente, aunque sea de manera aproximada. c) Los conglomerados elegidos han de ser pocos, si realmente se quiere reducir los costes de la investigación. Pero adviértase que esto es cuando se prima la "rentabilidad". Si se busca, por el contrario, reducir el error muestral, habrá que aumentar el número de conglomerados, reduciendo el número de unidades de la muestra a seleccionar en cada uno de ellos. d) Los conglomerados deberían escogerse de manera que se consiga reducir el aumento en error muestral consiguiente a la conglomeración. e) Los conglomerados no tienen por qué estar idénticamente definidos en todos los lugares. Cuando se muestrean individuos u hogares en áreas urbanas o semiurbanas, los conglomerados suelen ser bloques o conjunto de bloques. En cambio, en áreas rurales, los conglomerados suelen ser segmentos geográficos limitados por carreteras y fronteras naturales (como ríos y lagos).
El muestreo aleatorio por conglomerados puede ser singular o monoetápico (si todas las unidades de población en los conglomerados elegidos integran la muestra), bietápico o polietápico. Bietápico, cuando la selección muestral prosigue dentro de cada conglomerado, en una segunda fase. Quiere esto decir que, en cada uno de los conglomerados elegidos aleatoriamente se procede a la extracción aleatoria de una nueva muestra. Si el proceso de selección concluye aquí, se está ante un muestreo por conglomerados de dos etapas o fases. Pero, si la selección aleatoria de las unidades últimas de la muestra prosigue, se está ante un muestreo por conglomerados polietápico de tres, cuatro e, inclusive, más fases. Estos últimos no son diseños muestrales infrecuentes. Precisamente, como subrayan Lynn y Lievesley (1991), lo usual es que el número de fases o etapas comprendidas en el muestreo polietápico sean tres o cuatro.
Capítulo 3: El diseño de la muestra
143
En el muestreo por conglomerados polietápico o polifásico, la unidad de muestreo final no son los conglomerados, sino subdivisiones de éstos. No se toma a cada uno de los integrantes de los conglomerados elegidos mediante algún procedimiento aleatorio, sino subdivisiones de éstos. Únicamente se toma una parte de los conglomerados, también seleccionados de forma aleatoria. Ello supone muestrear (como su nombre indica) en varias fases o niveles. Implica varios procedimientos de selección muestral, incluyendo la estratificación. Por ejemplo, si se quisiese encuestar a médicos de centros de salud, se podría proceder, primero, a seccionar los distintos municipios que constituyen el ámbito de la encuesta en áreas sanitarias. La primera fase de muestreo consistiría en la selección aleatoria de áreas sanitarias. La segunda fase, la selección aleatoria de centros de salud en las áreas sanitarias que hayan sido seleccionadas. Cuando se entrevista a todos los médicos de los centros elegidos, se está ante un muestreo de conglomerados de dos fases (bietápico). Si, por el contrario, se procede a la selección aleatoria de médicos, en cada centro de salud de los elegidos, la muestra por conglomerados tendrá tres fases (trietápico). Los centros de salud constituyen los conglomerados y los médicos las unidades de observación.
UNIVERSIDAD
ALBERTO
HURTADO
'3\1------=B~I"=B":'""LIOTECA
Se desea encuestar cara a cara a 1.300 profesores universitarios españoles, con el propósito de conocer su opinión sobre los nuevos planes de estudio. Como la encuesta es de ámbito nacional, la selección de la muestra siguiendo el procedimiento aleatorio simple elevaría considerablemente los costes de la investigación. A la dificultad de encontrar un marco incluyera a todos los profesores universitarios españoles (tanto de universidades públi(~as como privadas), se sumaría el aumento de los costes por desplazamiento de los entrevistadores a puntos dispersos del país. Lo más fácil será acceder a un listado que incluya al conjunto de las universidades españolas (públicas y privadas) para, a continuación, proceder a la extracción muestral polie(ápica por conglomerados. Ésta podría consistir en:
a) Listar todas las universidades españolas, tanto públicas como privadas. Este listado constituirá el marco inicial para la extracción de la muestra. En la selección de la muestra nacional de universidades podría estratificarse por tipo de universidad (pública y privada y, dentro de esta última, diferenciándose por confesionales y no confesionales) y por ubicación geográfica (Comunidad Autónoma). Ello asegura la representación de las unidades de muestreo primarias (las universidades) en conformidad con las variables de estratificación elegidas: dispersión geográfica y tipo de universidad.
144
Capítulo 3: El diseño de la muestra
Métodos de encuesta
También conviene -para alcanzar una mayor precisión- que las unidades primarias de muestreo elegidas sean bastante heterogéneas respecto a las características que se analizan. De esta forma se facilita que la variedad del universo de estudio quede reflejada en la muestra. Asimismo, se recomienda que -como regla- no proceda más del 7% de la muestra total de una sola unidad de muestreo primaria (Lynn y Lievesley, 1991). Interesa que las unidades de muestreo primarias sean bastante heterogéneas respecto al problema de investigación. La heterogeneidad es más probable que se dé cuanto más ampliamente se definan las unidades primarias. b) Elegir (de las universidades seleccionadas) una muestra de facultades mediante alguno de los procedimientos de selección aleatoria (simple, sistemática, estratificada). c) Para cada una de las facultades escogidas, extraer una muestra aleatoria de profesores. A tal fin se acude a un nuevo marco de muestreo: el listado de los p r9fe sores pertenecientes a las facultades que han resultado elegidas. Éstos podrían, a su vez, muestrearse conforme a los criterios de categoría profesional (catedrático, titular, profesor asociado, ayudante), dedicación (a tiempo completo o parcial), yantigüedad docente, aplicando un muestreo aleatorio estratificado o por cuotas. Si se opta por el estratificado, la elección de los profesores cuyas características se ajusten a los estratos diferenciados será totalmente aleatoria (muestreo simple, sistemático). En cambio, si se decide el de cuotas, la elección de los profesores será arbitraria, con la única condición de que compartan las características fijadas en las cuotas. Pero también podría extraerse una muestra aleatoria de departamentos y entrevistar a todos los profesores que lo integran. Esto último supondría reducir el número de departamentos elegidos. O podría optarse por una selección aleatoria de profesores en cada departamento. Lo cual permitiría ampliar el número de departamentos en la muestra y conseguir que ésta fuese más heterogénea, con la consiguiente reducción en el error de muestreo. Es más probable encontrar más heterogeneidad entre profesores de departamentos y de facultades diferentes que entre aquellos de un mismo departamento y facultad. El diseño muestral que resulte de la conjunción de estas fases se corresponderá con la precisión que el investigador quiera dar a las estimaciones muestrales. Esto tiene una repercusión directa en los costes de la investigación. Por ejemplo, en la elección del número de facultades y de profesores a entrevistar en cada facultad las opciones posibles son diversas. Dependerá del presupuesto destinado a la realización del trabajo de campo y de la heterogeneidad de los conglomerados, principalmente. El investigador tendrá que decidir si aumentar el número de facultades, disminuyendo el número de profesores a entrevistar en cada una de ellas, o proceder a la inversa (reducir el número de facultades, incrementando el número de profesores a encuestar). La primera opción supone aumentar -para un mismo tamaño muestral (1.300 unidades)- los costes (en tiempo y dinero) de la investigación. A continuación se exponen algunas de las opciones posibles:
Número de facultades
Número de profesores
5 10 15 20 30 40
260 130
.
145
87
65 43 33
Si fuesen 5 las facultades elegidas (entrevistándose a 260 profesores, en cada una de ellas), los costes del trabajo de campo serían inferiores, pero también sería mayor el error muestral que cuando se eligiesen 40 facultades y, en cada una de ellas, se entrevistase a 33 profesores. En general, se recomienda aumentar el número de conglomerados (en este caso de facultades) con preferencia a elevar el número de individuos a observar en cada uno de ellos (los profesores). La razón está en la probable hom9geneidad de los conglomerados elegidos, aunque se haya hecho de forma aleatoria. Cuando éstos son bastante homogéneos, no se precisa añadir más elementos del conglomerado a la muestra porque se obtendría una información redundante, al ser similares las características de las unidades que forman el conglomerado. En este caso (cuando los conglomerados son homogéneos), se aconseja ampliar el número de conglomerados para, de esta forma, abarcar una mayor variedad de la población de interés. Por el contrario, si los conglomerados fuesen heterogéneos, la mejor opción (entendida como reducción del error muestra~ sería la opuesta: reducir el número de conglomerados, aumentando las unidades a observar en cada uno de ellos. En suma, la varianza (homogeneidad o heterogeneidad) del conglomerado afecta al número de conglomerados a elegir. La probabilidad de selección de cada uno de los integrantes de los conglomerados será igual al número de unidades a elegir de cada conglomerado dividido por el número de unidades contenidas en el conglomerado.
En encuestas nacionales a la población en general, lo usual es aplicar un muestreo por conglomerados polietápico, que incluye la previa estratificación de la población de estudio. Primero, la población se estratifica por región y tamaño de hábitat. En España, para la estratificación por región se aplica la actual división política administrativa del país en comunidades autónomas. Normalmente, la asignación del tamaño la muestra se hace proporcionalmente, de acuerdo con su peso en el conjunto de la población. Después, se procede a la extracción aleatoria de los municipios o puntos de muestreo, con probabilidad proporcional al peso de la población de cada municipio. Para la selección de los puntos de muestreo lo común es utilizar datos agregados (frecuencias absolutas acumuladas de la población en cada estrato diferenciado por su tamaño poblacional) y la tabla de números aleatorios, como se ilustra en el ejemplo a continuación.
146
Métodos de encuesta
En los municipios elegidos se procede a la selección aleatoria de áreas o secciones estadísticas (como pueden ser las secciones censales en los municipios extraídos para la muestra) dentro de los municipios. En las áreas seleccionadas se elegirán, mediante algún procedimiento aleatorio, las viviendas u hogares (habitualmente aplicando el muestreo por rutas aleatorias) y los individuos (las unidades últimas de muestreo) en ellas. La selección de los individuos se hará siguiendo el muestreo por cuotas u otro de los mencionados en el subapartado 3.4.6, ya de forma aislada, ya combinada. En las encuestas a la población en general, el nivel de agregación habitual suelen ser las viviendas o los hogares. La unidad familiar o del hogar se presenta como un conglomerado. En él habrá que proceder a la selección aleatoria de uno o varios de sus integrantes. Generalmente se desaconseja la realización de más de una entrevista en un mismo hogar o vivienda porque se prevé una mayor homogeneidad entre sus integrantes que entre aquellos elegidos de hogares diferentes. Y, como ya se ha dicho de forma reiterada, en la consecución de una muestra "representativa" se prima la heterogeneidad, como estrategia para reducir el error muestral. El Centro de Investigaciones Sociológicas (CIS), según información proporcionada por uno de sus anteriores responsables del diseño de las muestras para encuestas personales, Rodríguez Osuna (1991: 40), utiliza las secciones censales (unidades de segunda etapa) para seleccionar las unidades de la muestra. Normalmente, en torno a 10 entrevistas por sección, porque se prefiere seleccionar un número elevado de secciones. Las entrevistas se realizan sólo en las secciones censales elegidas y únicamente en las viviendas. El éxito de la encuesta radicará en la rigurosa aplicación de la aleatoriedad y en evitar el recurso fácil a la sustitución de los no contactados. De nuevo, se insiste en la necesidad de hacer, al menos, hasta tres revisitas previo a la sustitución. El Instituto Nacional de Estadística (INE), al tener acceso a la información completa por los Censos de Población, utiliza, en cambio, los listados sobre la composición de las secciones censales (viviendas, hogares, individuos), en sus encuestas a hogares.
Para ilustrar el procedimiento habitual seguido en la selección de los puntos de muestreo (municipios), en encuestas a la población en general, a nivel provincial, autonómico, nacional e intemacional, se plantea el siguiente supuesto: una encuesta a la población de 65 y más años en la Comunidad Autónoma de Madrid, para conocer sus condiciones de vida. El ámbito de la encuesta se restringe a la población mayor que reside en hogares propios o ajenos. Se excluye a la población en residencias para la tercera edad u otros centros asistenciales. La encuesta se hará mediante entrevista personal en domicilios. De acuerdo con el reciente Censo de Población y Vivienda de 2001, en la Comunidad de Madrid residen, a dicha fe-
Capítulo 3: El diseño de la muestra
147
cha, 771.683 personas de 65 y más años. Para un error muestral máximo de ±2%, un nivel de confianza del 95,5% y el supuesto de máxima heterogeneidad poblacional (P = Q =50), al no disponer de información previa de la varianza poblacional en la variable de estudio, se fija el tamaño muestral en el conjunto de la Comunidad de Madrid en 1.600 unidades muestrales. Éstas se extraerán de forma proporcional al peso de los municipios elegidos en el conjunto de la población de Madrid. Los municipios de la Comunidad de Madrid se estratifican por tamaño de hábitat para proceder a la afíjación proporcional de la muestra, en función de su tamaño y el número de entrevistas a afijar. Para la formación de los estratos, según tipo de hábitat, se decide segmentar la población en cinco estratos. Como el municipio de Madrid agrupa al 72,42% de la población de 65 y más años, podría plantearse una estratificación no proporcional, reduciendo el número de entrevistas a hacer en dicho municipio para incrementar el tamaño de la muestra en los otros estratos. Pero, como en el caso más desfavorable, el primer estrato diferenciado (de menos de 1.000 habitantes), supone un tamaño muestral de 130 por afijación proporcional, se acaba haciendo una estratificación proporcional. CUADRO 3.0. Determinación del número de puntos de muestreo de acuerdo con la estratificación proporcional, según la distribución de la población de 65 y más años residente en la Comunidad de Madrid
..
Tamaño del municipio por población de 65 y más años residente
Número de municipios
Población total de 65 y más años
Proporción que representa
Afijación proporcional
Número de puntos de muestreo
Menos de 1.000 hab. De 1.000 a 5.000 De 5.001 a 10.000 De 10.001 a 50.000 Más de 50.000
145 21 7 5 1
40.057 47.501 45.241 80.022 558.862
0,0519 0,0616 0,0586 0,1037 0,7242
130 154 147 259 1.810
8 6 3 2 1
Total
179
771.683
1,0000
2.500
20
El número de puntos de muestreo se determina considerando el número de municipios en cada estrato y su población. Obviamente, en el quinto estrato sólo hay un municipio, que es Madrid. Por consiguiente, no habría que proceder a la selección aleatoria de municipios en dicho estrato. Pero sí en los cuatro restantes. Para ilustrar el proceso seguido en la elección de los municipios se toma el cuarto estrato (aquel que agrupa a los municipios de 10.001 a 50.000 habitantes de 65 y más años), por ser el siguiente que reúne un menor número de municipios. En los demás estratos, el procedimiento a seguir sería el mismo. Primero, se listan los municipios incluidos en el estrato. Segundo, se calcula la frecuencia absoluta acumulada de su población, sumando la habida en los estratos precedentes. Después, se seleccionan números aleatorios. Tantos como puntos de muestreo se tengan que elegir. En el cuarto estrato son sólo dos. De la lista de números aleatorios del Anexo, se extraen los dos primeros de la primera columna, que cumplen la condición de ser igualo inferior a 80.022. Cantidad que representa a la población total agrupada en dicho estrato. En el cuadro 3.E puede verse que, de acuerdo
148
Capítulo 3: El diseño de la muestra
Métodos de encuesta
con las frecuencias absolutas acumuladas, los dos municipios elegidos (las unidades de muestreo de segunda etapa) son aquellos que primero incluyen al número aleatorio seleccionado: Móstoles y Alcorcón. CUADRO 3.E. Elección aleatoria de los municipios (o puntos de muestreo) en el cuarto estrato
De 10.001 a 50.000 habitantes
Población de 65 y más años
Frecuencia absoluta acumulada
Número aleatorio
Móstoles Getafe Alcalá de Henares Alcorcón Leganés
14.863 15.617 15.921 15.929 17.692
14.863 30.480 46.401 62.330 80.022
06318
Total
80.022
47534
El número de entrevistas a realizar en cada municipio será proporcional a su peso. Asimismo, partiendo de la hipótesis de que las condiciones de vida pueden estar afectadas por la edad de la persona, se decide la distribución proporcional de la muestra en cada municipio por cuotas de género y edad. La distribución de las entrevistas en los municipios de Madrid, Móstoles y Alcorcón se da en el cuadro 3.F.
CUADRO 3.F. Distribución proporcional de la muestra en los municipios del cuarto y quinto estrato por cuotas de género y edad
Población total de 65 y más años
65-69
70·80
Más de 80
65-69
70-80
Más de 80
Móstoles Alcorcón
14.863 15.929
2.350 2.890
2.856 2.932
1.016 1.074
2.533 2.994
3.946 3.785
2.162 2.254
Total
30.792
5.240
5.788
2.090
5.527
7.731
4.416
558.862
73.878
107.118
39.048
94.640
157.775
86.403
Municipios
Madrid
Varones
Mujeres
149
Si la encuesta se realiza en las viviendas donde residen las unidades de la población a encuestar (personas de 65 y más años), pueden seleccionarse aleatoriamente los hogares partir de la elección, también aleatoria, de secciones censales (las unidades de muestreo de segunda etapa) por distrito. Alcorcón, por ejemplo, administrativamente se halla seccionado en cuatro distritos con las siguientes secciones censales: 17, en el distrito 1; 34, en el distrito 2; 29, en el distrito 3; y 28, en el distrito 4. Madrid cuenta con 21 distritos y las secciones censales van desde 27, en el distrito 21, hasta 217, en el distrito 10. Debería concretarse el número de entrevistas a realizar en cada sección. En encuestas a la población general, el CIS, como antes se indicó, fija en un número alrededor de 10 las entrevistas a hacer por sección. Ello propicia una mayor heterogeneidad en la muestra conjunta. En el supuesto aquí ilustrado, al tratarse de una población más restringida (de 65 y más años), podría elevarse el número de entrevistas a hacer por sección. Por ejemplo, a 15, e inclusive 20, dependiendo de lo que se prime: ahorro de costes en el ~rabajo de campo o mayor precisión de las estimaciones de los parámetros poblacionales. Esta se alcanza cuanto más heterogénea sea la muestra. Es decir, cuanto menos concentrada esté en unos conglomerados concretos. La elección de los individuos (unidades muestrales de tercera etapa) se haría mediante la realización de muestreos de áreas y de rutas aleatorias en cada sección que resulte elegida (como se indica en el subapartado 3.4.5). Su aplicación requiere el conocimiento preciso de las secciones censales seleccionadas. Elegida la vivienda, se procedería a la elección, también aleatoria, de la persona dentro de la vivienda, siguiendo alguno de los procedimientos aleatorios incluidos en el subapartado 3.4.6, a cuya lectura se remite.
El cuadro 3.7 resume las ventajas y los inconvenientes principales del muestreo aleatorio por conglomerados. Se insiste en su aplicabilidad en: a) Encuestas personales de ámbito nacional e internacional, que supongan una considerable dispersión de la muestra. b) Cuando exista dificultad para la obtención de un marco muestral exhaustivo, que incluya a todos los componentes de la población de estudio. Lo cual imposibilitaría la práctica de otro método de muestreo probabilístico, que sí podría aplicarse en conglomerados concretos (con un muestreo por conglomerados polietápico). c) Se quiera reducir los costes económicos y la duración del trabajo de campo en la encuesta personal, especialmente.
Unidades muestrales Móstoles Alcorcón
125 134
20 24
24 25
9 9
21 25
33 32
18 19
Total
259
44
49
18
46
65
37
1.810
239
347
126
307
511
280
Madrid
3.4.5. Muestreo de áreas y rutas aleatorias
El muestreo de áreas comúnmente se aplica para la selección aleatoria de viviendas, cuando las unidades de muestreo son personas y familias. Pero también se aplica para la selección aleatoria de granjas, cosechas (en encuestas agrícolas), empresas u otras edificaciones distintas a las viviendas. Su realización exige la existencia de mapas
150
Capítulo 3: El diseño de la muestra
Métodos de encuesta
CUADRO 3.7. Ventajas e inconvenientes del muestreo aleatorio por conglomerados Ventajas
Inconvenientes
• Simplifica la elaboración del marco muestral. No exige un listado de todas las unidades de la población de interés. Sólo de los conglomerados aleatoriamente elegidos. • Al concentrarse el trabajo de campo en un número limitado de puntos de muestreo, se reducen los costes económicos y temporales de la encuesta personal.
• Mayor error muestral y la consiguiente menor precisión de las estimaciones de los parámetros poblacionales, al haber más homogeneidad que heterogeneidad en los conglomerados*. • Requiere cálculos estadísticos complejos en la estimación del error muestral, principalmente. También de pesos para compensar distintas probabilidades de selección y de errores de no cobertura. • Para muestreos por conglomerados polietápicos se requieren marcos muestrales específicos para cada etapa en la selección de la muestra.
* El error muestral puede reducirse aumentando el número de conglomerados. Además, los conglomerados grandes suelen ser más heterogéneos que los pequeños.
que cubran el área del ámbito espacial de la encuesta. Éstos actúan como marcos de muestreo. La zona geográfica de interés (país, comunidad autónoma, provincia, municipio) se divide en áreas, que constituyen unidades de muestreo primarias. Después, se procede a la selección aleatoria de áreas. En las elegidas se crean nuevos mapas, que ayuden en la elección aleatoria de subáreas, hasta concluir en la extracción, igualmente aleatoria, de las unidades últimas de muestreo. En la selección de viviendas, los mapas han de especificar claramente los límites de las áreas de la población de estudio. Se excluirá, por tanto, toda área que no contenga edificios de viviendas (parques, colegios, iglesias, estaciones ferroviarias, de autobuses, hospitales, centros de internamiento). Si bien, Kish (1965/1995) advierte que estos lugares pueden contener viviendas de las personas que están a su cuidado; es decir, trabajadores que pueden pertenecer a la población de interés en la encuesta. A continuación, el área se divide en bloques porque contienen viviendas y tienen límites claramente identificados. Los bloques se estratifican de acuerdo con su similaridad para que en la muestra estén representados los diversos vecindarios del municipio. Se parte del supuesto de que los habitantes de un mismo vecindario comparten un perfil sociodemográfico similar. Además, permite utilizar diferentes grados de conglomeración en distintos estratos. De modo que, "en estratos con elevados costes por bloque de la muestra, podamos seleccionar menos bloques, con submuestras más grandes por bloque de la muestra" (Kish, 1965: 306). Los bloques se numeran y se
151
les asignan medidas de tamaño, en función de las viviendas que incluyan, según la información disponible. En caso contrario, puede asignársele un número aproximado, en consonancia con el tamaño promedio de las viviendas en los vecindarios en los que se procederá a la elección aleatoria de viviendas. A este respecto, el procedimiento más sencillo consiste en la selección sistemática de los bloques de la muestra, con el intervalo de selección aplicado a una lista de números de bloque. Este proceso de extracción muestral es, en palabras de Kish (1965: 308-309), "más fácil y adecuado" en la mayoría de los casos. Por el contrario la se' lección "a pares" de bloques precisa más cuidado.' En las encuestas personales en domicilios en las que se utilizan las secciones censales como unidades de segunda etapa (en un muestreo por conglomerados polietápico), como hace el CIS, la selección aleatoria de viviendas en las secciones elegidas se hace -colUo indica Rodríguez Osuna (1991)- de dos formas principales. Una consiste en el estudio detallado, previo a la selección, de las secciones. El coordinador de la zona ~cula; de fo.~a aproximada, el número de viviendas y las refleja en un croquis. A partir de el, se flJa la ruta y la frecuencia de selección de los entrevistados: uno cada 100 \yiviendas,p0r. ejemplo. Después, se extrae un número aleatorio, que es el que marca . la ruta a segun para la elección aleatoria de la vivienda. \ El segundo procedimiento al que se hace referencia es el específicamente conocido fomo método de rutas aleatorias. Persigue la selección aleatoria de viviendas procuran.do mantener el principio de "equiprobabilidad", presente en todo muestreo aleatono. '< ~e denomina muestreo de rutas porque se establece la "ruta" o itinerario que el entrevlstador ha de seguir en la selección de las unidades muestrales. Las rutas se eligen de forma "aleatoria", sobre un mapa del municipio concreto donde han de realizarse s~mtrevistas. En el mapa se indican múltiples puntos de partida o de inicio de rutas slbl.es. ~~rmalme~te, el punto de partida corresponde a un edificio determinado por a dlrecclOn (por ejemplo, la calle Serrano n.O 22). Pero, en entidades de población equeñas (núcleos rurales), el punto de inicio de la ruta suele corresponder a edificios
View more...
Comments