1-King Keohane y Verba - Resumen Libro Completo
December 8, 2022 | Author: Anonymous | Category: N/A
Short Description
Download 1-King Keohane y Verba - Resumen Libro Completo...
Description
Diseño de Investigación Social King, Keohane y Verba 1. La Cienc Ciencia ia en las las Cienci Ciencias as So Socia ciales les:: La diferencia entre la tradición cuantitativa y cualitativa son solo de tipo estilístico y que su importancia en términos metodológicos y de contenido es mínima. Los estudios no estadísticos tendrían resultados más fiables si los investigadores prestaran más a las reglascuantitativa. de la inferencia científica, científica, que a veces se formulan mejor con el estiloatención de la investigación La investigación posee 4 características: 1) El objetivo es la inferencia i nferencia:: el objetivo de extraer inferencias descriptivas descriptivas o explicativas explicativa s a partir de la información empírica. Utilización de datos para hacer inferencias que conduzcan a algo más amplio que no se observa directamente. Ese algo puede entrañar una inferencia descriptiva -utilizar -utilizar observaciones del mundo para relevar otros hechos que no se han observado (o una inferencia causal). Conocer efectos causales a partir de los datos observados. 2) Los procedimientos son públicos: públicos: La investigación investigación científica ocupa métodos explícitos codificados codificados y públicos, que por tanto, pueden evaluarse. A través de los métodos explícitos pueden captarse tales afirmaciones y si es posible remediarlas. remediarlas. Los métodos se pueden enseñar y compartir. Este proceso permite que los resultados de la investigación se comparen con los de otros investigadores, investigadores, que se reproduzcan los estudios de proyectos ajenos y que los académicos aprendan. 3) Las conclusiones son inciertas: La inciertas: La inferencia es por definición un proceso imperfecto, tiene como objetivo utilizar datos cuantitativos y cualitativos para conocer el mundo que los ha producido. Si la incertidumbre no se calcula de manera razonable, no se podrá interpretar ninguna descripción del mundo real ni ninguna inferencia causal que le afecte. Un investigador que no contemple abiertamente la incertidumbre estará afirmando afirmando que lo sabe todo a la perfección o que no tiene idea de la certeza o incertidumbre incertidumbre de sus resultados. Las inferencias que carecen de cálculo de incertidumbre no son ciencia tal como aquí se define. 4) El contenido es método: método: La investigación científica propugna un conjunto de normas inferenciales de las que depende su validez. Explicar las más importantes es una tarea primordial del libro: El principal contenido de la ciencia son sus métodos y reglas, no su objeto de estudio ya que podemos utilizar tales métodos para estudiar prácticamente todo. La unidad de todas las formas de ciencia se basa únicamente en su método, no en su materia. Estas cuatro características tienen otra consecuencia: cuando la ciencia es buena, es una empresa social. Los trabajos científicos están sometidos a limitaciones de conocimiento, ideas y los errores son inevitables. inevitables. El trabajo no tiene que estar por encima de una crítica para hacer una aportación importante. important e. Una aportación será posible siempre y cuando nuestro trabajo contemple explícitamente las preocupaciones de la comunidad académica y utilice medios públicos públicos para hacer inferencias que respeten las reglas científicas y la información de la que disponemos. La complejidad que se percibe en una situación depende en parte de en qué medida podemos simplificar la realidad adecuadamente, y nuestra capacidad de simplificar depende
de si podemos extraer con coherencia resultados y variables explicativas. Por ende, la complejidad compleji dad depende, en parte, del estado de nuestra teoría. Un proceso de investigación dinámico tiene lugar dentro de una normativa estable. Los autores dividen el diseño de investigación en 4 fases: la pregunta de investigación, la teoría, los datos, y la utilización de los datos. -
Pregunta Pregunta de inves investiga tigación ción:: ¿C ¿Cómo ómo podemos podemos llevar llevar ésta ésta a cabo cabo para para dar explicaciones válidas a los fenómenos sociales y políticos? ¿dónde se originan las preguntas de un estudio? ¿cómo elige un investigador el tema de análisis?, no existe algo que pueda llamarse método lógico para tener nuevas ideas. El descubrimiento contiene un elemento irracional o una intuición creativa. Lo ideal sería que todos los proyectos de investigación en Ciencias Sociales cumplieran dos condiciones: En primer lugar un proyecto de investigación tiene que plantear una pregunta importante para el mundo real. En segundo lugar un proyecto de investigación tiene que hacer una aportación concreta a lo escrito en el área académica identificable, aumentando la capacidad colectiva colectiva de dar explicaciones científicas verificables verificables de algún aspecto del mundo (orientándose en el estado del arte) reduciendo la probabilidad que se repita lo que ya se ha dicho. Consejos Consejo s para hacer un aporte explícito a lo escrito sobre el tema en varias maneras: 1) Eligiendo una hipótesis hipótesis que los estudiosos estudiosos consideren consideren importante importante en en la bibliogra bibliografía fía pero que no se haya realizado un estudio sistemático, si encontramos pruebas a favor o en contra la hipótesis estaremos haciendo un aporte. 2) Eligiendo una hipótesis hipótesis aceptada aceptada en la bibliografía bibliografía que que sospechemos sospechemos es falsa (o creamos que no se ha demostrado adecuadamente) e inestigando si realmente lo es o si es otra teoría t eoría correcta. 3) Intentando resolver resolver o presentando más pruebas pruebas a favor favor de uno de los bandos bandos en una polémica que esté presente en lo escrito hasta el momento; demostrando quizá que toda esa polémica carecía de fundamento desde el principio. 4) Diseñando investigaciones investigaciones que arrojen luz luz o evalúen evalúen premisas premisas no no cuestionadas cuestionadas por la bibliografía. 5) Señalando que en la bibliografía bibliografía no no se ha ha concedido concedido atención atención a un un asunto importante y proceder a continuación a aportar a ese campo un estudio sistemático. 6) Señalando que las teorías o pruebas relativas a cierto objetivo en en un campo campo podrían podrían aplicarse a otro para solucionar un problema existente, pero aparentemente aparentemente alejado. Sobre la teoría En ciencias sociales una teoría es una especulación especulación razonada y precisa sobre la respuesta que cabe dar a la pregunta de una investigación. Las teorías suelen conllevar a hipótesis descriptivas descriptiva s o causales más específicas. Formas de evaluar y aumentar la utilidad de una teoría: 1) Se aprende aprende más de las teorías que que pueden pueden estar equivocada equivocadas s que de de aquellas aquellas que se enuncian de forma tan general que puede que ni siquiera lo estén en principio. La
pregunta es, ¿qué datos nos convencerían convencerían de que estamos equivocados? equivocados? Si no hay respuesta a esta pregunta, tampoco hay teoría. 2) Para asegurarnos asegurarnos que que una teoría es falsable, hay que elegir una una que pueda generar generar tantas consecuencias observables observables como sea posible. Esto posibilita que la teoría se ponga a prueba, estando más veces en peligro de ser falsada para darle una mayor consistencia. 3) Al diseñar diseñar teorías es preciso preciso ser lo más concreto posible, posible, las las teorías e hipótesis hipótesis que se formulan con vaguedad no sirven más que para ofuscar. Se puede demostrar más fácilmente que una teoría está equivocada cuando se ha enunciado con precisión y hace predicciones específicas, por consiguiente consiguiente esta teoría es mejor. Después de la recogida de datos y posterior análisis, análisis, para mejorar la teoría se recomiendan dos normas: 1) Si nuestra predicción predicción se halla halla condicionada condicionada por diversas diversas variables variables y queremos queremos librarnos de una de las condiciones, podemos hacerlo, ampliando el N por ejemplo. 2) En cuanto a la alteración alteración de una teoría una vez vez que se han observado observado los datos datos es: podemos hacer que la teoría sea menos restrictiva (de forma que contemple una gama más amplia de fenómenos y se vea expuesta a más oportunidades de falsación), pero esto no ha de hacerse sin haber recogido más datos con los que contrastar la nueva versión de la teoría. Mejorar la calidad de los datos: La primera directriz para mejorar la calidad de los datos: es registrar y detallar el proceso con el que se generan los datos. La segunda directriz para mejorar la calidad de los datos es: Para evaluar mejor una teoría hay que recoger datos acerca de la mayor cantidad posible de consecuencias observables. (esto supone recoger tantos datos como sea posible en los contextos más diversos. Al añadir datos datos sobre sobre nuevas nuevas consecuencias consecuencias observables observables de una teo teoría ría podemos (A) (A) recoger más observaciones sobre la misma variable dependiente o (B) registrar más variables dependientes. dependientes. La tercera directriz es maximizar la validez de nuestras mediciones, la validez tiene que ver con calibrar lo que creemos que estamos calibrando. La cuarta directriz es: asegurarse que los métodos de recogida de datos son fiables. Fiabilidad significa que si se aplica el mismo procedimiento de la misma manera siempre se obtendrá la misma medida. La quinta directriz es que: todos los datos y análisis deben ser en la medida de los posible reproducibles, esto tiene que ver con el tipo de razonamiento que se utiliza para alcanzar tales conclusiones Utilizar mejor los datos existentes: - Utili Utilizar zar dato datos s que no no estén estén sesga sesgados dos /(se /(sesgo sgo de de selecc selección ión). ). - eficienci eficiencia a , para que los los datos datos se utilicen utilicen de de manera manera eficie eficiente nte hay hay que maxim maximizar izar la la información que se ha tenido en cuenta para hacer las inferencias descriptivas o causales. Las consecuencias observables de la teoría han de guiar la recogida de datos y de qué manera éstos disciplinan la imaginación teórica. La teoría y la investigación empírica deben estar estrechamente relacionadas. Cualquier teoría que trabaje para nosotros tendrá consecuencias consecuen cias en la investigación científica.
La maximización de control: Explicar tanto como sea posible de la forma más escueta posible. Si podemos exponer con precisión, a través de una o varias variables causales, lo que en principio parece un complicado complicad o efecto, el control que tendremos sobre los problemas será muy elevado. Al revés, si podemos explicar muchos efectos a partir de una variable o de algunas pocas, también dispondremos dispondremos de un control considerable. considerable. El control se puede aumentar incrementando el número de consecuencias observables de nuestra hipótesis y buscar el modo de confirmarlas. confirmarlas. Esta tarea puede suponer: 1) Una mejora mejora de la teoría teoría para que que tenga más más consecuen consecuencias cias observ observable ables. s. 2) Una mejora mejora de los datos datos para que que realmente realmente se detecten más consecuencias consecuencias y se utilicen para evaluar la teoría. 3) Una utiliza utilización ción más más provecho provechosa sa de esos esos datos, datos, con el fin de traer traer más más consecuencias de aquellos que estén disponibles. Utilizar datos agregados puede llevarnos a hacer inferencias incorrectas sobre los individuos:: cuando estos son los que nos interesan, suele ser mejor estudiarlo individuos estudiarlos s directamente si podemos hacernos con los datos adecuados. Pero si queremos que nuestra inferencia plantee una hipótesis hipótesis con bastante validez, quizá sea mejor que nuestra teoría tenga consecuencias consecuencias en muchos niveles de análisis diferentes y a menudo, podremos utilizar datos de todos para dar alguna información información sobre ella. (ANALISIS AGREGADO V/S INDIVIDUAL). El único problema, a la hora de utilizar información procedente de otros niveles y fuentes para estudiar una teoría que está diseñada con un determinado grado de agregación, reside en dilucidar si tales observaciones contienen alguna información relevante para evaluar las consecuencias consecuen cias de nuestra teoría. Si esas nuevas observaciones ayudan a comprobar la teoría, habrá qué utilizarlas, aunque no sean consecuencias de gran interés. Incertidumbre En cuali y cuanti el conocimiento y la inferencia son siempre inciertos, las causas pueden ser diferentes. El entrevistador cualitativo, que hace una larga entrevista en profundidad a una persona cuyo contexto ha estudiado, tiene menos posibilidades de calibrar mal la auténtica ideología política de ese sujeto, que otro que entreviste de forma estructurada a una persona elegida de forma aleatoria y de la que no sepa nada. Sin embargo, el encuestador tiende menos que el que investiga en profundidad profundidad a extrapolar de forma inapropiada a una población amplia, lo que sólo es aplicable a casos particulares. Ninguno de ellos es inmune a las incertidumbres incertidumbres de la medición o al inherente carácter probabilístico del mundo social. Hay que evitar sacar conclusiones muy ambiciosas de datos poco consistentes. Pensar como un científico social: escepticismo e hipótesis contrapuestas:
La incertidumbre de las inferencias inferencias1 causales tiene como consecuencia que los buenos investigadores investigad ores sociales no las acepten fácilmente. Cuando se dice que A produce B, alguien que piense como un científico social se preguntará si esa relación es auténticamente causal, es fácil hacer esas preguntas respecto a las investigaciones ajenas, pero resulta más importante plantearlas en relación a los propios proyectos. Para enfrentarnos al problema de la inferencia causal: con escepticismo y teniendo en cuenta las explicaciones alternativas que podrían haberse pasado por alto. De este modo la inferencia causal se convierte en un proceso en el que cada conclusión es una oportunidad de investigar aun más, con el fin f in de profundizar en esa inferencia y ponerla a prueba. A través de aproximaciones aproximaciones sucesivas, acercarnos cada vez más a una inferencia causal precisa. 2. La Infere Inferenci ncia aD Desc escrip riptiv tiva: a: La investigación, investigación, ya sea cuali o cuanti, tiene dos objetivos: describir y explicar. No podemos dar explicaciones causales con sentido sin una buena descripción, y esta a su vez, pierde gran parte de su interés si no está vinculada a alguna relación causal. La descripción suele venir primero porque es difícil proponer explicaciones antes de saber algo acerca del mundo y que ha de explicarse en función de qué características. La relación entre descripción y explicación es interactiva. A veces nuestras explicaciones nos inducen a buscar descripciones descripciones de diferentes partes del mundo y al contrario, estas pueden llevarnos a nuevas explicaciones explicaciones causales. La descripción y la explicación dependen de las reglas de la inferencia científica. La descripción científica tiene varios aspectos fundamentales. fundamentales. Uno de ellos es que conlleva un proceso inferencial describir consiste, en parte, en inferir información sobre hechos no observados a partir de aquellos que sí se han contemplado. Otro aspecto es su capacidad para distinguir lo que tienen de sistemático y de no sistemático los hechos observados. El único objetivo de ir de lo particular a lo general es aumentar nuestro conocimiento conocimiento de ambas cosas. Los hechos concretos de los integrantes, es donde deben descansar las generalizaciones. 1.1 Interpretación e inferencia: inferencia: Los interpretacionistas interpretacionistas tratan de encontrar síntesis precisas de los pormenores históricos y situar los acontecimientos que describen en un contexto inteligible inteligibl e dentro del que pueda explicarse el significado de las acciones. Los investigadores que hacen hincapié en la interpretación pretenden arrojar luz sobre los aspectos deliberados del comportamiento humano, utilizando el concepto de verstehen (empatía: comprender el significado de las acciones e interacciones a partir del punto de vista de los que participan en ellas. Los interpretacionistas interpretacionistas quieren explicar las razones
1
La inferencia es la acción y efecto de inferir, en otras palabras, deducir algo, sacar una
consecuencia de otra cosa, conducir a un nuevo resultado. ( Revisar: Bril-Mascarenhas, T., Maillet, A., & Mayaux, P. L. (2017). Process tracing. Inducción, deducción e inferencia causal. Revista de ciencia política (Santiago), (Santiago) , 37 (3), (3), 659-684.)
de las acciones intencionadas intencionadas relacionándolas relacionándolas con todos los conceptos y prácticas en los que están inmersas. También emplean normas de evaluación: las normas más evidentes son la de la coherencia y el campo de aplicación: Una explicación interpretativa tiene que dar la máxima coherencia o inteligibilidad inteligibilidad a un conjunto de prácticas sociale sociales s y, si lo que explica es un conjunto de prácticas determinado, tiene que ser compatible con otras prácticas o tradiciones de la sociedad. Uno de los mejores y más famosos ejemplos de la tradición interpretativa es el análisis que hizo Clifford Geertz del estudio de Gilbert Ryle sobre las diferencias entre un tic nervioso y un guiño: El ejemplo se enfoca en dos personas, una guiña el ojo por un tic nervioso y la otra como típico guiño, ambos movimientos son idénticos, si se realizara una observación observación fenomenística de estos movimientos aislados aislados como lo haría una cámara fotográfica no se podría distinguir entre el tic y el guiño, o si en realidad ambos han sido una cosa u otra. No obstante, la diferencia entre un tic y un guiño es enorme, aunque no sea fotografiable. El que guiña hace dos cosas: contraer el párpado y guiñar, mientras que el que tiene un tic solo hace una cosa: contraer el párpado. Cuando existe un código público por el que contraer los párpados se considera una señal de tipo conspirativo, hacer este movimiento es guiñar. Geertz está señalando un importante problema conceptual, sin el concepto de guiño, al que da sentido una teoría de la comunicación, el estudio más preciso de las contracciones de párpados en los seres humanos carecería de sentido para los que estudian las relaciones sociales. La interpretación proporciona nuevas formas de mirar el mundo (nuevos conceptos que considerar e hipótesis que evaluar), su utilidad resulta incuestionable. La mejor forma de determinar el significado de las contracciones de los párpados es la que se basa en los métodos sistemáticos descritos en este libro. Con frecuencia se nos pide que interpretemos el significado de una acción. En política exterior, los que toman las decisiones se envían mensajes unos a otros. Ante un determinado mensaje, cabe preguntarse si es una amenaza, un punto de negociación o una afirmación destinada a atraerse al público del propio país. Conocer las normas culturales, las convenciones de las comunicaciones comunicaciones internacionales internacionales y la historia de cada actor nos ayudará a hacer tal interpretación. interpretación. Singularidad, complejidad y simplificación: simplificación: Los cuali sostienen que los hechos o unidades unidades que estudian son únicos, y en cierto sentido tienen razón. La revolución francesa fue una sola, solo hay una Tailandia, etc. La explicación, según su punto de vista, se limita a ese único acontecimiento acontecimiento o unidad: no al porqué de las revoluciones sino al de la revolución francesa. Los investigadores de esta tradición creen que perderían su capacidad de explicar lo específico si intentaran ocuparse de lo general.
El término singularidad es engañoso. La revolución francesa, Tailandia, son realmente únicos, en cierto sentido, son todos los fenómenos, acontecimie acontecimientos, ntos, pero también fueron las elecciones al congreso en la séptima circunscripción de pensivalnia en 1988, así como la opción que tonó cada uno de los millones de votantes. La singularidad de las cosas forma parte de la condición humana: no distingue entre las situaciones situacione s que son suceptibles suceptibles de generalización generalización científica y aquellas en las que no es posible generalizar. La singularidad plantea el problema de la complejidad, la cuestión no es si los acontecimientos acontecimie ntos son de por sí únicos, sino el hecho de que sea posible o no, extraer de un amasijo de acontecimientos acontecimientos las características principales principales de la realidad social que queremos comprender. Simplificar es una de las tareas de la investigación sociales Simplificar sociales más difíciles, objetualizar y reducir de forma drástica la realidad observada. La diferencia que hay entre el grado de complejidad del mundo y el de la descripción más densa sigue siendo mucho más grande que la que existe entre dicha descripción y el análisis cuantitativo o formal más abstracto. Ninguna explicación (independientemente del número de factores explicativos que contemple) pueden llegar a captar siquiera levemente toda la floreciente y agitada realidad del mundo. El analista tiene que simplificar las descripciones, siempre que sea posible, solo después de comprender la riqueza histórica y cultural. El conocimiento profundo y no estructurado del contexto histórico cultural de los fenómenos que quieren tratar de forma sintética y científica suelen ser indispensables para evitar simplificaciones claramente equivocadas. En resumen: la investigación social tiene que ser general y específica al mismo tiempo: debe informarnos sobre los tipos de acontecimientos y también sobre hechos específicos en lugares concretos. Queremos aislarnos del tiempo sin perder el vínculo con él y la insistencia insistenci a en uno de estos objetivos puede variar de una investigación investigación a otra, aunque es probable que ambos estén presentes. Puede que la mejor manera de entender un determinado determinad o acontecimiento sea utilizar también los métodos de la inferencia científica para estudiar pautas sistemáticas en acontecimientos acontecimientos paralelos similares.
Estudios de caso comparados: Los estudios de caso son esenciales para la descripció descripción n y por tanto, para la ciencias sociales. No tiene sentido intentar explicar lo que antes no se ha descrito con un razonable grado de precisión. Una de las ventajas del estudio de caso en profundidad, que suele pasar por alto, es que desarrollar una buena hipótesis causal complementa una buena descripción más centrada y relevante, aunque al final del estudio no logre extraer una sola inferencia causal válida.
Los estudios de caso comparados pueden generar inferencias causales válidas cuando se utilizan los procedimientos descritos en el resto del libro, aunque tal como se practican en la actualidad, no suelan cumplir las normas de una inferencia válida. Método de comparación estructurada y centrada: se destaca la necesidad de que haya una recogida sistemática de la misma información (de las mismas variables) en unidades seleccionadas cuidadosamente. Para que sea posible una inferencia causal, son necesarias directrices teóricas con el fin de describir de forma sistemática. A través de este método método el investigador investigador define y estandariza estandariza las necesidade necesidades s de los datos de los estudios de caso. Formulando pregu preguntas ntas relevantes desde el punto de vista teórico con el fin de dar pautas para el análisis de cada caso. Inferencia como el fin científico de la recogida de datos: La inferencia es un proceso en el que se utilizan hechos que conocemos para aprender sobre los que desconocemos. Los hechos conocidos se someten a preguntas, teorías e hipótesis de nuestra investigación investigación y conforman nuestros datos y observaciones de tipo cuantitativo y cualitativo. La mejor manera científica de organizar los hechos es hacer que sean consecuencias observables de alguna teoría o hipótesis con el fin de evaluarla. Después, la teoría nos lleva a seleccionar los hechos que son consecuencia de ella. Organizarlos en función de las consecuencias consecuen cias observables de una determinada teoría tiene importantes y beneficiosos beneficiosos resultados para el diseño y la realización realización de la investigación. investigación. En primer lugar: con este criterio de selección de los hechos podemos darnos cuenta rápidamente de que si existe más observaciones de las consecuencias de una teoría no podemos más que beneficiarnos de ello al evaluar la teoría en cuestión. Como más información de este tipo no puede ser perjudicial, perjudicial, esos datos nunca se desechan, y así mejora el proceso investigad investigador. or. En segundo lugar, no hay por qué poseer una teoría completa antes de recoger los datos, ni tampoco nuestra teoría tiene por qué mantenerse inalterable durante el proceso. La teoría y los datos interaccionan. Al igual que ocurre con la gallina y el huevo, siempre es necesaria alguna teoría antes de recoger los datos y también se precisan algunos datos antes de teorizar. En tercer lugar: insistir en que se recojan los datos que sean consecuen consecuencias cias observables de una hipótesis deja mucho más claro el territorio común que comparten los estilos de investigación investigac ión cuantitativo y cualitativo. Organizar los datos mediante una lista de las observaciones específicas de una teoría ayuda a poner de manifiesto el fin científico esencial de gran parte de la investigación cualitativa. Cada vez que desarrollamos una hipótesis resulta provechoso hacer una lista de todas las consecuencias de la misma que, en principio, pudieran observarse. La lista constituye una guía básica operativa para el proyecto de estudio. Dentro del proceso de simplificación que se desarrolla al organizar nuestros datos como consecuencias observables de la teoría, necesitamos sistematizar dichos datos. Podemos consecuencias pensar en convertir los fenómenos brutos del mundo real en “clases” que estén compuestas
por “unidades” o en “casos” que, a su vez, se compongan de “atributos”, “variables”, o “parámetros”. La clase podría ser de “votantes”, las unidades, una ,muestra de esos votantes, en diversas circunscripciones para las elecciones del congreso estadounidense y los atributos o variables podrían ser la renta, la identificación partidista o cualquier otra cosa que represente una consecuencia observable de la teoría que se evalúa. La clase podría ser un determinado determinad o colectivo, como las comunidades o países, las unidades unidades podrían ser una selección de estos; y los atributos o variables podrían ser el tamaño de los mismos, el tipo de gobierno, su situación económica, composición étnica o cualquier otro elemento cuantificable cuantificab le y de interés para el investigador. Lo central es concentrar en la hipótesis tanta información como sea posible, lo cual puede suponer la realización de más estudios de caso; pero esto suele ser demasiado difícil, requiere mucho tiempo o es caro.
3.- Modelos formales en investigaci investigación ón cualitativa: Un modelo es una simplificación de algún aspecto del mundo y una aproximación al mismo. Los modelos nunca son, netamente “verdaderos” o “falsos”, aunque los buenos sólo recopilan las características “correctas” de la realidad que representan. Existen modelos verbales y algebraicos. 4.- Modelo formal sobre la recogida de datos. Sobre la recogida de datos: la regla más importante para toda recogida de datos es dejar claro como se han creado y de qué manera hemos accedido a ellos. Hacemos modelos con los datos por medio de variables, unidades, observaciones. Conceptos como el de variable y unidad pueden hacer que abordemos de forma más clara el diseño de investigación, investigación, incluso cuando no sea apropiado usar medidas cuantitativas para resumir la información de que dispongamos. La pregunta en cuestión es: ¿cómo podemos hacer inferencias descriptivas sobre “la historia tal como fue” sin perdernos en un mar de datos irrelevantes? irrelevantes? ¿cómo separar lo esencial de lo efímero? 5.- El resumen de los por menores históricos: ¿qué normas rigen el resumen de los pormenores históricos? La primera es que los resúmenes deben centrarse en los resultados que queremos describir o explicar. Si lo que nos interesa es el crecimiento de la organización internacional media, no sería muy inteligente centrarse en naciones unidas, pero si lo que nos importa es cómo influye el mayor o menor tamaño de la distribución de dichas organizaciones, las Naciones Unidas serían seguramente seguramente una de las unidades en las que tendríamos que centrarnos. La ONU no es una organización organización representativa, pero si es importante. Para estudiar la típica t ípica organización internacional internacional desde el punto de vista estadístico examinaríamos valores medios (de presupuestos, examinaríamos presupuestos, cometidos, número de miembros, etc), pero para comprender el abanico de actividades tendríamos que examinar la varianza.
Un segundo precepto: un resumen tiene que simplificar la información de que disponemos, esto significa que hay que utilizar menos estadísticos sintetizadores que unidades hay en los datos originales, porque de no ser así podría ser fácil presentar los datos originales sin ningún tipo de resumen. 6.- Inferencia descriptiva: Proceso mediante el cual se comprende un fenómeno no observado a partir de un conjunto de observaciones. observaciones. Uno de los objetivos fundamentales de la inferencia es distinguir entre el componente sistemático y el no sistemático dentro de los fenómenos que estudiamos. El sistemático no es más importante que el que no lo es, y nuestra atención no debería centrarse en uno a costa del otro. Los factores sistemáticos son persistentes y sus consecuencias se repiten cuando tienen un valor determinado. Los no sistemático sistemáticos s son transitorios: no podemos predecir su impacto. Esto no significa que los sistemáticos representen constantes. Resumir los pormenores históricos es un importante paso intermedio en el proceso de utilización de los datos, pero también tenemos que hacer inferencias descriptivas descriptivas que distingas los fenómenos aleatorios de los sistemáticos. Saber qué ocurrió en una ocasión concreta no es suficiente. Con la inferencia descriptiva pretendemos comprender en qué medida nuestras observaciones observacio nes reflejan fenómenos típicos y atípicos. Si no nos esforzamos por determinar las características características sistemáticas de un asunto, las lecciones de la historia se perderán y nada aprenderemos de los aspectos de nuestro objeto de estudio que pueden mantenerse o ser relevantes para estudios o acontecimientos futuros. 7.- Criterios para juzga las inferencias descriptivas.
Inferencias no sesgadas: Si aplicamos una y otra vez un método inferencial obtendremos estimaciones que unas veces serán demasiado grandes y otras muy pequeñas. En un número elevado de aplicaciones, aplicacio nes, ¿obtenemos “en promedio” promedio” la respuesta es correcta? Si la contestación es sí, entonces se dice que este método o “estimador”, no está sesgado. En un estimador, esta propiedad no nos dice en qué medida cualquiera de las aplicaciones del método está lejos del promedio, pero lo deseable es que la medida sea correcta. Se obtienen estimaciones no sesgadas cuando la variación que hay entre la reproducción de una medida y la que le sigue no es sistemática y empuja ese cálculo a veces en una dirección y a veces en otra. Se produce sesgo cuando, en un conjunto de reproducciones, hay un error sistemático de medida que lleva la estimación más en una dirección que en otra. Eficiencia: La eficiencia proporciona una manera de distinguir entre estimadores no sesgados. La eficiencia es un concepto relativo que se mide calculando la varianza del estimador en las reproducciones reproducci ones hipotéticas. En los estimadores no sesgados, cuando menor es la varianza,
más eficiente (mejor) es el estimador. Nos interesa la eficiencia si el sesgo es pequeño, y quizá a veces estemos dispuestos a admitir un pequeño sesgo a cambio de una mayor eficiencia. Cuanto más observaciones haya, mejor, porque así disminuye la variabilidad (y por tanto la ineficiencia). De hecho, la coherencia es una propiedad que consiste en que a medida que aumenta el número de observaciones, observaciones , la variabilidad se acerca a cero y la estimación es igual al parámetro que estamos intentando calcular.
Causalidad e inferencia causal Siempre tenemos que dejar claro si nuestro objetivo es describir o explicar. Algunos científicos sociales estudian asociaciones asociaciones y no causar mientras que otros caen con facilidad en afirmaciones aparentemente causales, calificando de expresiones expresiones hipótesis o especulaciones especula ciones no evaluadas, que se basan en diseños de investigación imprecisos, imprecisos, pero ambas posturas esquivan el problema de la inferencia causal.
Definición de causalidad: 1.1 definición y un ejemplo ejemplo cuantitativo. Esta definición se aplica a una sola unidad, es decir, uno de los muchos elementos a observar. Ejemplo: el efecto causal que tiene sobre la proporción de votos que recibe un candidato demócrata a la cámara de representantes estadounidense el hecho de que ya esta al poder (utilizar solo un candidato demócrata simplifica el ejemplo) Variable dependiente (Y): Proporción de votos que obtienen los demócratas en el sist. Bipartidista de (para tener más claro el ejemplo ver el texto página 89) la cámara Otros nombres para variables en el lenguaje causal:
Variable independiente (x): es la variable dicotómica, el demócrata esta en el poder o no lo está.
Variable variable deexplicativa resultado o de control. Estas se dividen en variable causal Variable dependiente: independiente: independiente: variable principal (variable tratamiento) tratamiento) y variable de control. La variable causal principal adopta dos o más valores, que suelen conocerse como “grupo de tratamiento” y “grupo de control”. La Condición contrafáctica es la esencia de la definición de causalidad, y la diferencia, en el ejemplo anterior, anterior, entre el voto real (que este al poder) y el voto probable (que no este al poder) es el efecto causal. Hay que tener cuidado al definir contrafácticos ya que, aunque se oponen a los hechos, tienen que ser razonables. Cuando se define la condición contrafáctica adecuada, adecuada, es esencial precisar qué se mantiene constante cuando alteramos el valor de la variable en tratamiento, en este caso la variable de tratamiento es el poder, es decir, si el candidato demócrata esta o no esta en el poder pero ante el contrafáctico de que no este en el poder y el partido decida lanzar otro candidato no se entra en detalles como el reconocimiento del nombre o el carisma ya que estos son consecuencia de las variables de tratamiento.
Llevándolo al ejemplo, el efecto causal que tiene estar en el poder sería la diferencia entre estas dos fracciones del voto (estar en el poder – no estar en el poder). De este modo, esta definición de causalidad demuestra que nunca se puede conocer con certeza un efecto causal. Holland (1986):describe lo anterior como problema fundamental de la inferencia causal y esto porque independiente independiente de lo perfecto que sea el diseño de la investigación, investigac ión, de la cantidad de datos recogidos, nunca se conocerá a ciencia cierta la inferencia causal. Holland no establece claramente la distinción entre componentes sistemáticos y no sistemáticos. La importancia de esta distinción se puede ver en el ejemplo anterior, la suma total de votos tendría un resultado ligeram ligeramente ente diferente, a causa de ciertas características no sistemáticas de las campañas electorales: aspectos políticos que no se mantienen de unas campañas a otras, incluso si estas parten de situaciones idénticas. Por lo tanto, podemos imaginar una variable que representa los valores del voto demócrata en diversas reproducciones reproducci ones hipotéticas de las mismas elecciones. Esta variable se denomina variable variable aleatoria, ya que tiene características no sistematicas: le afectan las variables explicativas que no contempla nuestro análisis teorico o contiene una variabilidad fundamentalmente inexplicable. inexplica ble. Entonces, el efecto causal aleatorio en el ejemplo se define como la diferencia entre dos variables aleatorias. Describir la causalidad como una de las características sistemáticas de las variables aleatorias tiene dos ventajas: a) hace que que la definició definición n dada en el texto texto sea directame directamente nte análoga análoga a las características sistemáticas de un fenómeno (como la media o la varianza) que sirve de objeto a la inferencia descriptiva. descriptiva. b) Posibilita la división división de un problema problema inferencial inferencial causal causal en sus componentes componentes sistemáticos y no sistemáticos. sistemáticos. El efecto causal es la diferencia que existe entre el componente sistemático de las observaciones que se hacen cuando la variable explicativa tiene un valor y el componente sistemático de observaciones comparables comparables cuando la variable explicativa explicativa tiene otro valor. Hay muchas otras características sistemáticas de estos efectos causales aleatorios que podrían ser de interés en diversas circunstancias, circunstancias, como, por ejemplo, la varianza. Es importante comprender comprender que el efecto de la varianza del efecto causal es una parte fundamental del mundo y que no representa una incertidumbre causada por la estimación.
1.2 un ejemplo ejemplo cualitativo El objetivo principal de este apartado es formular una definición definición precisa de efecto causal. Ejemplo: instaurar un sistema parlamentario y que periódicamente periódicamente por 10 años calibrar su su grado de estabilidad democrática y al mismo tiempo fundar un sistema presidencial y medir su estabilidad en le mismo periodo y los mismos elementos. El efecto causal sería la diferencia entre los grados de estabilidad observados en el sistema presidencial y en el parlamentario. El efecto causal medio es la media de los efectos causales realizados en las reproducciones de estos experimentos. experimentos. En este ejemplo también se puede ver la varianza del efecto causal. A cualquier cualquier país que se esté planteando elegir entre estos sistemas políticos le interesaría conocer el efecto causal medio que tiene uno u otro sobre la estabilidad democrática, democrática, sin embargo, para cada país solo es posible una reproducción de este experimento.
Clarificación de las definiciones alternativas de causalidad: 2.1 mecanismos causales Algunos investigadores investigadores señalan señalan que la iidea dea principal principal de la causalidad causalidad es el conjunto conjunto de mecanismos mecanismo s causales que se dice que existen entre causa y efecto. Identificar mecanismos causales es una forma habitual de hacer análisis empíricos a la que se ha denominado con expresiones expresion es diferentes: rastreo de procesos, análisis histórico, estudio de caso detallados. Para demostrar el carácter causal de cada posible vínculo en un mecanismo como este, tendrá que definir el efecto causal subyacente y luego hacer una estimación de este. Si postulamos que una variable explicativa produce otra dependiente, para utilizar un enfoque a base de mecanismos causales tendremos que listar los vínculos causales que hay entre ambas variables. En esta definición también necesitamos determinar una serie de enlaces causales, definir la causalidad en cada par de variables consecutivas de la secuencia y precisar qué unión existe entre cada dos variables, así como la conexión entre parejas diferentes. Para el efecto del texto, identificar los mecanismos causales sirven de apoyo a una teoría y es un proceso operativo útil y pueden entregarnos más control sobre una teoría ya que convierte las observaciones observaciones de otros niveles de análisis en consecuencias de dicha teoría. 2.2 causalidad múltiple Esto quiere decir que el fenómeno que se investiga tiene determinantes alternativos; alternativos; lo que Mill (1843) llamaba el problema de la pluralidad de causas. Para la teoría general de sistemas este problema se denomina equifinalidad. En situaciones con causas múltiples, estos autores señalan que un mismo resultado pueden producirlo combinaciones de diferentes variables independientes. Para Ragin, cuando diversas variables explicativas pueden explicar el mismo resultado en una variable dependiente, hay métodos estadísticos que rechazan equivocadamente la hipótesis de que tales variables tengan un carácter causal. 2.3 causalidad simétrica y asimétrica Stanley Lieberson distingue entre lo que clasifica como formas de causalidad simétricas y asimétricas y se centra en las diferencias que se producen en los efectos causales cuando se aumenta una variable explicativa o cuando se reduce. El argumento de Lieberson no resulta una definición para el texto de causalidad sino que es solo aplicable a algunas inferencias inferencia s causales, al proceso de aprendiza aprendizaje je sobre un efecto causal a partir de las observaciones observacio nes existentes. Por otro lado, el ejemplo entregado por Lieberson no incluye cantidades cantidade s hipotéticas y, por lo tanto, no puede ser una definición causal.
Supuestos necesarios para la estimación de efectos causales: 3.1 homogeneidad de las unidades Dos unidades son homogéneas si los valores esperados de as variables dependientes de cada una de ellas son los mismos cuando nuestra variable explicativa adopta un valor determinado (o sea, µn1= µn2 y µ i1 = µi2) En un conjunto de datos con n observaciones, la homogeneidad de las unidades consiste en presuponer que todas las que tengan igual valor en sus variables explicativas tendrán
también el mismo valor esperado en la dependiente. En general, el supuesto de homogeneidad de las unidades no puede comprobarse en una única unidad. El supuesto del efecto constante es una versión más débil, pero comtamente aceptable, de la homogeneidad de las unidades. En lugar de presuponer que el valor esperado de la variable dependiente es el mismo en diferentes unidades si también lo es el de la variable explicativa, explicativ a, solo tendremos que presuponer que el efecto causal es constante. 3.2 independencia condicional Según el supuesto de independencia condicional, los valores que se adjudican a las variables explicativas son independientes de los de las dependientes. Esto quiere decir que, después de tener en cuenta las variables explicativas, el proceso de asignar valores a la variable explicativa es independiente de las variables dependientes, Y N1, yi1. La expresión asignar valores hace referencia a las variables explicativas para describir el proceso mediante el cual estas consiguen unos valores determinados. Los análisis de n grande en los que hay que utilizar un sistema aleatorio, tanto de selección como de asignación como de selección de valores, son la forma más fiable de garantizar la independencia condicional y no necesitan del supuesto de la homogeneidad de las unidades. Este sistema aleatorio de selección y asignación nos ayuda a extraer inferencias causales porque cumple tres supuestos que subyacen del concepto independencia condicional: 1) que el proceso de asignación asignación de valores a las variables variables explicativas explicativas es independiente de las dependientes 2) que no hay hay sesg sesgo o de sele selecci cción. ón. 3) No hay hay sesgo sesgo de la la variab variable le omiti omitida da Cuando no es factible ni seleccionar ni asignar valores de manera aleatoria y tampoco se puede controlar el proceso de asignación y de selección tenemos que recurrir a alguna versión del supuesto de homogeneidad de las unidades para hacer inferencias causales válidas.
Criterios para evaluar las inferencias causales: Para definir la causalidad en función de variables aleatorias logramos establecer una estricta analogía entre este fenómeno y otras características sistemáticas, en las que nos centramos al extraer inferencias descriptivas. Esta analogía nos permite evaluar las inferencias inferencia s causales precisamente con los mismos criterios.
Reglas para elaborar teorías causales:
Las teorías causales tienen como objetivos mostrar las causas de un fenómeno o conjunto de fenómenos. Cualquier Cualquier teoría, independiente de que en un principio haya sido deductiva o inductiva, conlleva a un conjunto Interrelacionado Interrelacionado de hipótesis causales. Cada una de ella postula la existencia de una relación entre variables que genera consecuencias consecuencias observables: observabl es: si unas determinadas variables explicativas explicativas tienen ciertos valores, se predice que las dependientes tendrán otros valores específicos. Para comprobar o evaluar cualquier hipótesis causal se necesitan inferencias del mismo tipo. La teoría general, que se compone de hipótesis, ha de tener coherencia interna porque porque sino no se plantearán hipótesis contradictorias. 5.1 regla 1: elaborar teorías falsables Las teorías hay que diseñarlas para que se pueda demostrar de la formar más rápida y fácil posible que están equivocadas. equivocadas. Subrayar la necesidad de que las teorías sean falsables nos
obliga a mantener una perspectiva adecuada sobre la incertidumbre y garantiza que vamos a considerar tales teorías como algo provisional, sin dejarlas convertirse en dogmas. Karl Popper postula que existe una asimetría fundamental entre confirmar una teoría y desmentirla. Lo primero es prácticamente irrelevante, mientras que lo segundo es la clave de la ciencia. En este sentido, las teorías no son verificable verificables s porque nunca podemos comprobar todas sus consecuencias observables. Sin embargo, para evaluar las teorías existentes en las ciencias sociales no resulta tan significativa significati va la asimetría entre la verificación y falsación. Ninguna de ellas contribuye a nuestro conocimiento. conocimiento. Si siguiéramos la regla de Popper, las teorías que se basan en el supuesto de la elección racional hubieran sido rechazadas hace tiempo, ya que han sido falseadas en muchos otros ejemplos específicos. Además, la evaluación que hace Popper de las teorías no establece una distinción fundamental fundamental entre las que acaban de formularse y las que ya han resistido numerosas pruebas empíricas. Para el texto, no es así como se hacen las ciencias sociales o como deberían hacerse; después de hacer mil comprobaciones a favor o en contra, no prescindiríamos de la teoría que, por ejemplo, afirma que las campañas no tienen t ienen impacto, sino que la modificaríamos para decir que las campañas normales carecen de impacto, a no ser que haya pruebas concluyentes de que uno de los candidatos se ha comportado de forma inmoral. Hay que añadir una advertencia, se ha señalado que el proceso de evaluación de teorías e hipótesis es flexible: ciertas comprobaciones empíricas no las confirman ni desmienten definitivamente. definitivam ente. Si nuestras pruebas empíricas no concuerdan con las expectativas teóricas no hay porque desecharla, hay muchas otras cosas que se pueden hacer como decir que los datos son pobres por causalidad o ajustar lo que consideramos que es el ámbito de aplicación de una teoría, aunque no se sostenga en un caso determinado y, en virtud de ese ajuste, seguir aceptando esa elaboración teórica. De manera que, en sí misma, la conclusión que se la preferencia normativa por teorías que tienen pocos componentes no siempre es aplicable. Para maximizar el control hay que intentar formular teorías que expliquen lo más posible con el menor número de elementos. A veces esta formulación se logra mediante la concisión,, pero otras no. podemos pensar en ejemplos en los que una teoría ligeramente concisión más complicada explica una parte del mundo mucho mas amplia, en tal situación seguramente seguramen te utilizaremos una teoría poco concisa, ya que esta maximiza mejor el control que la más concisa. 5.2 regla 2: construir teorías que tengan coherencia interna Una teoría sin coherencia interna no solo es falsable, es falsa. De hecho, ésta en la única situación en la que se conoce la veracidad de una teoría son necesidad de datos empíricos: si tiene dos o más componentes que generan hipótesis contradictorias, contradictorias, no hay datos del mundo empírico que puedan sostenerla. Sin embargo, al igual que ocurre contras hipótesis, los modelos formales no son explicaciones explicacio nes verificadas si no evalúan empíricamente sus predicciones. En la investigación investigación social, la formalización nos ayuda a razonar con más claridad y garantiza realmente que nuestras ideas tengan coherencia interna, pero no resuelve los problemas de evaluación empírica de las teorías. Por lo tanto, estos modelos formales no son más que modelos: abstracciones que hay que diferenciar del mundo que estudiamos. De hecho, algunas teorías formales hacen predicciones a partir de supuestos enormemente simplificadores y a veces no tienen gran valor empírico. Simplificarr es esencial para los modelos formales, al igual que lo es en toda investigación, Simplifica pero hay que tener cuidado con las inferencias inferencias que se extraen de la realidad a partir de
esos modelos. Para que el modelo formal sea útil, el supuesto no tiene t iene que ser correcto, pero no podemos emplear en la elaboración de diseños de investigación empírica supuestos teóricos no comprobados o justificados. Por el contrario, para que las teorías formales sean útiles en los estudios empíricos, suele ser preciso complementarlas con otros elementos. Un buen modelo formal debe ser abstracto, de manera que los rasgos clave del problema se pongan de manifiesto y pueda aplicarse fácilmente el razonamiento matemático. 5.3 regla 3: seleccionar cuidadosamente las variables dependientes A continuación, continuación, el texto da tres indicacione indicaciones: s: a) Las variable variables s dependient dependientes es deben ser realmen realmente te dependien dependientes tes b) No hay que selecc selecciona ionarr observacio observaciones nes que es estén tén basadas basadas en la variabl variable e dependiente dependien te para que esta se mantenga constante. c) Hay que elegir una una variable variable dependiente dependiente que que represente represente la variación que queremos queremos explicar. En consecuencia, consecuencia, para obtener una estimación no sesgada del impacto de las variables explicativas explicativ as es preciso que todo el abanico de posibles variaciones de la variable dependiente dependi ente pueda ser resultado del experimento experimento.. 5.4 regla 4: maximizar lo concreto Esta surge de la insistencia en la falsabilidad, la coherencia y la variación de la variable dependiente, es maximizar lo concreto. Siempre que sea posible, hay que elegir conceptos dependiente, observables en vez de no observables. Plantear explicaciones mediante ideas como cultura, interés nacional o utilidad resultará sospechoso, sospechoso, a menos que tales conceptos se puedan calibrar al margen de la variable dependiente que se busca explicar. Cuando se utilizan tales términos en las explicaciones, es fácil caer en la tautología o no presentar consecuencias consecuen cias observables y diferenciadoras. diferenciadoras. Cuanto más abstracto sean nuestros conceptos, más difusas serán sus consecuencias consecuencias observables y menos posibilidades posibilidades habrá de falsar la teoría. Algunos investigadores investigadores utilizan utilizan esta estrategia: estrategia: parten de un un concepto abstracto abstracto y al aceptar que no pueden medirlo de forma directa y señalan indicadores indicadores específicos. Sim embargo, tiene una mala parte, ya que con frecuencia el indicador específico se aleja del concepto original relacionándose relacionándose de forma indirecta o incierta. El desfase entre concepto e indicador indicador es inevitable en gran parte de los estudios sociales, pero existen buenas razones para usar conceptos generales: permiten ampliar nuestro marco de referencia y la aplicabilidad de las categorías. Cuanto más impreciso sea nuestro lenguaje, menos posibilidades habrá de que nos equivoquemos, pero también de que nuestro trabajo sea útil. Es mejor equivocarse que ser impreciso. 5.5 regla 5: formular teorías de forma tan incluyente como sea posible. Un marco de referencia más amplio resulta útil si no perdemos de vista el hecho de que es necesario evaluar evaluar su aplicabilidad. aplicabilidad. De hecho, expresarla en relación con un marco de referencia hipotéticamente más amplio podría obligarnos a pensar en qué rasgos estructurales estructurale s de la teoría la harían aplicable o no a otros poderes legislativos legislativos independientes. Puede que parezca que esta regla entra en conflicto con las preferencias que mostró Robert Merton por las teorías de alcance medio. Merton no critica la teoría de fijación de roles, que consideraba de alcance medio, sino que ataca las amplias orientaciones teóricas con las que concuerda casi cualquier teoría más específica u observación empírica.
Precisar qué va a observarse Aquí se plantean plantean problemas problemas específicos del diseño diseño de investigación. investigación. Este capitulo capitulo se ocupa ocupa de como seleccionar los casos u observaciones observaciones para el análisis.
Diseños de investigación imprecisos Un diseño de investigación es un plan que muestra, mediante el análisis de un modelo y de unos datos, de qué manera esperamos utilizar nuestro material para extraer inferencias. Sin embargo, algunos diseños son imprecisos. O sea que no puede saberse casi nada de sus hipótesis causales. Por desgracia, esta práctica está muy extendida tanto en la investigación investigac ión cuantitativa como cualitativa, cuando la primera es imprecisa, el problema suele ser evidente por el programa de ordenador no dará estimaciones, sin embargo, las segundas no disponen de nada tan automático para descubrir diseños de investigación imprecisos. Hay dos situaciones en que un diseño de investigación es impreciso: a) Cuando Cuando el numero numero de inferen inferencias cias que que hay que que hacer hacer es mayor que que el de consecuencias consecuenci as observadas b) Cuando en en los datos hay 2 o más más variables variables explicativas explicativas que se correlacionan correlacionan perfectamente entre sí (multicolinealidad (multicolinealidad en términos estadísticos) 1.1 más inferencias inferencias que observacion observaciones es Cada observación puede puede ayudarnos a extraer, como máximo, una inferencia; un numero de observaciones n nos ayudará a hacer una cantidad de inferencias menor que n si las observaciones observacio nes no son independientes. independientes. En la practica se suele necesitar mucho más que una observación para hacer una inferencia causal que sea razonable. Al enfrentarnos enfrentarnos a explicaciones explicaciones imprecisas, imprecisas, a veces buscamos buscamos otras causas posibles posibles para el el acontecimiento acontecimi ento que intentemos explicar. Esto es exactamente lo contrario de lo que la lógica de la de la explicación explicación tendría que sugerirnos. sugerirnos. Una descripción mejor o más completa de cada caso de estudio no es la solución, ya que, al haber más parámetros que observaciones, casi cualquier explicación del impacto de cada una de las siete variantes estaría tan en consonancia con los datos como las demás. El problema de la imprecisión se podría solucionar reorientando la investigación hacia el estudio del efecto de unas determinadas variables explicativas sobre un abanico de acciones de los estados, más que de las causas de ciertos conjuntos de consecuencias, como es el éxito de proyectos conjuntos. 1.2 multicoli multicolineal nealidad idad el uso que se le da al termino multicolinealidad multicolinealidad refiere particularmente a cualquier situación en la que podamos predecir perfectamente una variable explicativa en función de una o más de las restantes. No partimos de ningún supuesto de linealidad, como si se hace en el significado significad o habitual del término estadístico.
Aunque se solucione solucione el problema problema de la imprecisión del diseño de investigación, puede que nuestras inferencias causales sigan siendo muy inciertas, por cuestiones como la de un número insuficiente de observaciones o la colinealidad entre variables causales. Para tener más confianza en las estimaciones siempre habrá que intentar maximizar el control sobre nuestro problema. En consecuencia, siempre tendremos que observar tantas consecuencias de nuestra teoría como sea posible. También el texto recomienda que se maximice el control limitando el número de variables explicativas explicativ as con las que se quiere hacer inferencias inferencia s causales. Un proyecto que logra sus fines es el que explica mucho utilizando pocos elementos, y lo ideal es que se utilice una sola variable explicativa para aclarar numerosas observaciones en las dependientes.
Límites de la selección aleatoria: En los estudios en los que n es grande evitamos el sesgo de selección mediante una selección aleatoria de las observaciones, porque un criterio aleatorio no se correlaciona con todas las variables explicativas o dependientes dependientes posibles. La aleatoriedad aleatoriedad es un enfoque muy valioso porque ofrece un procedimiento procedimiento de selección que automáticamente no se correlaciona con todas las variables. Esto quiere decir que, cuando n es grande, las posibilidades de que un criterio de selección se correlacione con cualquier variable observada son extremadamente pequeñas. En consecuencia, la selección aleatoria de observacio observaciones nes elimina automáticamente elsociales sesgo desolo selección en este tipo demente, estudios. Los experimentos controlados en ciencias se realizan ocasionalmente, ocasional sin embargo, tienen dos ventajas: control sobre la selección de observaciones y adjudicación adjudicación de valores de las variables explicativas a las unidades.
En la investigación cualitativa, y de hecho en gran parte de la cuantitativa, la selección aleatoria puede no ser factible, porque el universo de casos no está claramente especificado. La selección aleatoria no es necesariamente la mejor técnica, ni necesariamente siquiera cuando es factible. Es frecuente que los cualitativitas se resistan a utilizar (con razón) el concepto de selección aleatoria, negándose a correr el riesgo de no contar con casos importantes que este método podría descartar (estudiar revoluciones omitiendo la revolución revolució n francesa). En realidad, si solo tenemos un número reducido de observaciones, la selección aleatoria puede no resolver el problema del sesgo de selección y puede ser incluso peor que otros métodos de selección. Los cualitativitas apenas recurren abiertamente a la aleatoriedad como criterio de selección, pero han de asegurarse de que los criterios que utilizan no tengan t engan consecuencias consecuencias similares.
Sesgo de selección: 3.1 seleccionar en función de la variable dependiente En estudios con un n grande la selección aleatoria nos permite hacer caso omiso de la relación que existe en nuestro análisis entre los criterios de selección y otras variables. Esto nos conduce a una regla fundamental y evidente: la selección tiene que permitir que se produzca, al menos, alguna variación en la variable dependiente. Cuando las observaciones se eligenninguna a partir de de las un causas determinado valor la variable dependiente, no se puede conocer de esta sinde tener en cuenta otros ejemplos en los que adopte valores diferentes. En algunos casos, el diseño de una investigación investigación contempla el cambio de la variable dependiente pero la trunca: es decir, nuestras observaciones se limitan a una gama de cambios menor de la que puede alcanzar dicha variable en el mundo real. A pesar de que en este caso se puede decir algo de la variable dependiente, es posible que las inferencias estén sesgadas, esto porque el criterio de selección no tiene t iene en cuenta las variables explicativas, cualquier criterio de selección que se correlacione con la variable dependiente atenuara la media de estimaciones de los efectos causales. Si sabemos que existe un sesgo de selección y no hay forma de esquivarlo mediante una muestra mejor, esto supone que la media de nuestra estimación mostrará mostrará,, al menos, que el verdadero efecto causal tiene un límite más bajo. Los casos de sesgo de selección extremoen los que el diseño no permite que cambie la variable dependiente- son fáciles de manejar: evitarlos, si los utilizamos no conoceremos efectos causales.
3.1.1 ejemplos de sesgo de selección producidos por el investigador El problema del sesgo de selección suele aparecer en la política comparada cuando los investigadores tienen que viajar a determinados lugares para abordar su objeto de estudio. Con frecuencia, su capacidad de elegir unidades es limitada, ya que algunos gobiernos no dan información a los investigadores investigadores extranjeros. Por desgracia, esta negativa puede correlacionarse con la variable dependiente que interesa al investigador. 3.1.2 ejemplos de sesgo de selección producido por el mundo El sesgo que se produce cuando la selección de casos se correlaciona con la variable dependiente es una de las dificultades más habituales a las que se enfrentan los investigadores investigad ores que buscan pruebas en fuentes históricas. La razón es que los procesos históricos indican indican lo que ha de observase en función de un conjunto de criterios selectivos que no siempre se desprende claramente del registro. Ejemplo si en un principio unas culturas hacían esculturas de piedra y madera, y las de madera la misma historia las ha ido eliminando, el sesgo entorno a la piedra se hace solo. 3.2 seleccionar en función de una variable explicativa Seleccionar Seleccion ar observaciones para un estudio mediante las categorías de la variable explicativa principal no produce problemas inferenciales porque nuestro procedimiento de selección no predetermina el resultado del estudio, ya que no hemos restringido el grado de variación posible de la variable dependiente. Al limitar el alcance de la variable causal clave podemos reducir el carácter general de nuestra conclusión o la legitima certeza con la que se puede mantener, pero no introducimos ningún sesgo. Seleccionar casos a partir de los valores de esta variable nos permite controlarla dentro de ese proceso. No se introducirá sesgo, aunque la variable causal se correlacione con la dependiente, porque ya hemos controlado esa variable explicativa. De este modo, aunque la selección se realice en función de una variable que se correlaciona con la dependiente, es posible evitar el sesgo si se controla en el análisis En consecuencia, se puede evitar el sesgo seleccionando casos en función de la variable causal clave, pero también podemos lograr el mismo objetivo utilizando las categorías de una variable control (siempre que, en términos causales, esta proceda a la variable causal clave, como ha de ser siempre en las variables de control). Los experimentos casi siempre seleccionan en función de las variables explicativas. Las unidades se crean cuando se manipulan dichas variables y después se observa lo que le ocurre a la variable dependiente. También podemos evitar el sesgo haciendo la selección a partir de una variable irrelevante para nuestro estudio (que no influye en nuestra variable dependiente). Cuando resulta muy útil seleccionar en función de una variable irrelevante hay que realizar un análisis secundario de lo datos que existen. 3.3 otros tipos de sesgo de selección En esta situación, en la que los efectos causales varían de una unidad a otra, un criterio de selección que se correlacione con el tamaño del efecto causal conducirá a un sesgo en las estimaciones de los efectos causales medios. Si seleccionamos unidades con efectos causales acusados y hacemos una media de ellos durante la estimación, el efecto causal medio resultante será una sobreestima sobreestimación. ción. Del mismo modo, si seleccionamos unidades con efectos débiles, el calculo aproximado del efecto causal medio tendrá un valor menor que el real.
Seleccionar observaciones en función de la variable explicativa: En la investigación política, lo normal es que no tengamos control sobre los valores de nuestras variables explicativas; explicativas; los adjudica la naturaleza o la historia, pero no nosotros. En esta situación tan común la principal influencia que podemos recibir al diseñar la investigación afecta a la selección de los casos y de las observaciones. Seleccionar de manera intencionada las observaciones implica que, como mínimo, conocemos de antemano los valores de ciertas variables relevantes y descartamos la selección aleatoria. aleatoria. Tendremos menos posibilidades posibilidades de equivocarnos equivocarnos si los casos se seleccionan a partir de categorías de las variables explicativas. 4.1 seleccionar observaciones en función de la variable explicativa Tal como acabamos de señalar, los mejores diseños intencionados eligen sus observaciones de manera que la variable explicativa (y cualquiera de las de control) pueda cambiar, al margen de cuales sean los valores de las dependientes. Estos solo se descubren durante la investigación; después se extraen la primera inferencia causal, examinando de qué manera varía la distribución de resultados en la variable dependiente si se dan ciertos valores en las explicativas. Si los dos conjuntos de observaciones están bien equipados en las variables de control y se resuelven satisfactoriamente problemas como el de la endogeneidad, este diseño nos permitirá extraer inferencias válidas sobre las consecuencias de los acuerdos de control de armamentos,, por ejemplo. armamentos Las recomendaciones recomendaciones puristas – seleccionar seleccionar siempre en función de las variables variables explicativas explicativ as y nunca a partir de las dependientesdependientes- suelen ser poco realistas para la investigación investigac ión cualitativa. No todo está perdido cuando hay que tener en cuenta los valores de la variable dependiente al recoger los datos o cuando aquell aquellos os de los que se dispone ya que tienen en cuenta dichos valores. Aun puede obtenerse información sobre los efectos causales, pero si no tenemos mucho cuidado es probable que aparezca algún sesgo. 4.2 seleccionar un abanico de valores de la variable dependiente Las investigaciones investigaciones suelen comenzar del siguiente siguiente modo: encontramos algunas algunas fascinantes variaciones variacion es en un comportamiento comportamiento que queremos explicar. En este diseño de tipo retrospectivo (que en epidemiología se denomina estudio de control de caso), tomamos aquellas observaciones que adoptan valores especialmente altos o bajos en la variable dependiente. Comocausales, hemos subrayado, dedescriptivas selección pueda a hacer inferencias carece deaunque utilidadeste paraproceso hacer las que seayudarnos refieren a la variable dependiente. dependiente. Además, la falta de datos descriptivos sistemáticos y la mayor posibilidad de que aparezcan otros problemas debidos a posibles no lineados o efectos causales variables hacen que las inferencias causales que genera este procedimiento no suelan ser válidas. Un diseño de investigación retrospectivo puede ayudarnos a recabar información valiosa sobre la plausibilidad empírica de una inferencia causal, ya que bien podríamos darnos cuenta de que los valores altos y bajos de la variable dependiente dependiente están asociados, respectivamente, con los valores de uno u otro signo que se observan en las posibles variables explicativas. Es esencial que seleccionemos las observaciones sin tener en cuenta los valores de las variables explicativas. 4.3 seleccionar observaciones utilizando utilizando tanto las variables explicativas como las dependientes
Resulta peligroso seleccionar observaciones utilizando intencionalmente tanto las variables explicativas explicativ as como las dependientes, dependientes, porque, al hacerlo, es fácil que, sin darnos cuenta, introduzcamos introduzcam os un sesgo en el resultado. El error más grande consiste en seleccionar observaciones observacio nes en las que las variables explicativas y la dependiente cambian al unísono de una manera que se sabe que ajusta a la hipótesis que la investigación trata de contrastar. A pesar del riesgo riesgo que conlleva conlleva hacer una una selección a partir partir de las variables variables explicativas explicativas y de la dependiente, puede que haya unos pocos ejemplos de estudios con un número limitado de observaciones observaciones en los que tenga cierto sentido utilizar un método que baraje información sobre los valores de uno y otro tipo de variables, aunque esta técnica sea peligrosa y haya que tener mucho cuidado al utilizarla. Cuando los valores de la variable dependiente son los mismos, al margen de cuales sean los de las explicativas, nos encontramos ante un caso claro de efecto causal cero. Esta única situación sólo sería preocupante si creyéramos que el autentico efecto causal es muy pequeño, pero no cero. En estudios con n pequeño, no es probable que podamos distinguir con mucha certeza entre un efecto estimado con valor cero y otro efecto pequeño que no tenga ese valor. En esta simulación, simulación, la solución más directa será incrementar el número de observaciones. También se pueden seleccionar observaciones que se basen en valores muy extremos de las variables explicativas, de manera que sea más fácil reconocer cualquierr pequeño efecto causal. Si estas medidas no son suficientes, la selección a partir cualquie de las variables explicativas y de la dependiente (pero sin utilizarlas simultáneamente) pueden mejorar el diseño de investigación lo suficiente como para que se encuentre el efecto que buscamos. Por lo tanto, quizá tenga sentido utilizar técnicas de muestreo para elegir observaciones partiendo primero de la variación de la variable explicativa, pero haciéndolo de tal manera que se incluyan también las observaciones que tengan el valor atípico de la variable dependiente. Sin embargo, al hacerlo así, es importante no predeterminar el valor de la variable explicativa con la que se asocia la dependiente. Además, si se utiliza este procedimiento, hay que ser consciente de las posibilidades de sesgo que introduce y, por lo tanto, del valor limitado de nuestras inferencias.
4.4 seleccionar observaciones de manera que la variable causal sea contante A veces los científicos científicos sociales sociales diseñan investigaciones investigaciones de manera que la variable explicativa explicativ a que constituye la base de la selección se mantiene constante. Este enfoque es claramente deficiente, porque el efecto causal de una variable explicativa que no cambia no puede juzgarse. Por lo tanto, no es probable que sea productivo – al menos en sí mismo – un diseño que pretenda mostrar el efecto que tiene un rasgo constante del medio. Sin embargo, la mayoría de los trabajos forman parte de un cuerpo bibliográfico o tradición investigadora, investigad ora, y, por consiguiente, es probable que de antemano se disponga de cierta información útil. David Laitin proporciona un instructivo ejemplo de cómo un único investigador puede solucionar solucion ar ese tipo t ipo de problema en una sucesión de estudios. En el que realizó sobre el impacto del cambio religioso en el medio político de los yorubas nigerianos, nigerianos, analiza por qué no había podido superar este problema en su investigación anterior sobre Somalia. 4.5 seleccionar observaciones de manera que la variable dependiente sea constante Tampoco podemos aprender nada sobre el efecto causal de un estudio que seleccione sus observaciones observacio nes de modo que la variable dependiente dependiente no varié, pero la bibliografía del área
puede aportar la suficiente información como para permitir que se hagan inferencias causales validas. Dee ahí que hay que cambiar, si es posible, un estudio acerca de por qué nunca se llegó a un determinado resultado, para hacer que varíen la variable dependiente y las explicativas. Los investigadores investigadores sociales a veces utilizan un enfoque retrospectivo similar al de los centro de control de enfermedades, que basan su selección en valores extremos, pero constantes de la variable dependiente.
5. Ente Entend nder er que que debe debe evit evitars arse. e. Se estudiara de que manera una vez seleccionadas las observaciones es posible comprender las causas de ineficiencia y del sesgo de reducirlas a proporciones manejables y también de cómo podemos controlar la investigación con el fin de enfrentarnos adecuadamente a estos problemas. En el apartado 1 se analizaran los errores de medida que pueden sesgar nuestros resultados y hacerlos menos eficientes. En el apartado 2 se considerara el sesgo que puede aparecer en nuestras inferencias causales cuando hemos eliminado del análisis variables explicativas que deberían haber incluido. En el 3 se aborda el control de variables irrelevantes que reducen eficiencia analítica. La endogeneidad se verá en el 4 es decir, cuando la variable dependiente afecta a las explicativas y el 5 y 6 se vera la adjudicación aleatoria de valores en variables explicativas. 1. Er Erro rorr de medi medida da.. Al ser las observaciones y medidas imprecisas en Cs. Sociales nos encontraremos con el problema de error de medida. Los estudios cuanti tienen medidas mas precisas pero no necesariamente mas certeras. Las cuali intentan obtener medidas certeras que sin embargo, suelen ser un poco menos precisas. Si bien bien cu cual alii y cu cuan anti ti se mide miden n con con dist distin into toss va valo lore ress nu numé méri rico coss y ca cate tego gorí rías as,, lo loss investigadores utilizan criterios nominales, ordinales y de intervalo. Nominal: no presupone un determinado determinado orden. Ordinales: dividen fenomenos siguiendo un orden. Por ejemplo en cuali se podría distinguir 3 categorias en relacion al grado de industrilizacion o tamaño de fuerzas armadas. Intervalos: variables continuas. No hay ninguna formula que pueda determinar como lograr el equilibrio entre el uso de indicadores cuanti que quizás no reflejen de forma valida los conceptos subyacentes que nos interesan y el de valoraciones cuali siempre imprecisas y sujetas a sesgos inconscientes. Sin embargo los investigadores de cualquiera de estas deben hacer una estimación de las incertidumbres en sus inferencias. Cuantis deben presentar junto a sus medidas numéricas los errores típicos mientras que los cualitativistas deben hacer estimación de la incertidumbre, redactando lo que piensan de sus observaciones. Ambas mediciones cualis y cuantis son categorías que no vienen dadas por la naturaleza sino que son creados por el investigador, al igual que los criterios para ordenarlas. Es eviden evidente te que que no existen existen respue respuestas stas con validez validez univers universal: al: todas todas las medici medicione oness dependen del problema que el investigador pretenda comprender. Lo principal es utilizar la medida mas apropiada para nuestros fines teóricos.
Elegir entre categorías Elegir categorías nominales, nominales, ordinales ordinales o intervalares intervalares puede implicar un intercambio entre riqueza descriptiva y facilidad a la hora de comparar. Cada categoría tiene ventajas e inconvenientes, los fines del investigador deben determinar que opción se toma. Los problemas de medición mas frecuentes aparecen cuando se mide sin hacer referencia explicita a ninguna estructura teorica. No hay que descartar datos sin que haya razón para ello , como el hecho de realizar agrupaciones demasiada extensas como en la edad de una persona en clasificaciones como joven y viejo. Solo cierto tipo de errores de medida sistematico sesgan nuestras inferencias causales. a. Erro Errorr de med medid idaa siste sistema mati tico co.. Este error consiste en exagerar de manera constante el valor de ciertos tipos de unidades y que a veces puede sesgar y hacer incoherente la estimación de los efectos causales. El cometido es determinar que tipo de sesgo produce cada error de medida sistematico. Esto se debe a que el investigador puede tomar decisiones que haga que los datos favorezcan la constatación de sus expectativas. En cuali pueden realizarse evalauciones subjetivas en base a hipótesis formadas y querer demostrar que son correctas, mientras que en cuanti pueden utilizarse datos sesgados. El error de medida sistematico que afecta a todas las unidades por medio de una misma cantidad constante no sesga la inferencia causal. El consejo consejo es que se utilic utilicen en valora valoracio ciones nes que hayan hayan hecho hecho otros otros investi investigad gadore oress para para propósitos completamente diferentes. En la investigación cuali o cuanti eso nos garantiza que las medidas no sean influidas por nuestras hipótesis. b. Error de medida no sistematico. Este error no sesga la medida de la variable, se definen como no sistematicas aquellas variables que presentan valores que a veces son demasiado altos o demasiado bajos. Cuando se hace una estimación de efectos causales, el efecto del error de medida aleatorio es diferente si aparece en la variable explicativa o en la dependiente. Cuando lo encontramos en esta ultima reduce la eficiencia de la estimación causal pero no lo sesga y puede hacer que los valores de las relaciones causales sean a veces demasiado altos y otras demasiado bajos. Sin embargo la medida de la estimación será correcta. En una variab variable le explic explicati ativa va el error error aleato aleatorio rio tambié también n puede puede genera generarr inefici ineficienc encias ias que conduzcan a estimaciones vacilantes. Sin embargo sus consecuencias son diferentes a las que produce en la variable dependiente, ya que en la explicativa el error aleatorio sesga la estimación de la relacion que existe entre ambas.
2. Exclus Exclusion ion de de variab variables les relev relevant antes: es: el sesg sesgo o Los cualitativistas se dan cuenta de la importancia de controlar los posibles efectos falsos de otras variables cuando se ha ce una estimación de las consecuencias que tiene una variable sobre otra, entre los que se encuentra el método de similitud y diferencia de JS. Mill. Por desgracia los cualitativistas disponen de pcoas herramientas para epresar las consecuencias
precisas de no tener en cuenta mas variables en determinados momentos de una investigación, o sea, de ocuparse del sesgo de variable omitiada. a. Como Como calibr calibrar ar el sesgo sesgo de de las varia variable bless omitid omitidas as Supongamos que queremos hacer una estimación del efecto causal que tiene nuestra variable explicativa X1 sobre la dependiente Y. Si estamos haciendo análisis cuanti el efecto causal de X1 sobre Y lo expresamos mediante B1, que se puede estimar mediante una ecuación de regresión B1 o utilizando otra forma de análisis que nos de una estimaciob b1 de B1. Si estamo est amoss realiza realizando ndo investi investigac gación ión cuali cuali tambié también n intent intentarem aremos os obtene obtenerr esa estimac estimación ión del efecto causal sin embargo en este caso el calculo dependerá de un argumento verbal y de la valoración del investigador que se basan en la experiencia y el criterio. El tema es que puede vernir un tercero a ver nuestro análisis y plantea una objeción de que he hemo moss omit omitid ido o un unaa impo import rtan ante te va vari riab able le de co cont ntro roll X2. X2. Hemo Hemoss estad estado o ha hacie ciend ndo o un unaa estimación del efecto que tienen los gastos en las campañas electorales sobre la proporción del voto que recibe un candidato del congreso estadounidense, pero se sugiere que no hemos tenido en cuenta la variable explicativa X2 como medir si los candidatos son ya congresistas. Es decir la conclu conclusió sión n seria seria falsa debido debido al sesgo de variable omitida. Lo que sugiiere nuestra estimación b1 de B1 es incorrecta porque no se ha tenido en cuenta la otra variale explicativa X2. Ahora ¿Cómo evaluamis dicha afirmación del colega? Esta situación no siempre tiene una influencia importante, en el sentido de que omitir un termino que mida influencia de ser ya congresista no tendrá importancia si el hecho no influye en la variable dependiente, es decir, que si X2 es irrelevante porque no tiene efecto sobre Y es irrelevante, y no produce ningún sesgo. Las variables omitidas irrelevantes no producen sesgos. El segundo caso donde no se produce sesgo es cuando la variable omitida no se correlaciona con la explicativa incluida. Tampoco hay sesgo si el hecho de ser ya congresista no se correlaciona con nuestra variable explicativa, el gasto en campaña electoral. Podemos omitir variables de control con tranquilidad, aunque tengen una gran influencia en la variable dependiente, siempre que no cambien con la variable explicativa incluida en el análisis. (pag 179) Podemos omitir una variable de control si: - La variable omitida no tiene un efecto causal sobre la dependiente (o sea, B2= 0, independientemente del tipo de relacion que exista entre la variable incluida y la excluida, F) correlaciona aciona con la incluida incluida (es decir, F=0 cualquiera cualquiera que - LA variable omitida no se correl sea el valor de B2) Cuando sospechemos que hay una variable omitida que puede estar sesgando los resultados, nuestro análisis no podrá terminar aquí, si es posible, hay que controlar esa variable omitida y aunque no podamos hacerlo por falta de buena fuente de datos nuestro modelo podrra ayudarnos a determinar la dirección del sesgo, lo cual puede ser muy útil. Verlo en la pagina 182-183 Si pensam pensamos os que quizás quizás nu nuestr estro o diseño diseño de investi investigac gación ión se ha visto visto perjud perjudica icado do por la omisión de ciertas variables pero no sabemos cuales son, es muy posible que tengamos conclusiones imperfectas (que probablemente, en el futuro, otros investigadores detectarán).
Toda información cualquiera sea su procedencia y aunque sea incompleta, puede ayudarnos a determinar determ inar el posible posible nivel de sesgo que hay en nuestr nuestros os efectos causales y la dirección que sigue. 3. Inclusion Inclusion de variab variables les irrelevantes: irrelevantes: la inefici ineficiencia encia A causa de los problemas potenciales que presenta el sesgo de la variable omitida, podríamos pensar ingenuamente que es esencial recoger todas las posibles variables explicativas, estimando estima ndo a la vez sus efectos efectos causal causales, es, esto no es lo que se señala en el apartado 2 del capitulo, donde se dice que omitiar una variable explicativa que no se relaciona con las explicativas explic ativas incluidas incluidas no gene genera ra se sesg sgo, o, aunq aunque ue te teng ngaa fu fuer erte te impa impact cto o ca caus usal al en la dependiente. El argumento no debería llevar a los investigadores a recabar información sobre todas las inferenfcias causales posibles o a criticar los estudios que no lo hagan. En el presen presente te aparta apartado do analiz analizamo amoss los costes costes que eiene eiene inclui incluirr variab variables les explica explicativ tivas as iirele iirelevan vantes tes y mostra mostramos mos reserva reservass fumdan fumdanent entale aless ante ante la preten pretensió sión n de “inclu “incluirl irlo o todo”. todo”. variables es irrelevantesn irrelevantesn puede ser muy dañino. Nuestra idea principal es que aunque Incluir variabl la va vari riab able le de co cont ntro roll no tenga tenga ning ningún ún ef efec ecto to ca caus usal al en la de depe pend ndie ient nte, e, cuant cuanta a mayor correlacion haya entre la variable explicativa y la irrelevante de control, menos eficiente será la estimación del principal efecto causal. (paginas 194-195 para entender mas) 4. Endo Endoge gen neida eidad: d: En cs políticas no tenemos posibilidad de hacer investigación experimental con frecuencia y de manipular variables explicativas, solo las observamos. Una consecuencia de esta falta de control es la endogeneidad, es decir, que los valores de nuestra nuest ra svariables svariables explicativas explicativas a veces provienen provienen de nuestra nuestra variable variable dependient dependientee en vez de ser una de sus causas. Si el investigador no controla los valores de las variables explicativas, la dirección de la causalidad siempre será un problema difícil, en la investigación no experimental las variables explicativas y dependintes varian por influencia de factores que escapan al investigador. En este apartado apartado se revisaran revisaran 5 procedimientos procedimientos para evitar evitar porblmas porblmas de endogeneida endogeneidad, d, pero también pueden verse como formas de aclarar una hipótesis causal. Corregir una inferencia sesgada Precisar cuales son los componentes de la variable dependiente y estudiar solo aquells que sean consecuencia y no causa de al explicativa. - Convertir un problema de endogeneidad en un sesgo producido por una variable omitida y controlar estra variable. Selecci ccion onar ar co con n cu cuid idad ado o al meno menoss algu alguna nass ob obser serva vaci cion ones es en la lass qu quee no ha haty tyaa - Sele problema de endogeneidad - Prec Precisa isarr cuales cuales son los compon component entes es de las variab variables les explica explicativ tivas as con el fin de asegurarse de que solo entrean en el análisis los que sean realmente exógenos. i. Corregir inferencias sesgadas: Aunque no podamos evitar el sesgo de endogeneidad, a veces si podemos mejorar las inferencias a posteriori haciendo una estimación del nivel de sesgo. Como minimo esto nos permitirá determinar su
-
dirección y quizás el limite superior o inferior de la estimación correcta.
ii. ii.
iii. iii.
iv. iv.
Prec Precisa isarr cual cuales es son son lo loss comp compon onen ente tess de la la vari variab able le dep depen endi dien ente: te: un uno o de de las las form formas as de evitar evitar el sesgo sesgo de endoge endogenei neidad dad es redefi redefinir nir la variab variable le depend dependien iente te para para dotarl dot arlaa de sus propio propioss compo componen nentes tes depend dependien iente te y explica explicativ tivo. o. Este Este ultimo ultimo obstaculiza nuestro análisis a través de un mecanismo de retroalimentación, es decir, influye en la variable causal (explicativa) clave. La otra parte de nuestra variable dependiente es realmente dependiente: es una función, y no una causa, de la variable explicativa. El objetivo de esta forma de evitar sesgo de endogeneidad es identificar y medir solo la parte dependiente de nuestra variable dependiente. Con onve vert rtir ir la en end dogen ogenei eida dad d en un pr pro obl blem emaa de va vari riab able le omit omitid ida: a: fu func ncio iona na principalmente trasladando la preocupación general sobre la endogeneidad a posibles fuentes especificas de sesgo de la variable omitida, para buscar después un subconjunto de observaciones en el que podrían no estar presente esas causas de sesgo. Pagina 202-204 ejemplo. Pr Prec ecis isar ar cual cuales es son los los compo compone nent ntes es de la varia variabl blee ex expl plic icat ativ iva: a: su objet objetiv ivo o es dividir una variable explicativa potencialmente endógena en 2 componentes: uno claramente exógeno y otro que sea al menos en parte endógeno. Posteriormente el investigador solo utilizara en su análisis causal la parte exógena de la variable explicativa. Pag 205 un ejemplo.
5. Asignac Asignacion ion de valo valores res a la variabl variablee explica explicativ tivo. o. La endogeneidad no siempre es un problema que haya que precisar, sino que a veces constituye una parte integral del proceso por el que el mundo genera observaciones. Con frecuencia, resulta bastante difícil averiguar como se han determinado los valores de las variables explicativas, y no suele ser posible recurrir a ningún procedimiento automatico para resolver los problemas que plantea. Los cualitativistas deben preguntarse si es posible aumentar el numero de observaciones que van a investigar ya que a falta de reunirlas todas el procedimiento procedimiento mas fiable fiable es recoger de forma aleatoria datos relacionados con un gran numero de unidades y aleatorizar la asignación de valores para las variables explicativas. Sin embargo, si esto no es posible, no hay que selecci selecciona onarr las ob observ servaci acione oness aleato aleatoria riamen mente, te, sino sino que es precis preciso o utiliza utilizarr el conocimiento que ya tenemos de las observaciones disponibles y hacer la selección de observaciones y la de valores a las variables explicativas de tal modo que se evite el sesgo e ineficiencias. Si el sesgo es inevitable al menos hay que averiguar su dirección y magnitud. Si no es posible determinar esto ultimo, debemos describir los resultados con un mayor grado de incertidumbre para que la investigación mejore. En cualquier caso en todos los estudios tendría que haber un apartado o cap en el que se expliquen los proceso de asignación y selección de valores, las reglas utilizadas. 6. Contro Controlar lar la situ situaci ación ón que que se invest investiga iga.. Si se seleccionan de forma deliberada observaciones sin tener en cuenta las variable de control relevantes ni problemas inferenciales, no se cumple el presupuesto de homogeneidad de las las un unid idad ades. es. Hay Hay qu quee asegu asegurar rarse se de lo loss va valo lores res de la va vari riab able le ex expl plic icat ativ ivaa en la lass observaciones elegidas se midan con el minimo error posible de que no se correlacionen con
alguna variable explicativa omitida clave y de que no esten parcialmente determinados por la dependiente. Hay Ha y que que cali calibr brar ar pr prob oble lema mass como como el er erro rorr de medi medida da,, la lass va vari riab able less omit omitid idas as y la endogeneidad. Y si no se puede al menos reconocerlos e intentar corregirlos. Ejercer controles es un proceso difícil porque hay que aplicarlos a todas las variables que puedan ser confusas. Si no equiparamos en función de una determinada variable controlada de ninguna otra manera e influye en al variable dependiente a la vez que se correlaciona con la explicativa, la estimación de nuestro efecto causal estará sesgada. La estrategia de selección intencionada conlleva a algunos peligros ocultos de los que los inve invest stig igad ador ores es tend tendrí rían an que que se serr co cons nsci cien ente tes, s, es espe peci cial alme ment ntee al in inte tent ntar ar eq equi uipa para rar r observaciones con el fin de controlar variables potencialmente relevantes.
El investigador investigador que intente intente hacer inferencias inferencias causales puede puede seleccionar seleccionar los casos de dos maneras. La primera es la que utiliza los criterios aleatorios para sleeccionar y adjudicar valores, que es útil en estudios con un N grande. En tales investigaciones la aleat ale ator oried iedad ad cu cump mple le au auto tomá máti ticam camen ente te la in inde depe pend nden enci ciaa co cond ndic icio iona nall y es un procedimiento mucho mas fácil que el de seleccionar observaciones a propósito para cumplir la homogeneidad de las unidades. La aleatoreidad nos garantiza que no se omiten variables relevantes y que la selección de observaciones no se esta realizando con criterios que se correlacionan con la variable dependiente. Este proceso igual garantiza que los sesgos del investigador no entran en el criterio de selección y no influye en los resultados. El segun segundo do méto método do es el de dela la se selec lecci ción ón in inte tenc ncio iona nada da de ob obser serva vaci cion ones, es, qu quee recomendan en estudios que tengan un n reducido. Este tipo de investigaciones parte de una selección intencionada para hacer inferencias causales razonables, casi siempre arrojarán inferencias mas arriesgadas que las que aplican criterios aleatorios a grandes muestras y dependerán mas de las opiniones previas que tenga el investigador sobre el mundo empírico; en ellas los controles pueden introucir sesgos diversos y sutiles. No obstante por las razones que se han subtayado los controles son necesarios en un estudio de n pequeño y syi son adecuados quizás solo haya que calcular el efecto causal de una única variable explicativa, con la que aumentaremos el control sobre el problema.
6. aumentar el numero de observaciones Importante es maximizar el control sobre los problemas de investigación. Lo que puede ser un estudio de un solo caso o de unos pocos quizá contenga en realidad muchas posibles observaciones que sean relevantes para la teoría que se está contrastando y que se encuentren en diferentes niveles de análisis. Al aumentar el numero de observaciones incluso sin recoger mas datos, el investigador suele transformar un problema insoluble que tiene un diseño de investigación impreciso en algo manejable. El capitulo tratara en como aumentar el numero de observaciones relevantes en un estudio social de tipo científico.
Si hay solo una observación cuando n = 1, es imposible evitar el problema fundamental de inferencia causal. Se pasara a dar cuenta de cuantas observcaciones son suficientes para alcanzar niveles de incertidumbre satisfactorio
Se demostrara que casi todos los diseños de investigación cualitativos pueden reformularse para darles muchas observaciones y que si el investigador conceptualiza adecuadamente las consecuencias observables que ya tiene, esto suele poder hacerse sin que sea necesario llevar a cabo una costosa recogida de datos adicionales. a. Inferencias Inferencias causales causales con con diseños diseños de una sola observación observación
Es muy difícil salir airoso de una investigación con solo una unidad para evaluar teorias causales n=1. - Estudio de caso “cruciales” Para Eckstein los estudio de caso cruciales pueden refutar teorias suficientemente precisas con una sola observación. Hay 3 razones por las que dudamos que un estudio que se base en una observación crucial pueda servir para los fines explicativos que Eckstein le concede. Ejemplos 223-224 223-224 - Hay muy pocas explicaciones que solo dependen de una variable causal; para evaluar el im impa pact cto o de mas mas de un unaa va varia riabl blee ex expl plic icati ativa va el in inve vest stig igad ador or ne nece cesi sita ta ha habe ber r observado mas de una consecuencia - Medir la observación crucial es difícil y no del todo fiable - No es razonable abordar la realidad social partiendo de la base de que es una consecuencia de procesos deterministas, de manera que, aunque las medidas fueran perfectas habría errores aleatorios. b. Razonamiento analógico: El uso adecuado de la nalogia nalogia es fundamenta fundamentalmente lmente el mismo que el de la equiparación equiparación que mantiene otras variables constantes. Nuestra hipótesis causal es que si 2 unidades son las mismas en todos los aspectos relevantes, unos valores parecidos en variable explicativa relevante hara que también se asemejen en la dependiente, es decir, sabríamos que la crisis que vive actualmente el país B que es equiparable a la del país A el año pasado, tendría la misma consecuencia consecuencia que las que se observaron observaron en el ultimo. ultimo. Si lo observamos observamos de este modo se verá que el “razonamiento analógico” puede ser apropiado. Sin embargo este tipo de argumentación nunca es mejor que el análisis comparado que conlleva. Siempre será mejor partir de mas observaciones para nuestra generalización, lo que ocurre en el país país A podría podría haber haber sido sido consecu consecuenc encia ia de favtor favtores es esocást esocástico icoss que habría habrían n quedad quedado o anulados si nuestras predicciones se hubieran basado en las crisis ocurrida en otros cinco países equiparables. Si la analogía es incompleta, es decir, si se han omitido variables relevante, puede que al calcular los efectos causales cometamos errores. La an anal alog ogía ía util utiliza iza so solo lo un unaa ob obse serv rvac ació ión n pa para ra pr pred edec ecir ir ot otra ra,, mien mientr tras as qu quee el méto método do comparado comp arado emplea una combinación combinación bien sopesada de un numero numero mayor de observacion observaciones. es. Estas nos ayudarán a realizar un pronostico mas preciso y eficientem siempre que contengan ciertos rasgos que se parezcan de algún modo al acontecimiento que estamos pronosticando y que utilicemos la información adicional de manera razonable. Si queremos usar analogías tendremos que abordarlas de un punto de vista comparativo y mas general. 2. Cuantas observaciones son suficientes? Depende en gran medida del diseño del estudio, de que inferencia causal intente calcular y de algunos rasgos del mundo que el investigador no puede controlar.
Se puede expresar fácilmente el numero de unidades que se precisan en una determinada situación mediante una formula sencilla.
1. Variabilidad Variabilidad fundam fundamental: ental: mientras mientras mas mas sea la variabilida variabilidad d no explicada explicada de la la variable variable dependiente, mas observaciones habrá que recoger para hacer una inferencia causal fiable. fiab le. Recog Recoger er datos datos sobre sobre mas un unida idades des puede puede increm increment entar ar nuestro nuestro contro controll lo suficiente como para permitirnos encontrar pautas causales sistémicas. Un estimador mas eficiente también necesitara que se recoja mas datos. 2. Incertidumb Incertidumbre re de la inferencia inferencia causal: causal: su presenci presenciaa en el denominad denominador or de la ecuación, ecuación, demuestra que es obvio que cuanta mas incertidumbre estemos dispuestos a tolerar, menos observaciones habrá que recoger. Cuando no se sabe mucho sobre cierta área quizás se puede aportar mucho con relativamente pocas observaciones, pero si el tema ya se ha profundizado un estudio es relevante solo si se tienen mas observaciones para convencer la existencia de un nuevo efecto causal. 3. Coli Coline neali alida dad d en entr tree la variab variable le ca caus usal al y las las de contr control ol:: si la va vari riab able le ca caus usal al no se correlaciona con otras variables que estemos controlando, incluir estas no influirá en el numero de observaciones que hay que recoger, de lo contrario se necesitan mas. 4. Varia Varianz nzaa de los los va valo lores res de la va vari riab able le ex expl plic icat ativ ivaa ca caus usal al:: mien mientra trass mayo mayorr se seaa la varianza de valores de variable explicativa causal, menos necesitaremos recabar para alcanzar un determinado nivel de certidumbre en relacion a la inferencia causal.
c. Aumentar Aumentar el numero numero de observacion observaciones es a partir de unas unas pocas. pocas. Las observaciones son el componente fundamental de la investigación social empírica, las reunimos con el fin de presentar pruebas que consideramos fiables para evaluar nuestras teorías. Si ne neces cesit itam amos os mas mas ob obse serv rvac acio ione ness pa para ra reali realiza zarr un unaa co comp mpro roba baci ción ón ha hay y 3 fo form rmas as de conseguirla. i. Observar Observar mas unidades, unidades, medirl medirlas as otra vez de de diferente diferente manera manera o hacer ambas ambas cosas. cosas. ii. Una reproducc reproducción ión parcial parcial de nuestra nuestra teoría teoría o hipótesis hipótesis en la que que se utiliza utiliza una nueva nueva variable dependiente con las mismas variables explicativas
iii. Se plantea plantea una hipótesis hipótesis nueva nueva que estaba estaba implícita implícita en nuestra nuestra teoría teoría original original y que utiliza otra variable dependiente para aplicarla a nuevos ejemplos. 1. Las mism mismas as medid medidas as con con otras otras unid unidade ades. s. No es necesario que rebasemos los limites de la unidad que hemos estado estudiando (creo que se refiere por ejemplo a otros países). Una teoría que en principio se centre en un estado nación, puede contrastarse en las unidades geográficas que lo componen, estados, condados, regiones, etc. Lo que aumenta el margen de variabilidad de las variables explicativas como de la dependiente. Un enfoque alternativo es considerar observaciones a lo largo del tiempo. La india actual y la de hace una década pueden ser 2 ejemplos del proceso que nos interesa. De hecho en la mayoría de investigaciones que se consideran estudios de caso, hay multiples medidas de hipótesis a lo largo del tiempo. Creemos que aconsejar que se aumente el numero de observaciones buscando mas ejemplos en las sub unidades o teniendo en cuenta mas situaciones a lo largo del tiempo es una de las indicaciones mas utiles que podemos dar a investigadores cualitativos. Soluciona el problema que plantea un n pequeño porque lo aumenta sin que sea necesario, sin viajar a otro país o analizar una decisión completamente nueva. Sin embargo hay que tener cuidado, la teoría o hipótesis tiene que ser aplicable a la nueva situación, es decir, la subunidad debe contener realmente una consecuencia observable de dicha teoría. 2. Nuevas Nuevas medi medidas das con con las las misma mismass unidad unidades. es. Se pueden obtener mas ejemplo para comprobar una teoría o hipótesis con la misma unidad de observación pero cambiando la variable dependiente. Para utilizar este método hay que buscar muchos efectos de la misma causa, lo cual constituye una técnica muy convincente para comprobar una hipótesis. Aparte de la variable dependiente actual ¿en que otras cosas cabe esperar que influyan nuestras variables explicativas? Esto nos puede sugerir indicadores alternativos de la variable dependiente. (237) 3. Nuevas Nuevas medi medidas das con con nuev nuevas as unida unidades des.. Tambien podemos salirnos del conjunto de variables explicativas y dependientes que se han aplicado a un determinado conjunto de variables para buscar otras consecuencias observables que manejen nuevas variables y unidades. Para llegar a la nueva teoría o hipótesis que es diferente a la orgiginal pero que parte de ella, suele ser necesario desplazarse a un nivel de agregación mas bajo y aun nuevo tipo de unidad. Esto Esto no supo supone ne tr trasl aslad adar arse se de desd sdee un unaa un unid idad ad po poli liti tica ca co como mo na naci ción ón a ot otro ro in infe feri rior or de ag agreg regaci ación ón co como mo pr prov ovin inci cia, a, sino sino de desp splaz lazar arse se de desd sdee esas esas na naci cion ones es o pr priv ivin inci cias as ha hast staa individuos que viven en las unidades o hasta las decisiones que toman dentro de ellas. Ejemplos 237-241
View more...
Comments