Curso de Psicometria
Short Description
Download Curso de Psicometria...
Description
CURSO VIRTUAL DE PSICOMETRIA
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA FACULTAD DE CIENCIAS SOCIALES, HUMANAS Y EDUCATIVAS
2
ÍNDICE
I. Protocolo
4
Ficha Técnica
4
Introducción
5
Justificación
6
Intencionalidades formativas
7
Unidades didácticas
13
Contexto teórico
14
Metodología
15
Sistema de Evaluación
17
Recursos Tecnológicos
18
Glosario de Términos
21
II. Guía Didáctica
24
Presentación
24
Fases del Aprendizaje
24
Técnicas e Instrumentos para la Objetivación del Aprendizaje
25
Portafolio de Desempeño Personal y Grupal
26
Descripción de Actividades
27
III. Modulo
31
Unidad I
31
Historia de la Psicometría
31
Definición de Psicometría
39
La Teoría de los Test
50
Conceptos y Metodología Estadística de la Psicometría
55
Confiabilidad
55
Validez
58
Artículo Complementario: Técnicas Psicométricas: Cuestiones de Validez y Confiabilidad
61
3
Unidad II
84
Aproximación al Uso de Pruebas Estandarizadas
84
Evaluación de la Personalidad
84
Cuestionario de la personalidad 16PF
84
Inventario Multifasico de la Personalidad de Minnesota MMPI
104
Pruebas Proyectivas
118
El Test de Rorscharch
118
Pruebas de Inteligencia
124
WISC – R
125
Conclusión
125
Referencias Usadas y Bibliografía Recomendada
128
Anexo 1: Directrices Internacionales para el Uso de Test
130
4
I. PROTOCOLO
Ficha Técnica Nombre del curso:
Psicometría
Palabras clave: Institución:
Universidad Nacional Abierta y a Distancia -UNAD.
Ciudad:
Bogotá – Colombia
Autor del Protocolo Académico: Año:
Franklin Soler 2006.
Unidad Académica: Campo de formación:
Básica disciplinar
Área del conocimiento: Ciencias Humanas y Sociales Créditos académicos:
Dos (2)
Tipo de curso:
Fundamentación teórica. Estudiantes de diversos programas de pregrado y
Destinatarios:
cursos abiertos de la Universidad Nacional Abierta y a Distancia-UNAD-.
Competencia general de aprendizaje:
Los estudiantes evalúan las capacidades mentales haciendo uso de diversos métodos, técnicas y pruebas de evaluación.
Metodología de oferta: A distancia. Formato de circulación:
Documentos impresos, Web; CD-ROM.
Denominación de las
1. Historia y Conceptos Básicos de la Psicometría
unidades didácticas:
2. Aproximación al de Pruebas Estandarizadas
5
Introducción
Las intencionalidades formativas de este curso van dirigidas principalmente al desarrollo de competencias cognoscitivas y prácticas en el orden del analizar, explicar los fundamentos conceptuales y metodológicos sobre los que se construye la psicometría y los principales instrumentos de medición de eventos psicológicos.
Sus unidades didácticas abarcan los temas de la historia de la psicometría, sus presupuestos básicos teóricos y metodológicos y la comprensión y uso de algunos instrumentos que miden o evalúan diferentes características psicológicas de los individuos, entre ellos están la prueba Roscharch, el MMPI, el 16 PF y el WISC-R.
El área temática abordará el estudio de los principios de la medición y evaluación en la disciplina de la psicología y de los fenómenos psíquicos que son determinantes en el comportamiento humano, en tanto que la psicometría es un área de la psicología cuya finalidad intrínseca consiste en aportar soluciones al problema de la medida en cualquier proceso de investigación del comportamiento. Es además un campo metodológico que incluye teorías, métodos y usos de la medición psicológica en aspectos conceptuales e instrumentales.
La metodología enseñanza - aprendizaje de este curso se adelantará utilizando las estrategias de tipo interactivo desarrolladas por la UNAD, propias de la Educación a Distancia. Los procesos de evaluación requerirán del estudiante su disposición investigativa y participativa, se promoverá la discusión y la proposición.
Los documentos que el estudiante se encargará de leer para llevar a buen término el curso serán principalmente escritos que se encuentran en las revistas electrónicas científicas de psicología (medición y psicometría). La participación y el trabajo activo tanto del estudiante como del tutor permitirán que el curso cumpla las metas propuestas.
6
Al ser un curso diseñado para estudiantes de educación a distancia, hace énfasis en la autogestión formativa mediada sincrónica y asincrónica, proponiendo interacciones entre tutor y estudiante y de los estudiantes entre sí. Constituye dos créditos académicos equivalentes a 96 horas de estudio, distribuidas de la siguiente manera: Estudio independiente: 64 Acompañamiento y seguimiento tutorial: 32 El campo de formación corresponde al área básica disciplinar dentro de los créditos obligatorios del plan de estudios. El curso es conducente a la autogestión estudiantil de los conocimientos metodológicos y conceptuales teóricos necesarios para la comprensión y desarrollo de habilidades en medición de variables psicológicas. A través del curso se prepara al estudiante para reflexionar críticamente en torno a la utilidad de la medición y la evaluación de las habilidades y destrezas cognoscitivas además de los riesgos y desventajas que pueden generar. Justificación
La psicometría es una herramienta indispensable para las actividades relacionadas con la psicología principalmente en el campo de la evaluación y el diagnóstico, permitiendo niveles altos y objetivos de medición del comportamiento humano. Una de las dificultades que debe afrontar el psicólogo, en cualquiera de sus áreas de desempeño, es precisamente la evaluación, puesto que el hombre con su diversidad en todos los aspectos hace que la cuantificación del comportamiento sea compleja.
La formación en psicometría provee a los estudiantes la posibilidad de acercarse a la medición de eventos psicológicos; forma al estudiante en los paradigmas
7
particulares de resolución de problemas psicológicos, instalándolo en los procesos de comprensión y uso técnico de pruebas propias de esta ciencia. Algunas preguntas que guiarán este curso son las que siguen:
-
¿Cuál ha sido el curso histórico que ha permitido el desarrollo de pruebas o test de medición de eventos psicológicos?
-
¿Qué significan en la medición los conceptos de validez y confiabilidad?
-
¿Qué pruebas se utilizan con mayor frecuencia en psicología y que fenómenos psicológicos miden?
-
Para resolver estos y otros cuestionamientos, el presente curso académico abarcara dos elementos centrales de la psicometría: la historia, los elementos metodológicos y conceptuales para la construcción de test y la segunda parte estará dirigida a la comprensión y manejo de algunas pruebas de uso tradicional en diferentes áreas de la psicología.
Intencionalidades Formativas Propósitos de formación 1. Explicar los conceptos fundamentales sobre los que se construye la psicometría como estrategia cuantitativa de la psicología, valiéndose de las principales teorías y modelos psicológicos y estadísticos que la ha abordado. 2. Valorar los aportes teóricos de las diferentes escuelas psicológicas a la comprensión de la medición, partiendo de criterios científicos y experimentales. 3. Demostrar la existencia e importancia de los procesos psicológicos y su posibilidad de cuantificarlos. 4. Hacer una aproximación metodológica y conceptual sobre las capacidades cuantitativas y cualitativas de algunas pruebas que se han utilizado para medir diferentes características psicológicas, a través de ejercicios y aplicaciones y calificación de algunos instrumentos de alta tradición en la psicología científica.
8
5. Contribuir a la mejora de hábitos de indagación y pesquisa sistemática través del desarrollo de competencias de investigación formativa mediante el conocimiento de protocolos y pruebas psicométricas. 6. Generar en el estudiante una actitud critica, a través del fomento de la discusión y el trabajo colaborativo en redes de comunidad académica en psicometría, a partir de la selección y valoración de las diferentes pruebas que aporta la psicología y otras formas de abordaje de la medición del comportamiento. 7. Potenciar los procesos de autoaprendizaje del estudiante a través del desarrollo de estrategias de autogestión formativa, a partir de la interacción con medios y mediaciones incluidos escenarios virtuales, coherentes con la estructura epistemológica y metodológica de la medición en psicología. 8. Desarrollar capacidades de medición y evaluación psicológica, a través del entrenamiento en el uso de algunas pruebas y estrategias que permitan una aproximación del estudiante a los problemas de desarrollo y consolidación de la psicometría. Los propósitos expuestos se pueden globalizar en la siguiente síntesis: Contribuir al desarrollo del espíritu investigativo del estudiante en el área de Psicometría, a partir del análisis de los elementos centrales de los métodos y aproximaciones teóricas, mediante la organización y selección de actividades que perfilen el autoaprendizaje y la discusión con sus pares y el docente guía. Objetivos de aprendizaje -
Que el estudiante adquiera los conocimientos necesarios y suficientes que permitan la comprensión de los aportes de la psicometría al desarrollo y estudio del
comportamiento
(léase
personalidad,
actitud,
aptitud,
inteligencia,
competencia, etc.), mediante el estudio de las diferentes teorías y modelos psicológicos y que la explican.
9
-
Que el estudiante describa, relacione y comparare los aportes teóricos y metodológicos que han permitido el desarrollo de la medición en psicología, a través de ejercicios de aplicación de pruebas psicométricas.
-
Que el estudiante comprenda la importancia de la medición, mediante el estudio y
aplicación
a
situaciones
donde
se
requiera
la
cuantificación
del
comportamiento.
-
Que los estudiantes adquieran las destrezas necesarias para la formulación y resolución de problemas de investigación psicométrica.
-
Capacitar a los alumnos para comprender y analizar críticamente la bibliografía relacionada con cualquiera de los campos de la Psicometría.
-
Que los alumnos conozcan y sepan utilizar adecuadamente los principales esquemas procedimentales para la medición de variables psicológicas.
-
Dotar a los alumnos de herramientas para que generen sus propios criterios con la finalidad de que puedan realizar juicios críticos en relación con la calidad y adecuación de los diferentes instrumentos de medida que habrán de utilizar en el desempeño de su labor como profesionales.
-
Motivar positivamente a los alumnos hacia la Metodología de las Ciencias del Comportamiento en general y respecto a los problemas propios de la Psicometría en particular.
-
Promover actitudes favorables a la investigación científica y al método científico como una forma de enfrentarse a los problemas psicológicos.
10
Competencias Teniendo en cuenta las fases del aprendizaje (reconocimiento, profundización y transferencia), se desarrollarán entonces, competencias de tipo cognoscitivo, práctico y afectivo que permitirán la apropiación e interiorización del conocimiento. Las competencias que se presentan a continuación procuran vincular e integrar los diferentes elementos teóricos y metodológicos de los diferentes contenidos del presente curso y que el estudiante desarrollará a lo largo del aprendizaje mediático sobre el que está basada su didáctica:
-
Tener como meta de actuación la calidad del trabajo realizado (es decir, no sólo trabajar de modo eficaz sino también del mejor modo posible).
-
Interés por la investigación y creación de nuevos datos en Psicología, tanto como receptor o evaluador de las innovaciones, como usuario o como generador de las mismas.
-
Conocer y cumplir la normativa ética propia de la profesión y de la investigación psicológica y respetar los derechos de consultantes y usuarios de los servicios psicológicos.
-
Tener la capacidad de valorar los procedimientos utilizados para obtener datos psicológicos relevantes así como para valorar la pertinencia de los informes resultantes de la investigación y evaluación psicológicas.
-
Transferencia y uso flexible del conocimiento.
-
Habilidad para transferir el conocimiento académico a las diferentes situaciones reales.
11
-
Saber aplicar distintos métodos de medición, evaluación y diagnóstico en los ámbitos aplicados de la Psicología.
-
Conocer y respetar la diversidad psicológica, las creencias y valores de otros grupos humanos.
-
Tener interés y respeto por las aportaciones de otros campos a la Psicología y de ésta a ellos.
-
Manejo de informática e Internet como usuario.
-
Saber planificar y realizar una búsqueda bibliográfica o de referencias tanto en bases de datos informatizadas como en bibliotecas y hemerotecas.
-
Conocer y utilizar adecuadamente los conceptos científicos propios de la Psicología.
-
Saber comunicar resultados psicológicos de forma oral adecuando la presentación al destinatario/s de la misma.
-
Saber analizar, sintetizar y resumir la información procedente de textos científicos y profesionales relacionados con la psicología.
-
Identificar la conducta o el proceso psicológico objeto de estudio, así como las conductas o procesos vinculados y la estrategia para evaluarlos o medirlos.
Metas Al finalizar el curso el estudiante estará en capacidad de:
-
Reconocer los métodos y técnicas que se han usado en psicometría usando como estrategia el desarrollo de ejercicios aplicados.
12
-
Reconocer algunos hitos históricos del estudio de la medición psicológica a partir de la lectura de los textos asignados al curso.
-
Esbozar mediante mapas conceptuales, los componentes medulares de las diferentes herramientas estadísticas que cuantifican el comportamiento.
-
Analizar los conceptos y categorías fundamentales de las pruebas psicológicas, usando como estrategia la comunicación interactiva (Chat) con sus compañeros de curso y el tutor.
-
A través del trabajo grupal, aplicar los conceptos básicos de la medición psicológica para explicar y predecir el comportamiento en diferentes campos de la acción humana.
13
UNIDADES DIDÁCTICAS
UNIDAD
CAPITULO
DIDÁCTICA
TEMA Estudio de las diferencias individuales
HISTORIA DE LA La consolidación
MEDICIÓN HISTORIA Y CONCEPTOS BÁSICOS DE LA PSICOMETRIA
institucional de la psicometría Definición
Vertiente práctica de la psicometría LA PSICOMETRÍA
Fases: Construcción, Evaluación y Aplicación
Definiciones y objetivo de la psicometría El método de la psicometría EL MÉTODO DE LA
Los contenidos
PSICOMETRÍA
La teoría de los test. CONCEPTOS
Y
METODOLOGÍA ESTADÍSTICA DE LA
Estandarizadas
de Pruebas
Aproximación al uso
PSICOMETRÍA
Validez
Confiabilidad
16PF MMPI
Uso de pruebas e
TEST ROSCHACH
interpretación
WISC –R
14
Descripción de las unidades didácticas A partir de la concepción epistemológica para el autoaprendizaje de la psicometría se ha seleccionado las palabras claves: psicometría, medición personalidad, inteligencia, validez, confiabilidad, etc, como base para el diseño de las unidades didácticas indispensables en el presente curso. Unidad 1 Historia y Conceptos Básicos de la Psicometría La unidad introduce al estudiante en el desarrollo histórico de la psicometría, sus aproximaciones y autores más influyentes y el proceso científico por el cual la medición adquiere importancia y reconsolida principalmente con el uso de test y de herramientas estadísticas. Unidad 2 Aproximación al Uso de Pruebas Estandarizadas Presenta las características de cuatro pruebas de gran reconocimiento en la psicología y con el acompañamiento del tutor se espera que los estudiantes logren entrenarse en su uso e interpretación de resultados. Contexto Teórico La Psicometría es la ciencia de la medida de los aspectos "psicológicos" de una persona, tales como conocimiento, habilidades, capacidades, o personalidad. La medida de estos aspectos es difícil, y gran parte de la investigación y técnicas acumuladas en esta disciplina están diseñadas para definirlos de manera fiable antes de cuantificarlos. Los críticos argumentan que tales definiciones y cuantificaciones son imposibles y que las mediciones a menudo son tergiversadas.
15
Los primeros trabajos de psicometría se desarrollaron para medir la inteligencia. Posteriormente, la teoría psicométrica se ha aplicado a la medida de otros aspectos como la personalidad, las actitudes, las creencias, el rendimiento académico y en campos relacionados con la salud y la calidad de vida. Los contenidos de la psicometría se articulan, fundamentalmente, en dos grandes bloques: teoría de los test, que hace referencia a la construcción, validación y aplicación de los test, y escalamiento, que incluye los métodos para la elaboración de escalas psicofísicas y psicológicas. A su vez, la teoría de los test se divide en dos ramas: la teoría clásica de los tests y la más reciente teoría de respuesta a los ítems. Los conceptos clave de la teoría clásica de los tests son: confiabilidad (fiabilidad) y validez. "Confiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo que realmente se pretende medir. Ambas propiedades, confiabilidad y validez, admiten un tratamiento matemático (estadístico). La consistencia interna puede calcularse por correlación entre distintos tests. Los métodos más conocidos se denominan: método de las formas paralelas, método del test-retest y método de las dos mitades. La validez puede calcularse correlacionando las mediciones con las de una medida patrón aceptado como válida. Se distinguen los siguientes aspectos: validez de contenido, validez predictiva y validez de constructo. Metodología
Este curso se desarrollará de manera virtual, con el acompañamiento del tutor y el trabajo orientado a través del Protocolo, la Guía de Actividades y el Protocolo. Para
16
cada Unidad Didáctica se desarrollarán actividades tanto individuales como colaborativas que den cuenta de las competencias y metas a desarrollar. También se generarán espacios de discusión y participación a través de foros virtuales que serán señalados en la Guía de Actividades. Con esto no sólo se pretende un aprendizaje memorístico de los conceptos más relevantes y característicos de la Psicometría, sino que también se procurará la consolidación de un sentido crítico y proponente que facilite la aplicación de estos conceptos y sus métodos de abordaje a situaciones donde el actuar y el criterio del psicólogo sea determinante, elemento básico de las intencionalidades formativas del curso. Fase de reconocimiento hace referencia a la confrontación de los contenidos del curso con los conocimientos y experiencias previas, identificando nuevos conceptos a adquirir. Fase de profundización se refiere al conjunto de actividades orientadas a precisar las nociones, procedimientos y estado del arte en los campos de la medición psicológica. Fase de transferencia integra los aprendizajes mediante una recontextualización, resignificación y aplicación autónoma a situaciones problémicas de naturaleza teórica
o
práctica,
generando
competencias
para
el
futuro
desempeño
interdisciplinario y transdisciplinario en el campo profesional. El proceso general se complementa y refuerza con procesos de autoevaluación, coevaluación y heteroevaluación, articulados con sistemas de interactividad pedagógica para socialización de logros del estudio independiente, en pequeños grupos colaborativos y tutoría individual. El proceso final se refuerza con la retroalimentación sobre los logros sustentados en los procesos evaluativos a nivel formativo.
17
Sistema de Evaluación La evaluación se concibe como un proceso continuo orientado a verificar las competencias logradas en concordancia con los objetivos del curso académico de Psicometría. El proceso de evaluación se guiará por el modelo institucional y se ejecutará con base en los siguientes momentos: autoevaluación, coevaluación y heteroevaluación Autoevaluación: La realiza el estudiante al inicio y al final de cada fase de aprendizaje con el fin de identificar las debilidades o vacíos cognoscitivos, como sus logros o dominios en el abordaje de la medición psicológica. La autoevaluación se entiende como una oportunidad para hacer la revisión y reflexión autocrítica de los procesos, aprendizajes y productos que esta llevando a cabo el estudiante. Tiene por objeto que el estudiante juzgue objetiva y constructivamente sus propios esfuerzos, resultados y productos con base en las metas trazadas por él mismo. Con esta se espera identificar los progresos alcanzados por el estudiante y las necesidades, aspiraciones y metas para aprendizajes futuros. Coevaluación: Es un proceso de trabajo colaborativo de los estudiantes en el cual socializan el resultado de sus construcciones personales de conocimiento y reciben la realimentación de sus compañeros, sustentan sus puntos de vista, asimilan nuevos enfoques y ajustan sus planteamientos con el enriquecimiento conceptual logrado en el dialogo de saberes. Los momentos de coevaluación integran la orientación pedagógica de la guía de actividades y la autorregulación del aprendizaje por parte del estudiante. Heteroevaluación: Es una evaluación sumativa coordinada a nivel nacional en cuanto a fechas y contenidos, además de la revisión y realimentación por parte del tutor sobre las construcciones cognitivas registradas sistemáticamente en el portafolio de desempeño personal.
18
El tutor enfoca la heteroevaluación como un análisis de logros a partir del acompañamiento a los estudiantes en sus procesos de aprendizaje evidenciados en resultados participativos en listas de correo, foros, mural electrónico, laboratorios y demás eventos teóricos o prácticos con productos de conocimiento destinados a registro en el portafolio de desempeño personal. Más el resultado del examen final. La distribución porcentual de notas asignadas en los procesos evaluativos es la siguiente: Valores de notas por actividades Resultados o productos de las actividades de aprendizaje consignados en el PDP y PDG
Evaluación final nacional
según fases de aprendizaje. Fase de reconocimiento: 10% de la nota Fase de profundización:
Prueba objetiva
30% de la nota Fase de transferencia: 20% de la nota Total: 60% de la nota definitiva
Valor: 40% de la nota definitiva
Recursos Tecnológicos Las actividades están centradas en el estudiante como autogestor de los procesos de aprendizaje, por lo cual se establece una sinergia de medios y mediaciones. Los recursos que el estudiante aprovechará son los siguientes: •
El computador como herramienta informática para estudio con CD ROM, con informaciones visuales, auditivas y de texto escrito.
19
•
El computador como canal electrónico hacia links hipertextuales en ambientes virtuales de autoaprendizaje, útiles para gestión de conocimiento actualizado.
•
Sistemas y plataformas tecnológicas institucionales para videoconferencias y audioconferencias.
•
Protocolo académico, guía de actividades de aprendizaje, módulo, fuentes hipertextuales de consulta, para estudio temático y orientación pedagógica.
•
Programación de eventos de socialización y trabajo colaborativo y sesiones de asesoría.
•
Eventos de prácticas de laboratorio de carácter obligatorio en el curso.
•
Interacciones programadas en aula virtual.
Una presentación sistematizada de estos recursos interactivos se puede visualizar en la gráfica “Recursos”:
20
Fuentes Documentales Además de los recursos didácticos como material impreso y ayudas audiovisuales incluidas como parte de las unidades didácticas de este curso, se señala en cada una de ellas una serie de fuentes documentales hipertextuales que permiten profundizar con suficiencia y calidad las construcciones conceptuales definidas en los objetivos y metas de aprendizaje.
21
GLOSARIO DE TÉRMINOS Psicometría: Área de la psicología científica que se encarga de la medida de los aspectos "psicológicos" de una persona, tales como conocimiento, habilidades, capacidades, o personalidad. La medida de estos aspectos es difícil, y gran parte de la investigación y técnicas acumuladas en esta disciplina están diseñadas para definirlos de manera fiable antes de cuantificarlos. Los críticos argumentan que tales definiciones y cuantificaciones son imposibles y que las mediciones a menudo son tergiversadas. Inteligencia: Es la capacidad evolutiva por la cual el individuo es capaz de tomar decisiones
dependiendo
de
su
entorno,
y
mejorar
sus
condiciones
de
supervivencia, como individuo, como grupo o como especie. Esta definición se basa en que no vivimos para pensar, sino que pensamos para vivir. Evolutivamente hablando, los seres más simples reaccionan ante el medio por programación genética, miedos y afinidades instintivas. Un pequeño cambio en estos instintos supone muchas generaciones. Para que la adaptación al medio sea más rápida son los propios individuos los que han de reprogramar sus comportamientos, aprendiendo del medio y reaccionando en consecuencia, esto es, con inteligencia. Habilidad: Grado de competencia de un sujeto concreto frente a un objetivo determinado. Es decir, en el momento en el que se ha alcanzado el objetivo propuesto en la habilidad, se considera que ésta se ha logrado a pesar de que este objetivo se haya conseguido de una forma poco depurada y económica. Se considera a la habilidad como a una aptitud innata o desarrollada o varias de estas, y al grado de mejora que se consiga a estas mediante la práctica, se le denomina talento.
22
Personalidad: Conjunto dinámico de características emocionales, de pensamiento y de conducta que son únicas a cada persona. Hay diversas aproximaciones teóricas a la personalidad en psicología, cada una proponiendo una relación distinta entre la personalidad y otros constructos psicológicos, sobre cómo se desarrolla la personalidad o cómo ésta interactúa con los sucesos. Se puede definir como la suma total de las formas en que un individuo reacciona y se relaciona con los demás; son los rasgos mensurables que exhibe una persona. 16PF: “Sixteen Personality Factors" de Raymond Catell. El 16PF es una prueba estructurada comúnmente utilizada y favorecida, por diversos investigadores alrededor del mundo, como instrumento para la medida y comprensión de la personalidad. Es el resultado de más de cuarenta años de investigación empírica por el psicólogo Raymond B. Cattell, quien redujo 4504 rasgos de personalidad a 16 rasgos básicos, mediante análisis factorial. La prueba se basa en la medida independiente de varios factores psicológicos. Ha sido debidamente validada y revisada, y al presente existen varias formas (A, B, C, D & E) que facilitan la aplicabilidad de la prueba a los diferentes intereses específicos de investigación. MMPI: Inventario Multifasico de Personalidad de Minnesota (S.R. Hathaway y J.C. Mckiney, USA.) Cuestionario de Personalidad encaminado a la búsqueda de trastornos psicológicos, formado por 566 ítems a los que hay que responder V o F. Tiene tres grupos de escalas y mide 19 variables. Tiene en cuenta la validez interna de las respuestas del sujeto. WISC R: Escala de Inteligencia (Revisada) de David Wechsler para Niños. Test de Rorscharch: Test de personalidad Proyectivo (H. Rorscharch). Evalúa aspectos profundos de la personalidad. Contiene diez láminas con manchas de tinta inestructuradas susceptibles de diversas interpretaciones. Su aplicación requiere conocimientos psicológicos amplios y una amplia experiencia.
23
Test Psicológico: Una situación experimental estandarizada que sirve de estímulo a un comportamiento. Tal comportamiento se evalúa por una comparación estadística, respecto a otros individuos colocados en la misma situación, lo que permite clasificar al sujeto examinado, ya sea cuantitativamente, ya sea tipológicamente (Pierre Pichot, "Los test mentales", Editorial Paidós. Buenos Aires. 1960 Teoría
de
los
tests:
Los
contenidos
de
la
psicometría
se
articulan,
fundamentalmente, en dos grandes bloques: teoría de los test, que hace referencia a la construcción, validación y aplicación de los test, y escalamiento, que incluye los métodos para la elaboración de escalas psicofísicas y psicológicas. La teoría de los test se divide en dos ramas: la teoría clásica de los tests y la más reciente teoría de respuesta a los ítems. Los conceptos clave de la teoría clásica de los tests son: fiabilidad y validez. "Fiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo que realmente se pretende medir. Ambas propiedades, fiabilidad y validez, admiten un tratamiento matemático.
24
GUÍA DIDÁCTICA Presentación La guía de actividades del curso de Psicometría explicita la configuración de las situaciones didácticas, mediante la planificación de actividades que permitan el logro de metas de aprendizaje en las diversas fases del aprendizaje, con un sentido crítico del cambio entre situaciones de entrada y de salida. FASES DEL APRENDIZAJE Fase de Reconocimiento Corresponde a la interacción entre los conocimientos previos y las nuevas conceptualizaciones del curso. Las actividades se enmarcan en situaciones didácticas que para la fase de reconocimiento, por unidad, pueden corresponder a las siguientes posibilidades de situaciones didácticas: Actividad de inducción al curso, con acompañamiento tutorial en grupo. Medio para la interactividad: Videoconferencia Estudio independiente, individual o en pequeño grupo: identifica conceptos conocidos y conceptos nuevos que necesitan posterior profundización. Tutoría sincrónica o asincrónica en grupo de curso sobre cada unidad temática. Medio para la interactividad: lista de distribución en aula virtual o mural. Tutoría sincrónica o asincrónica individual: asesoría para aclarar dudas en el proceso de aprendizaje con el fin de seleccionar líneas apropiadas de identificación de conceptos para trabajar en su reconceptualización. Tutoría a pequeños grupos colaborativos para mejorar la estrategia de estudio.
25
Autoevaluación y coevaluación formativa. Elaboración de portafolio. Fase de Profundización Corresponde al desarrollo de actividades de aprendizaje que permiten analizar, reconceptualizar y resignificar los conceptos encontrados en la fase de reconocimiento. Fase de Transferencia Se orienta a aplicar el conocimiento a situaciones problémicas, toma de decisiones e interacciones con otros campos disciplinares. Según cada caso particular de las temáticas de las unidades, en estas fases pueden aparecer todas o sólo algunas de las situaciones didácticas referenciadas en la fase de reconocimiento TÉCNICAS E INSTRUMENTOS PARA LA OBJETIVACIÓN DEL APRENDIZAJE En situaciones didácticas grupales El estudiante y el tutor (cuando participa sincrónicamente en apoyo pedagógico de la actividad), cumplirán el encuentro en fechas especificadas en la programación académica semestral previamente comunicada y socializada en la agenda de aula virtual, y aplicarán como instrumento un formato que registre la actividad colectiva, en el marco de objetivos explícitos y de resultados participativamente calificados. La técnica de apoyo pedagógico puede consistir, a nivel nacional, en videoconferencia,
combinación
de
mural
digital
(previamente
diseñado
y
enriquecido participativamente) con foro virtual dentro de días específicamente asignados.
26
El instrumento incorporará en las conclusiones del encuentro, apreciaciones sobre: logros,
funcionalidad
de
la
técnica
grupal
desarrollada,
sugerencias
de
mejoramiento. En otros casos, se diligenciarán informes grupales a partir de guías de prácticas o laboratorios, formatos grupales sobre solución de situaciones problémicas asignadas para trabajo colaborativo dentro de cada unidad temática o como resultado de la participación en procesos de investigación formativa, formatos de coevaluación para el caso de trabajo grupal colaborativo, etc. En caso de estudio independiente individual El estudiante aplicará como instrumento, formatos de informe para registro de sus logros en la construcción de conocimiento, los cuales tendrán una inserción oportuna en el portafolio del curso. Los
protocolos
específicos
pueden
ser:
formularios
diligenciados,
mapas
conceptuales complementados o modificados, guías diligenciadas, ensayos elaborados como soporte de la reflexión y resignificación conceptual, etc. Este tipo de protocolos incluirán informes autoevaluativos, donde el estudiante explicitará su nivel de desempeño previo o situación cognitiva de entrada y el nivel de logro alcanzado, conjuntamente con una prospectiva de profundización o actualización del conocimiento. PORTAFOLIO DE DESEMPEÑO PERSONAL (PDP) Y GRUPAL (PDG) La evidencia del trabajo académico del estudiante es el portafolio de desempeño personal, en el cual deben recopilarse de manera organizada los logros de aprendizaje y sus soportes o productos intelectuales. Los contenidos mínimos que deben aparecer en el PDP y PDG son los siguientes: •
Formatos de encuentro grupal: objetivos, logros, funcionalidad de las técnicas aplicadas, conclusiones y sugerencias de mejoramiento.
27
•
Informes de construcción y recontextualización cognitiva independiente: conceptualizaciones, mapas conceptuales o ideogramas similares, ensayos disciplinares, resúmenes de lecturas, etc.
•
Informes de estudio colaborativo: socialización y foro grupal crítico sobre formulación de situación problémica, diseños metodológicos, resultados o logros, crítica o coevaluación de procesos y logros, informes de prácticas o laboratorios, etc.
•
Otros: documentales didácticos, videos, audio, publicaciones u otros soportes, socializadas y conducentes a valoración heteroevaluativa en el centro regional. DESCRIPCIÓN DE ACTIVIDADES
Las actividades de reconocimiento se manejan simultáneamente para las unidades del
curso,
mediante
una
lectura
de
identificación
de
los
contenidos,
correlacionándolos con los conocimientos y experiencias previas de los estudiantes y las nociones nuevas que debe profundizar posteriormente. En las actividades de profundización, el estudiante hace énfasis en interiorizar los aspectos de conocimiento en que se encontró deficitario durante la fase de reconocimiento. Para orientarlo en esta fase el tutor debe prescribir actividades específicas destinadas a optimizar el proceso con relación a las metas de aprendizaje. Actividades por Sesiones y Fases de Aprendizaje Fase de Reconocimiento Sesión 1: Encuentro de grupo: Inducción e introducción, presentación del curso, constitución de grupos colaborativos y su registro en el Aula Virtual Sección “Grupos”.
28
Para su realización básese en el capítulo 1 Sobre la Historia de la Psicometría. Realice un mapa conceptual y socialícelo al tutor.
Sesión 2: A partir de los conceptos de psicometría expuestos en el módulo construya una definición de psicometría y discútala en la red un grupo colaborativo creado con algunos de sus compañeros. Junto a esto describa los pasos y entregue un informe a su tutor. Sesión 3: Fase Reconocimiento: Realice la lectura asignada para el tema que aparece en el modulo: La Teoría de los Test. Describa el con sus palabras las características generales de la teoría de los test. Realice un mapa conceptual y socialícelo ante sus compañeros y pida retroalimentación al tutor. Realice las correcciones del caso. Sesión 4: Fase Reconocimiento: Profundice el tema realizando la lectura del texto Los Test que aparece vinculada en el modulo. Realice un resumen de la lectura, socialícelo ante sus compañeros y pida retroalimentación al tutor. Realice las correcciones del caso.
Tenga en cuenta (tutor y estudiante) que este tema requerirá el empleo de dos sesiones.
Fase de Profundización
Sesión 5: Con la asesoría del tutor realice algunos ejercicios sobre Confiabilidad de pruebas. Pida retroalimentación del tutor. Puede entrar a la siguiente página para fortalecer plantillas).
sus
conocimientos.
http://www.uned.es/psico-3-psicometria/
(ver
29
Sesión 6: Con la asesoría del tutor realice algunos ejercicios sobre Validez de pruebas. Pida retroalimentación del tutor. Puede entrar a la siguiente página para fortalecer
sus
conocimientos.
http://www.uned.es/psico-3-psicometria/
(ver
plantillas). Sesión 7: Con la asesoría del tutor realice y presente al tutor los ejercicios que pertinentes que fortalezcan sus habilidades para analizar matemáticamente la Validez y Confialbilidad de las pruebas psicométricas. Tenga en cuenta (tutor y estudiante) que este tema requerirá el empleo de tres sesiones.
Al finalizar la realización de ejercicios entregue sus respuestas al docente para obtener retroalimentación y calificación de su desempeño. Fase de transferencia Sesión 8: En estas sesiones usted se entrenará en el uso de algunas pruebas psicológicas. Esta parte del curso debe recibir un acompañamiento estricto del tutor. Antes de empezar esta parte del curso, lea detalladamente el documento Directrices Internacionales para el uso de los tests que encontrará como Anexo 1. Seguidamente lea las indicaciones y características del 16 PF, escriba un pequeño ensayo sobre su valor para la psicología. Pida a su tutor la aplicación del test y con su ayuda califíquelo y analice sus resultados. Entregue la plantilla calificada y su interpretación al tutor. Sesión 9: Lea las indicaciones y características del MMPI, escriba un pequeño ensayo sobre su valor para la psicología. Pida a su tutor la aplicación del test y con su ayuda califíquelo y analice sus resultados. Entregue la plantilla calificada y su interpretación al tutor.
30
Sesión 10: Lea las indicaciones y características del Test Roscharch, escriba un pequeño ensayo sobre su valor para la psicología. Pida a su tutor la aplicación del test y con su ayuda califíquelo y analice sus resultados. Entregue la plantilla calificada y su interpretación al tutor. En grupos colaborativos analice las pruebas 16PF y MMPI con respecto al Test de Roscharch Sesión 11: Lea las indicaciones y características del WISC R, escriba un pequeño ensayo sobre su valor para la psicología. Pida a su tutor la aplicación del test y con su ayuda califíquelo y analice sus resultados. Entregue la plantilla calificada y su interpretación al tutor. Sesión 12: Lea el texto Importancia del Avance en la Investigación Psicométrica y sobre él concluya sobre la importancia de la psicometría y su desarrollo. Envíe sus conclusiones al tutor.
31
MODULO
UNIDAD I
HISTORIA DE LA PSICOMETRIA La revisión de los antecedentes históricos y de la evolución de la medición en psicología, ofrece una perspectiva útil para comprender la Psicometría actual. Para algunos autores, la historia de los tests mentales es tal vez uno de los mejores ejemplos de la existencia de una interacción entre las demandas sociales y la evolución de una disciplina científica. La historia de la medición psicológica ha estado marcada por la interrelación entre la evolución interna de la Psicometría y de la Psicología con el deseo de responder a las demandas sociales de cada momento histórico, reflejando un mayor acento en las aplicaciones prácticas que en el desarrollo teórico.
Este apartado pretende esbozar el entorno intelectual y social en el que nace la Psicología moderna y con ella la Psicometría. A continuación, sólo se aborda una de las dos líneas de trabajo que más trascendencia han tenido para la evolución de la Psicometría: el estudio de las diferencias individuales; para la otra línea: la Psicofísica, se puede recurrir a la bibliografía complementaria del tema. Por último, se señalan los acontecimientos que han marcado la consolidación de la disciplina. Estudio de las diferencias individuales Debemos advertir de una doble simplificación. Primera, dejar a un lado, por razones de tiempo, la Psicofísica que impide lograr una visión comprehensiva de la historia de la medición en Psicología; segunda, reducir la historia del estudio de las diferencias individuales a la historia de los tests psicológicos y presentarla recurriendo a las aportaciones de algunas figuras clave. La última es reduccionista pero difícil de evitar: gran parte de la Psicometría actual no se puede comprender
32
sin atender a los antecedentes y orígenes históricos de los tests psicológicos y de la medida de la inteligencia.
El rápido progreso económico y social en la Europa de finales del siglo XIX planteó la necesidad de evaluar las capacidades y conocimientos de los individuos en contextos educativos, laborales, etc. Si la Filosofía y la Fisiología fueron las disciplinas que más influyeron en el trabajo de los primeros psicofísicos, el impacto más dramático sobre el estudio de las diferencias individuales vino de la Biología. Al tiempo que Fechnner presentaba sus trabajos, Darwin (1809-1882) presentó su teoría en La Evolución de las Especies (1859) y su aplicación al estudio del hombre en El origen del hombre y la selección en relación al sexo (1871). Darwin defendió que la inteligencia y el sentido moral también se habían ido perfeccionando de manera gradual a través de la selección natural. Al defender esta idea Darwin no hacía sino reflejar la visión científica y la opinión popular dominante en la Inglaterra del siglo XIX, que justificaba el colonialismo y el sistema de clases bajo la creencia de que el hombre de letras inglés de clase media era el pico de la evolución humana (Rust y Golombok, 1989).
No es exagerado afirmar que las necesidades de la evaluación educativa fueron las primeras demandas sociales con un impacto significativo y duradero en la evolución del estudio de las diferencias individuales y, por ende, de la Psicometría. Los intentos por medir la inteligencia como respuesta a esas demandas caminan de la mano de los desarrollos metodológicos durante este periodo.
Thorndike (1997) señala el movimiento hacia la educación obligatoria en Francia, Inglaterra y Estados Unidos a finales del siglo XIX, como uno de los desarrollos críticos que propiciaron la medida de la inteligencia. La llegada por primera vez a las escuelas de niños cuyos padres no habían recibido una educación o, como en el caso americano, cuya lengua materna no era el inglés, generó una heterogeneidad en la población de alumnos como antes no se había conocido. La
33
exposición de estos niños a un currículo antiguo, diseñado para un grupo selecto de estudiantes, trajo como resultado niveles dramáticos de fracaso escolar próximos al 50%. Este fracaso fue visto como una pérdida de recursos en un tiempo en que eran limitados, de forma que se planteó la necesidad de destinar los recursos a quienes más se pudieran beneficiar, el medio: la evaluación de la inteligencia. Este es el contexto en el que se debe situar la obra de Binet.
Los pioneros de la Psicología llevaban años intentando una formulación aceptable de la inteligencia. Según Rust y Golombok (1989) los primeros autores tenían unas definiciones de la inteligencia que no iban más allá de lo que podría ser la psicología popular del maestro común de escuela. Se reconocía la diferencia entre una persona educada y una persona inteligente, entendiendo esta última como una persona "educable", con un origen esencialmente genético y receptora ideal de los recursos educativos, frente a los "torpes" incapaces de beneficiarse de la educación normal.
Entre los pioneros en el estudio de las diferencias individuales destaca el considerado por muchos autores, como el fundador de la Psicometría: Francis Galton. Primo de Darwin, inició sus investigaciones llevado por el objetivo de mostrar el componente hereditario del "genio". Para ello reunió el primer banco con los datos de personas relacionadas y no relacionadas. Influido por el asociacionismo de Locke y llevado por sus observaciones de que las personas con deficiencias mentales presentaban una peor ejecución a la hora de discriminar sensaciones de frío, calor, dolor, etc., pensó que la discriminación sensorial podía ser el medio para cuantificar el intelecto de una persona. Sus aportaciones propiamente metodológicas abarcan la formulación de las bases de procedimientos estadísticos, como el “coeficiente de correlación” desarrollado por K. Pearson (1857-1936), las intuiciones sobre la forma de "campana", como imagen para describir la distribución de puntuaciones en un test, así como las primeras
34
aplicaciones de las escalas de "rating" y los métodos de cuestionario (Anastasi y Urbina, 1997).
J. M. Catell (1860-1944) trabajo con Wundt, con quién compartió el interés por los fenómenos perceptivos y sensomotores, y el rigor en el control de las condiciones en que se realizaban las observaciones, pero de quién se distanció ante el despreció del experimentalista alemán por las diferencias individuales. Más tarde trabajo con Galton e inició en Estados Unidos el estudio de las diferencias individuales. Acuñó el término "test mental" en un artículo publicado en 1890 en la revista Mind bajo el título “Mental test and measurements”. Asumió la idea de Galton sobre la posibilidad de medir las funciones intelectuales por medio de tests de discriminación sensorial y tiempo de reacción. Sin embargo, los primeros estudios que se realizaron para evaluar este tipo de tests ofrecieron resultados desalentadores: el "rendimiento intelectual" mostraba poca correspondencia de unos tests a otros y prácticamente ninguna relación con estimaciones independientes del nivel intelectual realizadas por los profesores. Por el contrario, Ebbinghaus, apuntando ya un cambio de enfoque, había obtenido con un test de terminación de frases una correspondencia clara con el rendimiento académico de los niños.
Pero sin duda, la consolidación social de la medición psicológica vino de la obra del francés Alfred Binet (1857-1911) cuya influencia en el desarrollo de la teoría de los tests perdura en la actualidad. Binet a finales de los años noventa del siglo XIX criticó la aproximación de Galton y Cattell con el argumento de que para medir procesos mentales complejos era necesario observar la ejecución de los individuos en actos mentales complejos, rechazando la idea de que fuese necesaria una mayor precisión para la que no había instrumentos disponibles, ya que las diferencias individuales eran mayores respecto a los procesos superiores que en cuanto a la discriminación sensorial.
35
Binet recibió en 1904 el encargo del ministerio francés de instrucción pública de elaborar un instrumento de medida capaz de diferenciar entre los niños "educables" y los que no podrían beneficiarse de la educación normal. Junto con su colaborador Simon presentó en 1905 la primera versión del test Binet-Simon. El test estaba formado por 30 problemas o tareas dispuestos en orden de dificultad creciente, que medían la capacidad de juicio, razonamiento y comprensión. Para determinar el nivel de dificultad, los problemas habían sido administrados a 50 niños de entre 3 y 11 años más a algún niño retrasado. La segunda versión del test editada en 1908, incluía un número mayor de ítems junto con la eliminación de algunos que se habían considerado podían reflejar diferencias en función de la extracción social de los niños, además aparecían ya agrupados por niveles de edad. Binet prefirió el término "nivel mental" al de "edad mental" popularizado por las sucesivas traducciones de la escala, ya que el primer término estaba exento de las connotaciones evolutivas del segundo. Al poco tiempo de su presentación, el test de Binet y Simon fue traducido a diferentes idiomas y aplicado en diversos países, lo que prueba la favorable acogida social que recibió.
El interés por la obra de Binet se ha mantenido a lo largo del tiempo. Van der Linden (1986) ha resaltado las contribuciones estrictamente metodológicas de la aproximación de Binet a la medida de la inteligencia. Primero, frente a los experimentos antropométricos y psicofísicos que planteaban una única tarea, Binet decidió alargar la longitud del test por dos motivos: a) el conjunto de ítems debía ser una representación adecuada de la gran variedad de tareas a las que se debe enfrentar una persona en su vida diaria; y b) conocedor de las teorías de Spearman entendió que cada ítem en sí mismo era una media imprecisa, por lo que era necesario combinar observaciones de un buen número de ítems para obtener una medida fiable. Segundo, la insistencia de Binet en la estandarización de la aplicación del test, reflejada en la extrema precisión de las guías sobre el material, la administración, la puntuación y la interpretación de las mediciones. Por último, la
36
práctica de "normativizar" el test para iniciar una interpretación relativa de la ejecución de las personas.
Tras las aportaciones de Binet, los mayores desarrollos en la medición de las diferencias individuales hay que buscarlos en un área y lugar diferente. El test de Binet fue introducido en Estados Unidos por H. H. Goddard, cuya traducción y adaptación recibieron el beneplácito de la audiencia médica, al venir a cubrir la necesidad de una medida estandarizada y objetiva para el diagnóstico de la subnormalidad. Sin embargo, fue rápidamente desplazada por la revisión y adaptación psicométricamente más sólida, realizada por L. M. Terman en 1916 en la Universidad de Stanford. Al entrar Estados Unidos en la Primera Guerra Mundial, un comité encabezado por R. M. Yerkes detecta la necesidad de clasificar de forma rápida al millón y medio de reclutas con respecto a su nivel intelectual. De nuevo, una demanda social provoca un avance metodológico: los primeros tests de inteligencia de administración grupal y no verbales, para evaluar a los reclutas analfabetos o que no tenían como lengua materna el inglés. En este contexto hay que situar las contribuciones de A. S. Otis, por la introducción del formato de elección múltiple y otros formatos de puntuación objetiva. Impulsado por las necesidades militares aparece también el primer test estandarizado para la evaluación de variables de personalidad: el “Personal Data Sheet” de R. S. Woodworth, un instrumento pensado para la detección de personas con inestabilidad emocional.
37
La consolidación institucional de la Psicometría De forma paralela a los avances teóricos y las aplicaciones prácticas, se fue produciendo la consolidación institucional de la Psicología y, claro está, de la propia Psicometría. Esta consolidación se refleja en la creación de asociaciones profesionales, de publicaciones especializadas para la comunicación entre profesionales y de empresas privadas dedicadas desde el inicio al floreciente negocio de la evaluación psicológica.
J. Jastrow habla sobre los tests en la primera convención de la American Psychological Association (APA) en 1892. La APA formó en 1895 un comité especializado en la nueva tecnología de los tests. En 1899 Kilpatrick, presidente de la APA, realizó un llamamiento a los psicólogos para que elaborarán tests de tal naturaleza que "... pudieran ser aplicados tanto a niños como adultos, que fueran de tal forma que todas las personas tuvieran las mismas oportunidades de mostrar las capacidades examinadas, y que en aras de la economía del tiempo fueran diseñados de forma que se pudieran administrar a una clase o escuela de una vez" (Thorndike, 1997, pág. 6). Impulsado por la figura clave de Terman el uso de los tests de inteligencia en las escuelas creció rápidamente. El propio Terman calculó que en el periodo entre 1920 y 1921 más de dos millones de niños habían respondido a un test de inteligencia. El uso de test también se extendió al mundo laboral como prueba su incorporación a las prácticas de selección de la administración americana.
Cattell fundó la Psychological Corporation para la producción industrial de tests en 1922. En 1947 se funda el Educational Testing Service (ETS) institución sin animo de lucro que no sólo se ha encargado de la producción de tests estandarizados de rendimiento y tests de aptitud académica, sino que desde su constitución, ha contribuido a la formación y práctica profesional de influyentes psicómetras. Desde 1975, el ETS edita en formato CD-ROM el proyecto ERIC donde con una
38
periodicidad anual se recoge la información disponible sobre tests, escalamiento y medición psicológica y educativa.
Galton, Pearson y Weldon fundaron en 1901 la revista Biometrika que desde entonces publica trabajos matemáticos relacionados con la Biología y la Psicología. Thorndike funda en Estados Unidos en 1936 la publicación Psychometrika, revista de referencia para la Psicometría desde sus inicios. Desde entonces, la aparición de revistas relacionadas con la medición psicológica ha sido continua. Como muestra se pueden citar el Educational and Psychological Measurement (1941), el British Journal of Statistical Psychology (ahora con el nombre de British Jorunal of Statistical and Mathematical Psychology) (1947), el Journal of Mathematical Psychology y el Journal of Educational Measurement (1964), el Multivariate Behavioral Research y el Aplied Psychological Measurement (1977), el Applied Measurement in Education (1988), etc.
Un acontecimiento que se ha convertido en referente obligado para todos los profesionales es la publicación por las asociaciones profesionales más relevantes de las guías técnicas y éticas de la medición psicológica y educativa. Las recomendaciones elaboradas por la APA son, sin duda, las que han tenido y tienen una mayor influencia.
Entonces La psicometría es la ciencia de la medida de los aspectos "psicológicos" de una persona, tales como conocimiento, habilidades, capacidades, o personalidad. La medida de estos aspectos es difícil, y gran parte de la investigación y técnicas acumuladas en esta disciplina están diseñadas para definirlos de manera fiable antes de cuantificarlos. Los primeros trabajos de psicometría se desarrollaron para medir la inteligencia. Posteriormente, la teoría psicométrica se ha aplicado a la
39
medida de otros aspectos como la personalidad, actitudes y creencias, rendimiento académico, y en campos relacionados con la salud y la calidad de vida. Los contenidos de la psicometría se articulan, fundamentalmente, en dos grandes bloques: teoría de los test, que hace referencia a la construcción, validación y aplicación de los test, y escalamiento, que incluye los métodos para la elaboración de escalas psicofísicas y psicológicas. A su vez, la teoría de los test se divide en dos ramas: la teoría clásica de los tests y la más reciente teoría de respuesta a los ítems. Los conceptos clave de la teoría clásica de los tests son: confiabilidad y validez. "confiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo que realmente se pretende medir. Ambas propiedades admiten un tratamiento matemático. La consistencia interna puede calcularse por correlación entre distintos tests. Los métodos más conocidos se denominan: método de las formas paralelas, método del test-retest y método de las dos mitades. La validez puede calcularse correlacionando las mediciones con las de una medida patrón aceptada como válida. Se distinguen los siguientes aspectos: validez de contenido, validez predictiva y validez de constructo. Complemente y discuta con el profesor el artículo anexo “La medición de lo Psicológico
(que
se
encuentra
en
la
siguiente
página
http://www.psicothema.com/pdf/138.pdf) DEFINICIÓN DE PSICOMETRÍA Disciplina implicada directamente en la medición psicológica, con una doble vertiente: •
teórica : supone la fundamentación teórica de la medida
40
•
práctica: supone la construcción, evaluación y aplicación de instrumentos de medida para evaluar o medir las características psicológicas de interés.
Más adelante se seguirá ampliando el concepto de Psicometría, explicaremos a continuación algunos aspectos de la vertiente práctica de la psicometría. Se sugiere a los estudiantes hacer la búsqueda por Internet de la vertiente teórica de la psicometría (pueden también buscar en la red con la palabra clave “psicología matemática”). VERTIENTE PRÁCTICA DE LA PSICOMETRÍA Fase de Construcción de un Instrumento de Medida En esta fase del proceso habría que cubrir las siguientes etapas: •
Delimitación y operativización de la variable psicológica que se desea medir
•
Confección de los ítems
•
Determinación del valor escalar de los ítems
•
Confección de la prueba
Esta fase subsumiría lo que tradicionalmente se entiende al hablar de escalamiento, el escalamiento de estímulos psicológicos Una vez completada la fase de construcción se pasaría a la de la evaluación del instrumento construido para, finalmente, concluir con la administración efectiva del instrumento a un sujeto (o grupo de sujetos) en la fase de aplicación. Fase de Evaluación de un Instrumento de Medida La fase de evaluación del instrumento de medida es absolutamente crucial ya que todas las medidas obtenidas al aplicar una prueba contienen error. La consideración del error de medida inherente a toda medición psicológica hace necesario:
41
•
un planteamiento explícito acerca de hasta qué punto la medida obtenida en un momento determinado proporciona una estimación adecuada del nivel real en que posee el sujeto la característica psicológica que supuestamente se está evaluando. Por tanto, la consideración del error de medida exige el recurso a una teoría de los tests que dé cuenta del mismo y proporcione una estimación del rasgo o característica evaluada.
•
la evaluación de la calidad de los instrumentos de medida, es decir, determinar si éstos cumplen o no los criterios métricos de calidad que todo instrumento de medida debe de satisfacer para poder ser utilizado con garantía como un instrumento
científico.
Esto supone que habrá que estudiar confiabilidad y validez de la prueba y proceder al análisis de los ítems de la misma. Una vez construida y evaluada positiva o favorablemente la prueba, nos enfrentaríamos a la tercera fase del proceso: su aplicación a un sujeto o a una muestra de sujetos. Fase de Aplicación de un Instrumento de Medida Una vez construida y evaluada positiva o favorablemente la prueba, nos enfrentaríamos a la tercera fase del proceso: su aplicación a un sujeto o a una muestra de sujetos. El objetivo de esta fase es obtener una medida de cada sujeto o grupo en el rasgo o característica evaluada por la prueba, determinar el valor escalar de cada sujeto o grupo de sujetos, viendo la posición que éstos ocupan en el continuo que representa la característica o rasgo evaluado con el instrumento de medida. En particular, los contenidos del programa vinculados con esta fase son: •
la interpretación de las puntuaciones del test
42
•
la equiparación de las puntuaciones del test.
La Psicometría y la Teoría de los Tests La finalidad de este tema es presentar la Psicometría e introducir uno de sus contenidos más importantes: la Teoría de Tests. Intentar definir un concepto complejo como el de "Psicometría", al igual que ocurre con la denominación de cualquier disciplina científica, es una tarea difícil, razón por la que, al contrario de lo que se podría pensar, no abundan las definiciones explícitas. Bajo la palabra "Psicometría" pueden convivir contenidos, enfoques, objetivos y hasta concepciones diferentes sobre la ciencia y la función social de la Psicología. Por todo ello, tal vez la única estrategia útil para abordar una delimitación conceptual comprehensiva y lo más exacta posible de la Psicometría sea recorrer desde una perspectiva histórica la evolución de la medición psicológica, esbozar un análisis de la naturaleza del "objeto" de la medición psicológica, describir el método psicométrico,
presentar los contenidos de la
Psicometría y, a pesar de las dificultades ... no resistir la tentación final de proponer una definición propia de la Psicometría. Definiciones y objetivo de la Psicometría
En este apartado se aborda el significado de la denominación de la disciplina y se señalan los elementos comunes de las definiciones propuestas por diferentes autores.
El término "Psicometría" es el más extendido y general para hacer referencia a la medición psicológica. Su significado popular y la etimología de la palabra apuntan en la misma dirección: la disciplina que se encarga de la medición en Psicología. De hecho, los diccionarios de uso más común como el de la Real Academia de la Lengua o el de María Moliner también coinciden en su significado: la medida de los fenómenos psíquicos.
43
Para avanzar en el camino hacia una delimitación conceptual de la disciplina es necesario detenerse en las definiciones explícitas que, desde la propia Psicología, se han propuesto para la Psicometría. Señalar los puntos comunes y las diferencias de matiz entre ellas pueden ayudar a entender el alcance de la disciplina.
La Psicometría se ocupa de todas las medidas en el campo psicológico, habiéndose desarrollado a través de dos ramas principales: los métodos psicofísicos y la teoría de los tests. También se define a la Psicometría como la metodología encargada del desarrollo y utilización de las técnicas de medición en todos los ámbitos de la psicología.
Muñiz (1998) define la Psicometría como "... el conjunto de métodos, técnicas y teorías implicadas en la medición de variables psicológicas... lo específico de la Psicometría sería su énfasis y especialización en aquellas propiedades métricas exigibles a las mediciones psicológicas independientemente del campo sustantivo de aplicación y de los instrumentos utilizados".
La definición de Martínez-Arías (1984) introduce un matiz que apunta hacia la relación entre la Psicometría y la Psicología Matemática. Para la autora, la Psicometría "... aglutina todo el conjunto de modelos formales que posibilitan la medición de variables psicológicas, centrándose en las condiciones que permiten llevar a cabo todo proceso de medición en psicología".
No resulta difícil entresacar los elementos comunes de las definiciones anteriores. La Psicometría es una disciplina metodológica, sin un contenido psicológico propio, pero con un campo sustantivo: la teoría de la medición en sentido amplio. Muñiz (1998) afirma que el trabajo psicométrico tiene como finalidad construir y utilizar adecuadamente los tests y las escalas, de tal modo que se garantice su fiabilidad, validez y aplicación adecuada.
44
El objeto de la medición en Psicología Al presentar las definiciones explícitas de la Psicometría elaboradas por diferentes autores, se entresacaron sus elementos comunes: disciplina metodológica, sin contenido psicológico propio, pero con un dominio sustantivo: la teoría de la medición psicológica en un sentido amplio. La definición de Muñiz (1998) señala además, el rasgo definitorio de la preocupación psicométrica por la medida: las condiciones métricas exigibles a todas medición. Sin embargo, hay otra fuente de singularidad en la preocupación psicométrica por las condiciones métricas de la medición que no es posible soslayar: la que viene impuesta por la peculiaridad de los objetos psicológicos de medición. A diferencia de las variables físicas, las variables psicológicas no se pueden observar de manera directa. No quiere esto decir, que en psicología no se midan conductas directamente observables, cuya cuantificación se suele obtener a través de alguno de sus parámetros: duración, frecuencia, intensidad, etc., sino que, incluso en estos casos, la conductas observables se interpretan como indicios o resultado de variables inobservables más complejas. Atributos como "autoestima", "habilidad lectora", "razonamiento analógico", etc., son variables inobservables que sólo es posible medir por medio de los comportamientos observables a los que den lugar. Hay un amplio consenso sobre el término con el que referirse de forma genérica a los objetos de medición: constructos. El término "constructo" se ha hecho familiar en el campo de la medición psicológica desde su utilización en el artículo de L. Cronbach y P. E. Meehl titulado "Construct validity in Psychological Test" (1955). Cronbach y Meehl (1955) entendieron por constructo un instrumento intelectual para organizar la experiencia en categorías. Crocker y Algina (1986) lo definen como "... productos de la imaginación informada de los científicos sociales qué intentan desarrollar teorías para explicar el comportamiento humano" (pág. 4).
45
Crocker y Algina (1986) ilustran el proceso de elaboración de constructos insistiendo en su papel de "etiqueta" para resumir comportamiento y remarcan la importancia de establecer alguna regla de correspondencia entre el constructo y los comportamientos observables que son sus indicadores legítimos. La dificultad a la hora de encontrar la conexión "legítima" entre el constructo y sus indicadores comportamentales es valorada como uno de los lastres que impide el desarrollo de la medida psicológica. Lord y Novick (1968) fijaron la definición obligatoria de los constructos como requisito previo para su medición. La definición de los constructos se debe abordar a dos niveles:
•
Definición operacional o “semántica”. Consiste en enumerar la serie de comportamientos
indicadores
que
“engloba”
el
constructo.
Dichos
comportamientos son considerados los “indicadores empíricos” del constructo objeto de la medición. La importancia de la definición operacional es evidente: debe conectar la “etiqueta verbal” con los datos observables. •
Definición conceptual o “sintáctica”. Recoge la teoría sobre el constructo objeto de la medición. Se trata de un discurso “conceptual” en el que se hacen explícitas las relaciones del constructo objeto de la medición con otros constructos y/o indicadores empíricos de otros constructos con los que el objeto de la medición está relacionado.
La definición de los constructos a los dos niveles anteriores es el primer paso inexcusable a la hora de iniciar cualquier medición. El supuesto sobre la estabilidad de los constructos La medición psicológica asume, o al menos tiene en cuenta, algunos supuestos sobre la naturaleza del objeto de la medición, es decir, sobre la naturaleza de los
46
constructos. Sin duda, el supuesto común a la práctica totalidad de los modelos de medición es el de la estabilidad de la variable.
Numerosos estudiosos de la medición psicológica defienden la idea de que las diferentes versiones de la teoría de los tests (e. g., la teoría clásica, la teoría de la generalizabilidad y la teoría de respuesta al ítem) están elaboradas para hacer inferencias con el mismo "esqueleto": la tendencia de las personas a comportarse de manera prescrita en situaciones prescritas a partir de sus repuestas a un conjunto de tareas predeterminadas. Por ejemplo, la perspectiva tradicional para medir la inteligencia responde a este esquema inferencial: empleo de tests estandarizados, compuesto por ítems o tareas predeterminadas, aplicados bajo condiciones estandarizadas y con la pretensión de predecir el rendimiento futuro de las personas en situaciones igualmente "estandarizadas": la escuela, el trabajo, el ejercito, etc., En definitiva, los modelos de medida se han elaborado bajo el supuesto de estabilidad de la variable.
El supuesto de estabilidad está siendo amenazado por las perspectivas más recientes sobre la evaluación psicológica, es decir, por la necesidad de extender el "paradigma metodológico tradicional" para responder, por ejemplo, a las inferencias que el paradigma cognitivo plantea sobre las personas: las formas de uso y adquisición de conocimientos y habilidades, en definitiva, para modelar el cambio. La polémica sobre el objeto de la medición
La cuestión sobre la naturaleza del objeto no ha estado exenta de debate a lo largo de la historia de la medición psicológica como reflejo de las discusiones sobre el propio objeto de estudio de la psicología. Resulta difícil evitar plantearse preguntas como las lanzadas por Meliá (1990): "¿Cuántos atributos latentes o rasgos subyacentes existen?... ¿en qué medida son estables o evolucionan? ¿son comunes a todas las personas?" (pág. 37).
47
Rust y Golombok (1989) defienden que la discusión sobre el objeto de medición ha dividido a la Psicometría en dos escuelas: la Psicometría del rasgo y la Psicometría funcional. Spearman (1904, 1907) da carta de naturaleza a la Psicometría de los rasgos al plantear que la esencia de la tarea de la medida mental es identificar rasgos a través de las tendencias de los individuos a comportarse de formas prescritas en situaciones prescritas. El fuerte carácter hereditario atribuido por los pioneros de la medida mental a los rasgos aparece suavizado en la definición de Messick (1989): "Un rasgo es una característica relativamente estable de una persona –un atributo, proceso duradero o disposición– que se manifiesta consistentemente en algún grado a pesar de variaciones considerables en el rango de contextos y circunstancias" (pág. 15). Por el contrario, la Psicometría funcional defiende como un principio de partida que ningún rasgo o variable psicológica interviniente es relevante. Plantea que dado que es posible definir y medir directamente los comportamientos a los que supuestamente conducen los rasgos, el papel de estos es redundante.
Rust y Golombok (1989) contrastan la preeminencia de la Psicometría funcional en la evaluación educativa, con la de la Psicometría de los rasgos para la evaluación clínica; y proponen resolver el enfrentamiento atendiendo a los procesos de toma de decisión que realizan los clientes de la evaluación y de la selección psicométrica: las decisiones se realizan resumiendo la medición en términos de rasgos que reflejan lo que denominan "la psicología popular humana" ("don de gentes", "genio", "liderazgo", etc.). El método de la Psicometría
Meliá (1990) plantea que la conexión entre la Psicometría y la psicología matemática, permite considerar el método de la Psicometría desde una doble vertiente: por un lado, en tanto que la teoría psicométrica se refiera a contenidos
48
empíricos, el método no es otro que el método científico propio de toda ciencia empírica; y por otro lado, el componente matemático de los modelos formales de medición, sujeta a la teoría psicométrica, como a la psicología matemática, a los criterios formales de las matemáticas.
La relación entre la psicología matemática y la Psicometría ha llevado a algunos autores a defender que el método de la Psicometría es el de la psicología matemática. El esquema elaborado por Jáñez (1989) es la referencia obligada a la hora de presentar el método de la psicología matemática. De manera resumida, dos son las características distintivas del método de la psicología matemática: a) la presentación formal, generalmente en términos matemáticos, del componente teórico; y b) el recurso a procedimientos deductivos basados en la lógica o a procedimientos de simulación a la hora de derivar las consecuencias del modelo matemático.
Mención especial merece la simulación, por la preponderancia que está adquiriendo en Psicometría. El papel metodológico de la simulación no resulta fácil de establecer. Muchos campos de la Psicometría la utilizan como técnica de obtención de datos, cuando el problema de investigación hace imposible contrastar el modelo con datos empíricos. Este es el caso cuando se pretende descubrir las propiedades y características de índices estadísticos, métodos de estimación, potencia de contrastes, etc. Además, la simulación preserva también el estatus de método en cuanto generadora de conocimiento.
El análisis del método no puede obviar el papel instrumental de la Psicometría como herramienta metodológica para la contrastación empírica de las teorías psicológicas. La aplicación del método científico en psicología obliga a que la Psicometría desempeñe un papel activo en diferentes momentos del proceso. Arnau (1989) articula las relaciones entre el plano teórico y empírico del método científico en tres niveles: el nivel teórico-conceptual, que abarca desde el
49
planteamiento del problema hasta la formulación de hipótesis empíricamente contrastables; el nivel técnico-metodológico que abarca el plan de investigación y la estrategia de recogida de datos; y el nivel estadístico-analítico, donde se realiza la modelización estadística de los datos y las inferencias sobre las hipótesis sometidas a contrastación. La generalización de los resultados hace retornar la aplicación del método al nivel teórico-conceptual con lo que se cierra el ciclo. La Psicometría acompaña a la aplicación del método en cada uno de los tres niveles.
El nivel teórico conceptual recoge a teoría que contextualiza el problema de investigación. La teoría debe incluir la definición operacional y "sintáctica" de los constructos implicados en las hipótesis. A su vez, la teoría condiciona la elección del modelo de escalamiento y, por tanto, de las condiciones métricas que se exigirán a las mediciones. La red nomológica desempeña además un papel crucial durante la elaboración de tests para determinar la utilidad de las puntuaciones obtenidas.
El nivel técnico metodológico implica la construcción o selección de los instrumentos de medida idóneos para la medición de los constructos de interés. La Psicometría debe guiar el proceso de elaboración de instrumentos, teniendo en cuenta la teoría psicológica y el modelo de medida seleccionados en el nivel teórico-conceptual.
Dentro del nivel estadístico analítico, las propiedades métricas de las mediciones valoradas en el nivel anterior, condicionarán la modelización estadística de los datos y la elaboración de proposiciones a partir de los resultados. Por ejemplo, la información sobre la fiabilidad y validez de las mediciones, condicionará la generalización de los resultados en el regreso del proceso de investigación al nivel teórico conceptual.
50
Los contenidos de la Psicometría Hay un consenso amplio en la disciplina sobre cuales son los contenidos propios de la Psicometría. Las diferencias entre las propuestas de los autores responden a las distintas tradiciones de investigación de las que procedan o a diferencias en las estrategias de estudio de una misma temática. Si se unen las diferentes versiones de la teoría de los tests bajo una denominación común, se obtiene la división en tres grandes grupos de los contenidos psicométricos: teoría de la medición, escalamiento y teoría de los tests. Los dos primeros contenidos han sido o serán objeto de un tema en el programa de la asignatura. La teoría de los tests es introducida en el siguiente apartado. LA TEORÍA DE LOS TESTS La teoría de los tests puede verse como un esquema conceptual formalizado para hacer inferencias a partir de las puntuaciones de las personas en los tests y permitir la toma de decisiones que impliquen el constructo objeto de la medición. La teoría de los tests proporciona los fundamentos para la elaboración y uso de los tests, aportando además las herramientas para examinar las propiedades métricas de las mediciones obtenidas con ellos.
La definición de “test” no ha variado de forma significativa conforme evolucionaba la teoría de los tests. Valgan como muestra las definiciones de Anastasi o Lord. Para Anastasi (1968), un test psicológico es esencialmente una medida objetiva y tipificada de una muestra de conducta; para Lord (1980) “un test psicológico o educativo es un instrumento para obtener una muestra de conducta” (pág. 3). La definición de Yela (1996) expresa en términos más generales la finalidad de los tests como “un reactivo que aplicado a un sujeto revela y da testimonio de la índole o grado de su instrucción, aptitud o manera de ser” (pág. 249). (definición de test)
51
La mayoría de los profesionales de la medición psicológica coinciden en que las características definitorias de un test psicológico son: •
Procedimiento o instrumento estandarizado. Los tests plantean a las personas evaluadas una serie de tareas previamente determinadas, a las que deben responder siguiendo unas instrucciones fijadas de antemano y, de forma habitual, en un contexto controlado.
•
Obtención de muestras de conducta. Los tests están diseñados para la obtención de los comportamientos reveladores del constructo objeto de la medición.
•
Asignación numérica. Los tests deben permitir la cuantificación objetiva de acuerdo con unas reglas establecidas.
•
Dispone de información sobre la calidad de las mediciones. Los autores de los tests y, en algunas circunstancias, los usuarios deben aportar información técnica sobre la precisión y relevancia para el objetivo de la evaluación de las mediciones aportadas por el test.
Se han elaborado diversas clasificaciones de los tests utilizando diferentes criterios. Crocker y Algina (1986) ofrecen una clasificación útil de los tests atendiendo al carácter general de la tarea que deben realizar las personas: tests de ejecución óptima, en los que se instruye a la persona para que conteste lo mejor que pueda (incluiría los tests de inteligencia, aptitudes y rendimiento); y tests de ejecución típica, que demandan de la persona información sobre sus actitudes, sentimientos, intereses, etc., donde se incluirían los cuestionarios e inventarios de personalidad.
52
Las definiciones de Anastasi y Lord utilizan la expresión “muestras de conducta” que sintetiza la finalidad última de la teoría de los tests. Crocker y Algina (1986) enumeran los problemas por los que la medida psicológica está contaminada por el error: •
Ausencia de aproximaciones únicas a la medición de la mayoría de los constructos. El problema reside básicamente en las diferencias en las definiciones operacionales de la mayoría de las variables psicológicas, lo cual suele conducir a procedimientos diferentes de medida y distintas conclusiones sobre la evaluación de una misma persona.
•
Muestreo limitado del comportamiento. Las mediciones suelen basarse en un número limitado de comportamientos, obtenidos en un muestreo reducido de situaciones y momentos temporales. Así, determinar, por ejemplo, el número de ítems y la variedad de los contenidos de un test es uno de los problemas habituales en la elaboración de los procedimientos de medida.
•
Presencia inevitable de los errores de medida. Las limitaciones “muestrales” en la obtención de los comportamientos indicadores obliga a estimar el grado de error presente de forma inevitable en cualquier medición.
•
Evolución de las teorías psicológicas. Al ser los constructos “herramientas conceptuales” para la elaboración de teorías, el significado de las mediciones siempre estará sujeto a la evolución de la teoría de la que forma parte, dependiendo de la obtención de evidencias que la confirmen o modifiquen.
La finalidad de la teoría de los tests es aportar soluciones para minimizar el impacto de estos problemas sobre la medición psicológica (Martínez-Arias, 1995).
53
La imposibilidad de observar de forma directa la mayoría de las variables psicológicas obliga a considerar la teoría de los tests como una maquinaria conceptual para la inferencia psicométrica. ¿En qué consiste la inferencia psicométrica? La elaboración de ítems debe reflejar la definición operacional y sintáctica del constructo objeto de la medición (Lord y Novick, 1968). El papel de los ítems es el de provocar que las respuestas de las personas en una situación estandarizada, reflejen la conductas que en situaciones “espontáneas”, se considerarían los indicadores conductuales del constructo. La cuantificación se produce cuando a través de un procedimiento de escalamiento se asignan valores cuantitativos a los patrones de repuesta de las personas en el test. Sobre la inferencia, desde el valor cuantitativo o puntuación resumen de la ejecución de la persona hasta el constructo, pueden incidir diferentes fuentes de variabilidad “no deseada”, por no relacionada con el constructo objeto de la medición, que pueden amenazar la corrección de la inferencia: fuentes de variabilidad aleatoria, que tradicionalmente se agrupan bajo la denominación general de “fiabilidad”; y fuentes de variación sistemática, agrupadas bajo la etiqueta de “validez”. El objetivo principal de la teoría de los tests es estudiar este proceso de inferencia y aportar procedimientos para realizarla (Crocker y Algina, 1986). Este objetivo ha hecho que bajo la denominación “teoría de los tests” tengan cabida contenidos tan diversos como: construcción de tests, elaboración de ítems, análisis de ítems, métodos de puntuación e interpretación de las puntuaciones y, de forma preponderante, el análisis de la fiabilidad y validez de las medidas aportadas por los tests.
La teoría de los tests suele dividirse en dos grandes ramas: la teoría clásica de los tests y la teoría de respuesta a los ítems. La cita de Hambleton y van der Linden (1982) expresa con toda claridad esta división: “Las teorías de los tests pueden dividirse en dos grandes categorías. La primera es la teoría clásica de los tests, que parte de la concepción de Spearman de la puntuación observada en el test como compuesta de un componente verdadero y otro de error... Importantes hitos en esta larga y venerable tradición son Theory of mental tests de Gulliksen (1950) y
54
Statistical theories of mental test scores de Lord y Novick (1968)... La segunda es la teoría de respuesta al ítem, o teoría del rasgo latente, como se ha llamado hasta hace poco. Actualmente la teoría de respuesta al ítem esta teniendo un mayor impacto en el campo de los tests” (pág. 373). Complemente este apartado con la lectura anexa Los Test (http://www.psicothema.com/pdf/660.pdf)
55
CONCEPTOS Y METODOLOGÍA ESTADÍSTICA DE LA PSICOMETRÍA
Criterios de calidad en la construcción de test Guiado por el tutor consulte y analice los conceptos más relevantes en la construcción de test (Validez y Confiabilidad). Utilice como guía la siguiente página web: http://www.uned.es/psico-3-psicometria/ En ella encontrará la explicación de conceptos y técnicas importantes para la construcción de pruebas tales como los de Validez y Confiabilidad (fiabilidad), que se encuentran a continuación. Además encontrará ejercicios (plantillas) que podrá resolver con el acompañamiento del tutor.
CONFIABILIDAD
DEFINICIÓN: Criterio de calidad relacionado con la precisión de las medidas obtenidas con un test y que proporciona información acerca de: •
la estabilidad temporal de las puntuaciones obtenidas con el test (test-retest y formas paralelas)
•
la consistencia interna del test (alpha y dos mitades)
FÓRMULA GENERAL:
56
PROCEDIMIENTOS EMPÍRICOS PARA ESTIMAR EL COEFICIENTE DE FIABILIDAD: TEST-RETEST:
FORMAS PARALELAS:
BASADOS EN LA DIVISIÓN DEL TEST EN DOS MITADES:
PARALELAS: Fórmula de Spearman-Brown
ESTRICTA O ESENCIALMENTE TAU-EQUIVALENTES:
Fórmula de Rulon:
57
Fórmula de
Guttman/Flanagan: BASADOS EN LA COVARIANZA DE LOS ITEMS:
Coeficiente alpha:
KR 20:
KR 21:
FACTORES DE LOS QUE DEPENDE LA FIABILIDAD: LONGITUD DEL TEST: Fórmula de Spearman-Brown
VARIABILIDAD DE LA MUESTRA:
58
VALIDEZ
DEFINICIÓN: Criterio de calidad relacionado con la adecuación de las puntuaciones del test para el objetivo que suscitó su aplicación.
TIPOS DE VALIDEZ: VALIDEZ DE CONTENIDO: Trata de garantizar que el test constituye una muestra adecuada y representativa del contenido que éste pretende evaluar. Modo de evaluación: Recurso a expertos VALIDEZ DE CONSTRUCTO: Trata de garantizar la existencia de un constructo psicológico que subyaga y dé sentido y significado a las puntuaciones del test. Modo de evaluación:
Análisis factorial
59
Matriz multimétodo-multirrasgo
VALIDEZ PREDICTIVA: Trata de garantizar la eficacia del test para pronosticar una variable de interés. FIABILIDAD:
LONGITUD DEL TEST:
VARIABILIDAD DE LA MUESTRA: Para el caso de dos variables:
60
FÓRMULA GENERAL DEL COEFICIENTE DE VALIDEZ:
DERIVADOS DEL COEFICIENTE DE VALIDEZ:
También se puede ampliar sobre los conceptos de validez y confiabilidad en el siguiente artículo:
61
ARTÍCULO COMPLEMENTARIO
TÉCNICAS PSICOMÉTRICAS. CUESTIONES DE VALIDEZ Y CONFIABILIDAD
Juan Carlos Argibay (2006) Revista Subjetividad y Procesos Cognoscitivos
Resumen
En este artículo se analizan cuestiones de validez y confiabilidad referidas a las pruebas psicométricas. Se comentan los distintos aspectos de la confiabilidad, ya sea en lo que hace a su consistencia interna, como a la estabilidad de las mismas y a cuestiones de equivalencia. En cada caso se discuten sus características generales y se plantean, brevemente algunos de los distintos procedimientos para estimar la confiabilidad según de qué tipo se trate. En cuanto a la validez se indaga en sus principales tipos: de contenido, de criterio y de constructo y como se vinculan entre sí. Se plantean también los nexos entre validez y confiabilidad. Tratamos de plantear como estos estudios se vincularían con una visión metodológica global, en cuanto a métodos de investigación y diseños y respecto de su funcionalidad como formas de operacionalizar constructos hipotéticos. Dentro de la validez de criterio, se analiza tanto la concurrente como la predictiva y se las relaciona con conceptos como el poder predictivo y poder explicativo. La validez de constructo es estudiada en los problemas que presenta y en las distintas formas para establecer la misma, considerando la validez relacionada con la estructura factorial y la validez convergente y divergente. Palabras clave: técnicas psicométricas; validez; confiabilidad; validez de constructo; validez de contenido; validez de criterio. Al aplicar una técnica psicométrica, independientemente del propósito con que se utilice, se juegan permanentemente, cuestiones relacionadas con la validez y confiabilidad del instrumento.
Es cierto que muchas veces se utiliza un test, sin tener mucho en cuenta o, analizar su validez y confiabilidad. Pero se debiera considerar que las bondades de aquél, dependen mucho de estos factores. Ya sea que se utilice la técnica con fines puramente psicodiagnósticos o en investigación.
Para comenzar, podríamos preguntarnos, ¿cuál es el propósito de una técnica de evaluación, ya sea psicométrica o proyectiva? Consideramos que, en principio, una respuesta adecuada sería: la técnica sirve para operacionalizar algún constructo
62
hipotético.
Por ej., al evaluar la variable de personalidad Extraversión, mediante alguna técnica psicométrica, lo que estamos haciendo es operacionalizar mediante un instrumento dicho constructo hipotético. Puede haber más de una forma de operacionalizar dicho constructo y, de hecho, tanto el EPQ-Acomo el Neo-Pi-R miden entre otras dicha variable. Cabría preguntarse si, en realidad, miden el mismo constructo. Volveremos sobre este tema al analizar más adelante la validez de constructo.
Considerando lo anterior, es de fundamental importancia que el instrumento esté midiendo lo que dice medir, caso contrario se estaría operacionalizando incorrectamente el atributo, al no corresponderse lo que realmente se observa, con lo que se cree medir. También podríamos preguntarnos, ya que toda medida tiende a tener errores de medición, en qué medida el instrumento que estamos usando es preciso en medir los valores verdaderos de la variable que se analiza y cual es su grado de congruencia para medir la variable en cuestión.
Esto último, la precisión y la congruencia, tienen que ver con la confiabilidad del instrumento. Que el instrumento mida realmente lo que dice medir, se relaciona con la validez.
Existen distintas formas de validez y confiabilidad. A continuación pasaremos a analizarlas.
Confiabilidad
Como ya mencionamos, toda medición tiende a presentar errores, de manera que el valor observado en la medición, está formado por el valor verdadero y por el error de medición. Si se pudiera llegar a una medición que, en un sentido ideal no tuviera márgenes de error, el valor observado y el valor verdadero (que se correspondería con la variable a medir), coincidirían. Pero esto es algo ideal, ya que las medidas incluyen error. Obviamente, cuanto más error incluya la medición, más contaminada quedaría la variable de interés y
63
más imprecisa sería la técnica que intenta medirla.
Por éj.: si aplicamos un test que mide la variable de personalidad Neuroticismo y obtenemos un puntaje de 15 (valor observado) y el valor real de la persona fuera de 14 puntos (valor verdadero), tendríamos un margen de error de 1 punto; en otro caso, si el valor real fuera también de 14 puntos y hubiéramos obtenido en la aplicación del instrumento un puntaje de 10, el error de medida sería de 4 puntos. De manera que al aumentar el error de medida, el puntaje que obtenemos al aplicar el test se encuentra más alejado de la medida que sería la verdadera, o sea, que sería más impreciso.
Podemos entonces vincular la confiabilidad con los errores de medición de la siguiente manera: si en toda medida el valor obtenido, está compuesto por el valor verdadero y los errores de medición, un instrumento será más confiable, en la medida que maximice el valor verdadero. Con maximizar el valor verdadero, nos referimos a que éste aproxime lo más posible al valor observado u obtenido. Al reducir el error de medición, incrementamos la similitud entre el valor verdadero y el obtenido. De manera que al maximizar el valor verdadero, minimizamos el error de medición, con el consecuente incremento de la confiabilidad.
Es importante tener en cuenta, que la confiabilidad se refiere, específicamente a los errores aleatorios, tal cual menciona Martínez Arias (1996). Podemos hablar de dos tipos de errores: los errores aleatorios que, como tales, no pueden ser controlados y no se pueden predecir y los errores sistemáticos que son controlables y pueden ser explicados por alguna fuente de variación sistemática. De ambos errores los únicos que interesan a la teoría de la fiabilidad son los errores aleatorios.
Para Martínez Arias (1996), la confiabilidad es la consistencia en un conjunto de medidas de un atributo. Podríamos también definir la confiabilidad como la proporción de la variabilidad verdadera respecto de la variabilidad obtenida.
64
En el análisis de la confiabilidad tenemos que considerar tres aspectos:
• Su congruencia o consistencia interna. • La estabilidad del instrumento. • La equivalencia Congruencia o consistencia interna
La congruencia interna consiste en que las distintas partes que componen el instrumento estén midiendo lo mismo. Por éj., en un test compuesto por distintos reactivos, se esperaría que cada uno de ellos midiera el mismo atributo. En un instrumento que incluyera distintos factores, se esperaría que aquellos reactivos que remiten al mismo factor estuvieran midiendo también lo mismo. La forma de pensar la congruencia interna, se basa en que las distintas partes del instrumento correlacionen entre sí. Al hablar de confiabilidad del instrumento, estamos hablando de que los reactivos que componen el instrumento, son distintas formas del mismo atributo, de manera que estaríamos frente al mismo constructo, observado en conductas diferentes.
De manera que en condiciones ideales, esperaríamos encontrar que los distintos ítems estuvieran correlacionados entre sí. Podemos concluir, entonces, que la congruencia interna del instrumento se establecería según la magnitud de los valores que expresaren las correlaciones entre sus partes.
Por ejemplo: en el test EPQ-A de Eysenck (TEA Ediciones, 1982) las preguntas: ¿Tiene Ud. muchos “hobbys”, muchas aficiones?, ¿Es Ud. una persona conversadora?, ¿Es Ud. una persona animada, alegre?, remiten junto con otras al factor Extraversión, en consecuencia, se esperaría que las respuestas que dieran los sujetos a estas preguntas estuvieran relacionadas entre sí. Si las preguntas no correlacionaran eso afectaría la confiabilidad del instrumento.
Un comentario respecto de lo anterior: en la teoría clásica de la fiabilidad se parte de una situación ideal en la que todos los ítems del instrumento no solo medirían lo mismo sino que lo harían con idéntica intensidad. Lo que ocurre realmente es que, más allá de que
65
estén midiendo lo mismo, la intensidad con que lo hacen varía de ítem a ítem y, además, es usual que midan más de un constructo o dimensión, como menciona Morales (1988). Lo anterior también influye en una reducción de los niveles de correlación y consecuentemente en una reducción de la confiabilidad.
La confiabilidad a través de la congruencia interna, es una de las más utilizadas por los investigadores, entre otras cosas, por requerir una sola aplicación del instrumento, lo cual facilita la investigación.
Los procedimientos para calcular la congruencia interna podemos dividirlos en dos métodos principales:
• Métodos basados en la división del instrumento en dos mitades. • Métodos basados en la covarianza de los ítems.
El método de la división en mitades consiste en lo siguiente:
1º. Se divide el instrumento en dos mitades. 2º. Se obtiene la puntuación para cada mitad en forma independiente. 3º. Se usan estos puntajes para estimar el coeficiente de correlación entre ambas mitades.
Este coeficiente de correlación se ajusta mediante la fórmula de Spearman-Brown.
El motivo por el cual es necesario aplicar la fórmula de Spearman-Brown es que “las escalas de mayor longitud son más confiables que las cortas” (Polit y Hungler, 1995/1997); por ese motivo el coeficiente de correlación que fue obtenido a partir de las dos mitades, tiende a subestimar el valor real de la confiabilidad, que se obtendría con una escala con el doble de longitud que la de cada una de las mitades y que constituiría la longitud original del instrumento.
Existen distintas formas de dividir el test en dos mitades, y cada una de ellas nos da un valor diferente del coeficiente de confiabilidad. Si bien hay que aclarar que si la confiabilidad es buena, las variaciones del coeficiente en función de la forma de dividir el
66
test serían reducidas. De todos modos, en función de lo anterior, se desarrollaron los métodos basados en la covarianza de los ítems, que solucionan el problema anterior al dividir por cada ítem, lo que permite, tal cual dice Martínez Arias (1996), “tratar a cada ítem como si fuese un test de longitud unidad con una puntuación.”
Dentro de los métodos basados en la covarianza de los ítems el más utilizado es el coeficiente alpha de Cronbach y en general es preferible al método de la división por mitades. Si bien, de ser confiable el instrumento, con ambos métodos se obtendría un coeficiente de confiabilidad aceptable.
Algo que es fundamental al interpretar el coeficiente alpha es que el valor de éste, se ve afectado por el número de ítems. De manera que entre dos tests que tuvieran realmente la misma confiabilidad, el que tuviera menos ítems daría un menor coeficiente alpha. Esto se debe a que al aumentar la longitud del instrumento la varianza verdadera aumenta en mayor proporción que la varianza de error. Debido a lo anterior, Cronbach propuso una fórmula adicional de consistencia inter-ítem, que consistiría en una estimación de la correlación media inter-ítem y no se vería afectada por la longitud del instrumento. Esta nueva fórmula no llegó a alcanzar la difusión del coeficiente alpha, pero consideramos que puede ser útil su aplicación, cuando se desea comparar la confiabilidad de dos instrumentos con número desigual de ítems, o de dos factores dentro de un instrumento con un número de reactivos desigual.
En cuanto a cuál debe ser el valor mínimo del coeficiente alpha, no hay un criterio uniforme. Podríamos decir que un parámetro aceptable es un mínimo de .70, pero esto hay que tomarlo con precaución, ya que habría que considerar el número de ítems del instrumento. Si su longitud es reducida, valores menores a .70, podrían estar indicando una buena confiabilidad y si su longitud fuera extensa, un valor de .70 podría no ser tan buen indicador de confiabilidad. Por ejemplo si tuviéramos un instrumento con 10 ítems y alpha = .60 y otro con 100 ítems y alpha = .80 y calculáramos para cada uno la correlación media inter-ítem. Esta sería para el primero de .1304 y para el segundo de .0385; de manera que, si bien el segundo tiene un coeficiente de confiabilidad mayor, atendiendo a la cantidad de ítems, en realidad es menos confiable que el primero, si consideramos la correlación media inter-ítem. Además se debería ser más exigente respecto a la
67
confiabilidad, si la prueba va a ser utilizada para tomar decisiones con fines psicodiagnósticos individuales, que si va ser utilizada grupalmente, para obtener con la misma, valores medios grupales.
De manera que, posiblemente, lo más recomendable al interpretar el coeficiente de confiabilidad sea considerar cuan próximo está al valor máximo (uno), evaluar el margen de error y considerar las distintas circunstancias que involucren el uso del instrumento y, fundamentalmente, tener en cuenta el número de ítems que contenga el instrumento.
En la práctica, es muy importante que los instrumentos sean confiables. Los tests son utilizados en diversas áreas y, en todos los casos, quien los utiliza supone que el mismo mide con precisión determinado atributo, éste es el sentido de su aplicación. Pero, si el instrumento es poco confiable y entonces poco preciso y se lo usara por éj., para una investigación, podría ocurrir, de no cumplirse las hipótesis planteadas, que esto se debiera no a defecto de las mismas, sino a error de los instrumentos de medición, por ser poco confiables. Además, si hubiera que tomar decisiones respecto de un caso individual y, como parte de los elementos de juicio se utilizara un test, el riesgo de tomar una decisión equivocada, se vería incrementado por la poca confiabilidad del instrumento. Además, la confiabilidad y validez tienen cierta relación entre sí. De manera que si un instrumento es poco confiable, esto podría afectar su validez.
Si un instrumento es poco confiable está midiendo, aparte del atributo que pretende medir, diversas variables que son fuente de errores aleatorios, lo cual distorsionaría la medición de la variable de interés. Ya que como sugieren Polit y Hungler (1995/1997) si el instrumento es errático, inconsistente e impreciso difícilmente pueda medir con validez el atributo en cuestión. Esto no quiere decir que si un instrumento tiene alta confiabilidad, eso signifique que tenga que ser válido; un instrumento puede ser confiable y al mismo tiempo no ser válido. Pero a la baja confiabilidad, se la puede relacionar con problemas de validez y, justamente, si la aplicación de un instrumento es para operacionalizar un constructo, el que tenga baja confiabilidad debe servir como un alerta respecto de la validez del mismo y a la conveniencia de aplicar el instrumento para medir el correspondiente atributo.
68
Estabilidad
Al analizarse la congruencia interna, en ningún momento se contemplaban las variaciones que podían darse en las medidas y la consecuente disminución de la confiabilidad, debidas al paso del tiempo. Al hablar de la estabilidad de un instrumento contemplamos este factor, y lo que se observa es en qué grado se obtienen las mismas medidas al aplicar dos veces el mismo instrumento, mediando entre ambas tomas un tiempo determinado. Entre ambas tomas pueden intervenir una serie de factores que sean fuentes de varianza de error, disminuyendo la confiabilidad de las medidas.
El procedimiento es relativamente sencillo, consiste en aplicar la misma prueba en dos momentos diferentes al mismo grupo de sujetos y luego, correlacionar entre sí, los puntajes obtenidos en cada toma. Esta correlación sirve para establecer la confiabilidad del instrumento.
En este caso no estamos hablando solamente de que las partes del test correlacionen en forma significativa. Ya que no se trata de comprobar la relación entre dos variables diferentes, en cuyo caso si bien sería importante la magnitud de la correlación, importaría que se pudiera comprobar que hubiera correlación. Además de que si fueran dos variables diferentes, no se esperaría necesariamente que la correlación fuera alta, ya que estarían presentes otras fuentes de variación, aparte de la varianza de error. En este caso es la aplicación del mismo test, o sea que las variables a relacionar son las mismas. De manera que en condiciones ideales, esperaríamos encontrar una correlación perfecta. Esto no ocurre, porque debido a los errores de medición (anteriormente mencionados), hay un porcentaje de error aleatorio, incluido en la medición. No obstante, la correlación debiera ser en estos casos alta, ya que se esperaría que estas fuentes de error se vieran minimizadas, y que en la aplicación del instrumento no se incurriera en errores sistemáticos.
Hay varias cuestiones que podrían afectar la confiabilidad en estos estudios test-retest:
• Modificaciones en la actitud de los sujetos respecto de la prueba o cambios en la
69
información que éstos manejen podrían afectar los puntajes de la segunda toma del test, incidiendo sobre los valores de correlación, ya sea incrementando artificialmente la confiabilidad o infravalorándola.
• Puede haber efectos derivados de la primera aplicación del test que afecten el rendimiento en el segundo. Por. éj., que algunos sujetos recuerden las respuestas y al contestar el segundo test tiendan a poner las mismas respuestas, no tanto por que se correspondan con su perfil en el atributo que se mide, sino por contestarlo igual. También en tests que midan aptitudes o destrezas los sujetos pueden ver condicionado su rendimiento por la práctica previa.
• Un tema de fundamental importancia es el lapso que medie entre ambas tomas. Un lapso demasiado breve podría incrementar el efecto distorsivo de la memoria y la práctica. Si bien esto se solucionaría incrementando el tiempo, esto a su vez produciría otro problema, la aparición de variables relacionadas con la maduración y la historia:
- La maduración que, según define Arnau Gras (1982), “abarca el conjunto de procesos biológicos y psicológicos que se operan en los sujetos como consecuencia del paso del tiempo.” Suele ser mucho más relevante si los sujetos son niños, ya que en ellos se pueden esperar cambios pronunciados en lapsos de tiempo breve.
- La historia incluye todos aquellos eventos que pudieran tener lugar en el lapso que medie entre ambas aplicaciones y que podrían llegar a afectar el resultado de la segunda prueba. Esto se manifestaría menos en atributos estables como rasgos de personalidad, que en aquellos que describieran estados. Por éj., si consideramos la variable ansiedad, la forma en que podría intervenir la historia produciendo modificaciones en los puntajes de la segunda toma, sería muy diferente si se tratara de un test que midiera la ansiedad como un rasgo de personalidad, en cuyo caso se esperaría que éste fuera estable y que no sufriera cambios por el paso del tiempo o que fueran ínfimos, que si se evaluara la ansiedad como estado, la cual puede sufrir cambios importantes con el transcurso del tiempo.
- En el caso de instrumentos que evaluaran psicopatologías, la historia podría afectar la
70
confiabilidad test-retest, principalmente en aquellas psicopatologías (de carácter neurótico), con altos índices de remisión espontánea, no tanto en aquellas con remisión espontánea baja o casi nula. Por ej, Eysenck (1977/1978) menciona que las fobias específicas
y
los
trastornos
obsesivocompulsivos,
muestran
una
recuperación
particularmente lenta, y posiblemente muy a menudo no haya ninguna recuperación sin tratamiento.
Uno de los problemas de las técnicas para evaluar la confiabilidad mediante test-retest es que pueden llegar a confundir las fluctuaciones aleatorias con cambios que se producen realmente en el atributo. Los cambios que se podrían producir en el atributo, modificarían (en aquellos sujetos en que se produjeran), los puntajes en el instrumento que se estuviera evaluando, con la consecuente disminución de la confiabilidad.
Pero en este caso la disminución de la confiabilidad sería ficticia, no se correspondería con errores aleatorios, sino con errores sistemáticos, los cuales no son de interés de la teoría de la fiabilidad. En este caso hablamos de errores sistemáticos desde el punto de vista de la confiabilidad, pero en otro sentido, representarían realmente varianza sistemática producida en la variable que evalúe el test. Por ejemplo: supongamos que se evaluara la confiabilidad de un test que midiera estado depresivo y algunos de los sujetos estuvieran en tratamiento por dicha psicopatología, o por otra. Ya sea en un caso directamente, o en el otro indirectamente, la intervención podría producir una modificación en el atributo (estado depresivo) y esto reduciría los valores de confiabilidad. Pero la disminución de los puntajes de depresión sería esperable como un efecto de la intervención terapéutica y de ninguna manera podría tomarse como un indicador real de problemas de confiabilidad del instrumento.
También podría ocurrir que el instrumento fuera utilizado para hacer un seguimiento de la evolución de pacientes o en investigaciones sobre eficacia terapéutica. En estos casos se esperaría una disminución de los puntajes como efecto del tratamiento e, idealmente, en la mayoría de los sujetos. Estos tampoco serían errores aleatorios, sino, sistemáticos y no serían representativos de la confiabilidad del instrumento.
Cabe aclarar, en este último caso, que no toda variación sistemática, tendría que afectar
71
necesariamente los valores de confiabilidad que se obtendrían sin esta variación. Si el efecto del tratamiento se cumpliera de manera que produjera una mejora en todos los sujetos y en el mismo grado, los valores de confiabilidad no se verían afectados por el tratamiento, ya que sería la misma que si este no hubiera tenido lugar, debido a que al ser la disminución idéntica para todos (en un valor constante), por éj., la puntuación del test disminuyera en todos los sujetos diez puntos, la correlación entre ambas pruebas sería la misma, que la que se hubiera obtenido si el tratamiento no hubiera tenido lugar. Lo que realmente afectaría la confiabilidad sería el efecto diferencial del tratamiento, ya que con el mismo, algunos tendrían una mejoría mayor que otros, algunos ninguna mejoría y algunos hasta podrían empeorar; este efecto dispar del tratamiento, alteraría el ordenamiento que los sujetos hubieran tenido sin él, y modificaría los valores de correlación. Esto último es lo que ocurre en la realidad, el primer caso que implica una modificación igual en todos los sujetos, es un caso ideal que no se corresponde con lo que realmente ocurre en un tratamiento.
Por tal motivo la aplicación de un tratamiento psicológico en algunos de los sujetos, entre las dos tomas de una investigación test-retest, de un instrumento que midiera psicopatología, podría afectar los valores de confiabilidad que se obtuvieran para dicho instrumento. Lo anterior, podría hacerse claramente extensivo, a las diversas técnicas psicométricas que miden distintas psicopatologías. Además es importante en estas pruebas conocer su estabilidad pues, de ser usadas, por éj., para ir evaluando un tratamiento a través del tiempo, sería fundamental saber cuanto afecta el paso del tiempo a la confiabilidad del mismo, principalmente cuando se use en la clínica, ya que en investigación el disponer de grupo control, permitiría un mejor manejo de ese problema.
Puede haber también otras fuentes de errores sistemáticos, que alteren los puntajes del test, sin modificar básicamente el atributo, como ser por éj., factores que modifiquen el contexto de la medida. Supongamos el siguiente ejemplo: un psicólogo aplica un test que mide Atención a un grupo de sujetos. Dos días más tarde les aplica de nuevo el mismo test, pero cambia el lugar donde lo hace, y en este lugar hay mayor cantidad de ruido ambiente. Es probable que el resultado en la prueba de atención sea mejor en la primera toma, ya que los sujetos estaban expuestos en menor medida a estímulos distractores que pudieran afectar su rendimiento.
72
En los ejemplos anteriores, podemos observar, como al introducir una variable en forma sistemática entre ambas aplicaciones del test, se podrían alterar los resultados obtenidos en la confiabilidad test-retest. En qué casos los efectos de la historia producirían una reducción ficticia de los valores de confiabilidad y en qué casos estarían afectando realmente la confiabilidad.
La diferencia que podemos marcar es la siguiente, en los ejemplos que dimos, la modificación en el contexto de medida y la intervención terapéutica, estamos frente a variables, a la que están expuestos todos los sujetos o una parte de ellos, y que producen un cambio sistemático, consistente en una reducción de los puntajes (en otros ejemplos podría haber sido un incremento), como una tendencia grupal; ya que como mencionamos con anterioridad tomando cada caso en particular el efecto podría ser diferente en cada sujeto, fundamentalmente en grado (en qué medida se produce la modificación) y en una minoría de casos en dirección (por éj., si la mayoría experimenta una reducción de los puntajes, algunos podrían mantener el mismo puntaje o incrementarlo).
Por el contrario, cuando hablamos de la historia, nos referimos a un conjunto amplio de variables, donde cada sujeto se ve expuesto a distintas variables y/o a combinaciones diferentes de las mismas, sin poder determinarse cual o cuales variables afectaron a cada uno y de que forma. Se podría producir un incremento en el error, pero sin poder determinar una fuente de error claramente identificable, o sea, que los cambios en los puntajes serían impredecibles e incontrolables y, en consecuencia, errores aleatorios.
Consideramos entonces, que los efectos no identificados derivados de la historia y que contribuyeran a la varianza de error, de producir un descenso en la correlación entre ambas tomas, constituirían un déficit real de confiabilidad del instrumento, que deberá ser contemplado, por ejemplo, cuando el instrumento se utilice para evaluar el transcurso de un tratamiento, como así también en otras aplicaciones del test. Por el contrario, las diferencias en las medidas, claramente atribuibles, a fuentes de variación sistemática, deberían ser controladas dentro de lo posible, para que no sean incluidas como déficit de confiabilidad.
73
Equivalencia
La técnica de equivalencia se aplica cuando se quiere determinar la confiabilidad de dos instrumentos que se consideran paralelos. Se trata de poder establecer la consistencia o equivalencia de los instrumentos, que suponen medir el mismo constructo, al aplicarlos a los mismos sujetos, Polit y Hungler (1995/1997). En este caso se aplican las dos formas del test en forma simultánea, se va variando el orden de presentación de las formas de sujeto en sujeto (para controlar posibles efectos de orden) y luego se correlacionan los puntajes de ambas formas.
De ser ambas formas equivalentes tendría que obtenerse un coeficiente de correlación elevado. En la práctica es muy difícil establecer que las formas sean realmente paralelas, por tal motivo suele tratárselas más bien como formas alternativas. A diferencia de las otras técnicas de confiabilidad, en ésta, no solo se establece la confiabilidad, respecto de la magnitud de los errores aleatorios, sino que también se establece cual es el grado de paralelismo que hay entre ambas formas. Aveces ambas formas no se aplican simultáneamente, sino que se deja transcurrir un tiempo entre ambas, de manera que la correlación que se obtendría serviría tanto para estimar la equivalencia como la estabilidad de las dos formas para medir el atributo.
Otra forma de equivalencia consiste en determinar la confiabilidad entre evaluadores u observadores. Esta forma de confiabilidad no se puede aplicar a cualquier instrumento, sino que es específica de aquellos instrumentos en los cuales dos o más evaluadores u observadores tienen que calificar o puntuar la conducta y/o el rendimiento como parte de la aplicación del instrumento. Cabe aclarar que, en este caso, estamos usando el término conducta en un sentido amplio, sin remitir únicamente a la conducta directamente observable. Por ej., si en la aplicación del instrumento, los sujetos se expresaran en un relato sobre ellos mismos, y debiera establecerse una valoración mediante evaluadores, de las conductas descriptas en estos relatos, sería muy importante poder determinar la concordancia entre distintos evaluadores. Hay que tener en cuenta que en estos casos los evaluadores son una importante fuente de error.
74
Para determinar la confiabilidad entre los evaluadores u observadores se usan índices de concordancia, como por ejemplo, el coeficiente Kappa de Cohen.
Validez
Habíamos comentado que los instrumentos tenían como propósito operacionalizar constructos, o sea, medir determinados atributos. La validez tiene que ver con poder determinar si el instrumento está midiendo realmente el atributo que dice medir.
Determinar la validez de un instrumento es mucho más difícil que establecer su confiabilidad. Como dicen Polit y Hungler (1995/1997), “no es común encontrar pruebas sólidas que sustenten la validez de la mayor parte de las mediciones de carácter psicológico”. Esto se debe a que mientras la confiabilidad sería esencialmente una cuestión empírica; la validez incluye más elementos teóricos, ya que la validación persigue la explicación, con todas las complicaciones que esto implica.
Dentro de los distintos tipos de validez, encontramos como las más importantes, las siguientes: validez de constructo, validez de criterio y validez de contenido. Es importante tener en cuenta que distintas formas de validez, pueden ser adecuadas para propósitos diferentes y que cada una permite inferencias distintas, que no pueden cambiarse entre sí.
Validez de contenido
Al construir un test, elegimos determinados ítems de un conjunto de conductas que tienen un interés específico, por suponer que remiten al atributo a ser evaluado por el test. En el instrumento no colocamos todas las conductas posibles, elegimos algunas de ellas, o sea, que hacemos una muestra de conductas. Al analizar la validez de contenido, lo que hacemos es evaluar si los ítems que hemos usado para construir el test, son relevantes para el uso que se le va a dar al test, es decir, si todos los ítems están dentro del dominio de interés. Una vez establecida la relevancia, lo que importa es saber si los ítems constituyen una muestra representativa del universo de conductas que podrían haberse elegido como indicadores del atributo en cuestión. La validez de contenido se centra en establecer de la mejor manera lo anterior.
75
Validez de criterio
Podemos decir que en el caso de la validez de criterio, lo que se persigue, es un fin más práctico, no se trata únicamente de establecer que se mida adecuadamente un constructo, sino fundamentalmente relacionar las puntuaciones del instrumento con otras variables a las que llamaremos criterio.
La validez de criterio nos es útil especialmente cuando deseamos hacer inferencias a partir de los puntajes que se obtienen en el test respecto de alguna otra variable de interés. Por ejemplo, si nos interesara establecer en que medida los puntajes obtenidos en la variable de personalidad Neuroticismo, nos permiten inferir la predisposición para adquirir determinadas conductas con características psicopatológicas, o en que medida pueden servirnos para predecir una mejor evolución terapéutica, o menores recaídas; relacionaríamos dicha variable de personalidad con los distintos criterios mencionados. Si lo que quisiéramos fuera establecer la validez de criterio de un test de inteligencia, podríamos usar algún indicador de rendimiento académico (por éj. notas escolares), como criterio, para relacionar con el test de inteligencia.
Dentro de la validez de criterio se habla de validez concurrente y validez predictiva. La diferencia entre ambas formas de validez, radica en la temporalidad del criterio. Si las puntuaciones del test se utilizan para predecir alguna medida del criterio que se va a realizar a futuro, sería validez predictiva. Si por el contrario relacionamos las puntuaciones del test con alguna medida del criterio tomada en el mismo momento sería validez concurrente. Por ejemplo, si aplicáramos el EPQ-A (Cuestionario de Personalidad de Eysenck para Adultos), y lo utilizáramos para predecir que pacientes depresivos, pasado un año, tendrán una mejor respuesta al tratamiento, sería validez predictiva. Si por el contrario aplicáramos el EPQ-Ay el Inventario de Depresión de Beck (como criterio), en forma simultánea, y relacionáramos los puntajes de ambos instrumentos entre sí, para analizar en qué medida el Neuroticismo puede predisponer a la adquisición de conductas depresivas, sería validez concurrente.
Nos parece conveniente aclarar lo siguiente: cuando hablamos de validez predictiva, no debemos confundir ésta con el poder predictivo propio de las investigaciones científicas. Si
76
de poder predictivo se trata, éste está presente, tanto en la validez predictiva como en la concurrente. Cuando se ha hecho un estudio de validez concurrente y se ha establecido que tal variable de un test correlaciona con tal criterio, estamos prediciendo esa correlación, y eso es poder predictivo. O sea, que la diferencia entre ambas formas de validez, no tiene que ver con si son predictivas o no (desde un punto de vista científico), sino más bien con el diseño que involucran en cuanto a su dimensión temporal. La validez concurrente implica un diseño transeccional o transversal, los cuales como bien mencionan Sampieri, Collado y Lucio (1997), “recolectan datos en un solo momento, en un tiempo único”; mientras que la validez predictiva implicaría un diseño prospectivo.
Validez de constructo
Gran parte de las variables psicológicas, no son observables directamente, o sea, que constituyen constructos hipotéticos, que forman parte de las diversas teorías que tratan de explicar la conducta humana. Estas variables al no poder ser observadas directamente, para toda investigación, deben ser operacionalizadas, o sea, indicarse los procedimientos de medida para observar la variable, hacerla empírica. Los instrumentos psicométricos se refieren a constructos hipotéticos, siendo el instrumento una forma de operacionalizar los mismos. De esta manera la validez de constructo, consiste en tratar de probar que las conductas que registra el test, pueden ser consideradas indicadores válidos del constructo al cual refieren.
Es importante tener en cuenta que en la validación de constructo, no se trata de hacer corresponder en forma única la puntuación del test con el constructo, ya que un mismo constructo, puede tener, varios indicadores, es decir, varias operacionalizaciones. De lo que se trata es de establecer que las puntuaciones del test constituyen en forma válida una de las manifestaciones del constructo. También hay que tener cuidado, en el sentido de que puede ocurrir, que en algunos casos, diferentes tests que tratan de medir el mismo atributo, no sean en realidad distintas operacionalizaciones del mismo constructo, sino constructos diferentes, lo cual dependerá de las características de la teoría en que cada uno esté inserto, y el grado de similitud entre las mismas.
La validez de constructo, es el principal tipo de validez y a su vez, la más difícil de
77
comprobar. Si queremos establecer que las conductas que registra el test, son indicadores válidos del constructo, tendremos que considerar que sólo podremos aproximar a ese objetivo. Ya que suponer que se puede comprobar que un término conceptual, se corresponde exactamente con un término empírico, implicaría negar la diferencia de niveles entre ambos, que prácticamente imposibilita comprobar una correspondencia exacta. Con esto no queremos decir que ambos términos no puedan corresponderse exactamente, sino que no podríamos justificarlo. Solo aportar una serie de evidencias, más o menos convincentes que apunten en ese sentido.
Además, en este caso, lo que cuenta no son tanto cuestiones de utilidad en la aplicación del instrumento, las cuales eran importantes en la validez de criterio, sino el atributo que subyace a las conductas observables del test. O sea, que la cuestión es eminentemente teórica, y comporta gran parte de los problemas que podemos encontrar en la justificación de teorías.
Lo que importaría en este caso, si tomamos por ejemplo la variable Neuroticismo medida por el EPQ-A, no sería tanto si las puntuaciones de Neuroticismo pueden servir para establecer predisposición para la adquisición de determinadas psicopatologías. Lo que se consideraría más relevante sería establecer si este factor que mide el test se corresponde con el constructo Neuroticismo, ubicado en la teoría de la Personalidad de Eysenck, de la cual se deriva el instrumento al que nos referimos.
Hay distintos procedimientos para evaluar la validez de constructo, mencionaremos algunos de ellos:
• Análisis factorial:
Esta forma de evaluar la validez se utiliza cuando el test está dividido en factores y sirve para medir la validez de constructo, debido a que desde la teoría del instrumento se plantean los distintos factores como atributos diferenciados. Para comprobar la validez de constructo
(factorial)
se
utiliza
el
Análisis
factorial.
Esta
técnica
analiza
las
intercorrelaciones de un conjunto de datos, para establecer determinadas agrupaciones de ítems correlacionados entre sí, las cuales remiten a factores subyacentes, que no son
78
observables, o sea que constituyen distintos constructos. Estos constructos forman parte de la teoría del test. El análisis factorial, se utiliza no solo para evaluar la validez del instrumento, sino también en su construcción. Una vez construido el test y establecidos los correspondientes factores, la técnica puede aplicarse sobre los datos obtenidos a partir de una muestra de sujetos para establecer si la estructura factorial planteada, puede ser replicada, lo cual nos permitiría hablar de la validez factorial del instrumento.
Hay que aclarar al respecto que, en general, las estructuras factoriales pueden tender a ser inestables y dependen mucho del tamaño de la muestra. El tamaño necesario depende en parte de la cantidad de ítems involucrados en el análisis y hay diferentes criterios para establecer el número de sujetos indicado. Uno de los criterios, es que el número de sujetos no sea menor a cinco veces la cantidad de ítems del instrumento. Aún con este número de sujetos las estructuras factoriales pueden seguir siendo inestables, y no es sencillo replicar exactamente las mismas, máxime cuando el instrumento se aplica en un país o cultura diferente a aquella en que ha sido construido.
Por tal motivo, consideramos, que al replicar la estructura factorial, deberíamos considerar la validez factorial, como una cuestión de grado, desde una replica perfecta, hasta la obtención de una estructura de los factores, por lo menos similar a la original. De todos modos, cuando la estructura factorial, no es exactamente igual, pero guarda suficiente similitud con la predicha, tenemos la opción de considerar que el instrumento tiene validez factorial y aplicarlo tal cual, o introducir modificaciones acordes con los datos obtenidos en el nuevo análisis factorial, tratando de preservar mayormente las características originales del test. Esta última opción nos parece la más adecuada, principalmente si el test se está validando en un contexto diferente al de su construcción original y se dispone de los medios para hacer la adaptación correspondiente.
• Diferenciación entre grupos:
Se aplica el instrumento a dos o más grupos, los cuales debieran diferir en el atributo que se mide, en razón de alguna característica que se usó para formar los grupos, y que se podría inferir a partir de la teoría del constructo que mide el instrumento, que dicha característica estaría relacionada con diferencias predecibles en el atributo.
79
Como ejemplifica Martínez Arias (1996): Si tenemos un test que mide inteligencia, teniendo en cuenta que las habilidades cognitivas varían con la edad, podríamos formar grupos de distintas edades, de acuerdo a las diferencias cognitivas que fueran esperables, y esperaríamos encontrar diferencias entre los grupos en cuanto al nivel de inteligencia que mide el test.
• Correlaciones con otras medidas del constructo:
Cuando ya existe otro test ya validado que mide el mismo constructo, o varios tests, se puede correlacionar el nuevo con aquél, o con los varios tests ya existentes, para establecer su validez de constructo. Este procedimiento, depende de que exista, por lo menos un test, con un constructo idéntico o muy similar, al que se intenta validar.
• Las Matrices multimétodo-multirasgo:
Para poder aplicar esta técnica se precisa que existan como mínimo dos métodos diferentes para medir el constructo que se va a validar. También se necesitan otros constructos que puedan ser medidos por los mismos métodos. Se miden en los sujetos de la muestra los distintos constructos con métodos diferentes. Se calculan las correlaciones entre todas las medidas y se forma con ellas una matriz que contendría los siguientes datos:
- Coeficientes de fiabilidad: serían las correlaciones obtenidas entre medidas del mismo constructo con el mismo método. Se espera que sean elevados.
- Coeficientes de validez convergente: son las correlaciones entre las medidas del mismo constructo, obtenidas con métodos diferentes. Se espera que las correlaciones sean altas.
- Coeficientes de validez divergente: son las correlaciones de constructos diferentes medidos con igual método y las correlaciones de diferentes constructos medidos con distintos métodos. Se espera que sean mucho más bajas que las obtenidas en la validez convergente y en el cálculo de la confiabilidad.
80
Conclusiones
La falta de confiabilidad de un instrumento, por lo general, afecta la validez de alguna forma, pero esto no significa que pueda tomarse entonces la confiabilidad como un indicador de validez, ya que un test podría tener muy alta confiabilidad y no por eso que esa medida sea válida, es decir, que esté midiendo el atributo que se espera.
Tanto la validez como la confiabilidad, son importantes, porque es relevante que un instrumento sea lo más exacto posible, que contenga el menor número de errores; pero de qué nos sirve la precisión, que el instrumento tenga escaso margen de errores aleatorios, si lo que mide no es lo que suponemos, o sea, que no está midiendo la variable que realmente nos interesa medir. Por este motivo el test debe tener para ser adecuado, confiabilidad y también validez.
Consideramos que hay dos aspectos para pensar los análisis de validez: 1) desde un punto de vista teórico, o 2) con un sentido esencialmente práctico, focalizado en la utilidad del instrumento.
Desde un punto de vista teórico, nos interesa fundamentalmente la relación del instrumento con el constructo y las cuestiones relacionadas con la teoría que incluye al constructo, en cuanto a las hipótesis que pudieran derivarse de la misma para someter a prueba al instrumento mediante dichas hipótesis.
Si la validez la pensamos con un sentido práctico, no importaría tanto el constructo que se mide, como los resultados empíricos obtenidos y sus posibles aplicaciones. De esta manera podemos hablar de que un instrumento sea válido, pero también de que sea útil. Por éj, si un instrumento tuviera claro poder predictivo, que pudiera derivarse en aplicaciones útiles (establecidas a través de la validez de criterio); si no pudiera demostrarse con claridad su validez de constructo, ¿eso invalidaría su uso práctico? Seguramente que no.
En el caso del constructo, estaríamos en el orden de lo explicativo y esto sirve
81
fundamentalmente para generar nuevas ideas y, para mejorar la capacidad de predecir, ya que la explicación, implica necesariamente la predicción. Ahora, como ocurre en la ciencia en general, podemos tener poder predictivo, en ausencia de poder explicativo y eso no quita que ese poder predictivo, nos permita generar aplicaciones útiles.
Las investigaciones de validez nos proporcionan información, que al estar corroborada, nos permite avanzar hacia resultados con aplicaciones prácticas. Interesa establecer la validez relacionada con el constructo, pero sin perder de vista las investigaciones de validez que derivan en usos prácticos.
Podemos establecer un paralelismo, entre la investigación en psicometría y la investigación psicológica en general. Las formas y procedimientos de investigar en psicometría, no debiéramos considerarlos como absolutamente específicos de la misma.
En general la psicometría encuadra en métodos de investigación generales, por éj., la confiabilidad por test- retest, puede ser equiparada a un diseño longitudinal de panel, la validez predictiva con diseños prospectivos y la concurrente con diseños transversales.
En general la metodología usada es correlacional, pero no es la única posible. El constructo forma parte de teorías. De estas teorías se pueden derivar hipótesis, que al ser sometidas a prueba, aportan a la validez de criterio y/o a la de constructo, pero que en definitiva, también sirven para enriquecer el campo de conocimiento a que se refieren, más allá de la psicometría. En dichas investigaciones, al plantearse hipótesis funcionales, podrían haberse usado, tanto diseños experimentales, como diseños de grupos naturales, formados a partir de las medidas obtenidas en algún instrumento.
O sea, que investigaciones realizadas con fines estrictamente psicométricos de análisis de validez, pueden aportar a diversas áreas de conocimiento, y al mismo tiempo, investigaciones no realizadas con fines psicométricos de validación, sino de investigación en áreas diversas de la psicología, pueden aportar a los estudios de validez, al elegir instrumentos psicométricos como formas de operacionalización de las variables en estudio. Por ej., si hiciéramos un estudio sobre como ciertos factores de personalidad pueden intervenir facilitando o dificultando la evolución terapéutica en determinada
82
psicopatología, puede ser que la investigación se hiciera dentro de estudios sobre personalidad o en estudios clínicos y no como un análisis de validez, pero si en la operacionalización de la personalidad utilizamos una técnica psicométrica, el mismo estudio podría considerarse como un estudio de validez. No debemos olvidar que los tests operacionalizan variables y que estas formas de operacionalizar, son sumamente prácticas, motivo por el cual se utilizan en las áreas de investigación más diversas, al igual que en las más variadas aplicaciones, tanto clínicas, como en psicología laboral, en educación, etc. Esto da la razón de ser de la técnica, que en última instancia es creada para ser utilizada en investigación, o en distintas áreas de la psicología y crea un nexo indubitable entre la investigación psicométrica y la investigación psicológica en general.
Las distintas formas de validez, se encuentran muy relacionadas entre sí y, muchas veces, no diferenciadas claramente. Por ejemplo, una investigación sobre validez predictiva puede aportar a la validez de constructo, en la medida que la predicción pudo haberse deducido de la teoría que incluye al constructo. Consideramos entonces, que quizá, una diferenciación más clara, sea la que pase no tanto por las características de la investigación, sino por el propósito con que se la utilice. Si se la utiliza para analizar o justificar cuestiones teóricas relacionadas con el constructo, sería validez de constructo; si el propósito con el que se la realiza es establecer la utilidad del instrumento en aplicaciones prácticas o para corroborar hipótesis que vinculan el constructo con otras variables, sería validez de criterio.
Si bien en las técnicas psicométricas la validez y la confiabilidad son esenciales, no es menos cierto que, en cual de estas cuestiones o en que tipos de validez y confiabilidad se deba poner mayormente el énfasis, o en que elementos de los estudios se deba reparar especialmente y bajo que perspectiva, depende mucho, del instrumento que se vaya a utilizar, del propósito que se persiga y del contexto en que se piense emplear.
Por último, digamos que el uso adecuado de una técnica psicométrica, no se reduce a conocer como se aplica a los sujetos. Sino que fundamentalmente se trata de poder interpretar lo más correctamente posible las puntuaciones obtenidas. Para lo cual se requiere, conocer bien sobre validez y confiabilidad, en general y en particular sobre el test que se desee aplicar. Además de conocer lo más posible la teoría de la cual se derive el
83
instrumento, lo cual nos va a permitir establecer relaciones teóricas del instrumento con otras variables relevantes y poder extraer de su aplicación la mejor información que redunde en variados y útiles usos prácticos.
Bibliografía
Arnau Gras, J. (1982). Psicología experimental. México: Editorial Trillas.
Eysenck, H. J. (1978). Usted y la neurosis. Buenos Aires: Editorial Abril.
Martinez Arias, R. (1996). Psicometría: Teoría de los tests psicológicos y educativos. Madrid: Editorial Síntesis.
Morales, P. (1988). Medición de actitudes en Psicología y Educación. Construcción de escalas y problemas metodológicos. San Sebastián: Editorial Tarttalo en colaboración con la Universidad de Comillas.
Polit, D. F. y Hungler, B. P. (1997). Investigación científica en Ciencias de la Salud (5º ed). México: McGraw –Hill Interamericana.
Sampieri, R. H., Collado, C. F. y Lucio, P. B. (1997). Metodología de la Investigación. Colombia: McGraw-Hill.
Articulo tomado de: http://www.uces.edu.ar/publicaciones/archivos/revista_subjetividad/numero8/1533.pdf
84
UNIDAD DIDÁCTICA II APROXIMACIÓN AL USO DE PRUEBAS ESTANDARIZADAS Evaluación de la Personalidad En algunos aspectos, medir la personalidad, se asemeja mucho a evaluar la inteligencia, En uno u otro caso se intenta cuantificar algo que no podemos ver ni tocar, y en ambos casos una buena prueba ha de ser confiable y valida a la vez. Al evaluar la personalidad, no nos interesa la mejor conducta, lo que queremos averiguar es la conducta típica del sujeto, es decir, como suele comportarse en situaciones ordinarias. En la intrincada tarea de medir la personalidad los psicólogos recurren a cuatro instrumentos
básicos:
la
entrevista
personal,
la
observación
directa
del
comportamiento, los test objetivos y los test proyectivos. Cada ves que un psicólogo se enfrenta a la difícil tarea de medir la personalidad de un individuo, asumen un reto ya que la personalidad es algo que ellos no pueden ni ver ni tocar, pero que saben que esta presente en cada una de las persona, y tratar de ver como es la personalidad de un individuo en particular no es tarea fácil para los mismos. Para ilustrar esta temática veremos tres instrumentos, dos de carácter objetivo y uno proyectivo. CUESTIONARIO DE LA PERSONALIDAD 16 PF
FICHA TÉCNICA
Nombre original :
"Sixteen Personality Factor Questionnaire (16 PF)". Institute for
Personality and Ability Testing, Champaign, Illinois, U.S.A.
85
Autor:
R.B. Cattell.
Nombre en la Adaptación Española: Cuestionario de Personalidad 16 PF.
Adaptación Española: Sección de Estudios de TEA Ediciones, S.A. Madrid, 1.975.
Administración: Individual y Colectiva.
Duración:
Variable, 45 a 60 minutos.
Aplicación:
Adolescentes y Adultos, con un nivel cultural equivalente al de la Enseñanza Media para las Formas A Y B.
Significación: Apreciación de dieciséis rasgos de primer orden y cuatro de segundo orden de la personalidad; posible medida de la distorsión motivacional en las Formas A, C y D, y de la Negación en la Forma A.
Material: Manual, Cuadernillos, Hojas de respuestas y plantillas de corrección.
El Cuestionario de Personalidad de 16 Factores es un instrumento de valoración objetiva, elaborado mediante investigación psicológica con el fin de ofrecer en el menor tiempo posible una visión muy completa de la personalidad.
El 16 PF se diseño para ser aplicado a sujetos de 16 años en adelante y existen en uso o en preparación, seis formas diferentes; la C y la D están destinadas a sujetos con formación medio-baja; la A y la B para personas con nivel de formación igual o superior al de bachillerato superior. Las restantes formas del cuestionario E y F, están proyectadas para sujetos que presentan algún déficit en su formación y nivel de comprensión lectora.
86
La visión global de la personalidad que intenta el 16 PF se basa en la evaluación de 16 dimensiones funcionalmente independientes y psicológicamente significativas, aisladas y definidas repetidamente durante más de treinta años de investigaciones factoriales, en grupos de sujetos normales y clínicos.
Los rasgos de personalidad evaluados por el 16 PF no están únicamente aislados y definidos por el Cuestionario, sino que se encuadran dentro del contexto de una teoría general de la personalidad; la primera publicación comercial de la prueba (1949) fue precedida de una fase de cerca de diez años de investigación empírica factorial.
Las dimensiones del 16 PF se especifican y definen brevemente más adelante; los factores, identificados por letras, se describen en sus dos polos o extremos mediante una denominación técnica y unos cuantos adjetivos de uso corriente.
Además de los 16 factores primarios mencionados, el cuestionario puede evaluar ocho dimensiones secundarias que, como se indica posteriormente, son rasgos más amplios, obtenidos a partir de los factores primarios.
INSTRUCCIONES PARA LA APLICACIÓN
Las contestaciones se recogen en una Hoja de respuestas separada, nunca sobre el mismo Cuadernillo. En primer lugar se le pide al sujeto que anote los datos de identificación (apellidos, nombre, edad, etc.), en la parte superior de la Hoja de Respuestas. A continuación se le indica que lea, a la vez que lo hace el examinador en voz alta, las instrucciones de la portada del Cuadernillo y conteste en la Hoja a los cuatro ejemplos que se proponen.
87
En ocasiones es preferible leer y discutir con el sujeto ciertos puntos de las instrucciones, aunque el examinador debe ser siempre juez crítico en cualquier situación particular. Para contestar en la Hoja y señalar sus respuestas, el sujeto debe colocar la Hoja de forma apaisada; el espacio dedicado a los cuatro ejemplos de entrenamiento se encuentran en la parte superior, fuera del recuadro dedicado a los elementos, y éstos están dispuestos en forma de columnas, una para cada página del Cuadernillo.
Es probable que ayude al examinado conocer este diseño intencional en columnas, de modo que al final de cada columna y página tenga un control de que viene contestando a cada elemento en el lugar correspondiente.
Aunque el Cuestionario no tiene un tiempo limitado, es preferible recordarles que no deben entretenerse demasiado en cada cuestión, sino contestar de un modo natural, sincero y rápido.
Terminada la aplicación se recoge la Hoja de respuestas y el Cuadernillo, comprobando si se han anotado bien los datos de identificación y si se ha dado una y sólo una respuesta a cada cuestión.
NORMAS PARA LA CORRECCIÓN Y PUNTUACIÓN
Las hojas de respuestas pueden ser corregidas manualmente. Cada respuesta puede recibir 2, 1 ó 0 puntos, excepto en el factor B (Inteligencia), cuyas contestaciones reciben 1 ó 0 puntos. La puntuación de cada elemento contribuye sólo a un factor o escala (excepto en DM de la Forma A).
La utilización de la plantilla, preparada al efecto, facilita la corrección manual; en ella se pueden obtener las puntuaciones directas en los 16 factores. Basta
88
colocarla sobre la hoja de respuestas de modo que por los espacios transparentes de referencia - en la parte izquierda y fuera del recuadro dedicado a las contestaciones - aparezcan las estrellas superior e inferior de la hoja.
Cada una de las escalas ocupa en la plantilla una zona aproximadamente horizontal, separada por líneas y claramente diferenciadas. La puntuación directa de cada escala se puede hallar comenzando por la izquierda y sumando los puntos obtenidos por las contestaciones del sujeto que aparezcan a través de los espacios transparentes; al terminar en el margen derecho de la plantilla, se anota el resultado en la casilla existente en el margen derecho de la hoja de respuestas.
FIABILIDAD
La consistencia de las 16 escalas, puede mostrarse de muy diferentes modos. El primer tipo de consistencia es la fiabilidad o concordancia de los resultados a través del tiempo. La fiabilidad puede, a su vez, subdividirse en:
a. Coeficiente de permanencia o correlación test-retest en dos ocasiones distintas separadas por un pequeño intervalo de tiempo;
b. Coeficiente de estabilidad o correlación test-retest con un intervalo de tiempo más largo.
En diferentes aplicaciones de 16PF de diversas formas o diversas combinaciones se ha encontrado coeficientes de permanencia entre 0,70 y 0,90 aproximadamente. En todos los casos, el retest se realizo dentro de la semana siguiente a la primera aplicación. En otras aplicaciones, igualmente se han encontrado coeficientes de estabilidad del orden del 0,71 y 0,88 con muestras de 132 personas y con un intervalo de tiempo de 2 meses. Los coeficientes de estabilidad más bajos se
89
presentan en aplicaciones test-retest con intervalos de 4 años con valores entre 0,41 y 0,64.
VALIDEZ
El concepto de validez exige la elección de los elementos que sean buenas medidas de los factores de personalidad tal como estos factores son definidos por los estudios de investigación. Este concepto de validez de las escalas puede evaluarse directamente correlacionando las puntuaciones directas con los factores puros. En aplicaciones de diversas formas de PF16 se ha encontrado que la validez es mayor cuando se combinan las Formas y los índices son relativamente elevados, incluso en las escalas que contienen menos elementos.
El concepto de validez también puede evaluarse indirectamente determinando en que grado las correlaciones obtenidas entre las escalas del 16 PF y un grupo representativo de variables psicológicas diversas, están de acuerdo con aquellas que se esperaría obtener a partir de los criterios conceptuales o factores puros. Para ello, en una aplicación de las formas A, B, C y D a 606 varones y mujeres se encontró coeficientes de validez entre 0.90 y 0,96.
En ambas estimaciones de la validez, directa e indirecta, se encuentra gran congruencia. En ambos estudios los índices más elevados son obtenidos por las escalas A y F, y los más bajos por las escalas M, N, O y Q1.
NORMAS INTERPRETATIVAS
CONVERSIÓN DE PUNTUACIONES DIRECTAS EN DECATIPOS
El significado de las puntuaciones directas de una forma o combinación de formas del 16 PF depende, naturalmente, de la forma o formas utilizadas.
90
Consecuentemente, antes de que las puntuaciones directas puedan ser evaluadas e interpretadas, deben convertirse a una escala común y única que sitúe la puntuación del sujeto (adolescentes, universitario o de la población general adulta) en relación con las obtenidas por un grupo normativo y definido de la población. Las tablas construidas en la tipificación permiten la conversión de las puntuaciones directas en otras denominadas decatipos, una escala típica de diez puntos que ha mostrado en la práctica un grado bastante bueno, en la discriminación de los resultados.
Los decatipos se distribuyen sobre una escala de diez puntos equidistantes en unidades típicas (supuesta la distribución normal), con una media en el decatipo 5,50 y una desviación de 2 decatipos. Así, pues, los decatipos 5 y 6 se extienden, respectivamente, a media desviación típica a ambos lados de la media, y comprenden el grupo central de la población, mientras que los extremos superior del decatipo 10 e inferior del decatipo 1 se encuentran a dos y media desviaciones típicas a ambos lados de la media.
Se puede, por tanto, considerar que los decatipos 5 y 6 son valores medios, 4 y 7 muestran una pequeña desviación (en una y otra dirección, respectivamente), 2-3 y 8-9 indican una gran desviación, y 1 y 10 son valores extremos, entendiendo todas estas posiciones como relativas a la población especifica sobre la cual se realizó la tipificación.
La selección del baremo adecuado permite obtener los decatipos correspondientes a las puntuaciones directas alcanzadas por cualquier sujeto en las 16 escalas. Las tablas cubren, para cada una de las formas del cuestionario, las poblaciones adolescentes y adultos de uno y otro sexo. Para su elaboración, se han conjugado los criterios de significación estadística y de utilización práctica. El Psicólogo debe
91
elegir aquel baremo que mejor se ajuste a los sujetos examinados y a la finalidad de su estudio.
INTERPRETACIÓN
Cada uno de los factores primarios evaluados por el 16 PF tiene una denominación alfabética (desde A a Q ) y un 4 nombre técnico. La definición e interpretación de los mismos, tal como se presenta en los párrafos siguientes, es breve, no técnica y, naturalmente, menos exacta que la descripción critica y más profunda que presenta el "Handbook" u otras obras similares; si el Psicólogo desea profundizar mas en el significado y operatividad de los factores debería examinar los numerosos perfiles estudiados en el "Handbook" para grupos clínicos o profesionales bien definidos.
En las siguientes descripciones interpretativas de las puntuaciones bajas (decatipos 1-3) y altas (decatipos 8-10) el nombre técnico se incluye entre paréntesis; previamente se da una breve definición menos técnica, con varios adjetivos descriptivos que suelen utilizarse frecuentemente en la práctica.
FACTOR A
PUNTUACIONES BAJAS (1-3)
Reservada, alejada, crítica, fría. (Sizotimia)
La persona que puntúa bajo tiende a ser dura, fría, escéptica y a mantenerse alejada. Le gustan más las cosas que las personas, trabajar en solitario y evitar las opiniones comprometidas. Suele ser precisa y rígida en su manera de hacer las cosas y en sus criterios personales, rasgos que son deseables en muchas ocupaciones. En ocasiones puede ser crítica, obstaculizadora e inflexible.
92
PUNTUACIONES ALTAS (8-10)
Abierta, afectuosa, reposada, participativa. (Afectotimia)
La persona que puntúa alto tiende a ser afable, reposada, emocionalmente expresiva (de aquí el polo de afectotimia), dispuesta a cooperar, solícita con los demás, bondadosa, amable y adaptable. Le gustan las ocupaciones que exijan contactos con la gente y las situaciones de relación social. Fácilmente forma parte de grupos activos, es generosa en sus relaciones personales, poco temerosa de las críticas y bastante capaz de recordar los nombres de las personas.
FACTOR B
PUNTUACIONES BAJAS (1-3)
Inteligencia baja, pensamiento concreto. (Poca capacidad mental para los estudios)
La persona que puntúa bajo tiende a ser lenta para aprender y captar las cosas; corta e inclinada a interpretaciones concretas y literales. Su cortedad puede ser debida a una escasa capacidad intelectual o a la influencia de factores psicopatológicos que limitan su actuación.
PUNTUACIONES ALTAS (8-10)
Inteligencia alta, pensamiento abstracto, brillante. (Mucha capacidad mental para los estudios).
93
La persona que puntúa alto tiende a ser rápida en su comprensión y aprendizaje de las ideas. Existe alguna relación con el nivel cultural y con la viveza mental. En una situación de diagnóstico psicopatológico, estas puntuaciones altas contraindican la existencia de un deterioro mental.
FACTOR C
PUNTUACIONES BAJAS (1-3)
Afectada por los sentimientos, poco estable emocionalmente, turbable. (Poca fuerza del ego)
La persona que puntúa bajo tiende a presentar poca tolerancia a la frustración; cuando las condiciones no son satisfactorias es voluble, plástica, evade las necesidades y llamadas de la realidad, neuróticamente fatigada, displicente, de emoción y turbación fácil, activa cuando se encuentra insatisfecha; presenta síntomas neuróticos (fobias, alteraciones del sueño, quejas psicosomáticas, etc). Estas puntuaciones bajas son comunes a casi todas las formas de alteraciones neuróticas y a algunas psicóticas.
PUNTUACIONES ALTAS (8-10)
Emocionalmente estable, tranquila, madura, afronta la realidad. (Mucha fuerza del ego)
La persona que puntúa alto tiende a ser emocionalmente madura, estable, realista acerca de la vida, tranquila, con buena firmeza interior y capacidad para mantener una sólida moral de grupo. A veces puede presentar ajustes conformistas en el caso de problemas no resueltos.
94
FACTOR E
PUNTUACIONES BAJAS (1-3)
Sumisa, débil, acomodaticia, conformista. (Sumisión)
La persona que puntúa bajo tiende a ceder ante los demás, a ser dócil, y a conformarse. Es, a menudo, dependiente, acepta las ideas de los otros, y se muestra ansiosa por una exactitud obsesiva. Esta pasividad es parte de muchos síndromes neuróticos.
PUNTUACIONES ALTAS (8-10)
Dominante, independiente, agresiva, competitiva, obstinada. (Dominancia)
La persona que puntúa alto es dogmática, segura de sí misma, de mentalidad independiente. Tiende a ser austera, autoreguladora, hostil y extrapunitiva, autoritaria (en el manejo de los demás), y a hacer caso omiso de toda autoridad.
FACTOR F
PUNTUACIONES BAJAS (1-3)
Sobria, prudente, seria, taciturna. (Desurgencia)
La persona que puntúa bajo tiende a ser reprimida, reticente, introspectiva. A veces es terca, pesimista, indebidamente cauta; es considerada por los demás como
95
presumida y estiradamente correcta. Suele ser una persona sobria y digna de confianza.
PUNTUACIONES ALTAS (8-10)
Descuidada (confiada a la buena ventura), animada e impulsiva, entusiasta. (Surgencia)
La persona que puntúa alto tiende a ser jovial, activa, charlatana, franca, expresiva, acalorada y descuidada. Frecuentemente se le escoge como líder electo. Puede ser impulsiva y de actividad imprevisible o cambiante.
FACTOR G
PUNTUACIONES BAJAS (1-3) Despreocupada, evita las normas, acepta pocas obligaciones. (Poca fuerza del superego)
La persona que puntúa bajo suele ser inestable en sus propósitos. Sus acciones son casuales y faltas de atención a los compromisos del grupo y las exigencias culturales. Su alejamiento de la influencia del grupo puede llevarle a actos antisociales, lo cual le hace ser más efectiva, a la vez que su negativa de sujeción a las normas le permite tener menos conflictos somáticos en situaciones de tensión.
PUNTUACIONES ALTAS (8-10)
Escrupulosa (consciente), perseverante, sensata, sujeta a normas. (Mucha fuerza del superego)
La persona que puntúa alto tiende a ser de carácter exigente, dominada por el
96
sentido del deber, perseverante, responsable, organizada, y 'no malgasta un minuto'. Normalmente es escrupulosa y moralista. Más que a tipos graciosos prefiere como compañeros a personas trabajadoras. Hay que distinguir el íntimo 'imperativo categórico' de este superego esencial (en el sentido sicoanalítico), del 'yo social ideal' del Q3 aparentemente similar. FACTOR H
PUNTUACIONES BAJAS (1-3) Cohibida, reprimida, tímida, falta de confianza en sí misma. (Trectia)
La persona que puntúa bajo suele ser tímida, alejada, cautelosa, retraída, que permanece al margen de la actividad social. Puede presentar sentimientos de inferioridad. Tiende a ser lenta y torpe al hablar y expresarse, no le gustan las ocupaciones con contactos personales. Más que un grupo amplio, prefiere uno o dos amigos íntimos, y no es dada a mantenerse en contacto con todo lo que está ocurriendo a su alrededor.
PUNTUACIONES ALTAS (8-10) Emprendedora, socialmente atrevida, espontánea, no inhibida (Parmia)
La persona que puntúa alto tiende a ser sociable, atrevida, dispuesta a intentar nuevas cosas, espontánea, de numerosas respuestas emocionales. Su indiferencia (falta de vergüenza) le permite soportar sin fatiga el 'toma y daca' del trato con la gente y las situaciones emocionales abrumadoras. Sin embargo, puede despreocuparse por los detalles, e invertir mucho tiempo charlando. Tiende a ser emprendedora y estar activamente interesada por el otro sexo.
97
FACTOR I
PUNTUACIONES BAJAS (1-3)
Sensibilidad dura, confiada en sí misma, realista (Harria)
La persona que puntúa bajo tiende a ser práctica, realista, varonil, independiente, responsable y, a la vez, escéptica de las elaboraciones culturales subjetivas. A veces es inamovible, dura, cínica, pagada de sí misma. Tiende a mantener el grupo trabajando sobre unas bases prácticas, realistas y acertadas.
PUNTUACIONES ALTAS (8-10)
Sensibilidad blanda, dependiente, impresionable, superprotegida. (Premsia)
La persona que puntúa alto suele dejarse afectar por los sentimientos, idealista, soñadora, artista, descontentadiza femenina. A veces solicita para sí la atención y ayuda de los otros; es impaciente, dependiente, poco práctica. Le disgustan las personas y profesiones rudas. Suele frenar la acción del grupo y turbar su moral con actividades inútiles e idealistas.
FACTOR L
PUNTUACIONES BAJAS (1-3)
Confiable, adaptable, no afectada por los celos o envidia, de trato fácil. (Alaxia)
98
La persona que puntúa bajo suele no presentar tendencia a los celos o envidia; es adaptable, animosa, no competitiva, interesada por los demás, buena colaboradora del grupo.
PUNTUACIONES ALTAS (8-10) Suspicaz, engreída, difícil de engañar. (Protensión)
La persona que puntúa alto suele ser desconfiada y ambigua. A menudo se encuentra complicada con su propio yo, le gusta opinar sobre sí misma, y está interesada en la vida mental íntima. Suele actuar con premeditación, es despegada de los otros y colabora deficientemente con el grupo.
NOTA: Este Factor no es necesariamente 'Paranoia'; de hecho, los datos de los esquizofrénicos paranoicos no son tan claros como cabría esperar a partir de los valores típicos del Factor L.
FACTOR M
PUNTUACIONES BAJAS (1-3)
Práctica, cuidadosa, convencional, regulada por realidades externas, formal y correcta. (Praxernia)
La persona que puntúa bajo suele mostrarse ansiosa por hacer las cosas correctamente, atenta a los problemas prácticos y sujeta a los dictados de lo que es evidentemente posible. Se preocupa por los detalles, capaz de serenidad en situaciones de emergencia, aunque a veces es poco imaginativa.
99
PUNTUACIONES ALTAS (8-10)
lmaginativa, centrada en sus necesidades íntimas, abstraída, despreocupada de los asuntos prácticos.
(Autia) La persona que puntúa alto tiende a ser poco convencional, despreocupada de lo cotidiano, bohemia, motivada por si misma, creadora, imaginativa, preocupada por lo 'esencial' y despreocupada de las personas particulares y la realidad física. Sus intereses, dirigidos hacia su intimidad, la llevan a veces a situaciones irreales, con explosiones expresivas. Su individualidad le empuja a verse excluido de las actividades del grupo.
FACTOR N
PUNTUACIONES BAJAS (1-3)
Franca, natural, sencilla, sentimental. (Sencillez)
La persona que puntúa bajo suele ser sencilla, sentimental, llana, poco sofisticada. Se le satisface fácilmente y se muestra contenta con lo que le acontece; es natural, espontánea, poco refinada y torpe.
PUNTUACIONES ALTAS (8-10) Astuta, calculadora, mundana, perspicaz. (Astucia) La persona que puntúa alto suele ser refinada, experimentada, mundana y astuta. A menudo es 'cabeza dura' y analítica. Su enfoque es intelectual y poco sentimental, aproximándose a las situaciones de una manera casi cínica.
100
FACTOR O
PUNTUACIONES BAJAS (1-3)
Apacible, segura de sí, flexible, serena. (Adecuación imperturbable)
La persona que puntúa bajo tiende a ser plácida, de ánimo invariable. Su confianza en sí misma y su capacidad para tratar con cosas es madura y poco ansiosa; es flexible y segura, pero puede mostrarse insensible cuando el grupo no va de acuerdo con ella, lo cual puede provocar antipatías y recelos.
PUNTUACIONES ALTAS (8-10)
Aprensiva, preocupada, depresiva, turbable. (Tendencia a la culpabilidad)
La persona que puntúa alto suele ser depresiva, preocupada, llena de presagios e ideas largamente gestadas. Ante las dificultades presenta tendencia infantil a la ansiedad. En los grupos no se siente aceptada ni con libertad para actuar. Una puntuación alta es muy corriente en los grupos clínicos de todo tipo.
FACTOR Q1 PUNTUACIONES BAJAS (1-3)
Conservadora, respetuosa de las ideas establecidas, tolerante de los defectos tradicionales.
101
(Conservadurismo)
La persona que puntúa bajo confía en lo que le han enseñado a creer y acepta lo 'conocido y verdadero', a pesar de sus inconsistencias, aunque se le presente algo que pudiera ser mejor. Es precavida y puntillosa con las nuevas ideas, tiende a posponer u oponerse a los cambios, a seguir la línea tradicional, a ser conservadora en religión y política, y a despreocuparse de las ideas analíticas e 'intelectuales'.
PUNTUACIONES ALTAS (8-10)
Analítico-critica, liberal, experimental, de ideas libres y pensamiento abierto. (Radicalismo)
La persona que puntúa alto suele interesarse por cuestiones intelectuales y dudar de los principios fundamentales. Es escéptica y de espíritu inquisitivo en las ideas, sean tradicionales o nuevas. Suele estar bien informada, poco inclinada a moralizar y más a preguntarse por la vida en general y a ser más tolerante con las molestias y el cambio.
FACTOR Q2 PUNTUACIONES BAJAS (1-3)
Dependiente, buena compañera y de fácil unión al grupo. (Adhesión al grupo)
La persona que puntúa bajo prefiere trabajar y tomar decisiones con los demás, le gusta y depende de la aprobación social. Tiende a seguir las directrices del grupo, incluso mostrando falta de decisiones personales. No es necesariamente gregaria
102
por decisión propia, sino que necesita del apoyo del grupo.
PUNTUACIONES ALTAS (8-10)
Autosuficiente, prefiere sus propias decisiones, llena de recursos. (Autosuficiencia)
La persona que puntúa alto es temperamentalmente independiente, acostumbrada a seguir su propio camino; toma sus decisiones y actúa por su cuenta. No tiene en consideración la opinión del grupo, aunque no es necesariamente dominante en sus relaciones con los demás. No le disgusta la gente, simplemente no necesita de su asentimiento y apoyo.
FACTOR Q3 PUNTUACIONES BAJAS (1-3)
Autoconflictiva,
despreocupada
de
protocolos,
orientada
por
sus
propias
necesidades. (Baja integración)
La persona que puntúa bajo no está preocupada por aceptar y ceñirse a las exigencias sociales. No es excesivamente considerada, cuidadosa o esmerada. Puede sentirse desajustada, y muchas de sus desadaptaciones (especialmente las afectivas, pero no las paranoicas) puntúan en esta dirección de la variable.
PUNTUACIONES ALTAS (8-10)
Controlada, socialmente adaptada, llevada por su propia imagen. (Mucho control de su autoimagen)
103
La persona que puntúa alto suele tener mucho control de sus emociones y conducta en general, y ser cuidadosa y abierta a lo social; evidencia lo que comúnmente se llama 'respeto hacia sí misma'; tiene en cuenta la reputación social. No obstante, a veces tiende a ser obstinada. Los líderes eficaces y algunos paranoicos puntúan alto en Q3.
FACTOR Q4 PUNTUACIONES BAJAS (1-3) Relajada, tranquila, aletargada, no frustrada.
(Poca tensión érgica) La persona que puntúa bajo suele ser sosegada, relajada, tranquila y satisfecha (no frustrada). En algunas situaciones, su estado de mucha satisfacción le puede llevar a la pereza y al bajo rendimiento, en el sentido de que no tiene motivación para intentar algo (como un alto nivel de tensión érgica puede desbaratar también el rendimiento escolar o Profesional).
PUNTUACIONES ALTAS (8-10)
Tensa, frustrada, presionada, sobreexcitada. (Mucha tensión érgica)
La persona que puntúa alto suele ser tensa, excitable, intranquila, irritable e impaciente. Está a menudo fatigada pero incapaz de permanecer inactiva. Dentro del grupo tiene una pobre visión del grado de cohesión, del orden y del mando. Su frustración representa un exceso del impulso de estimulación no descargada.
104
INVENTARIO MULTIFASICO DE LA PERSONALIDAD DE MINNESOTA (MMPI).
DESCRIPCIÓN GENERAL
FICHA TÉCNICA
Nombre:
Inventario Multifásico de la Personalidad de Minnesota.
Autores:
S. R. Hathaway y J. C. Mc Kinley.
Administración:
Individual y Colectiva.
Duración:
Variable, de 45 a 60 minutos.
Aplicación:
Sujetos cuyas edades oscilen entre 14 y 64 años, con una
cultura equivalente a seis años de escolaridad y saber leer con fluidez; los sujetos no deben presentar alteraciones severas en su contacto con la realidad y limitaciones en su dotaci6n intelectual.
Significación:
Evalúa
las
características
de
personalidad,
de
manera
multifásica puesto que intenta abarcar diversos aspectos de la persona mediante el uso de 14 escalas; 4 de validez y 10 Clínicas.
ANTECEDENTES
Este inventario fue construido originalmente por el Psicólogo Starke Hathaway y el Psiquiatra J.C. Mckinley; los primeros estudios sobre el tema aparecieron hacia 1.940. Posteriormente, en 1.943, la Universidad de Minnesota publicó el cuestionario y, en 1.945, autorizó su publicación a la Corporación de Psicología. Los autores de la prueba pretendían que el MMPI fuera útil para la evaluación
105
diagnóstica de rutina. A finales de la década de 1.930 y principios de 1.940, un objetivo primordial para el Psicólogo Clínico y el Psiquiatra era asignar clasificaciones Psico-diagnósticas apropiadas a casos individuales.
Desde su primera publicación en 1.943, ha sido uno de los instrumentos de Psicoevaluación más objetivo y útil tanto en la investigación como en la práctica clínica ya que su uso se facilita por la alta calidad interpretativa de sistemas actuariales que ayudan en el proceso Clínico de elaboración de decisiones.
Por otra parte para su elaboración Hathaway y Mckinley, tuvieron en cuenta la educación y cultura de los sujetos a quienes se les administró, para que las frases fueran comprendidas aún por personas de bajo nivel intelectual.
En su elaboración los autores utilizaron un enfoque de codificación empírica en la construcción de las diversas escalas del MMPI. Inicialmente se procedió a reunir una gran cantidad de reactivos potenciales para el inventario, seleccionando una amplia variedad de enunciados afirmativos de tipos de personalidad extraídos de fuentes tales como: historias de casos e informes Psicológicos y Psiquiátricos; luego se seleccionaron grupos criterio apropiados y se procedió a elaborar las escalas administrando los 504 reactivos originales a "Grupos Normales" y a "Grupos Clínicos", realizando un análisis de estos reactivos; poco tiempo después se elaboraron 2 escalas clínicas adicionales, primero la escala de MasculinidadFeminidad (MF) y la escala de introversión social (IS) desarrollada por Drake en 1.946.
ESTRUCTURA DEL INVENTARIO
El Inventario Multifásico de la Personalidad de Minnesota (MMPI) incluye 566 enunciados afirmativos de autoreferencia. La tarea de la persona que resuelve la
106
prueba consiste en dar respuesta a cada afirmación como verdadera si se aplica a sí misma y como falsa si se considera que no es aplicable a sí misma.
El contenido de los ítems de este instrumento es muy variado. Estos dan información sobre conductas exteriores, sentimientos que puedan observarse y actitudes generales de tipo social; además algunos ítems intentan detectar "síntomas morbosos", mientras que otros parecen no poseer ningún sentido favorable o desfavorable.
DESCRIPCIÓN DE LAS ESCALAS
Como ya se ha visto el MMPI está formado por 14 escalas de validez: frases omitidas (?), sinceridad (L), puntuación de validez (F) y factor corrector (K); 10 escalas clínicas: escala 1 (Hipocondriasis), escala 2 (Depresión), escala 3 (Histeria), escala 4 (Desviación Psicopática), escala 5 (Masculinidad-Feminidad), escala 6 (Paranoia), escala 7 (Psicastenia), escala 8 (esquizofrenia), escala 9 (hipomanía), escala 0 Si (introversión o extroversión social).
ESCALAS DE VALIDACIÓN
ESCALA DE FRASES OMITIDAS (?) Comprende todos aquellos elementos clasificados por el sujeto como NO SE o "No puedo decir"; el valor de esta puntuación afecta el significado de las demás puntuaciones.
ESCALA DE SINCERIDAD (L) Se construyó con el fin de detectar un intento deliberado por parte del sujeto para presentarse a sí mismo de una manera favorable evaluando el grado de franqueza del sujeto.
107
PUNTUACIÓN DE VALIDEZ (F) Se desarrolló para detectar formas desviadas de responder a los reactivos de la prueba; puntuaciones altas indican el descontrol de las emociones, como también indican síntomas del Neurótico y Psiquiátrico.
FACTOR CORRECTOR (K) Se elaboró como un índice de los intentos del examinado por negar su patología y presentarse a sí mismo de una manera favorable o para aparecer de manera muy desfavorable. Está integrada por 30 frases, es una escala de corrección para las Escalas Clínicas: 1 (Hs), 4 (Dp), 7(Pf), 8 (Es) y 9 (Ma) y se relaciona con la actitud defensiva ante la debilidad Psicológica o exhibicionismo Psicológico.
ESCALAS CLÍNICAS
Se encuentran subdivididas en tres zonas así:
l. - ZONA PSICONEUROTICA
Comprende las siguientes Escalas:
ESCALA 1 HS (Hipocondriasis o Somatización) Se desarrolló para identificar pacientes que manifestaran un patrón de síntomas asociados con la clasificación de hipocondría y/o Somatización localizada (se caracteriza por una preocupación anormal por las propias funciones corporales y temores concomitantes a la enfermedad), Esta escala consta de 33 reactivos asociados con preocupaciones Somáticas o con el funcionamiento físico en general.
ESCALA 2 D (Depresión).
108
Se elaboró con el propósito de evaluar el grado en que un sujeto puede presentar depresión sintomática caracterizada por pesimismo, falta de esperanza en el futuro e insatisfacción general con la propia situación de vida. Esta escala consta de 60 reactivos que tratan diversos aspectos de la depresión (negación de la felicidad y el mérito personal, retardo psicomotor, ausencia de interés en lo que les rodea.
ESCALA 3 Hi (Histeria). Se desarrolló para identificar individuos que utilizaban reacciones histéricas ante las situaciones de tensión, además de determinar Somatización no Localizada sin determinación de una causa real. Consta de 60 reactivos de dos tipos generales; algunos tienen que ver con una negación general de la Salud Física y una variedad de quejas sintomáticas algo más especificas.
ZONA SOCIAL
Comprende las siguientes escalas:
ESCALA 4 Dp (Desviación Psicótica) Se elaboró con el fin de identificar personas asociales, antisociales, sociales y disociales. Esta escala consta de 50 reactivos que cubren un amplio rango de temas incluyendo falta de satisfacción en la vida, problemas sexuales y dificultad con la autoridad.
ESCALA 5 MF (Masculinidad- Feminidad) Se desarrolló para definir los intereses que son propios de hombres y mujeres; además de identificar la homosexualidad. Consta de 60 reactivos relacionados con material sexual y diversidad de temas.
ZONA PSIQUIATRICA
109
Comprende las siguientes escalas:
ESCALA 6 PA (Paranoia) Se elaboró a fin de identificar pensamientos o ideas paranoides (sentimientos de persecución, ideas de grandeza, suspicacia, opiniones, actitudes rígidas, etc). Consta de 40 a 60 reactivos relacionados con conductas Psicóticas.
ESCALA 7 Pt (Psicastenia) Se desarrolló con el propósito de encontrar características de la personalidad clasificada como Psicastenia (reacciones fóbicas - obsesivo compulsivas y excesivas dudas); sin embargo en la actualidad no es de uso común. Esta escala consta de 48 reactivos que cubren una variedad de síntomas y conductas relacionadas con pensamientos obsesivos, sentimientos de temor y/o ansiedad y dudas sobre la propia capacidad.
ESCALA 8 Es (Esquizofrenia) Se elaboro para identificar individuos asociados con la esquizofrenia, aislamiento emocional, las relaciones inadecuadas con las familias, apatía e indiferencia. Esta escala consta de 78 reactivos que cubren un amplio grupo de conductas; siendo la más amplia de todas las escalas clínicas.
ESCALA 9 Ma (Manía - Hipomanía) Se desarrolló básicamente para identificar estados de ánimo de las personas con características maníaco depresivas, tipo maníaco.
ESCALA O Si (Introversión - Extroversión Social) Aunque esta escala se desarrolló después de las otras Escalas Clínicas, ha sido tratada como estándar. Se diseñó para evaluar la tendencia de los sujetos a aislarse de los contactos y responsabilidades sociales; además de identificar aspectos relacionados con la extroversión social. Consta de 70 reactivos de dos
110
tipos generales: un grupo se refiere a la participación social, en tanto que el otro a una inadaptación neurótica general y autodesprecio.
MATERIAL DE LA PRUEBA
FORMA INDIVIDUAL
- Hoja de anotación y perfil. - 12 Plantillas de corrección.
FORMA COLECTIVA
- Cuadernillo con 566 reactivos. - Hoja de respuestas y Perfil. - Clave de corrección. - 15 plantillas de corrección (incluyendo escalas adicionales).
ESCALAS ADICIONALES
Comprende las siguientes Escalas:
FUERZA DEL YO (Es) La desarrolló Barron (1.953), específicamente para predecir la respuesta de pacientes neuróticos a la Psicoterapia individual. Consta de 68 reactivos que hacen referencia al funcionamiento físico, aislamiento, actitudes hacia la religión, posición moral, adecuación personal y habilidad para enfrentar fobias y ansiedades.
DEPENDENCIA (Dy) La desarrolló Navran (1.954), para evaluar la intensidad de las necesidades de dependencia. Consta de 57 reactivos.
111
DOMINANCIA (Do) La desarrollaron Gough, McClosky y Meehl (1.951); esta variable de la personalidad puede ser importante en la psicología de la participación social. Consta de 28 reactivos que permiten detectar la iniciativa social, capacidad para el mando, persistencia, acciones esforzadas, preocupación e identificación con la comunidad o sociedad y sentimiento de la responsabilidad.
RESPONSABILIDAD (Re) La desarrollaron los mismos autores de la Escala de Dominancia en 1.952. Consta de 32 reactivos los cuales se refieren a la preocupación por temas sociales y morales, desaprobación de privilegios, énfasis en los deberes y la autodisciplina, seguridad personal, etc. (Gough, 1.952).
CONTROL (Cn) La desarrolló Cuadra, (1.953) para estudiar el problema de la necesidad de hospitalización. Consta de 50 reactivos que incluyen la conciencia de las propias debilidades, sensibilidad a las críticas sociales, ciencias religiosas y participación en actividades riesgosas.
FUNDAMENTO ESTADÍSTICO
CONFIABILIDAD
En los cuestionarios de personalidad, la estimación de este estadístico depende en gran medida de que el grupo comprenda sólo sujetos normales, incluya sólo enfermos Psiquiátricos hospitalizados, o esté formado por personas de ambos grupos. Es muy probable que los rasgos de personalidad sean más estables en los sujetos normales que en los enfermos Psiquiátricos; por esto teniendo en cuenta
112
las dificultades aludidas para una prueba como el MMPI, los datos que se citan a continuaci6n parecen bastante satisfactorios.
Hathaway y Mc Kinley (1.942) y Mc Kinley y Hathaway (1.942, 1.944), han aplicado la forma individual a un grupo de 47 sujetos normales no seleccionados, presentan coeficientes de fiabilidad en seis de las variables básicas; utilizando el procedimiento de test-retest con un tiempo de intervalo entre tres días y más de un año.
Cottle (1.950) obtiene coeficientes de confiabilidad test-retest aplicando la forma individual y la forma colectiva en un grupo de 30 enfermos Psiquiátricos no seleccionados; Holaberg y Alessi (1.949), citan coeficientes de confiabilidad obtenidos mediante la aplicación de la forma individual completa y una versión reducida de la misma.
VALIDEZ
El criterio de validez se obtuvo principalmente en la predicción de casos clínicos; el valor del pronóstico del MMPI se halló comparando sus resultados con el diagnóstico final elaborado por Profesionales Neuropsiquiátricos de los Centros Clínicos. De esta manera, se ha observado que una puntuación alta en una escala predice positivamente el diagnóstico clínico final del profesional, y discrimina en más de un 60% las nuevas admisiones de enfermos psiquiátricos. Este porcentaje ha sido obtenido en la diferenciación entre varios tipos de casos clínicos.
INSTRUCCIONES PARA LA APLICACIÓN Y CORRECCIÓN
APLICACIÓN
113
Esta prueba puede administrarse con facilidad en forma individual o colectiva y dicha aplicación puede ser realizada por examinadores no profesionales (familiarizados con todo el material presentado en el Manual); aunque necesita de un clínico experimentado para su interpretación. Además la disponibilidad de diversas formas básicas asegura que puede administrarse a un amplio espectro de personas de la manera más conveniente para los sujetos y el examinador.
Las formas se encuentran disponibles para administraciones individuales, en grupo, para individuos ciegos u otros que no pueden leer y formas abreviadas que siempre conducen a una pérdida de información.
Las instrucciones que deben darse al sujeto son las indicadas en la primera página del cuadernillo forma colectiva.
Seisdedos y Cordero en el Manual publicado por TEA Ediciones, 1.986, afirman que el MMPI debe ser presentado como una tarea seria e importante, brindando al sujeto la seguridad de que las respuestas serán estudiadas en su propio beneficio. Si se consigue esta actitud, se favorecerá en gran medida la cooperación de los examinados; algunos pueden necesitar posteriores aclaraciones sobre el propósito perseguido y el uso que van a tener los resultados. Si es posible, deben darse respuestas sinceras, evitando eludir o desviar la responsabilidad.
CORRECCIÓN Y VALORACIÓN
Algunos autores afirman que en primer lugar, deben separarse las hojas de respuestas según el sexo de los examinados, y también borrar las respuestas que tengan señaladas las dos contestaciones (V y F), que se considerarán como respuestas NO SE.
114
Otros consideran que se realiza observando detalladamente la hoja de respuestas y anotando el número de respuestas omitidas; luego se procede a contar cuidadosamente el número de respuestas que caen dentro de las plantillas, anotando las puntuaciones en bruto de las diferentes escalas; en caso de no tener disponibles las plantillas se podrá utilizar la clave de corrección.
Posteriormente se anotan las puntuaciones en bruto de las diferentes escalas con el mayor cuidado convirtiendo esta puntuación en Puntajes T que vienen relacionados en la hoja del perfil arriba del nombre de la escala.
Por otra parte hay cinco escalas Clínicas que son modificadas por diversas proporciones del valor en bruto obtenido por la Escala K. De esta forma, la escala 1Hs, deberá ser incrementada en su puntaje en bruto, por el 0.5 (la mitad) del valor de la Escala K en bruto.
Al puntaje en bruto de la Escala 4 Dp, se le agrega el 0.4 de K.
Al puntaje en bruto de la Escala 7 Pt, se le agregará el puntaje completo de K.
Al puntaje en bruto de la Escala 8 Es, se le agregará el puntaje completo de K y al puntaje en bruto de la Escala 9 Ma, se le agregará el 0.2 de K.
Una vez modificados los puntajes de estas cinco escalas, se elabora el perfil, ubicando cada puntaje en bruto en el nivel de su conversión correspondiente en calificaciones T.
CODIFICACIÓN DEL PERFIL
115
Con respecto al MMPI se han utilizado dos sistemas de codificación: el sistema original de Hathaway (1.947) y un sistema más completo desarrollado por Welsh (1.948). En la actualidad existe una gran cantidad de material publicado en ambos sistemas. A continuación se describirán los pasos de cada uno de ellos:
- CODlGO DE WELSH
Paso 1. Escribir los dígitos que representan las escalas ordenadas según la cuantía de la puntuación T, de mayor a menor.
Paso 2. Introducir los símbolos que indiquen la cuantía de los valores T (90 o mayor, 80 -89, - 70 -79, - 60 - 69, -50 - 59,- 40 – 49, 30-39 # 29 o menor a la derecha de #) .
Paso 3. Se pueden codificar las escalas de validación y colocarlas separadamente a la derecha del código de las escalas clínicas.
- CODIGO DE HATHAWAY.
Paso 1. Se registra el número de la Escala que tiene la mayor puntuación T.
Paso 2. Se anotan a continuación de este número, y por orden descendente de las puntuaciones T, los números de las escalas que tengan valores superiores a 54.
Paso 3.
116
Insertar un apóstrofe (‘) después del último número de escala en la clave que tenga una puntuación T de 70 o más.
Paso 4. Se subrayan los números de las escalas cuyos valores T sean iguales o se diferencien en solo un punto.
Paso 5. Utilizar un guión (-) y luego registrar el número de la escala menor en el perfil si dicha escala tiene una puntuaci6n T menor que 46.
Paso 6. Siga la misma regla para subrayar esas puntuaciones bajas como se indicó en el paso 4 para puntuaciones altas.
Paso 7. A la derecha y separada de las escalas clínicas, registre los puntajes crudos para L, F y K en ese orden y separada por dos puntos (:). Si la puntuación directa de L es igual o mayor que 10, o si la F es igual o mayor que 16, se coloca un "X"; a fin de sugerir que el perfil puede ser inválido.
INTERPRETACIÓN
A continuación se presenta de manera breve algunos indicadores para la interpretaci6n del MMPI, a fin de ser una guía didáctica en dicha explicación. Es muy importante para la interpretación del MMPI tener un conocimiento previo de las características clínicas correspondientes a los nombres de las escalas; además es importante tener en cuenta las características cuantitativas del MMPI, que son las que permitirán la organización de las escalas en el perfil; se podrá observar, que se
117
utilizarán con frecuencia los términos elevada o baja, para designar la ubicación general de cada escala dentro del perfil.
Cuando se hable de una Escala elevada se hará referencia a que tiene un puntaje por arriba de la media estadística y, en comparación con las demás, tiende a sobresalir. Su puntaje es el más alto o uno de los más altos.
Se hablará de Escalas bajas, cuando el puntaje de la misma sea inferior a la media estadística o en comparación con los demás, sea uno de los más reducidos o el más reducido.
Otro aspecto importante al aplicar el MMPI es tener en cuenta la finalidad de la aplicaci6n y las situaciones que la rodean. Para poder interpretar los perfiles del MMPI en forma integral, se debe tomar en cuenta que en esta técnica concurren dos aspectos fundamentales: una parte cuantitativa y otra cualitativa.
La parte cuantitativa proporciona una información, tanto de la severidad con que un rasgo se acentúa en la personalidad (por la elevación de cada escala), como de la comparación de las características de un sujeto con otros de su mismo grupo o de otros grupos sociales.
El aspecto cualitativo del inventario debe ser entendido en base a los elementos clínicos que proporcionan cada una de las escalas y de las combinaciones en que se encuentran relacionadas; en este punto se debe tener en cuenta que todas las escalas del perfil tienen relación entre sí, además de la configuración que se puede observar con la clave.
118
PRUEBAS PROYECTIVAS EL TEST DE RORSCHACH Se ha discutido desde hace algún tiempo la utilización de las pruebas proyectivas, ya que no cumplen con los requisitos psicométricos (confiabilidad, validez y normas), por eso algunos autores opinan que no se les debe dar el titulo de pruebas, sino utilizar uno menos comprometedor como el de técnicas o métodos proyectivos de evaluación. Levy en 1963 propuso llamarlas «técnicas de provocación de respuestas», ya que dependen de la habilidad del clínico para hacer interpretaciones, otros más estrictos, sugieren que se deben retirar del arsenal de pruebas psicológicas. Se abordan los argumentos a favor y en contra de las pruebas proyectivas y su valor de uso como instrumentos propios del quehacer psicológico. Veamos aquí el test de Rorschach El test de Rorschach es una técnica y método proyectivo de psicodiagnóstico, creado por el psicoanalista suizo Hermann Rorschach (1884-1922). Se publicó por vez primera en 1921 y alcanzó una amplia difusión. El test consiste en una serie de láminas en las que encontramos manchas aleatorias de tinta. El psicoterapeuta pide al sujeto que dé sentido a esas manchas. A partir de estas interpretaciones el psicoterapeuta intenta ver lo que sucede en la mente del paciente. El test de Rorschach es quizás el más conocido de los test, debe su nombre al psiquiatra suizo Hermann Rorschach (1884-1922). Básicamente es un test proyectivo aunque a partir de él se ha estudiado su cuantificación. Por lo que se lo considera una de las pruebas más completas. Pero su mayor logro es la amplia difusión que posee, ya que a partir de ella existe una
119
amplia cantidad de investigaciones y casuística. El material actual disponible es inmenso. El test de Rorschach consta de 10 láminas compuestas por manchas de tinta (negras y policromáticas) sobre un fondo blanco. Estas láminas poseen una morfología vaga por lo que resultan especialmente sugerentes. Las láminas son presentadas de manera sucesiva a un paciente preguntándole lo que ve en ellas y como y donde manifiesta lo observado. Esta basado en lo que las personas perciben, ya que visualizan en las manchas diferentes aspectos. El análisis del test está basado en lo percibido. Para mencionar solo algunos pocos ejemplos que ilustran sobre las características del test, cabe mencionar que interesa (entre otras cosas) la localización de lo observado, su forma, si presenta movimientos (que tipos de movimientos) si se perciben diferentes aspectos, si se perciben utilizando toda la lámina o parte de ella (en que detalles de una lámina se visualizan los elementos), si lo observado tiene dimensión, profundidad, color, reflejo, sombra, brillo, si se observan objetos inanimados, humanos, animales, paisajes, el tipo de respuestas, etc. Sería interminable describir la infinidad de respuestas posibles. Varios caminos han tenido un desarrollo independiente. Los de mayor desarrollo y difusión fueron los de Klopfer y Rapaport, también alcanzaron un importante desarrollo las lecturas de Beck, Hertz y Piotrowsky entre otros. El nombre de John Exner merece una mención particular, integró las cinco principales corrientes en un único Sistema Comprensivo, y es en la actualidad la corriente de mayor desarrollo, difusión, utilización y expansión en el mundo. A diferencia de los anteriores posee un enfoque menos complicado en sus lecturas y desarrollos diagnósticos. Se presenta a si mismo como un medio y no un fin, por lo que se promociona como un test para ser utilizado en diferentes ámbitos y por diferentes lecturas teóricas. Proporciona más de cincuenta rasgos de la Personalidad estudiada, superando a cualquier otra prueba. Del sujeto estudiado, nos habla entre otros rasgos de:
120
•
Inteligencia: Capacidad. Estilo. Fantasía. Complejidad. Ajuste. Distorsión.
•
Afectos: Interés. Formas de mostrarlos. Control. Influencia de las emociones en la
resolución
de
problemas.
Constricción
de
las
muestras
afectivas.
Oposicionismo. •
Vivencialidad: Recursos psicológicos disponibles. Modos de afrontamiento: Reflexivo. Impulsivo. Ambigual. Activo o pasivo.
•
Autopercepción:
Autoestima:
Egocentrismo,
narcisismo,
dependencia,
aislamiento. Preocupación corporal. •
Interrelaciones: Modelos de lo humano. Interés por los demás. Habilidad social. Interés por lo convencional. Visión de las relaciones sociales bien como de cooperación o bien como agresivas.
•
Estrés: Nivel. Presiones que inciden en él
•
Tono de humor: Valoración de las interacciones con el entorno. Nivel de Depresión. Potencialidad suicida.
En la descripción de la Personalidad, no sólo se refiere a lo patológico, sino también a rasgos positivos en los que la terapia puede apoyarse o incluso potenciarlos. Con frecuencia descubre problemas que el propio sujeto ignoraba, haciéndole involucrarse más en la terapia. Libre del error de deseabilidad social, el Rorschach es insustituible cuando de la evaluación dependan consecuencias ajenas al mero diagnóstico: Custodia de hijos, puestos de trabajo, mejor trato por parte de la Justicia, etc. Es ideal para la Selección de Personal de alta cualificación, ya que, además de lo dicho, la rica información que proporciona señalará a los sujetos más idóneos para desempeñar tareas concretas.
121
Requiere mayor nivel de conocimientos que otras pruebas. No solo sobre el propio Rorschach sino también sobre Personalidad y Psicopatología, solo así se logra conseguir toda la amplitud de información que es capaz de proporcionar.
El Rorschach como test perceptivo El test de Rorschach no es propiamente un test proyectivo, sino que nació como un test perceptivo. Esto es, da cuenta de qué y cómo la persona ve el mundo; su capacidad para resistir el estrés, su tendencia a la introversión o extroversión, si sufre de algún tipo de problema emocional, la mucha o poca adecuación a la realidad social, etc. Métodos de interpretación Rorschach murió en 1922, a un año de presentar su test. Esto, sumado a su difusión un tanto tardía, llevo a que distintos psicólogos americanos y europeos
122
definieran sus propios métodos de interpretación del test. Los métodos de mayor renombre fueron los de Klopfer y Rapaport, junto a los de Beck, Hertz y Piotrowsky. Con el tiempo, la diversidad de métodos y la falta de un método común llevo al desprestigio del test por su falta de confiabilidad; esto es, cada psicólogo tenía su propio método y era casi imposible comparar resultados. A inicios de los 70, la Fundación Rorschach comenzó una serie de estudios para determinar cuales eran los métodos de tabulación e interpretación más utilizados, para después iniciar una serie de investigaciones sobre aquellos indicadores que proveían de información clínica relevante. El resultado de estos esfuerzos es el ahora conocido Método Comprehensivo de Exner, editado por primera vez el año 1974. El método comprehensivo de Exner El método comprehensivo de Exner es el resultado de las investigaciones iniciadas en los 70 por la Fundación Rorschach para generar un método único de codificación, tabulación e interpretación del Rorschach. Cada una de las variables que presenta el modelo cuenta con investigaciones empíricas que respaldan su validez. En estos momentos, es el estándar de facto para la aplicación e interpretación del Rorschach y, según la experiencia del autor, da resultados bastante válidos. Si bien las propiedades psicométricas del test de Rorschach son limitadas, el procedimiento se está fortaleciendo en tanto los sistemas de codificación se hacen más específicos y los investigadores dedican más atención a la comprobación empírica de sus conceptos. La validez de la interpretación puede mejorar con el uso frecuente de la técnica y con la mayor experiencia clínica. Para complementar información sobre este test, recomendamos ver las siguientes páginas:
123
www.rorschach.org http://www.serymp.org
124
PRUEBAS DE INTELIGENCIA En la medición de estas capacidades con test de inteligencia nos encontramos con un gran problema derivado del hecho de que la expresión de las mismas está muy influenciada por el momento en que se realizan. El cansancio, el estado de humor y otros múltiples factores pueden afectar significativamente su expresión de un día a otro o entre el comienzo y el final de un mismo día. El segundo gran problema es que cada medición concreta utiliza un test de inteligencia específico y particular y que los resultados pueden variar en gran medida en función de si el individuo ha realizado un test de inteligencia similar en el pasado o por la mayor o menor simpatía o afinidad cultural con el mismo, aunque si está bien diseñados este aspecto debería ser bastante reducido. Una conclusión sencilla sería el pensar que estas capacidades no son estables a lo largo de la vida y que se encuentran muy influenciadas por el medio ambiente. Sin embargo, algunos expertos opinan que existe una gran estabilidad de las capacidades a lo largo de la vida, especialmente a partir de los 6 años. Por su parte, el lenguaje, como expresión del inconsciente colectivo, claramente opina que la inteligencia es una cualidad fija puesto que utiliza el verbo ser y no el verbo estar en expresiones como "Esa persona es muy inteligente". Para ilustrar la relación entre el desarrollo de la comprensión de la inteligencia y la medición psicológica, ilustraremos la temática a partir de la prueba WISC-R
125
WISC - R, ESCALA DE INTELIGENCIA DE WECHSLER PARA NIÑOS REVISADA David Wechsler
CARACTERÍSTICAS
Versión revisada, modificada y actualizada del WISC. El WISC-R mantiene un gran número de elementos del WISC tradicional, sustituyendo o eliminando los que resultaban obsoletos y añadiendo otros, en ciertas pruebas, para aumentar su fiabilidad; se ha modificado el orden de aplicación a fin de que sea más ameno para el niño.
Algunas pruebas amplían sus instrucciones con nuevos ejemplos, evitando así posibles ambigüedades y garantizando que el niño comprenda la naturaleza de la tarea que ha de realizar.
Aplicación: Individual.
Tiempo: Aproximadamente 1 hora y 30 minutos. Edad: De 6 a 16 años.
Juego completo con 25 cuadernos de anotación y material manipulativo.
En la escala del WISC-R se incluyen las siguientes pruebas: Escala verbal:
Escala de ejecución:
Información.
Figuras Incompletas.
Semejanzas.
Ordenación de Dibujos.
Aritmética.
Diseños con Cubos.
126
Comprensión.
Composición de Objetos
Un buen ejemplo de su uso lo encontrará en el artículo anexo: Estructura factorial de la Escala de Inteligencia para Niños de Wechsler-Revisada (WISC-R). Un acercamiento desde el ámbito clínico (http://www.cop.es/delegaci/andocci/VOL.%2019_3_6.pdf) CONCLUSIÓN Lea y discuta con sus compañeros los aspectos más importantes del artículo anexo Importancia del Avance en la Investigación Psicométrica ubicado en la siguiente dirección electrónica: http://www.salvador.edu.ar/psic/ua1-9pub02-7-01.htm
127
REFERENCIAS USADAS Y BIBLIOGRAFÍA RECOMENDADA
Anastasi, A. (1968). Psychological testing. New York: MacMillan.
Anastasi, A. y Urbina, S. (1997). Psychological Testing (7ª ed.). Englewood Cliffs, NJ: Prentice-Hall.
Arnau, J. (1989). Metodología de la investigación y diseño. En J. Arnau y H. Carpintero (Eds.). Historia, teoría y método. Madrid: Alhambra Universidad.
Canpintero, H. (1996). Historia de las ideas psicológicas. Madrid: Pirámide.
Cronbach, L.J. y Meehl, P.E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52, 281-302.
Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart and Winston.
Hambleton, R.K. y van der Linden, W.J. (1982). Advances in IRT and applications: An introduction. Applied Psychological Measurement, 6(4), 373-378.
Lord, F.M. (1980). Applications of item response theory to practical testing problems. Hillsdale, New Jersey: Lawrence Erlbaum Associates.
Lord, F.M. y Novick, M.R (1968). Statistical theories of mental test scores. New York: Addison-Wesley.
Martínez-Arias, R (1995). Psicometría: Teoría de los tests psicológicos y educativos. Madrid: Síntesis.
128
Meliá, J.L. (1990). La construcción de la Psicometría coma ciencia teórica y aplicada. Valencia: Cristóbal Serrano.
Messick, S. (1989). Validity. En Linn, R.L. (Ed.). Educational measurement. New York: MacMillan.
Muñiz, J. (1991). Introducción a los métodos psicofísicos. Barcelona: PPU.
Muñiz, J. (1998). La teoría clásica de los tests. Madrid: Pirámide.
Nunnally, J. C. (1973). Introducción a la medición psicológica. Buenos Aires: Paidós.
Rust, J. y Golombok, S. (1989). Modern psychometrics: The science of psychological assessment. London: Routledge.
Thorndike, R. M. (1997). The early history of intellegence testing. En D. P. Flanagan, J. L. Genshaft y Harrison, P.L. (Eds.), Contemporary intelectual assessment, theories, tests and issues, (pp. 3-17). New York: The Guildford Press.
Van der Linden, W. J. (1986). The changing conception of measurement in education and psychology. Applied Psychological Measurement, 10, 325332. Yela, M. (1968). Apuntes de psicometría y estadística. Madrid: Universidad Complutense de Madrid.
129
documentación complementaria en castellano
ANEXO 1
puede consultarse en la sección de la Comisión de Tests incluida en la página web del COP
DIRECTRICES INTERNACIONALES PARA EL
(http://www.cop.es/tests/).
USO DE LOS TESTS Las directrices reflejan principios generales
International Test Commission (ITC)
implicados en el uso adecuado de los tests, pero no pretenden uniformar las diferencias legítimas
INTRODUCCIÓN
existentes entre la práctica en los diferentes Los tests constituyen una de las tecnologías
países o áreas profesionales. Existen bastantes
más utilizadas por los psicólogos en el ejercicio
razones
de la profesión. Como ocurre con la tecnología
directrices para el uso de los tests con carácter
de otras áreas científicas, los tests pueden
internacional. Veamos algunas de ellas.
utilizarse
correcta
o
incorrectamente.
por
las
que
se
necesitan
unas
Las
directrices que se proponen en este documento
a. Los países difieren ampliamente en el grado de control legal que pueden ejercer sobre el
tienen como objetivo fundamental mejorar el uso
uso de los tests y sus consecuencias para
que los profesionales hacen de los tests.
las personas evaluadas. Por tanto, la elaboradas
existencia de un conjunto de directrices
originalmente por la Comisión Internacional de
internacionalmente aceptadas proporcionará
Tests (ITC), bajo la dirección del profesor Dave
a las asociaciones nacionales de psicología
Bartram.
que
y otras organizaciones profesionales una
presentamos aquí ha sido realizada en el seno
buena base documental para completar
de la Comisión de Tests del Colegio Oficial de
directrices ya existentes o proceder a
Psicólogos (COP). El Colegio, a través de sus
crearlas.
Las
directrices
La
han
versión
sido
en
castellano
Comisión
b. El derecho a comprar y utilizar materiales
Internacional de Tests y en la Comisión Europea
psicométricos varía mucho de unos países a
sobre Tests de la Federación Europea de
otros. En algunos países el uso de los tests
Asociaciones
está restringido a los psicólogos, en otros a
representantes
en
la
citada
Profesionales
de
Psicólogos
(EFPPA), que también ha respaldado las
quienes
directrices, ha participado activamente en la
distribuidores de las pruebas, e incluso en
elaboración de las mismas, consciente de la
algunos los usuarios pueden obtener el
necesidad de contribuir a mejorar la práctica de
material
los tests en nuestro país.
restricciones. c.
Los
documentos
libremente,
los
sin
Algunos tests bien conocidos han aparecido
elaboración de las directrices, junto con otros en
editores, violando los derechos de copyright,
citados
en
psicométrico
por
en Internet sin la autorización de autores y
aparecen
utilizados
registrados
la
castellano,
más
estén
al
final;
130
y sin ninguna precaución en relación con la
DIRECTRICES
seguridad del test. d. En el ámbito de la psicología del trabajo, el
Objetivo
aumento de la movilidad internacional de los trabajadores ha incrementado la demanda de tests para utilizarlos con aspirantes de diferentes países. A menudo los tests son aplicados
en
un
país
para
empresas
ubicadas en otros países. e. En
países
como
El objetivo fundamental de las directrices es mejorar el uso de los tests, describiendo la forma adecuada de utilizarlos. Un usuario competente utilizará los tests de forma adecuada, profesional y ética, prestando
Estados
Unidos
e
Inglaterra, entre otros, se están llevando a cabo trabajos sobre evaluación a distancia vía Internet en las áreas de Trabajo y Educativa. Esto plantea todo un conjunto de problemas en relación con las normas de aplicación, control del proceso de evaluación y seguridad de los resultados.
la debida atención a las necesidades y derechos de las personas implicadas en el proceso de evaluación, y teniendo muy en cuenta las razones para utilizar los tests, así como el contexto en el cual se lleva a cabo su aplicación. Este objetivo se alcanzará asegurándose de que el usuario de los tests tiene las competencias y conocimientos necesarios para llevar a cabo el
Por todas estas razones, y otras que se podrían enumerar, parece conveniente disponer de unas
proceso evaluativo. Ámbito de aplicación
directrices internacionales que permita una referencia común a la hora de establecer
Resulta difícil dar una definición muy precisa de
normas nacionales para la mejora del uso de los
test o de su práctica, pues al hacerlo pueden
tests.
dejarse
fuera
algunos
procedimientos
que
debieran incluirse, o, por el contrario, incluir Las presentes directrices recogen el trabajo de especialistas
en
evaluación
psicológica
y
educativa (psicólogos, psicómetras, editores y constructores de tests) de diferentes países, entre ellos España. La idea no ha sido tanto el inventar unas nuevas directrices, como juntar las hebras comunes que se encuentran en las distintas directrices, códigos de práctica y estándares
ya
existentes,
formando
una
estructura coherente que resulte comprensible y de uso práctico.
otros que deberían quedar fuera. En estas directrices los términos test y práctica de los tests
se
directrices
utilizan son
en
sentido
aplicables
amplio. a
Las
muchos
procedimientos de evaluación que no suelen denominarse tests, o que incluso tratan de evitar su designación como tests. Más que proponer una
definición
cerrada,
se
describe
a
continuación el ámbito que tratan de cubrir las directrices.
131 •
•
•
•
Los tests incluyen un amplio abanico de
se autodenominen o no tests. Deben de tenerse
procedimientos utilizados en la evaluación
en cuenta para cualquier procedimiento de
psicológica, educativa y ocupacional.
evaluación utilizado en situaciones en las que la
Los tests incluyen procedimientos para la
evaluación tiene serias implicaciones para las
medición de conductas tanto normales como
personas, pudiendo causarles daños personales
anormales o disfuncionales.
o psicológicos si no se realiza adecuadamente.
Los tests son procedimientos diseñados
Las directrices no se aplican al uso de
para
condiciones
materiales que pueden tener una semejanza
controladas o estandarizadas, y conllevan la
superficial con los tests, pero que los propios
utilización de protocolos de puntuación
participantes reconocen que se utilizan con fines
rigurosos.
de diversión o entretenimiento (por ejemplo, los
Estos procedimientos proporcionan medidas
cuestionarios de estilos de vida de los periódicos
de ejecuciones y conllevan la obtención de
y revistas).
ser
aplicados
inferencias
a
partir
conducta.
También
procedimientos
bajo
de
que
muestras
pueden
de
incluir
proporcionan
clasificaciones cualitativas u ordenamientos de las personas. Cualquier procedimiento utilizado de la forma descrita arriba puede considerarse como un test, independientemente de su forma de aplicación, el tipo de profesional que lo haya construido, o si requiere contestar a ítems o ejecutar ciertas tareas u operaciones.
Destinatarios Las directrices se aplican al uso de los tests en la práctica profesional, por tanto van dirigidas fundamentalmente a: •
Los
compradores
y
vendedores
de
materiales psicométricos •
Los responsables de elegir los tests y el uso que se hará de ellos
•
Quienes aplican, puntúan e interpretan los tests
Los tests deben de estar apoyados por datos
•
Quienes aconsejan a otros basándose en
empíricos sobre su fiabilidad y validez para
los resultados de los tests (consultores en
medir los objetivos que se proponen. Hay que
ámbitos educativos y laborales, orientadores
aportar datos que justifiquen las inferencias que
escolares y profesionales, etc.)
se hacen a partir de las puntuaciones de los
•
Las
personas
encargadas
de
dar
tests. Estos datos tiene que estar disponibles
información sobre los resultados de los tests
para los usuarios de los tests, así como para los
a las personas evaluadas
profesionales e investigadores que deseen llevar
•
Los constructores de tests
a cabo una evaluación o revisión independiente.
•
Los editores de tests
•
Las
Las directrices que se presentan aquí son aplicables a todos los procedimientos descritos,
personas
implicadas
en
entrenamiento de los usuarios de los tests
el
132 • •
Los propios evaluados y las personas
•
Quienes
son
cercanas a ellos (padres, cónyuges, etc.)
resultados
Organizaciones
padres
profesionales
y
otras
los
(los
o
receptores
propios
responsables
de
los
evaluados,
los
legales,
los
asociaciones interesadas en el uso de los
constructores de los tests, los empleadores,
tests
etc.)
•
Legisladores y responsables políticos
•
Usuarios
de
los
tests
con
fines
•
Diferencias según el uso de los resultados de
de
los
tests
(por
ejemplo,
toma
de
decisiones frente a orientación)
investigación •
Grado en el que la situación permite la
Si bien las directrices no pretenden cubrir todo
posibilidad de comprobar la precisión de las
tipo de técnica o situación evaluativa, muchas
predicciones y su posible modificación a la
de las directrices pueden ser aplicables en
luz de los resultados posteriores
situaciones evaluativas que no se identifican estrictamente con la práctica de los tests, tales como
los
centros
de
evaluación
para
Conocimientos
la
entrevistas
Unos conocimientos psicológicos psicométricos
estructuradas y semiestructuradas, orientación
sólidos y una comprensión profunda de todos
escolar y profesional, etc.
los aspectos implicados en el proceso evaluativo
selección
de
personal,
las
constituyen la base fundamental para el uso pertinente de los tests. Los expertos suelen
Aspectos contextuales
estar de acuerdo en que la causa más Las
aplicables
importante del uso inapropiado de los tests es
internacionalmente, pero a la hora de utilizarlas
una formación deficiente de los usuarios. Los
a nivel local en un país determinado deben de
conocimientos concretos requeridos en cada
tenerse en cuenta diversos factores o aspectos
caso variarán en función de la situación y área
que pueden modular su aplicación. Entre otros,
de aplicación, por tanto no es fácil describir de
estos factores contextuales incluyen:
forma general los conocimientos requeridos para
•
directrices
son
la utilización adecuada de los tests en todas las Diferencias
sociales,
políticas,
institucionales, lingüísticas y culturales • • • •
situaciones, ejemplo,
depende
no
se
de
cada
requieren
caso.
los
Por
mismos
La legislación del país en el que se utilizan
conocimientos para aplicar un test colectivo a un
los tests
grupo que para interpretar las puntuaciones, o
Directrices
y
estándares
ya
existentes
construir el propio test, por citar un caso obvio.
establecidos por asociaciones profesionales
Las
Diferencias entre la evaluación individual y
detalladas
la colectiva
pretenden. No obstante, a la hora de aplicarlas a
Diferencias en función de la situación
una situación concreta habrá que tener muy
evaluativa (educativa, clínica, trabajo, otras)
presente
directrices de
y
no estos
describir
hacen
descripciones
conocimientos,
con
ni
precisión
lo
los
133
conocimientos requeridos para el caso. Esta
1.1.4. Asegurarse de que las personas para las
descripción ha de cubrir las distintas áreas de
que trabajan, o con quienes trabajan, se acogen
conocimientos implicadas en la situación de que
a estándares éticos y profesionales adecuados
se trate, entre ellas deberían de incluirse las
1.1.5. Actuar con el debido respeto para la
siguientes: a) Conocimientos sobre teoría de los
sensibilidad de las personas evaluadas y de
tests y propiedades técnicas de los tests, tales
otras personas o instituciones implicadas
como fiabilidad, validez, estandarización, sesgo,
1.1.6. Presentar la práctica de los tests de forma
análisis de ítems, etc. b) Conocimiento de los
positiva y equilibrada cuando interactúan con los
tests y principios de la medición para entender
medios de comunicación
adecuadamente
c).
1.1.7. Evitar las situaciones en las que pueda
Conocimientos sobre la teoría, modelos y
parecer que existen determinados intereses en
constructos medidos, que permita una elección
los resultados de la evaluación, o en las cuales
pertinente de las pruebas e interpretación de los
la evaluación pueda dañar su relación con los
resultados. d). Conocer el abanico de tests
clientes
disponibles,
los
así
resultados.
como
correspondientes.
e).
los
editores
Avances
técnicos
recientes, tales como los tests informatizados, bancos
de
ítems,
etc.
Otros
muchos
1.2. Asegurarse de que son competentes para el uso de los tests 1.2.1. Trabajar de acuerdo con los principios
conocimientos específicos han de ponerse en
científicos
funcionamiento para llevar a cabo una utilización
1.2.2.
adecuada de los tests, cada una de las
estándares personales de competencia
directrices puede servir como indicador de la
1.2.3.
naturaleza de éstos.
competencia y no actuar fuera de ellos
Establecer
Conocer
los
y
mantener
límites
de
elevados
la
propia
1.2.4. Mantenerse al día de los cambios y 1. Uso ético de los tests
avances en relación con el uso de los tests y de su construcción, incluyendo los cambios de
Los usuarios competentes deberían:
normas y legislación, los cuales pueden influir en los tests y su uso
1.1 Actuar de forma ética y profesional 1.1.1. Mantener y promover estándares éticos y
1.3. Responsabilizarse del uso que hacen de
profesionales
los tests
1.1.2.
Estar
al
corriente
de
los
debates
1.3.1. Ofrecer solo servicios y usar tests para los
profesionales y éticos sobre el uso de los tests
cuales están preparados
en su campo de especialización
1.3.2. Aceptar la responsabilidad por los tests
1.1.3. Llevar a cabo una política explícita sobre
elegidos
los tests y su uso (véase ejemplo en el Apéndice
proporcionadas
A)
1.3.3. Dar una información clara y adecuada a
y
por
las
recomendaciones
los participantes en el proceso evaluativo sobre
134
los principios éticos y las disposiciones legales
1.5.2. Explicar los niveles de confidencialidad
que regulan el uso de los tests
antes de dar los resultados
1.3.4. Asegurarse de que el contrato entre los
1.5.3. Limitar el acceso a los resultados
evaluados y los evaluadores es claro y se ha
únicamente a quienes tengan la necesidad y
comprendido (véase un ejemplo de contrato en
derecho a conocerlos
el Apéndice B)
1.5.4. Obtener las autorizaciones pertinentes
1.3.5. Estar atentos a cualquier consecuencia
antes de proporcionar los resultados a otros
imprevista del uso de los tests
1.5.5. Proteger los datos archivados de tal forma
1.3.6. Esforzarse para evitar cualquier tipo de
que sólo puedan acceder a ellos quienes tengan
daño o perjuicio a las personas evaluadas
derecho a hacerlo 1.5.6. Establecer una directrices claras en
1.4. Asegurarse de que los materiales del test están seguros 1.4.1.
Asegurar
relación con el tiempo que se van a mantener archivados los datos
un
almacenaje
seguro
y
1.5.7.
Suprimir
el
nombre
y
otros
datos
controlar el acceso a los materiales del test
identificatorios de los resultados si así lo solicita
1.4.2. Respetar el copyright y los acuerdos que
la persona evaluada
existan sobre el test, incluyendo cualquier
1.5.8.
prohibición sobre la copia y transmisión de los
identificativos de las bases de datos de los
materiales, bien sea electrónicamente o de otra
resultados,
forma. Asimismo se respetarán rigurosamente
elaboración de baremos, u otros tratamientos
los términos del acceso de otras personas,
estadísticos
Suprimir
el
con
nombre
fines
de
y
otros
datos
investigación,
cualificadas o no, a los materiales. 1.4.3. Proteger la integridad del test, no entrenando a las personas con los propios materiales del test, o con otros materiales de prácticas
que
puedan
influir
de
forma
inapropiada en el rendimiento de las personas
2. Utilización adecuada de los tests 2.1. Estimar la utilidad potencial de los tests en una situación evaluativa Los usuarios competentes deberían:
en el test 1.4.4. Asegurarse de que la tecnología del test
2.1.1. Ofrecer una justificación razonada para el
no se expone públicamente de tal modo que su
uso de los tests
utilidad quede deteriorada
2.1.2. Asegurarse de que se ha llevado a cabo un análisis riguroso de las necesidades del
1.5. Asegurarse de que los resultados de los tests se tratan confidencialmente
cliente, categoría diagnóstica, condiciones, o trabajo para el que se utilizará la evaluación
1.5.1. Especificar quienes tendrán acceso a los
2.1.3.
resultados
destrezas, aptitudes, u otras características, que
y
confidencialidad
definir
los
niveles
de
Comprobar
que
los
conocimientos,
miden los tests correlacionan con las conductas
135
pertinentes en el contexto en el que se van a
f.
Aspectos prácticos, tales como tiempo
llevar a cabo las inferencias
requerido,
2.1.4. Buscar otras fuentes fuentes adicionales
necesitan
coste,
o
recursos
que
se
de información 2.1.5. Sopesar las ventajas e inconvenientes de
2.2.3. Evitar el uso de tests que tengan una
utilizar
documentación técnica inadecuada o poco clara
tests
frente
a
otras
fuentes
de
información
2.2.4. Utilizar tests sólo para aquellos objetivos
2.1.6. Asegurarse de que se utilizan todas las
para los cuales se dispone de una validez
fuentes de información colateral disponibles
empírica adecuada y pertinente 2.2.5. No aceptar un test basándose únicamente
2.2. Elegir tests técnicamente correctos y
en su validez aparente, recomendaciones de
adecuados a cada situación
otros usuarios, o consejos de quienes tienen intereses comerciales
Los usuarios competentes deberían:
2.2.6. Responder a las preguntas de las
2.2.1. Examinar toda la información disponible sobre los tests potencialmente adecuados antes de elegir un test concreto 2.2.2. Comprobar que la documentación técnica
personas
implicadas
(personas
evaluadas,
padres, supervisores, representantes legales, etc.), dándoles suficiente información para que entiendan por qué se eligió el test
sobre el test proporciona suficiente información
2.3.
para evaluar los siguientes aspectos:
relacionados con el sesgo de los tests
a. Amplitud y representatividad del contenido
Cuando los tests se van a utilizar con personas
del
test,
adecuación
de
los
atención
a
los
aspectos
grupos
de diferentes grupos (por ejemplo: género,
normativos utilizados, nivel de dificultad de
cultura, educación, etnia, origen, o edad, entre
los contenidos, etc.
otros), los usuarios competentes de los tests
b. Precisión de la medición y fiabilidad para las poblaciones pertinentes c.
Prestar
harán
todos
los
esfuerzos
posibles
para
asegurarse de que:
Validez para las poblaciones pertinentes y su aplicabilidad para el uso que se hace del
2.3.1. Los tests son imparciales y adecuados
test
para todos los grupos evaluados
d. Ausencia de sesgo para los grupos con los que se utilizará
son relevantes para cada uno de los grupos
e. Aceptación por parte de quienes están implicados
en
2.3.2. Los constructos que se están midiendo
su
uso,
incluyendo
pertinencia y validez aparente percibidas
la
evaluados 2.3.3. Existen datos disponibles sobre las diferencias de rendimiento de los grupos en el test
136
2.3.4.
el
2.3.12. Se ha recabado consejo de los expertos
Funcionamiento Diferencial de los Ítems cuando
acerca de los efectos de la discapacidad sobre
ello es pertinente
el rendimiento en el test
2.3.5. Hay datos sobre la validez que apoyan el
2.3.13. Se han consultado las personas a
uso del test en diferentes grupos
evaluar y se ha dado un tratamiento adecuado a
2.3.6.
Hay
Se
datos
disponibles
minimizan
los
sobre
efectos
de
las
sus necesidades y deseos
diferencias grupales no relacionadas con el
2.3.14. Se han llevado a cabo los ajustes
objetivo de la medición
oportunos cuando se evalúa a personas con
2.3.7. Las directrices sobre la imparcialidad de
discapacidades auditivas, visuales, motoras,
los tests se interpretan dentro del marco de la
dislexia, u otras
legislación al respecto existente en cada país.
2.3.15. Se ha contemplado la posiblidad de utilizar
procedimientos
de
evaluación
Cuando se utilizan los tests en más de un idioma
alternativos en vez de modificaciones o ajustes
(idiomas distintos, dialectos, lenguaje de signos,
de los tests
etc.) los usuarios competentes harán todos los
2.3.16. Se ha solicitado consejo a expertos en el
esfuerzos posibles para asegurarse de que:
caso de que el grado de modificación requerido por el test esté más allá de la experiencia y
2.3.8. Las versiones de los distintos idiomas o dialectos hayan sido elaboradas utilizando una metodología rigurosa
aspectos
de
2.3.17.
Las
modificaciones,
cuando
sean
necesarias, se ajustan a la naturaleza de la
2.3.9. Los constructores hayan sido sensibles a los
conocimientos del usuario
contenido,
culturales
e
idiomáticos
discapacidad y se han diseñado para minimizar el impacto sobre la validez de las puntuaciones 2.3.18. La información relativa a cualquier ajuste
2.3.10. Quienes aplican los tests sean capaces de comunicarse perfectamente en el idioma en el que se aplica el test
o modificación hechos en el test o en su aplicación se comunica a quienes interpretan o utilizan las puntuaciones del test, para así
2.3.11. El dominio de la lengua (en la que se aplicará el test) de las personas evaluadas sea
facilitar una interpretación apropiada de las puntuaciones
comprobado sistemáticamente, utilizándose la versión más adecuada, o una bilingüe si fuese
2.4. Hacer los preparativos necesarios para la
necesario
aplicación del test
Cuando se utilizan los tests con personas que
El usuario competente hará todo lo posible para:
tienen
alguna
discapacidad,
los
usuarios
competentes harán todo lo que sea posible para
2.4.1. Proporcionar en el momento oportuno una
asegurarse de que:
información clara a las personas implicadas en la evaluación acerca de la finalidad del uso de
137
los tests, la mejor forma de prepararse para la
2.4.8. Prever posibles problemas y solventarlos
sesión de tests y los procedimientos a seguir
mediante
2.4.2. Aconsejar a los evaluados acerca de los
instrucciones
la
preparación
de
materiales
e
idiomas y dialectos para los que es apropiado el 2.5. Aplicar los tests adecuadamente
test 2.4.3. Proporcionar información a quienes van a hacer el test sobre el tipo de práctica permitida, así como la documentación donde pueden encontrar ejemplares y materiales oportunos
derechos y deberes (véase Apéndice B)
de
sus
responsables
o
representantes legales antes de aplicar los tests 2.4.6. explicar
Cuando a
los
las
tests
sean
personas
opcionales,
implicadas
las
consecuencias de hacerlos o no, para que puedan tomar una decisión con fundamento
para asegurarse de que: preparativos
coinciden
con
los
b. Los locales y otras facilidades para aplicar los tests se han reservado con antelación, el físico
es
accesible,
seguro,
tranquilo, libre de distracciones, y se ajusta a las necesidades c.
crear o reforzar ansiedad innecesaria 2.5.3.
Eliminar
Hay suficiente material disponible y se ha comprobado que no han quedado señales de usuarios previos en los cuadernillos o en las hojas de respuestas
d. Las personas implicadas en la aplicación de los tests son competentes e. Se han hecho los ajustes oportunos para aplicar los tests a las personas con alguna discapacidad (véase Apéndice C)
fuentes
potenciales
de
distracción, tales como alarmas de relojes de pulsera, teléfonos móviles, buscas, etc. 2.5.4. Asegurarse de que todas las personas
responder al test antes de comenzar éste 2.5.5.
establecidos en el manual del test
entorno
personas a las que se va a evaluar, evitando
disponen de los materiales necesarios para
2.4.7. Hacer los necesarios ajustes prácticos
a. Los
dirigiéndose a ellas de forma positiva 2.5.2. Tratar de reducir la ansiedad de las
2.4.5. Obtener el consentimiento explícito de los o
2.5.1. Establecer una buena relación con las personas evaluadas, dándoles la bienvenida y
2.4.4. Explicar claramente a los evaluados sus
evaluados
Los usuarios competentes deberían:
Supervisar
convenientemente
la
aplicación de los tests 2.5.6. Dar las instrucciones en la lengua dominante de las personas evaluadas siempre que sea posible, incluso cuando el test está diseñado para proporcionar datos sobre el conocimiento o dominio de una lengua distinta de la dominante 2.5.7. Ajustarse estrictamente a las instrucciones del manual del test, haciendo los ajustes pertinentes para las personas con alguna discapacidad 2.5.8.
Leer
las
instrucciones
pausada
y
claramente 2.5.9. Dar el tiempo adecuado para hacer los ejemplos
138
2.5.10.
Observar
y
anotar
las
posibles
2.6.4.
Elegir
los
tipos
de
escala
más
desviaciones de los procedimientos estándar del
convenientes de acuerdo con el uso que se vaya
test
a hacer de las puntuaciones del test
2.5.11. Registrar los tiempos de respuesta con
2.6.5.
precisión cuando se requiera
transformaciones de las escalas, así como la de
2.5.12. Asegurarse de que están todos los
cualquier tipo de análisis o tratamiento que se
materiales al final de cada sesión
haga con los datos
2.5.13. Realizar la aplicación de modo que
2.6.6.
permita
una
conclusiones erróneas debido a la utilización de
comprobación de la identidad de cada una de
baremos desfasados, o inadecuados para las
las personas evaluadas
personas evaluadas
2.5.14. Permitir a los ayudantes hacerse cargo
2.6.7. Calcular las puntuaciones compuestas
de la aplicación sólo si han sido entrenados
cuando proceda, utilizando las fórmulas y
adecuadamente
ecuaciones propuestas en el manual del test
2.5.15. Asegurarse de que durante la sesión
2.6.8. Inspeccionar los resultados para detectar
aplicación no se deja desatendidas o sujetas a
posibles
distracción a las personas evaluadas
puntuaciones
2.5.16. Proporcionar una asistencia adecuada a
2.6.9. Describir e identificar con precisión los
las personas evaluadas que muestran signos
resultados, normas, tipos de escalas, fórmulas,
excesivos de ansiedad o desazón
etc. utilizados
2.6. Puntuar y analizar los resultados de los
2.7.
tests con precisión
adecuadamente
Los usuarios competentes deberían:
Los usuarios competentes deberían:
2.6.1. Seguir al pie de la letra los procedimientos
2.7.1. Tener una buena comprensión profesional
estandarizados de puntuación
de las bases teóricas y conceptuales del test, de
2.6.2. Asegurarse de la precisión al asignar las
la documentación técnica y de las directrices
puntuaciones, especialmente en aquellos casos
para el uso e interpretación de las puntuaciones
en los que entra en juego el juicio de los
2.7.2. Tener una buena comprensión profesional
evaluadores. Para cerciorarse de la precisión
de las escalas utilizadas, de las normas y
puede volver a puntuarse una muestra de las
baremos, así como de las limitaciones de las
personas
puntuaciones
una
supervisión
evaluadas,
adecuada
comprobando
y
así
la
Comprobar
Asegurarse
errores
Interpretar
la
de
o
precisión
que
no
anomalías
los
de
se
en
las
sacan
las
resultados
coincidencia entre las puntuaciones
2.7.3. Tratar de minimizar cualquier sesgo que
2.6.3. Llevar a cabo las transformaciones de las
pueda existir hacia las personas evaluadas en la
puntuaciones directas a otros tipos de escalas
interpretación de las puntuaciones del test
pertinentes
139
2.7.4. Utilizar normas o grupos de comparación
disponga de datos sobre los efectos de dicha
apropiados cuando estén disponibles
experiencia sobre el rendimiento en la prueba
2.7.5. Interpretar los resultados a la luz de la información
disponible
sobre
la
persona
evaluada (edad, género, escolaridad, cultura, etc.),
teniendo
en
cuenta
las
limitaciones
técnicas del test, el contexto de la evaluación, y las necesidades de las personas o instituciones con intereses legítimos en el resultado del proceso evaluativo
de un test a rasgos o características de la persona que no han sido medidos por el test
medida de cada escala, así como otros factores que puedan alterar artificialmente los resultados a la hora de interpretar las puntuaciones muy
en
cuenta
los
medido en relación con las características de los grupos evaluados, tales como cultura, edad, clase social, género, etc. Utilizar
puntos
corte
en
la
se disponga de datos empíricos sobre su validez 2.7.10. Ser conscientes de los estereotipos sociales que pueden existir sobre las personas evaluadas (en relación con su cultura, edad, clase social, género, etc.), evitando interpretar los tests de forma que se perpetúen dichos estereotipos
individual o colectiva que se haya hecho procedimiento
estándar
en
la
aplicación de las pruebas 2.7.12.
2.8.2. Elaborar informes orales o escritos para los receptores de los resultados, siempre con el explícito
de
las
personas
evaluadas o de sus representantes legales 2.8.3. Asegurarse de que el nivel técnico de los contenidos de los informes es adecuado para su
2.8.4. Dejar muy claro en los informes que los resultados de los tests son confidenciales, y especificar
el
tiempo
que
se
mantendrán
archivados los resultados
representan una sola fuente de información que debe
analizarse
conjuntamente
con
otras
fuentes 2.8.6. Explicar el peso que debe de darse a las puntuaciones de los tests en relación con otras fuentes de información acerca de las personas evaluadas 2.8.7. Proporcionar la información sobre los resultados en un lenguaje comprensible para el
2.7.11. Tener en cuenta cualquier variación
al
pertinentes que pueden recibir los resultados de
2.8.5. Dejar claro que los datos de los tests de
interpretación de las puntuaciones sólo cuando
respecto
2.8.1. Identificar las personas o instituciones
comprensión por los receptores datos
disponibles sobre la validez del constructo
2.7.9.
Los usuarios competentes deberían:
consentimiento
2.7.7. Tener en cuenta la fiabilidad y el error de
Tener
y precisa
los tests
2.7.6. Evitar la generalización de los resultados
2.7.8.
2.8. Comunicar los resultados de forma clara
Tomar
en
consideración
receptor, de modo que se minimice la posibilidad de interpretaciones incorrectas 2.8.8. Utilizar una forma y estructura para el informe que encaje en el contexto de la
cualquier
experiencia previa que la persona evaluada haya tenido con el test, en el caso de que se
evaluación
140
2.8.9. Si procede, proporcionar información a
baremos,
quienes toman las decisiones acerca de como
proporcionando los datos pertinentes a los
pueden usar los resultados de los tests para
constructores, editores o investigadores
fiabilidad
y
validez
del
test,
mejorar sus decisiones 2.8.10. Explicar y fundamentar la utilización que se hace de los resultados en los tests para la clasificación de las personas en categorías con fines diagnósticos, u otros. 2.8.11. Incluir un resumen claro en los informes escritos,
y,
cuando
sea
pertinente,
recomendaciones concretas 2.8.12.
Dar
información
Apéndice A Directrices
para
el
establecimiento
de
políticas sobre el uso de los tests Las directrices que siguen se refieren a la
a
las
personas
evaluadas de forma constructiva y positiva
necesidad de las organizaciones de considerar su política sobre la práctica de los tests de forma
2.9. Revisión de la adecuación del test y de
sistemática, asegurándose de que todas las personas implicadas en la evaluación tienen
su uso
clara esta política. La necesidad de una política explícita sobre la práctica de los tests no atañe
Los usuarios competentes deberían:
sólo
a
las
grandes
organizaciones.
Las
2.9.1. Seguir y revisar periódicamente los
empresas de tamaño medio o pequeño, al igual
posibles cambios en la población de personas
que las grandes, deben de prestar atención a la
evaluadas, así como los criterios utilizados para
política sobre la práctica de los tests, de la
la validez
misma forma que lo hacen en relación con la
2.9.2.
Estar
atentos
a
posibles
impactos
salud
y
seguridad
laboral,
igualdad
de
negativos de los tests
oportunidades, discapacidades, u otras áreas
2.9.3. Ser conscientes de la necesidad de
relacionadas con una práctica adecuada en el
reanalizar la utilización de un test si se ha
tratamiento y atención al personal.
llevado a cabo algún cambio en su forma, Aunque las siguientes consideraciones pueden
contenidos, o forma de aplicación de
necesitar una adaptación para su utilización por
reconsiderar la validez del test si se ha
parte de usuarios individuales de los tests
cambiado la finalidad para la que se utilizaba
cuando actúan como profesionales, sigue siendo
2.9.5. Siempre que sea posible, validar los tests
importante que tengan muy clara su propia
para los usos para los que fueron elaborados y
política y que puedan comunicarla a otros.
2.9.4.
Tener
presente
la
necesidad
participar en los trabajos rigurosos de validación que se lleven a cabo 2.9.6. Ayudar en la medida de sus posibilidades a mantener al día la información sobre los
Los objetivos de una política sobre el uso de los tests serían:
141 •
Asegurar
que
se
alcanzan
las
metas
Cualquier política que se establezca sobre tests
personales y organizacionales
tiene
•
Evitar el posible uso inadecuado de los tests
actualizándola de acuerdo con los avances
•
Demostrar explícitamente el compromiso
producidos en los tests o en su utilización. Hay
con una práctica adecuada
que permitir el acceso e informar sobre la
Asegurar que el uso de los tests se ajusta a
política establecida a las partes implicadas en la
los fines establecidos
utilización de los tests. La responsabilidad de la
Asegurar que los tests se utilizan de forma
política de una organización debe recaer en un
no discriminativa
usuario cualificado, que tenga autoridad para
Asegurar que las evaluaciones se basan en
asegurar su implementación y cumplimiento.
• • •
que
ser
revisada
periódicamente,
información comprensiva y pertinente •
Asegurar que los tests son utilizados por personas cualificadas para ello
Directrices para desarrollar contratos entre
Una política sobre el uso de los tests deberá abordar los siguientes aspectos.
las partes implicadas en la evaluación Los contratos entre los usuarios de los tests y las personas evaluadas deben de estar de
•
Uso adecuado de los tests
•
Seguridad de los materiales y puntuaciones
•
Quién puede aplicar, puntuar e interpretar
acuerdo con los criterios de una práctica
los resultados •
Apéndice B
adecuada, la legislación correspondiente y la política establecida sobre el uso de los tests. Los puntos que siguen se ofrecen como un ejemplo
Cualificaciones de quienes van a usar los tests
del tipo de aspectos que un contrato de este tipo debe abarcar. Los detalles variarán en función
•
Entrenamiento de los usuarios
•
Preparación de las personas a evaluar
•
Acceso a los materiales y seguridad de los
del contexto de la evaluación (ocupacional, educativo, clínico, jurídico, etc.), y de las leyes y regulaciones locales y nacionales.
tests • • •
•
Acceso a los resultados y confidencialidad
Los contratos entre los usuarios, las personas
de las puntuaciones
evaluadas y otras partes implicadas aparecen
Información sobre los resultados a las
con
personas evaluadas
explícitamente, al menos en parte. Dejando
Responsabilidades hacia los evaluados,
claros
antes, durante y después de la sesión de
responsabilidades de cada una de las partes
tests
ayuda a evitar los malentendidos, los perjuicios y
Responsabilidades
individuales
de
los
frecuencia
los
implícitos,
objetivos,
el
no
formalizados
papel
la necesidad de acudir a los tribunales.
usuarios de los tests El usuario se compromete a:
y
las
142
1. Informar a las personas evaluadas de sus
10. Asegurarse de que las personas evaluadas
derechos en cuanto a cómo se utilizarán sus
saben que se les explicarán los resultados
puntuaciones de los tests, así como sus
después de hacer el test tan pronto como
derechos de acceso a ellas
sea posible y en términos que les resulten
2. Advertir con anterioridad suficiente sobre cualquier carga económica que conlleve el proceso
saben que sus resultados son confidenciales
responsable de los pagos y fechas en las
hasta el punto que permitan la ley y una
que deben de hacerse efectivos
práctica profesional adecuada
a
cortesía,
evaluación,
las
personas
imparcialidad
quién
es
11. Asegurarse de que las personas evaluadas
el
3. Tratar
de
comprensibles
evaluadas y
con
12. Informar a las personas evaluadas sobre
respeto,
quienes tendrán acceso a los resultados y
independientemente de su raza, género,
las
edad, discapacidad, etc.
proporcionarán
condiciones
bajo
las
cuales
se
4. Utilizar tests de calidad probada, adecuados
13. Asegurarse de que las personas evaluadas
a las personas evaluadas y a la situación de
conocen los procedimientos para elevar
evaluación
quejas o comunicar algún problema
5. Informar antes de la aplicación de los tests sobre la finalidad de la evaluación, el tipo de
El usuario comunicará a las personas evaluadas
test, a quién se enviarán los resultados y el
que se espera de ellas:
uso que hará de ellos 6. Avisar con antelación donde se aplicarán los tests, cuando se darán los resultados, y si pueden o no obtener una copia del test una vez hecho, de su hoja de respuestas, o de
personas
cualificadas
para
la
aplicación de los tests y la interpretación de los resultados 8. Asegurarse de que las personas a evaluar saben si el test es opcional o no, y, cuándo lo sea, asegurarse de que conocen las consecuencias de hacerlo o no hacerlo 9. Asegurarse de que las personas que van a hacer el test conocen las condiciones (si las hubiera) en las que podrían volver a hacer el test, ser calificados de nuevo, o anulárseles la prueba
las
personas
durante
el
proceso
de
evaluación 15. Preguntar antes del test si no están seguras acerca de por qué se aplica el test, cómo se
sus puntuaciones 7. Utilizar
14. Un trato cortés y respetuoso con el resto de
aplicará, qué tienen que hacer exactamente, y que se hará con los resultados 16. Informar sobre cualquier circunstancia que consideren
que
puede
invalidar
los
resultados del test, o que deseen que se tenga en cuenta 17. Seguir las instrucciones de la persona que aplica el test 18. Ser consciente de las consecuencias que se siguen de no hacer el test, si deciden no hacerlo, y estar preparado para aceptar dichas consecuencias
143
19. Si se requiere abonar alguna cantidad para
tiempo de aplicación, el uso de Braille, o
hacer la prueba, los pagos se harán en la
versiones auditivas de los tests en casete,
fecha acordada
deben
de
utilizarse
como
guía
para
las
modificaciones que se lleven a cabo. Aunque Apéndice C
una estricta estandarización de la versión
Aplicación de los tests a personas con alguna discapacidad
para
aplicarlo
personas
con
alguna
discapacidad hay que proceder con sumo cuidado y experiencia. Como siempre, si existe alguna legislación local o nacional específica debe respetarse, así como el derecho a la privacidad de la persona evaluada. Cuando se recoge la información sobre los tipos y niveles de
discapacidad
hay
que
limitarse
a
la
información relativa a la capacidad de cada persona para llevar a cabo las tareas requeridas por el test. Hay que poner especial cuidado cuando los tests se utilizan en el ámbito ocupacional,
bien
sea
para
selección,
promoción, u otros fines.
correctamente que sea generalizable a todas las personas con algún tipo de discapacidad. Queda a juicio del profesional si es mejor utilizar una forma alternativa de evaluación o modificar el test, o su forma de aplicación. En la práctica no suele ser posible baremar los tests modificados muestras
amplias
Dada la escasez de información sobre el rendimiento en los tests (modificados o no) de las personas con alguna discapacidad, suele ser más adecuado utilizar los resultados de forma más cualitativa. Puede tomarse como una indicación
de
la
característica
evaluada,
complementándola con información recogida por otros métodos. En el caso de aplicaciones individuales el evaluador
suele
poder
ajustar
los
procedimientos evaluativos a las capacidades de la persona evaluada. Sin embargo, en el caso
de
aplicaciones
colectivas
aparecen
problemas especiales, como ocurre por ejemplo
No hay una regla sencilla para aplicar un test
en
lo sea deben de llevarse a cabo estudios piloto con muestras pequeñas.
Cuando se modifica la forma de aplicación de un test
modificada tal vez no sea posible, siempre que
de
personas
con
discapacidades equivalentes, de modo que se pueda asegurar la comparabilidad del test con la versión estándar. No obstante, cuando haya datos al respecto, por ejemplo, en el caso de los efectos producidos por la modificación del
en selección de personal. En estos casos puede haber dificultades prácticas para modificar la forma de aplicación para determinadas personas dentro del marco de una aplicación colectiva. Además, los tratamientos diferenciados podrían ser vistos por algunos como discriminatorios. Por ejemplo, si se concede más tiempo para hacer el test, las personas discapacitadas podrían tener la sensación de que son tratadas de forma diferente, mientras que quienes no tienen ninguna discapacidad pueden pensar que el tiempo extra concedido proporciona a los otros una ventaja.
144
Consejos sobre necesidades especiales pueden
3. Cuando
una
discapacidad
ajena
al
obtenerse habitualmente de las organizaciones
constructo medido influye en el rendimiento
de discapacitados, así como de las propias
en el test, deben de llevarse a cabo los
personas con discapacidades a las que se van
ajustes convenientes en la prueba
aplicar los tests. Suele ser de gran ayuda dirigirse
directamente
a
las
personas
4. Los usuarios deben de consultar siempre el
y
manual del test y los editores para buscar
preguntarles si hay alguna circunstancia que
información sobre las modificaciones de las
consideran que debe de tenerse en cuenta. En
pruebas
muchos casos esta consulta va a permitir llevar
procedimientos alternativos
a cabo las modificaciones oportunas en el
y
sobre
posibles
formatos
y
5. Los usuarios de tests deben de consultar a
contexto de aplicación de la prueba, sin tener
las
organizaciones
que modificar el propio test.
discapacitados acerca de las implicaciones de
Las
siguientes
reglas
generales
una
correspondientes
discapacidad
concreta,
de
la
pueden
documentación sobre la discapacidad, y el
utilizarse como guía a la hora de decidir si se
tipo de modificaciones que podrían ser
modifica el proceso evaluativo y cómo hacerlo.
convenientes 6. Cualquier tipo de modificación que se haga
1. Si la discapacidad no afecta al rendimiento
en el test o en el proceso de aplicación debe
en el test, no es necesario hacer ajustes en
de
la prueba 2. Cuando
estar
rigurosamente
documentada,
exponiendo claramente las razones que la
discapacidad
influye
en
el
justifican la modificación
rendimiento en el test hay que distinguir si esta influencia es incidental o forma parte
DOCUMENTACIÓN
del constructo medido. Si es incidental hay que modificar el test, pero si forma parte del
Inglés:
constructo medido no. Por ejemplo, una •
American
Educational
problemas con un test de velocidad que
Association,
American
conlleve escribir. Si la capacidad para
Association,
escribir rápidamente formase parte del
Measurement
constructo medido, entonces no debería de
Standards for Educational and Psychological
cambiarse el test. Sin embargo, si la
Testing.
finalidad fuese, por ejemplo, medir la rapidez
Psychological Association.
persona con artritis en las manos tendrá
de percepción visual, habría que buscar una
•
&
Research Psychological
National in
Council
Education.
Washington
DC:
on
(1985).
American
Bartram, D. (1995). The Development of
forma de respuesta a la prueba más
Standards for the Use of Psychological
adecuada, pues la artritis estaría influyendo
Tests
negativamente en el constructo medido.
Competence Approach. The Psychologist,
in
Occupational
May, 219-223.
Settings:
The
145 •
Bartram, D. (1996). Test Qualifications and
Assessment of Test User Qualifications: A
Test Use in the UK: The Competence
Research-Based Measurement Procedure.
Approach.
American Psychologist, 50, 14-23.
European
Journal
of •
Psychological Assessment, 12, 62-71. •
•
Schafer, W. D. (1992). Responsibilities of
Canadian Psychological Association. (1987).
Users
Guidelines
Statement
for
Educational
and
of
Standardized Revised.
Tests:
RUST
Alexandria,
VA:
Psychological Testing. Ottawa: Canadian
American Association for Counseling and
Psychological Association.
Development.
Eyde, L. D., Moreland, K. L. & Robertson, G.
•
Van de Vijver, F. & Hambleton, R. (1996).
J. (1988). Test User Qualifications: A Data-
Translating tests: some practical guidelines.
based Approach to Promoting Good Test
European Psychologist , 1, 89-99.
Use. Report for the Test User Qualifications Working Group. Washington DC: American Psychological Association. •
Eyde, L. D., Robertson, G. J., Krug, S. E. et
Castellano: •
Deontológico. Madrid: Colegio Oficial de
al (1993). Responsible Test Use: Case Studies For Assessing Human Behaviour. Washington DC: American Psychological
Psicólogos. •
Fremer, J., Diamond, E. E. & Camara, W. J. (1989). Developing a Code of Fair Testing Practices
in
Education.
Hambleton, adapting
R.
(1994).
educational
and
•
Committee
on
Guidelines
for
psychological
Testing
• •
Psychological
(1993).
Revista
de
Historia
de
la
Muñiz,
J.
(1997).
Aspectos
éticos
y
A.
Cordero
(Ed.),
La
evaluación
psicológica en el año 2000. Madrid: TEA •
Moreland, K. L., Eyde, L. D., Robertson, G. J., Primoff, E. S. & Most, R. B. (1995).
Muñiz, J. y Hambleton, R. K. (1996). Directrices para la traducción y adaptación de los tests. Papeles del Psicólogo, 66, 63-
Tests.
Australian Psychological Society. •
R.
Franca Tarragó, O. (1996). Ética para
En
Clancy, D. (1997). Supplement to Guidelines of
Ballesteros,
Ediciones.
Kendall, I., Jenkinson, J., De Lemos, M. &
use
Tests:
deontológicos de la evaluación psicológica.
Practices.
on Testing Practices.
the
de
psicólogos. Bilbao: Desclée de Brouwer.
Education. Washington DC: Joint Committee
for
Comisión
Psicología, 14, 97-114.
(1988). Code of Fair Testing Practices in
•
Fernández
aplicación.
of Psychological Assessment, 10, 229-244. Joint
COP,
Evaluación psicológica en sus contextos de
American
tests: A progress report. European Journal •
del
http://www.cop.es/tests/
Psychologist, 44, 1062-1067. •
Colegio Oficial de Psicólogos (1999). Página web
Association. •
Colegio Oficial de Psicólogos (1987). Código
70. •
Rodríguez Sutil, C. (1996). La ética de la devolución en el psicodiagnóstico clínico. Papeles del Psicólogo, 66, 91-94.
146
COMISIÓN DE TESTS DEL COLEGIO OFICIAL DE PSICÓLOGOS o
José Muñiz (Coordinador). Universidad de Oviedo
o
Mª
Teresa
Anguera.
Universidad
de
Barcelona o
Rocío Fernández Ballesteros. Universidad Autónoma de Madrid
o
José
Ramón
Fernández
Hermida.
Universidad de Oviedo o
Manuel García Pérez. ALBOR-COHS
o
Miguel Martínez. EOS
o
Rosario
Martínez
Arias.
Universidad
Complutense de Madrid o
Eduardo Montes. COP
o
Gerardo Prieto. Universidad de Salamanca
o
Carlos
Rodríguez
Complutense de Madrid o
Nicolás Seisdedos. TEA
Sutil.
Universidad
View more...
Comments