Curso de Psicometria

August 31, 2017 | Author: Camilo Chaparro Blanco | Category: Validity (Statistics), Psychology & Cognitive Science, Psychometrics, Evaluation, Science

Share Embed Donate

Report this link

Short Description

Download Curso de Psicometria...

Description

CURSO VIRTUAL DE PSICOMETRIA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA FACULTAD DE CIENCIAS SOCIALES, HUMANAS Y EDUCATIVAS

2

ÍNDICE

I. Protocolo

4

Ficha Técnica

4

Introducción

5

Justificación

6

Intencionalidades formativas

7

Unidades didácticas

13

Contexto teórico

14

Metodología

15

Sistema de Evaluación

17

Recursos Tecnológicos

18

Glosario de Términos

21

II. Guía Didáctica

24

Presentación

24

Fases del Aprendizaje

24

Técnicas e Instrumentos para la Objetivación del Aprendizaje

25

Portafolio de Desempeño Personal y Grupal

26

Descripción de Actividades

27

III. Modulo

31

Unidad I

31

Historia de la Psicometría

31

Definición de Psicometría

39

La Teoría de los Test

50

Conceptos y Metodología Estadística de la Psicometría

55

Confiabilidad

55

Validez

58

Artículo Complementario: Técnicas Psicométricas: Cuestiones de Validez y Confiabilidad

61

3

Unidad II

84

Aproximación al Uso de Pruebas Estandarizadas

84

Evaluación de la Personalidad

84

Cuestionario de la personalidad 16PF

84

Inventario Multifasico de la Personalidad de Minnesota MMPI

104

Pruebas Proyectivas

118

El Test de Rorscharch

118

Pruebas de Inteligencia

124

WISC – R

125

Conclusión

125

Referencias Usadas y Bibliografía Recomendada

128

Anexo 1: Directrices Internacionales para el Uso de Test

130

4

I. PROTOCOLO

Ficha Técnica Nombre del curso:

Psicometría

Palabras clave: Institución:

Universidad Nacional Abierta y a Distancia -UNAD.

Ciudad:

Bogotá – Colombia

Autor del Protocolo Académico: Año:

Franklin Soler 2006.

Unidad Académica: Campo de formación:

Básica disciplinar

Área del conocimiento: Ciencias Humanas y Sociales Créditos académicos:

Dos (2)

Tipo de curso:

Fundamentación teórica. Estudiantes de diversos programas de pregrado y

Destinatarios:

cursos abiertos de la Universidad Nacional Abierta y a Distancia-UNAD-.

Competencia general de aprendizaje:

Los estudiantes evalúan las capacidades mentales haciendo uso de diversos métodos, técnicas y pruebas de evaluación.

Metodología de oferta: A distancia. Formato de circulación:

Documentos impresos, Web; CD-ROM.

Denominación de las

1. Historia y Conceptos Básicos de la Psicometría

unidades didácticas:

2. Aproximación al de Pruebas Estandarizadas

5

Introducción

Las intencionalidades formativas de este curso van dirigidas principalmente al desarrollo de competencias cognoscitivas y prácticas en el orden del analizar, explicar los fundamentos conceptuales y metodológicos sobre los que se construye la psicometría y los principales instrumentos de medición de eventos psicológicos.

Sus unidades didácticas abarcan los temas de la historia de la psicometría, sus presupuestos básicos teóricos y metodológicos y la comprensión y uso de algunos instrumentos que miden o evalúan diferentes características psicológicas de los individuos, entre ellos están la prueba Roscharch, el MMPI, el 16 PF y el WISC-R.

El área temática abordará el estudio de los principios de la medición y evaluación en la disciplina de la psicología y de los fenómenos psíquicos que son determinantes en el comportamiento humano, en tanto que la psicometría es un área de la psicología cuya finalidad intrínseca consiste en aportar soluciones al problema de la medida en cualquier proceso de investigación del comportamiento. Es además un campo metodológico que incluye teorías, métodos y usos de la medición psicológica en aspectos conceptuales e instrumentales.

La metodología enseñanza - aprendizaje de este curso se adelantará utilizando las estrategias de tipo interactivo desarrolladas por la UNAD, propias de la Educación a Distancia. Los procesos de evaluación requerirán del estudiante su disposición investigativa y participativa, se promoverá la discusión y la proposición.

Los documentos que el estudiante se encargará de leer para llevar a buen término el curso serán principalmente escritos que se encuentran en las revistas electrónicas científicas de psicología (medición y psicometría). La participación y el trabajo activo tanto del estudiante como del tutor permitirán que el curso cumpla las metas propuestas.

6

Al ser un curso diseñado para estudiantes de educación a distancia, hace énfasis en la autogestión formativa mediada sincrónica y asincrónica, proponiendo interacciones entre tutor y estudiante y de los estudiantes entre sí. Constituye dos créditos académicos equivalentes a 96 horas de estudio, distribuidas de la siguiente manera: Estudio independiente: 64 Acompañamiento y seguimiento tutorial: 32 El campo de formación corresponde al área básica disciplinar dentro de los créditos obligatorios del plan de estudios. El curso es conducente a la autogestión estudiantil de los conocimientos metodológicos y conceptuales teóricos necesarios para la comprensión y desarrollo de habilidades en medición de variables psicológicas. A través del curso se prepara al estudiante para reflexionar críticamente en torno a la utilidad de la medición y la evaluación de las habilidades y destrezas cognoscitivas además de los riesgos y desventajas que pueden generar. Justificación

La psicometría es una herramienta indispensable para las actividades relacionadas con la psicología principalmente en el campo de la evaluación y el diagnóstico, permitiendo niveles altos y objetivos de medición del comportamiento humano. Una de las dificultades que debe afrontar el psicólogo, en cualquiera de sus áreas de desempeño, es precisamente la evaluación, puesto que el hombre con su diversidad en todos los aspectos hace que la cuantificación del comportamiento sea compleja.

La formación en psicometría provee a los estudiantes la posibilidad de acercarse a la medición de eventos psicológicos; forma al estudiante en los paradigmas

7

particulares de resolución de problemas psicológicos, instalándolo en los procesos de comprensión y uso técnico de pruebas propias de esta ciencia. Algunas preguntas que guiarán este curso son las que siguen:

-

¿Cuál ha sido el curso histórico que ha permitido el desarrollo de pruebas o test de medición de eventos psicológicos?

-

¿Qué significan en la medición los conceptos de validez y confiabilidad?

-

¿Qué pruebas se utilizan con mayor frecuencia en psicología y que fenómenos psicológicos miden?

-

Para resolver estos y otros cuestionamientos, el presente curso académico abarcara dos elementos centrales de la psicometría: la historia, los elementos metodológicos y conceptuales para la construcción de test y la segunda parte estará dirigida a la comprensión y manejo de algunas pruebas de uso tradicional en diferentes áreas de la psicología.

Intencionalidades Formativas Propósitos de formación 1. Explicar los conceptos fundamentales sobre los que se construye la psicometría como estrategia cuantitativa de la psicología, valiéndose de las principales teorías y modelos psicológicos y estadísticos que la ha abordado. 2. Valorar los aportes teóricos de las diferentes escuelas psicológicas a la comprensión de la medición, partiendo de criterios científicos y experimentales. 3. Demostrar la existencia e importancia de los procesos psicológicos y su posibilidad de cuantificarlos. 4. Hacer una aproximación metodológica y conceptual sobre las capacidades cuantitativas y cualitativas de algunas pruebas que se han utilizado para medir diferentes características psicológicas, a través de ejercicios y aplicaciones y calificación de algunos instrumentos de alta tradición en la psicología científica.

8

5. Contribuir a la mejora de hábitos de indagación y pesquisa sistemática través del desarrollo de competencias de investigación formativa mediante el conocimiento de protocolos y pruebas psicométricas. 6. Generar en el estudiante una actitud critica, a través del fomento de la discusión y el trabajo colaborativo en redes de comunidad académica en psicometría, a partir de la selección y valoración de las diferentes pruebas que aporta la psicología y otras formas de abordaje de la medición del comportamiento. 7. Potenciar los procesos de autoaprendizaje del estudiante a través del desarrollo de estrategias de autogestión formativa, a partir de la interacción con medios y mediaciones incluidos escenarios virtuales, coherentes con la estructura epistemológica y metodológica de la medición en psicología. 8. Desarrollar capacidades de medición y evaluación psicológica, a través del entrenamiento en el uso de algunas pruebas y estrategias que permitan una aproximación del estudiante a los problemas de desarrollo y consolidación de la psicometría. Los propósitos expuestos se pueden globalizar en la siguiente síntesis: Contribuir al desarrollo del espíritu investigativo del estudiante en el área de Psicometría, a partir del análisis de los elementos centrales de los métodos y aproximaciones teóricas, mediante la organización y selección de actividades que perfilen el autoaprendizaje y la discusión con sus pares y el docente guía. Objetivos de aprendizaje -

Que el estudiante adquiera los conocimientos necesarios y suficientes que permitan la comprensión de los aportes de la psicometría al desarrollo y estudio del

comportamiento

(léase

personalidad,

actitud,

aptitud,

inteligencia,

competencia, etc.), mediante el estudio de las diferentes teorías y modelos psicológicos y que la explican.

9

-

Que el estudiante describa, relacione y comparare los aportes teóricos y metodológicos que han permitido el desarrollo de la medición en psicología, a través de ejercicios de aplicación de pruebas psicométricas.

-

Que el estudiante comprenda la importancia de la medición, mediante el estudio y

aplicación

a

situaciones

donde

se

requiera

la

cuantificación

del

comportamiento.

-

Que los estudiantes adquieran las destrezas necesarias para la formulación y resolución de problemas de investigación psicométrica.

-

Capacitar a los alumnos para comprender y analizar críticamente la bibliografía relacionada con cualquiera de los campos de la Psicometría.

-

Que los alumnos conozcan y sepan utilizar adecuadamente los principales esquemas procedimentales para la medición de variables psicológicas.

-

Dotar a los alumnos de herramientas para que generen sus propios criterios con la finalidad de que puedan realizar juicios críticos en relación con la calidad y adecuación de los diferentes instrumentos de medida que habrán de utilizar en el desempeño de su labor como profesionales.

-

Motivar positivamente a los alumnos hacia la Metodología de las Ciencias del Comportamiento en general y respecto a los problemas propios de la Psicometría en particular.

-

Promover actitudes favorables a la investigación científica y al método científico como una forma de enfrentarse a los problemas psicológicos.

10

Competencias Teniendo en cuenta las fases del aprendizaje (reconocimiento, profundización y transferencia), se desarrollarán entonces, competencias de tipo cognoscitivo, práctico y afectivo que permitirán la apropiación e interiorización del conocimiento. Las competencias que se presentan a continuación procuran vincular e integrar los diferentes elementos teóricos y metodológicos de los diferentes contenidos del presente curso y que el estudiante desarrollará a lo largo del aprendizaje mediático sobre el que está basada su didáctica:

-

Tener como meta de actuación la calidad del trabajo realizado (es decir, no sólo trabajar de modo eficaz sino también del mejor modo posible).

-

Interés por la investigación y creación de nuevos datos en Psicología, tanto como receptor o evaluador de las innovaciones, como usuario o como generador de las mismas.

-

Conocer y cumplir la normativa ética propia de la profesión y de la investigación psicológica y respetar los derechos de consultantes y usuarios de los servicios psicológicos.

-

Tener la capacidad de valorar los procedimientos utilizados para obtener datos psicológicos relevantes así como para valorar la pertinencia de los informes resultantes de la investigación y evaluación psicológicas.

-

Transferencia y uso flexible del conocimiento.

-

Habilidad para transferir el conocimiento académico a las diferentes situaciones reales.

11

-

Saber aplicar distintos métodos de medición, evaluación y diagnóstico en los ámbitos aplicados de la Psicología.

-

Conocer y respetar la diversidad psicológica, las creencias y valores de otros grupos humanos.

-

Tener interés y respeto por las aportaciones de otros campos a la Psicología y de ésta a ellos.

-

Manejo de informática e Internet como usuario.

-

Saber planificar y realizar una búsqueda bibliográfica o de referencias tanto en bases de datos informatizadas como en bibliotecas y hemerotecas.

-

Conocer y utilizar adecuadamente los conceptos científicos propios de la Psicología.

-

Saber comunicar resultados psicológicos de forma oral adecuando la presentación al destinatario/s de la misma.

-

Saber analizar, sintetizar y resumir la información procedente de textos científicos y profesionales relacionados con la psicología.

-

Identificar la conducta o el proceso psicológico objeto de estudio, así como las conductas o procesos vinculados y la estrategia para evaluarlos o medirlos.

Metas Al finalizar el curso el estudiante estará en capacidad de:

-

Reconocer los métodos y técnicas que se han usado en psicometría usando como estrategia el desarrollo de ejercicios aplicados.

12

-

Reconocer algunos hitos históricos del estudio de la medición psicológica a partir de la lectura de los textos asignados al curso.

-

Esbozar mediante mapas conceptuales, los componentes medulares de las diferentes herramientas estadísticas que cuantifican el comportamiento.

-

Analizar los conceptos y categorías fundamentales de las pruebas psicológicas, usando como estrategia la comunicación interactiva (Chat) con sus compañeros de curso y el tutor.

-

A través del trabajo grupal, aplicar los conceptos básicos de la medición psicológica para explicar y predecir el comportamiento en diferentes campos de la acción humana.

13

UNIDADES DIDÁCTICAS

UNIDAD

CAPITULO

DIDÁCTICA

TEMA Estudio de las diferencias individuales

HISTORIA DE LA La consolidación

MEDICIÓN HISTORIA Y CONCEPTOS BÁSICOS DE LA PSICOMETRIA

institucional de la psicometría Definición

Vertiente práctica de la psicometría LA PSICOMETRÍA

Fases: Construcción, Evaluación y Aplicación

Definiciones y objetivo de la psicometría El método de la psicometría EL MÉTODO DE LA

Los contenidos

PSICOMETRÍA

La teoría de los test. CONCEPTOS

Y

METODOLOGÍA ESTADÍSTICA DE LA

Estandarizadas

de Pruebas

Aproximación al uso

PSICOMETRÍA

Validez

Confiabilidad

16PF MMPI

Uso de pruebas e

TEST ROSCHACH

interpretación

WISC –R

14

Descripción de las unidades didácticas A partir de la concepción epistemológica para el autoaprendizaje de la psicometría se ha seleccionado las palabras claves: psicometría, medición personalidad, inteligencia, validez, confiabilidad, etc, como base para el diseño de las unidades didácticas indispensables en el presente curso. Unidad 1 Historia y Conceptos Básicos de la Psicometría La unidad introduce al estudiante en el desarrollo histórico de la psicometría, sus aproximaciones y autores más influyentes y el proceso científico por el cual la medición adquiere importancia y reconsolida principalmente con el uso de test y de herramientas estadísticas. Unidad 2 Aproximación al Uso de Pruebas Estandarizadas Presenta las características de cuatro pruebas de gran reconocimiento en la psicología y con el acompañamiento del tutor se espera que los estudiantes logren entrenarse en su uso e interpretación de resultados. Contexto Teórico La Psicometría es la ciencia de la medida de los aspectos "psicológicos" de una persona, tales como conocimiento, habilidades, capacidades, o personalidad. La medida de estos aspectos es difícil, y gran parte de la investigación y técnicas acumuladas en esta disciplina están diseñadas para definirlos de manera fiable antes de cuantificarlos. Los críticos argumentan que tales definiciones y cuantificaciones son imposibles y que las mediciones a menudo son tergiversadas.

15

Los primeros trabajos de psicometría se desarrollaron para medir la inteligencia. Posteriormente, la teoría psicométrica se ha aplicado a la medida de otros aspectos como la personalidad, las actitudes, las creencias, el rendimiento académico y en campos relacionados con la salud y la calidad de vida. Los contenidos de la psicometría se articulan, fundamentalmente, en dos grandes bloques: teoría de los test, que hace referencia a la construcción, validación y aplicación de los test, y escalamiento, que incluye los métodos para la elaboración de escalas psicofísicas y psicológicas. A su vez, la teoría de los test se divide en dos ramas: la teoría clásica de los tests y la más reciente teoría de respuesta a los ítems. Los conceptos clave de la teoría clásica de los tests son: confiabilidad (fiabilidad) y validez. "Confiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo que realmente se pretende medir. Ambas propiedades, confiabilidad y validez, admiten un tratamiento matemático (estadístico). La consistencia interna puede calcularse por correlación entre distintos tests. Los métodos más conocidos se denominan: método de las formas paralelas, método del test-retest y método de las dos mitades. La validez puede calcularse correlacionando las mediciones con las de una medida patrón aceptado como válida. Se distinguen los siguientes aspectos: validez de contenido, validez predictiva y validez de constructo. Metodología

Este curso se desarrollará de manera virtual, con el acompañamiento del tutor y el trabajo orientado a través del Protocolo, la Guía de Actividades y el Protocolo. Para

16

cada Unidad Didáctica se desarrollarán actividades tanto individuales como colaborativas que den cuenta de las competencias y metas a desarrollar. También se generarán espacios de discusión y participación a través de foros virtuales que serán señalados en la Guía de Actividades. Con esto no sólo se pretende un aprendizaje memorístico de los conceptos más relevantes y característicos de la Psicometría, sino que también se procurará la consolidación de un sentido crítico y proponente que facilite la aplicación de estos conceptos y sus métodos de abordaje a situaciones donde el actuar y el criterio del psicólogo sea determinante, elemento básico de las intencionalidades formativas del curso. Fase de reconocimiento hace referencia a la confrontación de los contenidos del curso con los conocimientos y experiencias previas, identificando nuevos conceptos a adquirir. Fase de profundización se refiere al conjunto de actividades orientadas a precisar las nociones, procedimientos y estado del arte en los campos de la medición psicológica. Fase de transferencia integra los aprendizajes mediante una recontextualización, resignificación y aplicación autónoma a situaciones problémicas de naturaleza teórica

o

práctica,

generando

competencias

para

el

futuro

desempeño

interdisciplinario y transdisciplinario en el campo profesional. El proceso general se complementa y refuerza con procesos de autoevaluación, coevaluación y heteroevaluación, articulados con sistemas de interactividad pedagógica para socialización de logros del estudio independiente, en pequeños grupos colaborativos y tutoría individual. El proceso final se refuerza con la retroalimentación sobre los logros sustentados en los procesos evaluativos a nivel formativo.

17

Sistema de Evaluación La evaluación se concibe como un proceso continuo orientado a verificar las competencias logradas en concordancia con los objetivos del curso académico de Psicometría. El proceso de evaluación se guiará por el modelo institucional y se ejecutará con base en los siguientes momentos: autoevaluación, coevaluación y heteroevaluación Autoevaluación: La realiza el estudiante al inicio y al final de cada fase de aprendizaje con el fin de identificar las debilidades o vacíos cognoscitivos, como sus logros o dominios en el abordaje de la medición psicológica. La autoevaluación se entiende como una oportunidad para hacer la revisión y reflexión autocrítica de los procesos, aprendizajes y productos que esta llevando a cabo el estudiante. Tiene por objeto que el estudiante juzgue objetiva y constructivamente sus propios esfuerzos, resultados y productos con base en las metas trazadas por él mismo. Con esta se espera identificar los progresos alcanzados por el estudiante y las necesidades, aspiraciones y metas para aprendizajes futuros. Coevaluación: Es un proceso de trabajo colaborativo de los estudiantes en el cual socializan el resultado de sus construcciones personales de conocimiento y reciben la realimentación de sus compañeros, sustentan sus puntos de vista, asimilan nuevos enfoques y ajustan sus planteamientos con el enriquecimiento conceptual logrado en el dialogo de saberes. Los momentos de coevaluación integran la orientación pedagógica de la guía de actividades y la autorregulación del aprendizaje por parte del estudiante. Heteroevaluación: Es una evaluación sumativa coordinada a nivel nacional en cuanto a fechas y contenidos, además de la revisión y realimentación por parte del tutor sobre las construcciones cognitivas registradas sistemáticamente en el portafolio de desempeño personal.

18

El tutor enfoca la heteroevaluación como un análisis de logros a partir del acompañamiento a los estudiantes en sus procesos de aprendizaje evidenciados en resultados participativos en listas de correo, foros, mural electrónico, laboratorios y demás eventos teóricos o prácticos con productos de conocimiento destinados a registro en el portafolio de desempeño personal. Más el resultado del examen final. La distribución porcentual de notas asignadas en los procesos evaluativos es la siguiente: Valores de notas por actividades Resultados o productos de las actividades de aprendizaje consignados en el PDP y PDG

Evaluación final nacional

según fases de aprendizaje. Fase de reconocimiento: 10% de la nota Fase de profundización:

Prueba objetiva

30% de la nota Fase de transferencia: 20% de la nota Total: 60% de la nota definitiva

Valor: 40% de la nota definitiva

Recursos Tecnológicos Las actividades están centradas en el estudiante como autogestor de los procesos de aprendizaje, por lo cual se establece una sinergia de medios y mediaciones. Los recursos que el estudiante aprovechará son los siguientes: •

El computador como herramienta informática para estudio con CD ROM, con informaciones visuales, auditivas y de texto escrito.

19

•

El computador como canal electrónico hacia links hipertextuales en ambientes virtuales de autoaprendizaje, útiles para gestión de conocimiento actualizado.

•

Sistemas y plataformas tecnológicas institucionales para videoconferencias y audioconferencias.

•

Protocolo académico, guía de actividades de aprendizaje, módulo, fuentes hipertextuales de consulta, para estudio temático y orientación pedagógica.

•

Programación de eventos de socialización y trabajo colaborativo y sesiones de asesoría.

•

Eventos de prácticas de laboratorio de carácter obligatorio en el curso.

•

Interacciones programadas en aula virtual.

Una presentación sistematizada de estos recursos interactivos se puede visualizar en la gráfica “Recursos”:

20

Fuentes Documentales Además de los recursos didácticos como material impreso y ayudas audiovisuales incluidas como parte de las unidades didácticas de este curso, se señala en cada una de ellas una serie de fuentes documentales hipertextuales que permiten profundizar con suficiencia y calidad las construcciones conceptuales definidas en los objetivos y metas de aprendizaje.

21

GLOSARIO DE TÉRMINOS Psicometría: Área de la psicología científica que se encarga de la medida de los aspectos "psicológicos" de una persona, tales como conocimiento, habilidades, capacidades, o personalidad. La medida de estos aspectos es difícil, y gran parte de la investigación y técnicas acumuladas en esta disciplina están diseñadas para definirlos de manera fiable antes de cuantificarlos. Los críticos argumentan que tales definiciones y cuantificaciones son imposibles y que las mediciones a menudo son tergiversadas. Inteligencia: Es la capacidad evolutiva por la cual el individuo es capaz de tomar decisiones

dependiendo

de

su

entorno,

y

mejorar

sus

condiciones

de

supervivencia, como individuo, como grupo o como especie. Esta definición se basa en que no vivimos para pensar, sino que pensamos para vivir. Evolutivamente hablando, los seres más simples reaccionan ante el medio por programación genética, miedos y afinidades instintivas. Un pequeño cambio en estos instintos supone muchas generaciones. Para que la adaptación al medio sea más rápida son los propios individuos los que han de reprogramar sus comportamientos, aprendiendo del medio y reaccionando en consecuencia, esto es, con inteligencia. Habilidad: Grado de competencia de un sujeto concreto frente a un objetivo determinado. Es decir, en el momento en el que se ha alcanzado el objetivo propuesto en la habilidad, se considera que ésta se ha logrado a pesar de que este objetivo se haya conseguido de una forma poco depurada y económica. Se considera a la habilidad como a una aptitud innata o desarrollada o varias de estas, y al grado de mejora que se consiga a estas mediante la práctica, se le denomina talento.

22

Personalidad: Conjunto dinámico de características emocionales, de pensamiento y de conducta que son únicas a cada persona. Hay diversas aproximaciones teóricas a la personalidad en psicología, cada una proponiendo una relación distinta entre la personalidad y otros constructos psicológicos, sobre cómo se desarrolla la personalidad o cómo ésta interactúa con los sucesos. Se puede definir como la suma total de las formas en que un individuo reacciona y se relaciona con los demás; son los rasgos mensurables que exhibe una persona. 16PF: “Sixteen Personality Factors" de Raymond Catell. El 16PF es una prueba estructurada comúnmente utilizada y favorecida, por diversos investigadores alrededor del mundo, como instrumento para la medida y comprensión de la personalidad. Es el resultado de más de cuarenta años de investigación empírica por el psicólogo Raymond B. Cattell, quien redujo 4504 rasgos de personalidad a 16 rasgos básicos, mediante análisis factorial. La prueba se basa en la medida independiente de varios factores psicológicos. Ha sido debidamente validada y revisada, y al presente existen varias formas (A, B, C, D & E) que facilitan la aplicabilidad de la prueba a los diferentes intereses específicos de investigación. MMPI: Inventario Multifasico de Personalidad de Minnesota (S.R. Hathaway y J.C. Mckiney, USA.) Cuestionario de Personalidad encaminado a la búsqueda de trastornos psicológicos, formado por 566 ítems a los que hay que responder V o F. Tiene tres grupos de escalas y mide 19 variables. Tiene en cuenta la validez interna de las respuestas del sujeto. WISC R: Escala de Inteligencia (Revisada) de David Wechsler para Niños. Test de Rorscharch: Test de personalidad Proyectivo (H. Rorscharch). Evalúa aspectos profundos de la personalidad. Contiene diez láminas con manchas de tinta inestructuradas susceptibles de diversas interpretaciones. Su aplicación requiere conocimientos psicológicos amplios y una amplia experiencia.

23

Test Psicológico: Una situación experimental estandarizada que sirve de estímulo a un comportamiento. Tal comportamiento se evalúa por una comparación estadística, respecto a otros individuos colocados en la misma situación, lo que permite clasificar al sujeto examinado, ya sea cuantitativamente, ya sea tipológicamente (Pierre Pichot, "Los test mentales", Editorial Paidós. Buenos Aires. 1960 Teoría

de

los

tests:

Los

contenidos

de

la

psicometría

se

articulan,

fundamentalmente, en dos grandes bloques: teoría de los test, que hace referencia a la construcción, validación y aplicación de los test, y escalamiento, que incluye los métodos para la elaboración de escalas psicofísicas y psicológicas. La teoría de los test se divide en dos ramas: la teoría clásica de los tests y la más reciente teoría de respuesta a los ítems. Los conceptos clave de la teoría clásica de los tests son: fiabilidad y validez. "Fiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo que realmente se pretende medir. Ambas propiedades, fiabilidad y validez, admiten un tratamiento matemático.

24

GUÍA DIDÁCTICA Presentación La guía de actividades del curso de Psicometría explicita la configuración de las situaciones didácticas, mediante la planificación de actividades que permitan el logro de metas de aprendizaje en las diversas fases del aprendizaje, con un sentido crítico del cambio entre situaciones de entrada y de salida. FASES DEL APRENDIZAJE Fase de Reconocimiento Corresponde a la interacción entre los conocimientos previos y las nuevas conceptualizaciones del curso. Las actividades se enmarcan en situaciones didácticas que para la fase de reconocimiento, por unidad, pueden corresponder a las siguientes posibilidades de situaciones didácticas: Actividad de inducción al curso, con acompañamiento tutorial en grupo. Medio para la interactividad: Videoconferencia Estudio independiente, individual o en pequeño grupo: identifica conceptos conocidos y conceptos nuevos que necesitan posterior profundización. Tutoría sincrónica o asincrónica en grupo de curso sobre cada unidad temática. Medio para la interactividad: lista de distribución en aula virtual o mural. Tutoría sincrónica o asincrónica individual: asesoría para aclarar dudas en el proceso de aprendizaje con el fin de seleccionar líneas apropiadas de identificación de conceptos para trabajar en su reconceptualización. Tutoría a pequeños grupos colaborativos para mejorar la estrategia de estudio.

25

Autoevaluación y coevaluación formativa. Elaboración de portafolio. Fase de Profundización Corresponde al desarrollo de actividades de aprendizaje que permiten analizar, reconceptualizar y resignificar los conceptos encontrados en la fase de reconocimiento. Fase de Transferencia Se orienta a aplicar el conocimiento a situaciones problémicas, toma de decisiones e interacciones con otros campos disciplinares. Según cada caso particular de las temáticas de las unidades, en estas fases pueden aparecer todas o sólo algunas de las situaciones didácticas referenciadas en la fase de reconocimiento TÉCNICAS E INSTRUMENTOS PARA LA OBJETIVACIÓN DEL APRENDIZAJE En situaciones didácticas grupales El estudiante y el tutor (cuando participa sincrónicamente en apoyo pedagógico de la actividad), cumplirán el encuentro en fechas especificadas en la programación académica semestral previamente comunicada y socializada en la agenda de aula virtual, y aplicarán como instrumento un formato que registre la actividad colectiva, en el marco de objetivos explícitos y de resultados participativamente calificados. La técnica de apoyo pedagógico puede consistir, a nivel nacional, en videoconferencia,

combinación

de

mural

digital

(previamente

diseñado

y

enriquecido participativamente) con foro virtual dentro de días específicamente asignados.

26

El instrumento incorporará en las conclusiones del encuentro, apreciaciones sobre: logros,

funcionalidad

de

la

técnica

grupal

desarrollada,

sugerencias

de

mejoramiento. En otros casos, se diligenciarán informes grupales a partir de guías de prácticas o laboratorios, formatos grupales sobre solución de situaciones problémicas asignadas para trabajo colaborativo dentro de cada unidad temática o como resultado de la participación en procesos de investigación formativa, formatos de coevaluación para el caso de trabajo grupal colaborativo, etc. En caso de estudio independiente individual El estudiante aplicará como instrumento, formatos de informe para registro de sus logros en la construcción de conocimiento, los cuales tendrán una inserción oportuna en el portafolio del curso. Los

protocolos

específicos

pueden

ser:

formularios

diligenciados,

mapas

conceptuales complementados o modificados, guías diligenciadas, ensayos elaborados como soporte de la reflexión y resignificación conceptual, etc. Este tipo de protocolos incluirán informes autoevaluativos, donde el estudiante explicitará su nivel de desempeño previo o situación cognitiva de entrada y el nivel de logro alcanzado, conjuntamente con una prospectiva de profundización o actualización del conocimiento. PORTAFOLIO DE DESEMPEÑO PERSONAL (PDP) Y GRUPAL (PDG) La evidencia del trabajo académico del estudiante es el portafolio de desempeño personal, en el cual deben recopilarse de manera organizada los logros de aprendizaje y sus soportes o productos intelectuales. Los contenidos mínimos que deben aparecer en el PDP y PDG son los siguientes: •

Formatos de encuentro grupal: objetivos, logros, funcionalidad de las técnicas aplicadas, conclusiones y sugerencias de mejoramiento.

27

•

Informes de construcción y recontextualización cognitiva independiente: conceptualizaciones, mapas conceptuales o ideogramas similares, ensayos disciplinares, resúmenes de lecturas, etc.

•

Informes de estudio colaborativo: socialización y foro grupal crítico sobre formulación de situación problémica, diseños metodológicos, resultados o logros, crítica o coevaluación de procesos y logros, informes de prácticas o laboratorios, etc.

•

Otros: documentales didácticos, videos, audio, publicaciones u otros soportes, socializadas y conducentes a valoración heteroevaluativa en el centro regional. DESCRIPCIÓN DE ACTIVIDADES

Las actividades de reconocimiento se manejan simultáneamente para las unidades del

curso,

mediante

una

lectura

de

identificación

de

los

contenidos,

correlacionándolos con los conocimientos y experiencias previas de los estudiantes y las nociones nuevas que debe profundizar posteriormente. En las actividades de profundización, el estudiante hace énfasis en interiorizar los aspectos de conocimiento en que se encontró deficitario durante la fase de reconocimiento. Para orientarlo en esta fase el tutor debe prescribir actividades específicas destinadas a optimizar el proceso con relación a las metas de aprendizaje. Actividades por Sesiones y Fases de Aprendizaje Fase de Reconocimiento Sesión 1: Encuentro de grupo: Inducción e introducción, presentación del curso, constitución de grupos colaborativos y su registro en el Aula Virtual Sección “Grupos”.

28

Para su realización básese en el capítulo 1 Sobre la Historia de la Psicometría. Realice un mapa conceptual y socialícelo al tutor.

Sesión 2: A partir de los conceptos de psicometría expuestos en el módulo construya una definición de psicometría y discútala en la red un grupo colaborativo creado con algunos de sus compañeros. Junto a esto describa los pasos y entregue un informe a su tutor. Sesión 3: Fase Reconocimiento: Realice la lectura asignada para el tema que aparece en el modulo: La Teoría de los Test. Describa el con sus palabras las características generales de la teoría de los test. Realice un mapa conceptual y socialícelo ante sus compañeros y pida retroalimentación al tutor. Realice las correcciones del caso. Sesión 4: Fase Reconocimiento: Profundice el tema realizando la lectura del texto Los Test que aparece vinculada en el modulo. Realice un resumen de la lectura, socialícelo ante sus compañeros y pida retroalimentación al tutor. Realice las correcciones del caso.

Tenga en cuenta (tutor y estudiante) que este tema requerirá el empleo de dos sesiones.

Fase de Profundización

Sesión 5: Con la asesoría del tutor realice algunos ejercicios sobre Confiabilidad de pruebas. Pida retroalimentación del tutor. Puede entrar a la siguiente página para fortalecer plantillas).

sus

conocimientos.

http://www.uned.es/psico-3-psicometria/

(ver

29

Sesión 6: Con la asesoría del tutor realice algunos ejercicios sobre Validez de pruebas. Pida retroalimentación del tutor. Puede entrar a la siguiente página para fortalecer

sus

conocimientos.

http://www.uned.es/psico-3-psicometria/

(ver

plantillas). Sesión 7: Con la asesoría del tutor realice y presente al tutor los ejercicios que pertinentes que fortalezcan sus habilidades para analizar matemáticamente la Validez y Confialbilidad de las pruebas psicométricas. Tenga en cuenta (tutor y estudiante) que este tema requerirá el empleo de tres sesiones.

Al finalizar la realización de ejercicios entregue sus respuestas al docente para obtener retroalimentación y calificación de su desempeño. Fase de transferencia Sesión 8: En estas sesiones usted se entrenará en el uso de algunas pruebas psicológicas. Esta parte del curso debe recibir un acompañamiento estricto del tutor. Antes de empezar esta parte del curso, lea detalladamente el documento Directrices Internacionales para el uso de los tests que encontrará como Anexo 1. Seguidamente lea las indicaciones y características del 16 PF, escriba un pequeño ensayo sobre su valor para la psicología. Pida a su tutor la aplicación del test y con su ayuda califíquelo y analice sus resultados. Entregue la plantilla calificada y su interpretación al tutor. Sesión 9: Lea las indicaciones y características del MMPI, escriba un pequeño ensayo sobre su valor para la psicología. Pida a su tutor la aplicación del test y con su ayuda califíquelo y analice sus resultados. Entregue la plantilla calificada y su interpretación al tutor.

30

Sesión 10: Lea las indicaciones y características del Test Roscharch, escriba un pequeño ensayo sobre su valor para la psicología. Pida a su tutor la aplicación del test y con su ayuda califíquelo y analice sus resultados. Entregue la plantilla calificada y su interpretación al tutor. En grupos colaborativos analice las pruebas 16PF y MMPI con respecto al Test de Roscharch Sesión 11: Lea las indicaciones y características del WISC R, escriba un pequeño ensayo sobre su valor para la psicología. Pida a su tutor la aplicación del test y con su ayuda califíquelo y analice sus resultados. Entregue la plantilla calificada y su interpretación al tutor. Sesión 12: Lea el texto Importancia del Avance en la Investigación Psicométrica y sobre él concluya sobre la importancia de la psicometría y su desarrollo. Envíe sus conclusiones al tutor.

31

MODULO

UNIDAD I

HISTORIA DE LA PSICOMETRIA La revisión de los antecedentes históricos y de la evolución de la medición en psicología, ofrece una perspectiva útil para comprender la Psicometría actual. Para algunos autores, la historia de los tests mentales es tal vez uno de los mejores ejemplos de la existencia de una interacción entre las demandas sociales y la evolución de una disciplina científica. La historia de la medición psicológica ha estado marcada por la interrelación entre la evolución interna de la Psicometría y de la Psicología con el deseo de responder a las demandas sociales de cada momento histórico, reflejando un mayor acento en las aplicaciones prácticas que en el desarrollo teórico.

Este apartado pretende esbozar el entorno intelectual y social en el que nace la Psicología moderna y con ella la Psicometría. A continuación, sólo se aborda una de las dos líneas de trabajo que más trascendencia han tenido para la evolución de la Psicometría: el estudio de las diferencias individuales; para la otra línea: la Psicofísica, se puede recurrir a la bibliografía complementaria del tema. Por último, se señalan los acontecimientos que han marcado la consolidación de la disciplina. Estudio de las diferencias individuales Debemos advertir de una doble simplificación. Primera, dejar a un lado, por razones de tiempo, la Psicofísica que impide lograr una visión comprehensiva de la historia de la medición en Psicología; segunda, reducir la historia del estudio de las diferencias individuales a la historia de los tests psicológicos y presentarla recurriendo a las aportaciones de algunas figuras clave. La última es reduccionista pero difícil de evitar: gran parte de la Psicometría actual no se puede comprender

32

sin atender a los antecedentes y orígenes históricos de los tests psicológicos y de la medida de la inteligencia.

El rápido progreso económico y social en la Europa de finales del siglo XIX planteó la necesidad de evaluar las capacidades y conocimientos de los individuos en contextos educativos, laborales, etc. Si la Filosofía y la Fisiología fueron las disciplinas que más influyeron en el trabajo de los primeros psicofísicos, el impacto más dramático sobre el estudio de las diferencias individuales vino de la Biología. Al tiempo que Fechnner presentaba sus trabajos, Darwin (1809-1882) presentó su teoría en La Evolución de las Especies (1859) y su aplicación al estudio del hombre en El origen del hombre y la selección en relación al sexo (1871). Darwin defendió que la inteligencia y el sentido moral también se habían ido perfeccionando de manera gradual a través de la selección natural. Al defender esta idea Darwin no hacía sino reflejar la visión científica y la opinión popular dominante en la Inglaterra del siglo XIX, que justificaba el colonialismo y el sistema de clases bajo la creencia de que el hombre de letras inglés de clase media era el pico de la evolución humana (Rust y Golombok, 1989).

No es exagerado afirmar que las necesidades de la evaluación educativa fueron las primeras demandas sociales con un impacto significativo y duradero en la evolución del estudio de las diferencias individuales y, por ende, de la Psicometría. Los intentos por medir la inteligencia como respuesta a esas demandas caminan de la mano de los desarrollos metodológicos durante este periodo.

Thorndike (1997) señala el movimiento hacia la educación obligatoria en Francia, Inglaterra y Estados Unidos a finales del siglo XIX, como uno de los desarrollos críticos que propiciaron la medida de la inteligencia. La llegada por primera vez a las escuelas de niños cuyos padres no habían recibido una educación o, como en el caso americano, cuya lengua materna no era el inglés, generó una heterogeneidad en la población de alumnos como antes no se había conocido. La

33

exposición de estos niños a un currículo antiguo, diseñado para un grupo selecto de estudiantes, trajo como resultado niveles dramáticos de fracaso escolar próximos al 50%. Este fracaso fue visto como una pérdida de recursos en un tiempo en que eran limitados, de forma que se planteó la necesidad de destinar los recursos a quienes más se pudieran beneficiar, el medio: la evaluación de la inteligencia. Este es el contexto en el que se debe situar la obra de Binet.

Los pioneros de la Psicología llevaban años intentando una formulación aceptable de la inteligencia. Según Rust y Golombok (1989) los primeros autores tenían unas definiciones de la inteligencia que no iban más allá de lo que podría ser la psicología popular del maestro común de escuela. Se reconocía la diferencia entre una persona educada y una persona inteligente, entendiendo esta última como una persona "educable", con un origen esencialmente genético y receptora ideal de los recursos educativos, frente a los "torpes" incapaces de beneficiarse de la educación normal.

Entre los pioneros en el estudio de las diferencias individuales destaca el considerado por muchos autores, como el fundador de la Psicometría: Francis Galton. Primo de Darwin, inició sus investigaciones llevado por el objetivo de mostrar el componente hereditario del "genio". Para ello reunió el primer banco con los datos de personas relacionadas y no relacionadas. Influido por el asociacionismo de Locke y llevado por sus observaciones de que las personas con deficiencias mentales presentaban una peor ejecución a la hora de discriminar sensaciones de frío, calor, dolor, etc., pensó que la discriminación sensorial podía ser el medio para cuantificar el intelecto de una persona. Sus aportaciones propiamente metodológicas abarcan la formulación de las bases de procedimientos estadísticos, como el “coeficiente de correlación” desarrollado por K. Pearson (1857-1936), las intuiciones sobre la forma de "campana", como imagen para describir la distribución de puntuaciones en un test, así como las primeras

34

aplicaciones de las escalas de "rating" y los métodos de cuestionario (Anastasi y Urbina, 1997).

J. M. Catell (1860-1944) trabajo con Wundt, con quién compartió el interés por los fenómenos perceptivos y sensomotores, y el rigor en el control de las condiciones en que se realizaban las observaciones, pero de quién se distanció ante el despreció del experimentalista alemán por las diferencias individuales. Más tarde trabajo con Galton e inició en Estados Unidos el estudio de las diferencias individuales. Acuñó el término "test mental" en un artículo publicado en 1890 en la revista Mind bajo el título “Mental test and measurements”. Asumió la idea de Galton sobre la posibilidad de medir las funciones intelectuales por medio de tests de discriminación sensorial y tiempo de reacción. Sin embargo, los primeros estudios que se realizaron para evaluar este tipo de tests ofrecieron resultados desalentadores: el "rendimiento intelectual" mostraba poca correspondencia de unos tests a otros y prácticamente ninguna relación con estimaciones independientes del nivel intelectual realizadas por los profesores. Por el contrario, Ebbinghaus, apuntando ya un cambio de enfoque, había obtenido con un test de terminación de frases una correspondencia clara con el rendimiento académico de los niños.

Pero sin duda, la consolidación social de la medición psicológica vino de la obra del francés Alfred Binet (1857-1911) cuya influencia en el desarrollo de la teoría de los tests perdura en la actualidad. Binet a finales de los años noventa del siglo XIX criticó la aproximación de Galton y Cattell con el argumento de que para medir procesos mentales complejos era necesario observar la ejecución de los individuos en actos mentales complejos, rechazando la idea de que fuese necesaria una mayor precisión para la que no había instrumentos disponibles, ya que las diferencias individuales eran mayores respecto a los procesos superiores que en cuanto a la discriminación sensorial.

35

Binet recibió en 1904 el encargo del ministerio francés de instrucción pública de elaborar un instrumento de medida capaz de diferenciar entre los niños "educables" y los que no podrían beneficiarse de la educación normal. Junto con su colaborador Simon presentó en 1905 la primera versión del test Binet-Simon. El test estaba formado por 30 problemas o tareas dispuestos en orden de dificultad creciente, que medían la capacidad de juicio, razonamiento y comprensión. Para determinar el nivel de dificultad, los problemas habían sido administrados a 50 niños de entre 3 y 11 años más a algún niño retrasado. La segunda versión del test editada en 1908, incluía un número mayor de ítems junto con la eliminación de algunos que se habían considerado podían reflejar diferencias en función de la extracción social de los niños, además aparecían ya agrupados por niveles de edad. Binet prefirió el término "nivel mental" al de "edad mental" popularizado por las sucesivas traducciones de la escala, ya que el primer término estaba exento de las connotaciones evolutivas del segundo. Al poco tiempo de su presentación, el test de Binet y Simon fue traducido a diferentes idiomas y aplicado en diversos países, lo que prueba la favorable acogida social que recibió.

El interés por la obra de Binet se ha mantenido a lo largo del tiempo. Van der Linden (1986) ha resaltado las contribuciones estrictamente metodológicas de la aproximación de Binet a la medida de la inteligencia. Primero, frente a los experimentos antropométricos y psicofísicos que planteaban una única tarea, Binet decidió alargar la longitud del test por dos motivos: a) el conjunto de ítems debía ser una representación adecuada de la gran variedad de tareas a las que se debe enfrentar una persona en su vida diaria; y b) conocedor de las teorías de Spearman entendió que cada ítem en sí mismo era una media imprecisa, por lo que era necesario combinar observaciones de un buen número de ítems para obtener una medida fiable. Segundo, la insistencia de Binet en la estandarización de la aplicación del test, reflejada en la extrema precisión de las guías sobre el material, la administración, la puntuación y la interpretación de las mediciones. Por último, la

36

práctica de "normativizar" el test para iniciar una interpretación relativa de la ejecución de las personas.

Tras las aportaciones de Binet, los mayores desarrollos en la medición de las diferencias individuales hay que buscarlos en un área y lugar diferente. El test de Binet fue introducido en Estados Unidos por H. H. Goddard, cuya traducción y adaptación recibieron el beneplácito de la audiencia médica, al venir a cubrir la necesidad de una medida estandarizada y objetiva para el diagnóstico de la subnormalidad. Sin embargo, fue rápidamente desplazada por la revisión y adaptación psicométricamente más sólida, realizada por L. M. Terman en 1916 en la Universidad de Stanford. Al entrar Estados Unidos en la Primera Guerra Mundial, un comité encabezado por R. M. Yerkes detecta la necesidad de clasificar de forma rápida al millón y medio de reclutas con respecto a su nivel intelectual. De nuevo, una demanda social provoca un avance metodológico: los primeros tests de inteligencia de administración grupal y no verbales, para evaluar a los reclutas analfabetos o que no tenían como lengua materna el inglés. En este contexto hay que situar las contribuciones de A. S. Otis, por la introducción del formato de elección múltiple y otros formatos de puntuación objetiva. Impulsado por las necesidades militares aparece también el primer test estandarizado para la evaluación de variables de personalidad: el “Personal Data Sheet” de R. S. Woodworth, un instrumento pensado para la detección de personas con inestabilidad emocional.

37

La consolidación institucional de la Psicometría De forma paralela a los avances teóricos y las aplicaciones prácticas, se fue produciendo la consolidación institucional de la Psicología y, claro está, de la propia Psicometría. Esta consolidación se refleja en la creación de asociaciones profesionales, de publicaciones especializadas para la comunicación entre profesionales y de empresas privadas dedicadas desde el inicio al floreciente negocio de la evaluación psicológica.

J. Jastrow habla sobre los tests en la primera convención de la American Psychological Association (APA) en 1892. La APA formó en 1895 un comité especializado en la nueva tecnología de los tests. En 1899 Kilpatrick, presidente de la APA, realizó un llamamiento a los psicólogos para que elaborarán tests de tal naturaleza que "... pudieran ser aplicados tanto a niños como adultos, que fueran de tal forma que todas las personas tuvieran las mismas oportunidades de mostrar las capacidades examinadas, y que en aras de la economía del tiempo fueran diseñados de forma que se pudieran administrar a una clase o escuela de una vez" (Thorndike, 1997, pág. 6). Impulsado por la figura clave de Terman el uso de los tests de inteligencia en las escuelas creció rápidamente. El propio Terman calculó que en el periodo entre 1920 y 1921 más de dos millones de niños habían respondido a un test de inteligencia. El uso de test también se extendió al mundo laboral como prueba su incorporación a las prácticas de selección de la administración americana.

Cattell fundó la Psychological Corporation para la producción industrial de tests en 1922. En 1947 se funda el Educational Testing Service (ETS) institución sin animo de lucro que no sólo se ha encargado de la producción de tests estandarizados de rendimiento y tests de aptitud académica, sino que desde su constitución, ha contribuido a la formación y práctica profesional de influyentes psicómetras. Desde 1975, el ETS edita en formato CD-ROM el proyecto ERIC donde con una

38

periodicidad anual se recoge la información disponible sobre tests, escalamiento y medición psicológica y educativa.

Galton, Pearson y Weldon fundaron en 1901 la revista Biometrika que desde entonces publica trabajos matemáticos relacionados con la Biología y la Psicología. Thorndike funda en Estados Unidos en 1936 la publicación Psychometrika, revista de referencia para la Psicometría desde sus inicios. Desde entonces, la aparición de revistas relacionadas con la medición psicológica ha sido continua. Como muestra se pueden citar el Educational and Psychological Measurement (1941), el British Journal of Statistical Psychology (ahora con el nombre de British Jorunal of Statistical and Mathematical Psychology) (1947), el Journal of Mathematical Psychology y el Journal of Educational Measurement (1964), el Multivariate Behavioral Research y el Aplied Psychological Measurement (1977), el Applied Measurement in Education (1988), etc.

Un acontecimiento que se ha convertido en referente obligado para todos los profesionales es la publicación por las asociaciones profesionales más relevantes de las guías técnicas y éticas de la medición psicológica y educativa. Las recomendaciones elaboradas por la APA son, sin duda, las que han tenido y tienen una mayor influencia.

Entonces La psicometría es la ciencia de la medida de los aspectos "psicológicos" de una persona, tales como conocimiento, habilidades, capacidades, o personalidad. La medida de estos aspectos es difícil, y gran parte de la investigación y técnicas acumuladas en esta disciplina están diseñadas para definirlos de manera fiable antes de cuantificarlos. Los primeros trabajos de psicometría se desarrollaron para medir la inteligencia. Posteriormente, la teoría psicométrica se ha aplicado a la

39

medida de otros aspectos como la personalidad, actitudes y creencias, rendimiento académico, y en campos relacionados con la salud y la calidad de vida. Los contenidos de la psicometría se articulan, fundamentalmente, en dos grandes bloques: teoría de los test, que hace referencia a la construcción, validación y aplicación de los test, y escalamiento, que incluye los métodos para la elaboración de escalas psicofísicas y psicológicas. A su vez, la teoría de los test se divide en dos ramas: la teoría clásica de los tests y la más reciente teoría de respuesta a los ítems. Los conceptos clave de la teoría clásica de los tests son: confiabilidad y validez. "confiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo que realmente se pretende medir. Ambas propiedades admiten un tratamiento matemático. La consistencia interna puede calcularse por correlación entre distintos tests. Los métodos más conocidos se denominan: método de las formas paralelas, método del test-retest y método de las dos mitades. La validez puede calcularse correlacionando las mediciones con las de una medida patrón aceptada como válida. Se distinguen los siguientes aspectos: validez de contenido, validez predictiva y validez de constructo. Complemente y discuta con el profesor el artículo anexo “La medición de lo Psicológico

(que

se

encuentra

en

la

siguiente

página

http://www.psicothema.com/pdf/138.pdf) DEFINICIÓN DE PSICOMETRÍA Disciplina implicada directamente en la medición psicológica, con una doble vertiente: •

teórica : supone la fundamentación teórica de la medida

40

•

práctica: supone la construcción, evaluación y aplicación de instrumentos de medida para evaluar o medir las características psicológicas de interés.

Más adelante se seguirá ampliando el concepto de Psicometría, explicaremos a continuación algunos aspectos de la vertiente práctica de la psicometría. Se sugiere a los estudiantes hacer la búsqueda por Internet de la vertiente teórica de la psicometría (pueden también buscar en la red con la palabra clave “psicología matemática”). VERTIENTE PRÁCTICA DE LA PSICOMETRÍA Fase de Construcción de un Instrumento de Medida En esta fase del proceso habría que cubrir las siguientes etapas: •

Delimitación y operativización de la variable psicológica que se desea medir

•

Confección de los ítems

•

Determinación del valor escalar de los ítems

•

Confección de la prueba

Esta fase subsumiría lo que tradicionalmente se entiende al hablar de escalamiento, el escalamiento de estímulos psicológicos Una vez completada la fase de construcción se pasaría a la de la evaluación del instrumento construido para, finalmente, concluir con la administración efectiva del instrumento a un sujeto (o grupo de sujetos) en la fase de aplicación. Fase de Evaluación de un Instrumento de Medida La fase de evaluación del instrumento de medida es absolutamente crucial ya que todas las medidas obtenidas al aplicar una prueba contienen error. La consideración del error de medida inherente a toda medición psicológica hace necesario:

41

•

un planteamiento explícito acerca de hasta qué punto la medida obtenida en un momento determinado proporciona una estimación adecuada del nivel real en que posee el sujeto la característica psicológica que supuestamente se está evaluando. Por tanto, la consideración del error de medida exige el recurso a una teoría de los tests que dé cuenta del mismo y proporcione una estimación del rasgo o característica evaluada.

•

la evaluación de la calidad de los instrumentos de medida, es decir, determinar si éstos cumplen o no los criterios métricos de calidad que todo instrumento de medida debe de satisfacer para poder ser utilizado con garantía como un instrumento

científico.

Esto supone que habrá que estudiar confiabilidad y validez de la prueba y proceder al análisis de los ítems de la misma. Una vez construida y evaluada positiva o favorablemente la prueba, nos enfrentaríamos a la tercera fase del proceso: su aplicación a un sujeto o a una muestra de sujetos. Fase de Aplicación de un Instrumento de Medida Una vez construida y evaluada positiva o favorablemente la prueba, nos enfrentaríamos a la tercera fase del proceso: su aplicación a un sujeto o a una muestra de sujetos. El objetivo de esta fase es obtener una medida de cada sujeto o grupo en el rasgo o característica evaluada por la prueba, determinar el valor escalar de cada sujeto o grupo de sujetos, viendo la posición que éstos ocupan en el continuo que representa la característica o rasgo evaluado con el instrumento de medida. En particular, los contenidos del programa vinculados con esta fase son: •

la interpretación de las puntuaciones del test

42

•

la equiparación de las puntuaciones del test.

La Psicometría y la Teoría de los Tests La finalidad de este tema es presentar la Psicometría e introducir uno de sus contenidos más importantes: la Teoría de Tests. Intentar definir un concepto complejo como el de "Psicometría", al igual que ocurre con la denominación de cualquier disciplina científica, es una tarea difícil, razón por la que, al contrario de lo que se podría pensar, no abundan las definiciones explícitas. Bajo la palabra "Psicometría" pueden convivir contenidos, enfoques, objetivos y hasta concepciones diferentes sobre la ciencia y la función social de la Psicología. Por todo ello, tal vez la única estrategia útil para abordar una delimitación conceptual comprehensiva y lo más exacta posible de la Psicometría sea recorrer desde una perspectiva histórica la evolución de la medición psicológica, esbozar un análisis de la naturaleza del "objeto" de la medición psicológica, describir el método psicométrico,

presentar los contenidos de la

Psicometría y, a pesar de las dificultades ... no resistir la tentación final de proponer una definición propia de la Psicometría. Definiciones y objetivo de la Psicometría

En este apartado se aborda el significado de la denominación de la disciplina y se señalan los elementos comunes de las definiciones propuestas por diferentes autores.

El término "Psicometría" es el más extendido y general para hacer referencia a la medición psicológica. Su significado popular y la etimología de la palabra apuntan en la misma dirección: la disciplina que se encarga de la medición en Psicología. De hecho, los diccionarios de uso más común como el de la Real Academia de la Lengua o el de María Moliner también coinciden en su significado: la medida de los fenómenos psíquicos.

43

Para avanzar en el camino hacia una delimitación conceptual de la disciplina es necesario detenerse en las definiciones explícitas que, desde la propia Psicología, se han propuesto para la Psicometría. Señalar los puntos comunes y las diferencias de matiz entre ellas pueden ayudar a entender el alcance de la disciplina.

La Psicometría se ocupa de todas las medidas en el campo psicológico, habiéndose desarrollado a través de dos ramas principales: los métodos psicofísicos y la teoría de los tests. También se define a la Psicometría como la metodología encargada del desarrollo y utilización de las técnicas de medición en todos los ámbitos de la psicología.

Muñiz (1998) define la Psicometría como "... el conjunto de métodos, técnicas y teorías implicadas en la medición de variables psicológicas... lo específico de la Psicometría sería su énfasis y especialización en aquellas propiedades métricas exigibles a las mediciones psicológicas independientemente del campo sustantivo de aplicación y de los instrumentos utilizados".

La definición de Martínez-Arías (1984) introduce un matiz que apunta hacia la relación entre la Psicometría y la Psicología Matemática. Para la autora, la Psicometría "... aglutina todo el conjunto de modelos formales que posibilitan la medición de variables psicológicas, centrándose en las condiciones que permiten llevar a cabo todo proceso de medición en psicología".

No resulta difícil entresacar los elementos comunes de las definiciones anteriores. La Psicometría es una disciplina metodológica, sin un contenido psicológico propio, pero con un campo sustantivo: la teoría de la medición en sentido amplio. Muñiz (1998) afirma que el trabajo psicométrico tiene como finalidad construir y utilizar adecuadamente los tests y las escalas, de tal modo que se garantice su fiabilidad, validez y aplicación adecuada.

44

El objeto de la medición en Psicología Al presentar las definiciones explícitas de la Psicometría elaboradas por diferentes autores, se entresacaron sus elementos comunes: disciplina metodológica, sin contenido psicológico propio, pero con un dominio sustantivo: la teoría de la medición psicológica en un sentido amplio. La definición de Muñiz (1998) señala además, el rasgo definitorio de la preocupación psicométrica por la medida: las condiciones métricas exigibles a todas medición. Sin embargo, hay otra fuente de singularidad en la preocupación psicométrica por las condiciones métricas de la medición que no es posible soslayar: la que viene impuesta por la peculiaridad de los objetos psicológicos de medición. A diferencia de las variables físicas, las variables psicológicas no se pueden observar de manera directa. No quiere esto decir, que en psicología no se midan conductas directamente observables, cuya cuantificación se suele obtener a través de alguno de sus parámetros: duración, frecuencia, intensidad, etc., sino que, incluso en estos casos, la conductas observables se interpretan como indicios o resultado de variables inobservables más complejas. Atributos como "autoestima", "habilidad lectora", "razonamiento analógico", etc., son variables inobservables que sólo es posible medir por medio de los comportamientos observables a los que den lugar. Hay un amplio consenso sobre el término con el que referirse de forma genérica a los objetos de medición: constructos. El término "constructo" se ha hecho familiar en el campo de la medición psicológica desde su utilización en el artículo de L. Cronbach y P. E. Meehl titulado "Construct validity in Psychological Test" (1955). Cronbach y Meehl (1955) entendieron por constructo un instrumento intelectual para organizar la experiencia en categorías. Crocker y Algina (1986) lo definen como "... productos de la imaginación informada de los científicos sociales qué intentan desarrollar teorías para explicar el comportamiento humano" (pág. 4).

45

Crocker y Algina (1986) ilustran el proceso de elaboración de constructos insistiendo en su papel de "etiqueta" para resumir comportamiento y remarcan la importancia de establecer alguna regla de correspondencia entre el constructo y los comportamientos observables que son sus indicadores legítimos. La dificultad a la hora de encontrar la conexión "legítima" entre el constructo y sus indicadores comportamentales es valorada como uno de los lastres que impide el desarrollo de la medida psicológica. Lord y Novick (1968) fijaron la definición obligatoria de los constructos como requisito previo para su medición. La definición de los constructos se debe abordar a dos niveles:

•

Definición operacional o “semántica”. Consiste en enumerar la serie de comportamientos

indicadores

que

“engloba”

el

constructo.

Dichos

comportamientos son considerados los “indicadores empíricos” del constructo objeto de la medición. La importancia de la definición operacional es evidente: debe conectar la “etiqueta verbal” con los datos observables. •

Definición conceptual o “sintáctica”. Recoge la teoría sobre el constructo objeto de la medición. Se trata de un discurso “conceptual” en el que se hacen explícitas las relaciones del constructo objeto de la medición con otros constructos y/o indicadores empíricos de otros constructos con los que el objeto de la medición está relacionado.

La definición de los constructos a los dos niveles anteriores es el primer paso inexcusable a la hora de iniciar cualquier medición. El supuesto sobre la estabilidad de los constructos La medición psicológica asume, o al menos tiene en cuenta, algunos supuestos sobre la naturaleza del objeto de la medición, es decir, sobre la naturaleza de los

46

constructos. Sin duda, el supuesto común a la práctica totalidad de los modelos de medición es el de la estabilidad de la variable.

Numerosos estudiosos de la medición psicológica defienden la idea de que las diferentes versiones de la teoría de los tests (e. g., la teoría clásica, la teoría de la generalizabilidad y la teoría de respuesta al ítem) están elaboradas para hacer inferencias con el mismo "esqueleto": la tendencia de las personas a comportarse de manera prescrita en situaciones prescritas a partir de sus repuestas a un conjunto de tareas predeterminadas. Por ejemplo, la perspectiva tradicional para medir la inteligencia responde a este esquema inferencial: empleo de tests estandarizados, compuesto por ítems o tareas predeterminadas, aplicados bajo condiciones estandarizadas y con la pretensión de predecir el rendimiento futuro de las personas en situaciones igualmente "estandarizadas": la escuela, el trabajo, el ejercito, etc., En definitiva, los modelos de medida se han elaborado bajo el supuesto de estabilidad de la variable.

El supuesto de estabilidad está siendo amenazado por las perspectivas más recientes sobre la evaluación psicológica, es decir, por la necesidad de extender el "paradigma metodológico tradicional" para responder, por ejemplo, a las inferencias que el paradigma cognitivo plantea sobre las personas: las formas de uso y adquisición de conocimientos y habilidades, en definitiva, para modelar el cambio. La polémica sobre el objeto de la medición

La cuestión sobre la naturaleza del objeto no ha estado exenta de debate a lo largo de la historia de la medición psicológica como reflejo de las discusiones sobre el propio objeto de estudio de la psicología. Resulta difícil evitar plantearse preguntas como las lanzadas por Meliá (1990): "¿Cuántos atributos latentes o rasgos subyacentes existen?... ¿en qué medida son estables o evolucionan? ¿son comunes a todas las personas?" (pág. 37).

47

Rust y Golombok (1989) defienden que la discusión sobre el objeto de medición ha dividido a la Psicometría en dos escuelas: la Psicometría del rasgo y la Psicometría funcional. Spearman (1904, 1907) da carta de naturaleza a la Psicometría de los rasgos al plantear que la esencia de la tarea de la medida mental es identificar rasgos a través de las tendencias de los individuos a comportarse de formas prescritas en situaciones prescritas. El fuerte carácter hereditario atribuido por los pioneros de la medida mental a los rasgos aparece suavizado en la definición de Messick (1989): "Un rasgo es una característica relativamente estable de una persona –un atributo, proceso duradero o disposición– que se manifiesta consistentemente en algún grado a pesar de variaciones considerables en el rango de contextos y circunstancias" (pág. 15). Por el contrario, la Psicometría funcional defiende como un principio de partida que ningún rasgo o variable psicológica interviniente es relevante. Plantea que dado que es posible definir y medir directamente los comportamientos a los que supuestamente conducen los rasgos, el papel de estos es redundante.

Rust y Golombok (1989) contrastan la preeminencia de la Psicometría funcional en la evaluación educativa, con la de la Psicometría de los rasgos para la evaluación clínica; y proponen resolver el enfrentamiento atendiendo a los procesos de toma de decisión que realizan los clientes de la evaluación y de la selección psicométrica: las decisiones se realizan resumiendo la medición en términos de rasgos que reflejan lo que denominan "la psicología popular humana" ("don de gentes", "genio", "liderazgo", etc.). El método de la Psicometría

Meliá (1990) plantea que la conexión entre la Psicometría y la psicología matemática, permite considerar el método de la Psicometría desde una doble vertiente: por un lado, en tanto que la teoría psicométrica se refiera a contenidos

48

empíricos, el método no es otro que el método científico propio de toda ciencia empírica; y por otro lado, el componente matemático de los modelos formales de medición, sujeta a la teoría psicométrica, como a la psicología matemática, a los criterios formales de las matemáticas.

La relación entre la psicología matemática y la Psicometría ha llevado a algunos autores a defender que el método de la Psicometría es el de la psicología matemática. El esquema elaborado por Jáñez (1989) es la referencia obligada a la hora de presentar el método de la psicología matemática. De manera resumida, dos son las características distintivas del método de la psicología matemática: a) la presentación formal, generalmente en términos matemáticos, del componente teórico; y b) el recurso a procedimientos deductivos basados en la lógica o a procedimientos de simulación a la hora de derivar las consecuencias del modelo matemático.

Mención especial merece la simulación, por la preponderancia que está adquiriendo en Psicometría. El papel metodológico de la simulación no resulta fácil de establecer. Muchos campos de la Psicometría la utilizan como técnica de obtención de datos, cuando el problema de investigación hace imposible contrastar el modelo con datos empíricos. Este es el caso cuando se pretende descubrir las propiedades y características de índices estadísticos, métodos de estimación, potencia de contrastes, etc. Además, la simulación preserva también el estatus de método en cuanto generadora de conocimiento.

El análisis del método no puede obviar el papel instrumental de la Psicometría como herramienta metodológica para la contrastación empírica de las teorías psicológicas. La aplicación del método científico en psicología obliga a que la Psicometría desempeñe un papel activo en diferentes momentos del proceso. Arnau (1989) articula las relaciones entre el plano teórico y empírico del método científico en tres niveles: el nivel teórico-conceptual, que abarca desde el

49

planteamiento del problema hasta la formulación de hipótesis empíricamente contrastables; el nivel técnico-metodológico que abarca el plan de investigación y la estrategia de recogida de datos; y el nivel estadístico-analítico, donde se realiza la modelización estadística de los datos y las inferencias sobre las hipótesis sometidas a contrastación. La generalización de los resultados hace retornar la aplicación del método al nivel teórico-conceptual con lo que se cierra el ciclo. La Psicometría acompaña a la aplicación del método en cada uno de los tres niveles.

El nivel teórico conceptual recoge a teoría que contextualiza el problema de investigación. La teoría debe incluir la definición operacional y "sintáctica" de los constructos implicados en las hipótesis. A su vez, la teoría condiciona la elección del modelo de escalamiento y, por tanto, de las condiciones métricas que se exigirán a las mediciones. La red nomológica desempeña además un papel crucial durante la elaboración de tests para determinar la utilidad de las puntuaciones obtenidas.

El nivel técnico metodológico implica la construcción o selección de los instrumentos de medida idóneos para la medición de los constructos de interés. La Psicometría debe guiar el proceso de elaboración de instrumentos, teniendo en cuenta la teoría psicológica y el modelo de medida seleccionados en el nivel teórico-conceptual.

Dentro del nivel estadístico analítico, las propiedades métricas de las mediciones valoradas en el nivel anterior, condicionarán la modelización estadística de los datos y la elaboración de proposiciones a partir de los resultados. Por ejemplo, la información sobre la fiabilidad y validez de las mediciones, condicionará la generalización de los resultados en el regreso del proceso de investigación al nivel teórico conceptual.

50

Los contenidos de la Psicometría Hay un consenso amplio en la disciplina sobre cuales son los contenidos propios de la Psicometría. Las diferencias entre las propuestas de los autores responden a las distintas tradiciones de investigación de las que procedan o a diferencias en las estrategias de estudio de una misma temática. Si se unen las diferentes versiones de la teoría de los tests bajo una denominación común, se obtiene la división en tres grandes grupos de los contenidos psicométricos: teoría de la medición, escalamiento y teoría de los tests. Los dos primeros contenidos han sido o serán objeto de un tema en el programa de la asignatura. La teoría de los tests es introducida en el siguiente apartado. LA TEORÍA DE LOS TESTS La teoría de los tests puede verse como un esquema conceptual formalizado para hacer inferencias a partir de las puntuaciones de las personas en los tests y permitir la toma de decisiones que impliquen el constructo objeto de la medición. La teoría de los tests proporciona los fundamentos para la elaboración y uso de los tests, aportando además las herramientas para examinar las propiedades métricas de las mediciones obtenidas con ellos.

La definición de “test” no ha variado de forma significativa conforme evolucionaba la teoría de los tests. Valgan como muestra las definiciones de Anastasi o Lord. Para Anastasi (1968), un test psicológico es esencialmente una medida objetiva y tipificada de una muestra de conducta; para Lord (1980) “un test psicológico o educativo es un instrumento para obtener una muestra de conducta” (pág. 3). La definición de Yela (1996) expresa en términos más generales la finalidad de los tests como “un reactivo que aplicado a un sujeto revela y da testimonio de la índole o grado de su instrucción, aptitud o manera de ser” (pág. 249). (definición de test)

51

La mayoría de los profesionales de la medición psicológica coinciden en que las características definitorias de un test psicológico son: •

Procedimiento o instrumento estandarizado. Los tests plantean a las personas evaluadas una serie de tareas previamente determinadas, a las que deben responder siguiendo unas instrucciones fijadas de antemano y, de forma habitual, en un contexto controlado.

•

Obtención de muestras de conducta. Los tests están diseñados para la obtención de los comportamientos reveladores del constructo objeto de la medición.

•

Asignación numérica. Los tests deben permitir la cuantificación objetiva de acuerdo con unas reglas establecidas.

•

Dispone de información sobre la calidad de las mediciones. Los autores de los tests y, en algunas circunstancias, los usuarios deben aportar información técnica sobre la precisión y relevancia para el objetivo de la evaluación de las mediciones aportadas por el test.

Se han elaborado diversas clasificaciones de los tests utilizando diferentes criterios. Crocker y Algina (1986) ofrecen una clasificación útil de los tests atendiendo al carácter general de la tarea que deben realizar las personas: tests de ejecución óptima, en los que se instruye a la persona para que conteste lo mejor que pueda (incluiría los tests de inteligencia, aptitudes y rendimiento); y tests de ejecución típica, que demandan de la persona información sobre sus actitudes, sentimientos, intereses, etc., donde se incluirían los cuestionarios e inventarios de personalidad.

52

Las definiciones de Anastasi y Lord utilizan la expresión “muestras de conducta” que sintetiza la finalidad última de la teoría de los tests. Crocker y Algina (1986) enumeran los problemas por los que la medida psicológica está contaminada por el error: •

Ausencia de aproximaciones únicas a la medición de la mayoría de los constructos. El problema reside básicamente en las diferencias en las definiciones operacionales de la mayoría de las variables psicológicas, lo cual suele conducir a procedimientos diferentes de medida y distintas conclusiones sobre la evaluación de una misma persona.

•

Muestreo limitado del comportamiento. Las mediciones suelen basarse en un número limitado de comportamientos, obtenidos en un muestreo reducido de situaciones y momentos temporales. Así, determinar, por ejemplo, el número de ítems y la variedad de los contenidos de un test es uno de los problemas habituales en la elaboración de los procedimientos de medida.

•

Presencia inevitable de los errores de medida. Las limitaciones “muestrales” en la obtención de los comportamientos indicadores obliga a estimar el grado de error presente de forma inevitable en cualquier medición.

•

Evolución de las teorías psicológicas. Al ser los constructos “herramientas conceptuales” para la elaboración de teorías, el significado de las mediciones siempre estará sujeto a la evolución de la teoría de la que forma parte, dependiendo de la obtención de evidencias que la confirmen o modifiquen.

La finalidad de la teoría de los tests es aportar soluciones para minimizar el impacto de estos problemas sobre la medición psicológica (Martínez-Arias, 1995).

53

La imposibilidad de observar de forma directa la mayoría de las variables psicológicas obliga a considerar la teoría de los tests como una maquinaria conceptual para la inferencia psicométrica. ¿En qué consiste la inferencia psicométrica? La elaboración de ítems debe reflejar la definición operacional y sintáctica del constructo objeto de la medición (Lord y Novick, 1968). El papel de los ítems es el de provocar que las respuestas de las personas en una situación estandarizada, reflejen la conductas que en situaciones “espontáneas”, se considerarían los indicadores conductuales del constructo. La cuantificación se produce cuando a través de un procedimiento de escalamiento se asignan valores cuantitativos a los patrones de repuesta de las personas en el test. Sobre la inferencia, desde el valor cuantitativo o puntuación resumen de la ejecución de la persona hasta el constructo, pueden incidir diferentes fuentes de variabilidad “no deseada”, por no relacionada con el constructo objeto de la medición, que pueden amenazar la corrección de la inferencia: fuentes de variabilidad aleatoria, que tradicionalmente se agrupan bajo la denominación general de “fiabilidad”; y fuentes de variación sistemática, agrupadas bajo la etiqueta de “validez”. El objetivo principal de la teoría de los tests es estudiar este proceso de inferencia y aportar procedimientos para realizarla (Crocker y Algina, 1986). Este objetivo ha hecho que bajo la denominación “teoría de los tests” tengan cabida contenidos tan diversos como: construcción de tests, elaboración de ítems, análisis de ítems, métodos de puntuación e interpretación de las puntuaciones y, de forma preponderante, el análisis de la fiabilidad y validez de las medidas aportadas por los tests.

La teoría de los tests suele dividirse en dos grandes ramas: la teoría clásica de los tests y la teoría de respuesta a los ítems. La cita de Hambleton y van der Linden (1982) expresa con toda claridad esta división: “Las teorías de los tests pueden dividirse en dos grandes categorías. La primera es la teoría clásica de los tests, que parte de la concepción de Spearman de la puntuación observada en el test como compuesta de un componente verdadero y otro de error... Importantes hitos en esta larga y venerable tradición son Theory of mental tests de Gulliksen (1950) y

54

Statistical theories of mental test scores de Lord y Novick (1968)... La segunda es la teoría de respuesta al ítem, o teoría del rasgo latente, como se ha llamado hasta hace poco. Actualmente la teoría de respuesta al ítem esta teniendo un mayor impacto en el campo de los tests” (pág. 373). Complemente este apartado con la lectura anexa Los Test (http://www.psicothema.com/pdf/660.pdf)

55

CONCEPTOS Y METODOLOGÍA ESTADÍSTICA DE LA PSICOMETRÍA

Criterios de calidad en la construcción de test Guiado por el tutor consulte y analice los conceptos más relevantes en la construcción de test (Validez y Confiabilidad). Utilice como guía la siguiente página web: http://www.uned.es/psico-3-psicometria/ En ella encontrará la explicación de conceptos y técnicas importantes para la construcción de pruebas tales como los de Validez y Confiabilidad (fiabilidad), que se encuentran a continuación. Además encontrará ejercicios (plantillas) que podrá resolver con el acompañamiento del tutor.

CONFIABILIDAD

DEFINICIÓN: Criterio de calidad relacionado con la precisión de las medidas obtenidas con un test y que proporciona información acerca de: •

la estabilidad temporal de las puntuaciones obtenidas con el test (test-retest y formas paralelas)

•

la consistencia interna del test (alpha y dos mitades)

FÓRMULA GENERAL:

56

PROCEDIMIENTOS EMPÍRICOS PARA ESTIMAR EL COEFICIENTE DE FIABILIDAD: TEST-RETEST:

FORMAS PARALELAS:

BASADOS EN LA DIVISIÓN DEL TEST EN DOS MITADES:

PARALELAS: Fórmula de Spearman-Brown

ESTRICTA O ESENCIALMENTE TAU-EQUIVALENTES:

Fórmula de Rulon:

57

Fórmula de

Guttman/Flanagan: BASADOS EN LA COVARIANZA DE LOS ITEMS:

Coeficiente alpha:

KR 20:

KR 21:

FACTORES DE LOS QUE DEPENDE LA FIABILIDAD: LONGITUD DEL TEST: Fórmula de Spearman-Brown

VARIABILIDAD DE LA MUESTRA:

58

VALIDEZ

DEFINICIÓN: Criterio de calidad relacionado con la adecuación de las puntuaciones del test para el objetivo que suscitó su aplicación.

TIPOS DE VALIDEZ: VALIDEZ DE CONTENIDO: Trata de garantizar que el test constituye una muestra adecuada y representativa del contenido que éste pretende evaluar. Modo de evaluación: Recurso a expertos VALIDEZ DE CONSTRUCTO: Trata de garantizar la existencia de un constructo psicológico que subyaga y dé sentido y significado a las puntuaciones del test. Modo de evaluación:

Análisis factorial

59

Matriz multimétodo-multirrasgo

VALIDEZ PREDICTIVA: Trata de garantizar la eficacia del test para pronosticar una variable de interés. FIABILIDAD:

LONGITUD DEL TEST:

VARIABILIDAD DE LA MUESTRA: Para el caso de dos variables:

60

FÓRMULA GENERAL DEL COEFICIENTE DE VALIDEZ:

DERIVADOS DEL COEFICIENTE DE VALIDEZ:

También se puede ampliar sobre los conceptos de validez y confiabilidad en el siguiente artículo:

61

ARTÍCULO COMPLEMENTARIO

TÉCNICAS PSICOMÉTRICAS. CUESTIONES DE VALIDEZ Y CONFIABILIDAD

Juan Carlos Argibay (2006) Revista Subjetividad y Procesos Cognoscitivos

Resumen

En este artículo se analizan cuestiones de validez y confiabilidad referidas a las pruebas psicométricas. Se comentan los distintos aspectos de la confiabilidad, ya sea en lo que hace a su consistencia interna, como a la estabilidad de las mismas y a cuestiones de equivalencia. En cada caso se discuten sus características generales y se plantean, brevemente algunos de los distintos procedimientos para estimar la confiabilidad según de qué tipo se trate. En cuanto a la validez se indaga en sus principales tipos: de contenido, de criterio y de constructo y como se vinculan entre sí. Se plantean también los nexos entre validez y confiabilidad. Tratamos de plantear como estos estudios se vincularían con una visión metodológica global, en cuanto a métodos de investigación y diseños y respecto de su funcionalidad como formas de operacionalizar constructos hipotéticos. Dentro de la validez de criterio, se analiza tanto la concurrente como la predictiva y se las relaciona con conceptos como el poder predictivo y poder explicativo. La validez de constructo es estudiada en los problemas que presenta y en las distintas formas para establecer la misma, considerando la validez relacionada con la estructura factorial y la validez convergente y divergente. Palabras clave: técnicas psicométricas; validez; confiabilidad; validez de constructo; validez de contenido; validez de criterio. Al aplicar una técnica psicométrica, independientemente del propósito con que se utilice, se juegan permanentemente, cuestiones relacionadas con la validez y confiabilidad del instrumento.

Es cierto que muchas veces se utiliza un test, sin tener mucho en cuenta o, analizar su validez y confiabilidad. Pero se debiera considerar que las bondades de aquél, dependen mucho de estos factores. Ya sea que se utilice la técnica con fines puramente psicodiagnósticos o en investigación.

Para comenzar, podríamos preguntarnos, ¿cuál es el propósito de una técnica de evaluación, ya sea psicométrica o proyectiva? Consideramos que, en principio, una respuesta adecuada sería: la técnica sirve para operacionalizar algún constructo

62

hipotético.

Por ej., al evaluar la variable de personalidad Extraversión, mediante alguna técnica psicométrica, lo que estamos haciendo es operacionalizar mediante un instrumento dicho constructo hipotético. Puede haber más de una forma de operacionalizar dicho constructo y, de hecho, tanto el EPQ-Acomo el Neo-Pi-R miden entre otras dicha variable. Cabría preguntarse si, en realidad, miden el mismo constructo. Volveremos sobre este tema al analizar más adelante la validez de constructo.

Considerando lo anterior, es de fundamental importancia que el instrumento esté midiendo lo que dice medir, caso contrario se estaría operacionalizando incorrectamente el atributo, al no corresponderse lo que realmente se observa, con lo que se cree medir. También podríamos preguntarnos, ya que toda medida tiende a tener errores de medición, en qué medida el instrumento que estamos usando es preciso en medir los valores verdaderos de la variable que se analiza y cual es su grado de congruencia para medir la variable en cuestión.

Esto último, la precisión y la congruencia, tienen que ver con la confiabilidad del instrumento. Que el instrumento mida realmente lo que dice medir, se relaciona con la validez.

Existen distintas formas de validez y confiabilidad. A continuación pasaremos a analizarlas.

Confiabilidad

Como ya mencionamos, toda medición tiende a presentar errores, de manera que el valor observado en la medición, está formado por el valor verdadero y por el error de medición. Si se pudiera llegar a una medición que, en un sentido ideal no tuviera márgenes de error, el valor observado y el valor verdadero (que se correspondería con la variable a medir), coincidirían. Pero esto es algo ideal, ya que las medidas incluyen error. Obviamente, cuanto más error incluya la medición, más contaminada quedaría la variable de interés y

63

más imprecisa sería la técnica que intenta medirla.

Por éj.: si aplicamos un test que mide la variable de personalidad Neuroticismo y obtenemos un puntaje de 15 (valor observado) y el valor real de la persona fuera de 14 puntos (valor verdadero), tendríamos un margen de error de 1 punto; en otro caso, si el valor real fuera también de 14 puntos y hubiéramos obtenido en la aplicación del instrumento un puntaje de 10, el error de medida sería de 4 puntos. De manera que al aumentar el error de medida, el puntaje que obtenemos al aplicar el test se encuentra más alejado de la medida que sería la verdadera, o sea, que sería más impreciso.

Podemos entonces vincular la confiabilidad con los errores de medición de la siguiente manera: si en toda medida el valor obtenido, está compuesto por el valor verdadero y los errores de medición, un instrumento será más confiable, en la medida que maximice el valor verdadero. Con maximizar el valor verdadero, nos referimos a que éste aproxime lo más posible al valor observado u obtenido. Al reducir el error de medición, incrementamos la similitud entre el valor verdadero y el obtenido. De manera que al maximizar el valor verdadero, minimizamos el error de medición, con el consecuente incremento de la confiabilidad.

Es importante tener en cuenta, que la confiabilidad se refiere, específicamente a los errores aleatorios, tal cual menciona Martínez Arias (1996). Podemos hablar de dos tipos de errores: los errores aleatorios que, como tales, no pueden ser controlados y no se pueden predecir y los errores sistemáticos que son controlables y pueden ser explicados por alguna fuente de variación sistemática. De ambos errores los únicos que interesan a la teoría de la fiabilidad son los errores aleatorios.

Para Martínez Arias (1996), la confiabilidad es la consistencia en un conjunto de medidas de un atributo. Podríamos también definir la confiabilidad como la proporción de la variabilidad verdadera respecto de la variabilidad obtenida.

64

En el análisis de la confiabilidad tenemos que considerar tres aspectos:

• Su congruencia o consistencia interna. • La estabilidad del instrumento. • La equivalencia Congruencia o consistencia interna

La congruencia interna consiste en que las distintas partes que componen el instrumento estén midiendo lo mismo. Por éj., en un test compuesto por distintos reactivos, se esperaría que cada uno de ellos midiera el mismo atributo. En un instrumento que incluyera distintos factores, se esperaría que aquellos reactivos que remiten al mismo factor estuvieran midiendo también lo mismo. La forma de pensar la congruencia interna, se basa en que las distintas partes del instrumento correlacionen entre sí. Al hablar de confiabilidad del instrumento, estamos hablando de que los reactivos que componen el instrumento, son distintas formas del mismo atributo, de manera que estaríamos frente al mismo constructo, observado en conductas diferentes.

De manera que en condiciones ideales, esperaríamos encontrar que los distintos ítems estuvieran correlacionados entre sí. Podemos concluir, entonces, que la congruencia interna del instrumento se establecería según la magnitud de los valores que expresaren las correlaciones entre sus partes.

Por ejemplo: en el test EPQ-A de Eysenck (TEA Ediciones, 1982) las preguntas: ¿Tiene Ud. muchos “hobbys”, muchas aficiones?, ¿Es Ud. una persona conversadora?, ¿Es Ud. una persona animada, alegre?, remiten junto con otras al factor Extraversión, en consecuencia, se esperaría que las respuestas que dieran los sujetos a estas preguntas estuvieran relacionadas entre sí. Si las preguntas no correlacionaran eso afectaría la confiabilidad del instrumento.

Un comentario respecto de lo anterior: en la teoría clásica de la fiabilidad se parte de una situación ideal en la que todos los ítems del instrumento no solo medirían lo mismo sino que lo harían con idéntica intensidad. Lo que ocurre realmente es que, más allá de que

65

estén midiendo lo mismo, la intensidad con que lo hacen varía de ítem a ítem y, además, es usual que midan más de un constructo o dimensión, como menciona Morales (1988). Lo anterior también influye en una reducción de los niveles de correlación y consecuentemente en una reducción de la confiabilidad.

La confiabilidad a través de la congruencia interna, es una de las más utilizadas por los investigadores, entre otras cosas, por requerir una sola aplicación del instrumento, lo cual facilita la investigación.

Los procedimientos para calcular la congruencia interna podemos dividirlos en dos métodos principales:

• Métodos basados en la división del instrumento en dos mitades. • Métodos basados en la covarianza de los ítems.

El método de la división en mitades consiste en lo siguiente:

1º. Se divide el instrumento en dos mitades. 2º. Se obtiene la puntuación para cada mitad en forma independiente. 3º. Se usan estos puntajes para estimar el coeficiente de correlación entre ambas mitades.

Este coeficiente de correlación se ajusta mediante la fórmula de Spearman-Brown.

El motivo por el cual es necesario aplicar la fórmula de Spearman-Brown es que “las escalas de mayor longitud son más confiables que las cortas” (Polit y Hungler, 1995/1997); por ese motivo el coeficiente de correlación que fue obtenido a partir de las dos mitades, tiende a subestimar el valor real de la confiabilidad, que se obtendría con una escala con el doble de longitud que la de cada una de las mitades y que constituiría la longitud original del instrumento.

Existen distintas formas de dividir el test en dos mitades, y cada una de ellas nos da un valor diferente del coeficiente de confiabilidad. Si bien hay que aclarar que si la confiabilidad es buena, las variaciones del coeficiente en función de la forma de dividir el

66

test serían reducidas. De todos modos, en función de lo anterior, se desarrollaron los métodos basados en la covarianza de los ítems, que solucionan el problema anterior al dividir por cada ítem, lo que permite, tal cual dice Martínez Arias (1996), “tratar a cada ítem como si fuese un test de longitud unidad con una puntuación.”

Dentro de los métodos basados en la covarianza de los ítems el más utilizado es el coeficiente alpha de Cronbach y en general es preferible al método de la división por mitades. Si bien, de ser confiable el instrumento, con ambos métodos se obtendría un coeficiente de confiabilidad aceptable.

Algo que es fundamental al interpretar el coeficiente alpha es que el valor de éste, se ve afectado por el número de ítems. De manera que entre dos tests que tuvieran realmente la misma confiabilidad, el que tuviera menos ítems daría un menor coeficiente alpha. Esto se debe a que al aumentar la longitud del instrumento la varianza verdadera aumenta en mayor proporción que la varianza de error. Debido a lo anterior, Cronbach propuso una fórmula adicional de consistencia inter-ítem, que consistiría en una estimación de la correlación media inter-ítem y no se vería afectada por la longitud del instrumento. Esta nueva fórmula no llegó a alcanzar la difusión del coeficiente alpha, pero consideramos que puede ser útil su aplicación, cuando se desea comparar la confiabilidad de dos instrumentos con número desigual de ítems, o de dos factores dentro de un instrumento con un número de reactivos desigual.

En cuanto a cuál debe ser el valor mínimo del coeficiente alpha, no hay un criterio uniforme. Podríamos decir que un parámetro aceptable es un mínimo de .70, pero esto hay que tomarlo con precaución, ya que habría que considerar el número de ítems del instrumento. Si su longitud es reducida, valores menores a .70, podrían estar indicando una buena confiabilidad y si su longitud fuera extensa, un valor de .70 podría no ser tan buen indicador de confiabilidad. Por ejemplo si tuviéramos un instrumento con 10 ítems y alpha = .60 y otro con 100 ítems y alpha = .80 y calculáramos para cada uno la correlación media inter-ítem. Esta sería para el primero de .1304 y para el segundo de .0385; de manera que, si bien el segundo tiene un coeficiente de confiabilidad mayor, atendiendo a la cantidad de ítems, en realidad es menos confiable que el primero, si consideramos la correlación media inter-ítem. Además se debería ser más exigente respecto a la

67

confiabilidad, si la prueba va a ser utilizada para tomar decisiones con fines psicodiagnósticos individuales, que si va ser utilizada grupalmente, para obtener con la misma, valores medios grupales.

De manera que, posiblemente, lo más recomendable al interpretar el coeficiente de confiabilidad sea considerar cuan próximo está al valor máximo (uno), evaluar el margen de error y considerar las distintas circunstancias que involucren el uso del instrumento y, fundamentalmente, tener en cuenta el número de ítems que contenga el instrumento.

En la práctica, es muy importante que los instrumentos sean confiables. Los tests son utilizados en diversas áreas y, en todos los casos, quien los utiliza supone que el mismo mide con precisión determinado atributo, éste es el sentido de su aplicación. Pero, si el instrumento es poco confiable y entonces poco preciso y se lo usara por éj., para una investigación, podría ocurrir, de no cumplirse las hipótesis planteadas, que esto se debiera no a defecto de las mismas, sino a error de los instrumentos de medición, por ser poco confiables. Además, si hubiera que tomar decisiones respecto de un caso individual y, como parte de los elementos de juicio se utilizara un test, el riesgo de tomar una decisión equivocada, se vería incrementado por la poca confiabilidad del instrumento. Además, la confiabilidad y validez tienen cierta relación entre sí. De manera que si un instrumento es poco confiable, esto podría afectar su validez.

Si un instrumento es poco confiable está midiendo, aparte del atributo que pretende medir, diversas variables que son fuente de errores aleatorios, lo cual distorsionaría la medición de la variable de interés. Ya que como sugieren Polit y Hungler (1995/1997) si el instrumento es errático, inconsistente e impreciso difícilmente pueda medir con validez el atributo en cuestión. Esto no quiere decir que si un instrumento tiene alta confiabilidad, eso signifique que tenga que ser válido; un instrumento puede ser confiable y al mismo tiempo no ser válido. Pero a la baja confiabilidad, se la puede relacionar con problemas de validez y, justamente, si la aplicación de un instrumento es para operacionalizar un constructo, el que tenga baja confiabilidad debe servir como un alerta respecto de la validez del mismo y a la conveniencia de aplicar el instrumento para medir el correspondiente atributo.

68

Estabilidad

Al analizarse la congruencia interna, en ningún momento se contemplaban las variaciones que podían darse en las medidas y la consecuente disminución de la confiabilidad, debidas al paso del tiempo. Al hablar de la estabilidad de un instrumento contemplamos este factor, y lo que se observa es en qué grado se obtienen las mismas medidas al aplicar dos veces el mismo instrumento, mediando entre ambas tomas un tiempo determinado. Entre ambas tomas pueden intervenir una serie de factores que sean fuentes de varianza de error, disminuyendo la confiabilidad de las medidas.

El procedimiento es relativamente sencillo, consiste en aplicar la misma prueba en dos momentos diferentes al mismo grupo de sujetos y luego, correlacionar entre sí, los puntajes obtenidos en cada toma. Esta correlación sirve para establecer la confiabilidad del instrumento.

En este caso no estamos hablando solamente de que las partes del test correlacionen en forma significativa. Ya que no se trata de comprobar la relación entre dos variables diferentes, en cuyo caso si bien sería importante la magnitud de la correlación, importaría que se pudiera comprobar que hubiera correlación. Además de que si fueran dos variables diferentes, no se esperaría necesariamente que la correlación fuera alta, ya que estarían presentes otras fuentes de variación, aparte de la varianza de error. En este caso es la aplicación del mismo test, o sea que las variables a relacionar son las mismas. De manera que en condiciones ideales, esperaríamos encontrar una correlación perfecta. Esto no ocurre, porque debido a los errores de medición (anteriormente mencionados), hay un porcentaje de error aleatorio, incluido en la medición. No obstante, la correlación debiera ser en estos casos alta, ya que se esperaría que estas fuentes de error se vieran minimizadas, y que en la aplicación del instrumento no se incurriera en errores sistemáticos.

Hay varias cuestiones que podrían afectar la confiabilidad en estos estudios test-retest:

• Modificaciones en la actitud de los sujetos respecto de la prueba o cambios en la

69

información que éstos manejen podrían afectar los puntajes de la segunda toma del test, incidiendo sobre los valores de correlación, ya sea incrementando artificialmente la confiabilidad o infravalorándola.

• Puede haber efectos derivados de la primera aplicación del test que afecten el rendimiento en el segundo. Por. éj., que algunos sujetos recuerden las respuestas y al contestar el segundo test tiendan a poner las mismas respuestas, no tanto por que se correspondan con su perfil en el atributo que se mide, sino por contestarlo igual. También en tests que midan aptitudes o destrezas los sujetos pueden ver condicionado su rendimiento por la práctica previa.

• Un tema de fundamental importancia es el lapso que medie entre ambas tomas. Un lapso demasiado breve podría incrementar el efecto distorsivo de la memoria y la práctica. Si bien esto se solucionaría incrementando el tiempo, esto a su vez produciría otro problema, la aparición de variables relacionadas con la maduración y la historia:

- La maduración que, según define Arnau Gras (1982), “abarca el conjunto de procesos biológicos y psicológicos que se operan en los sujetos como consecuencia del paso del tiempo.” Suele ser mucho más relevante si los sujetos son niños, ya que en ellos se pueden esperar cambios pronunciados en lapsos de tiempo breve.

- La historia incluye todos aquellos eventos que pudieran tener lugar en el lapso que medie entre ambas aplicaciones y que podrían llegar a afectar el resultado de la segunda prueba. Esto se manifestaría menos en atributos estables como rasgos de personalidad, que en aquellos que describieran estados. Por éj., si consideramos la variable ansiedad, la forma en que podría intervenir la historia produciendo modificaciones en los puntajes de la segunda toma, sería muy diferente si se tratara de un test que midiera la ansiedad como un rasgo de personalidad, en cuyo caso se esperaría que éste fuera estable y que no sufriera cambios por el paso del tiempo o que fueran ínfimos, que si se evaluara la ansiedad como estado, la cual puede sufrir cambios importantes con el transcurso del tiempo.

- En el caso de instrumentos que evaluaran psicopatologías, la historia podría afectar la

70

confiabilidad test-retest, principalmente en aquellas psicopatologías (de carácter neurótico), con altos índices de remisión espontánea, no tanto en aquellas con remisión espontánea baja o casi nula. Por ej, Eysenck (1977/1978) menciona que las fobias específicas

y

los

trastornos

obsesivocompulsivos,

muestran

una

recuperación

particularmente lenta, y posiblemente muy a menudo no haya ninguna recuperación sin tratamiento.

Uno de los problemas de las técnicas para evaluar la confiabilidad mediante test-retest es que pueden llegar a confundir las fluctuaciones aleatorias con cambios que se producen realmente en el atributo. Los cambios que se podrían producir en el atributo, modificarían (en aquellos sujetos en que se produjeran), los puntajes en el instrumento que se estuviera evaluando, con la consecuente disminución de la confiabilidad.

Pero en este caso la disminución de la confiabilidad sería ficticia, no se correspondería con errores aleatorios, sino con errores sistemáticos, los cuales no son de interés de la teoría de la fiabilidad. En este caso hablamos de errores sistemáticos desde el punto de vista de la confiabilidad, pero en otro sentido, representarían realmente varianza sistemática producida en la variable que evalúe el test. Por ejemplo: supongamos que se evaluara la confiabilidad de un test que midiera estado depresivo y algunos de los sujetos estuvieran en tratamiento por dicha psicopatología, o por otra. Ya sea en un caso directamente, o en el otro indirectamente, la intervención podría producir una modificación en el atributo (estado depresivo) y esto reduciría los valores de confiabilidad. Pero la disminución de los puntajes de depresión sería esperable como un efecto de la intervención terapéutica y de ninguna manera podría tomarse como un indicador real de problemas de confiabilidad del instrumento.

También podría ocurrir que el instrumento fuera utilizado para hacer un seguimiento de la evolución de pacientes o en investigaciones sobre eficacia terapéutica. En estos casos se esperaría una disminución de los puntajes como efecto del tratamiento e, idealmente, en la mayoría de los sujetos. Estos tampoco serían errores aleatorios, sino, sistemáticos y no serían representativos de la confiabilidad del instrumento.

Cabe aclarar, en este último caso, que no toda variación sistemática, tendría que afectar

71

necesariamente los valores de confiabilidad que se obtendrían sin esta variación. Si el efecto del tratamiento se cumpliera de manera que produjera una mejora en todos los sujetos y en el mismo grado, los valores de confiabilidad no se verían afectados por el tratamiento, ya que sería la misma que si este no hubiera tenido lugar, debido a que al ser la disminución idéntica para todos (en un valor constante), por éj., la puntuación del test disminuyera en todos los sujetos diez puntos, la correlación entre ambas pruebas sería la misma, que la que se hubiera obtenido si el tratamiento no hubiera tenido lugar. Lo que realmente afectaría la confiabilidad sería el efecto diferencial del tratamiento, ya que con el mismo, algunos tendrían una mejoría mayor que otros, algunos ninguna mejoría y algunos hasta podrían empeorar; este efecto dispar del tratamiento, alteraría el ordenamiento que los sujetos hubieran tenido sin él, y modificaría los valores de correlación. Esto último es lo que ocurre en la realidad, el primer caso que implica una modificación igual en todos los sujetos, es un caso ideal que no se corresponde con lo que realmente ocurre en un tratamiento.

Por tal motivo la aplicación de un tratamiento psicológico en algunos de los sujetos, entre las dos tomas de una investigación test-retest, de un instrumento que midiera psicopatología, podría afectar los valores de confiabilidad que se obtuvieran para dicho instrumento. Lo anterior, podría hacerse claramente extensivo, a las diversas técnicas psicométricas que miden distintas psicopatologías. Además es importante en estas pruebas conocer su estabilidad pues, de ser usadas, por éj., para ir evaluando un tratamiento a través del tiempo, sería fundamental saber cuanto afecta el paso del tiempo a la confiabilidad del mismo, principalmente cuando se use en la clínica, ya que en investigación el disponer de grupo control, permitiría un mejor manejo de ese problema.

Puede haber también otras fuentes de errores sistemáticos, que alteren los puntajes del test, sin modificar básicamente el atributo, como ser por éj., factores que modifiquen el contexto de la medida. Supongamos el siguiente ejemplo: un psicólogo aplica un test que mide Atención a un grupo de sujetos. Dos días más tarde les aplica de nuevo el mismo test, pero cambia el lugar donde lo hace, y en este lugar hay mayor cantidad de ruido ambiente. Es probable que el resultado en la prueba de atención sea mejor en la primera toma, ya que los sujetos estaban expuestos en menor medida a estímulos distractores que pudieran afectar su rendimiento.

72

En los ejemplos anteriores, podemos observar, como al introducir una variable en forma sistemática entre ambas aplicaciones del test, se podrían alterar los resultados obtenidos en la confiabilidad test-retest. En qué casos los efectos de la historia producirían una reducción ficticia de los valores de confiabilidad y en qué casos estarían afectando realmente la confiabilidad.

La diferencia que podemos marcar es la siguiente, en los ejemplos que dimos, la modificación en el contexto de medida y la intervención terapéutica, estamos frente a variables, a la que están expuestos todos los sujetos o una parte de ellos, y que producen un cambio sistemático, consistente en una reducción de los puntajes (en otros ejemplos podría haber sido un incremento), como una tendencia grupal; ya que como mencionamos con anterioridad tomando cada caso en particular el efecto podría ser diferente en cada sujeto, fundamentalmente en grado (en qué medida se produce la modificación) y en una minoría de casos en dirección (por éj., si la mayoría experimenta una reducción de los puntajes, algunos podrían mantener el mismo puntaje o incrementarlo).

Por el contrario, cuando hablamos de la historia, nos referimos a un conjunto amplio de variables, donde cada sujeto se ve expuesto a distintas variables y/o a combinaciones diferentes de las mismas, sin poder determinarse cual o cuales variables afectaron a cada uno y de que forma. Se podría producir un incremento en el error, pero sin poder determinar una fuente de error claramente identificable, o sea, que los cambios en los puntajes serían impredecibles e incontrolables y, en consecuencia, errores aleatorios.

Consideramos entonces, que los efectos no identificados derivados de la historia y que contribuyeran a la varianza de error, de producir un descenso en la correlación entre ambas tomas, constituirían un déficit real de confiabilidad del instrumento, que deberá ser contemplado, por ejemplo, cuando el instrumento se utilice para evaluar el transcurso de un tratamiento, como así también en otras aplicaciones del test. Por el contrario, las diferencias en las medidas, claramente atribuibles, a fuentes de variación sistemática, deberían ser controladas dentro de lo posible, para que no sean incluidas como déficit de confiabilidad.

73

Equivalencia

La técnica de equivalencia se aplica cuando se quiere determinar la confiabilidad de dos instrumentos que se consideran paralelos. Se trata de poder establecer la consistencia o equivalencia de los instrumentos, que suponen medir el mismo constructo, al aplicarlos a los mismos sujetos, Polit y Hungler (1995/1997). En este caso se aplican las dos formas del test en forma simultánea, se va variando el orden de presentación de las formas de sujeto en sujeto (para controlar posibles efectos de orden) y luego se correlacionan los puntajes de ambas formas.

De ser ambas formas equivalentes tendría que obtenerse un coeficiente de correlación elevado. En la práctica es muy difícil establecer que las formas sean realmente paralelas, por tal motivo suele tratárselas más bien como formas alternativas. A diferencia de las otras técnicas de confiabilidad, en ésta, no solo se establece la confiabilidad, respecto de la magnitud de los errores aleatorios, sino que también se establece cual es el grado de paralelismo que hay entre ambas formas. Aveces ambas formas no se aplican simultáneamente, sino que se deja transcurrir un tiempo entre ambas, de manera que la correlación que se obtendría serviría tanto para estimar la equivalencia como la estabilidad de las dos formas para medir el atributo.

Otra forma de equivalencia consiste en determinar la confiabilidad entre evaluadores u observadores. Esta forma de confiabilidad no se puede aplicar a cualquier instrumento, sino que es específica de aquellos instrumentos en los cuales dos o más evaluadores u observadores tienen que calificar o puntuar la conducta y/o el rendimiento como parte de la aplicación del instrumento. Cabe aclarar que, en este caso, estamos usando el término conducta en un sentido amplio, sin remitir únicamente a la conducta directamente observable. Por ej., si en la aplicación del instrumento, los sujetos se expresaran en un relato sobre ellos mismos, y debiera establecerse una valoración mediante evaluadores, de las conductas descriptas en estos relatos, sería muy importante poder determinar la concordancia entre distintos evaluadores. Hay que tener en cuenta que en estos casos los evaluadores son una importante fuente de error.

74

Para determinar la confiabilidad entre los evaluadores u observadores se usan índices de concordancia, como por ejemplo, el coeficiente Kappa de Cohen.

Validez

Habíamos comentado que los instrumentos tenían como propósito operacionalizar constructos, o sea, medir determinados atributos. La validez tiene que ver con poder determinar si el instrumento está midiendo realmente el atributo que dice medir.

Determinar la validez de un instrumento es mucho más difícil que establecer su confiabilidad. Como dicen Polit y Hungler (1995/1997), “no es común encontrar pruebas sólidas que sustenten la validez de la mayor parte de las mediciones de carácter psicológico”. Esto se debe a que mientras la confiabilidad sería esencialmente una cuestión empírica; la validez incluye más elementos teóricos, ya que la validación persigue la explicación, con todas las complicaciones que esto implica.

Dentro de los distintos tipos de validez, encontramos como las más importantes, las siguientes: validez de constructo, validez de criterio y validez de contenido. Es importante tener en cuenta que distintas formas de validez, pueden ser adecuadas para propósitos diferentes y que cada una permite inferencias distintas, que no pueden cambiarse entre sí.

Validez de contenido

Al construir un test, elegimos determinados ítems de un conjunto de conductas que tienen un interés específico, por suponer que remiten al atributo a ser evaluado por el test. En el instrumento no colocamos todas las conductas posibles, elegimos algunas de ellas, o sea, que hacemos una muestra de conductas. Al analizar la validez de contenido, lo que hacemos es evaluar si los ítems que hemos usado para construir el test, son relevantes para el uso que se le va a dar al test, es decir, si todos los ítems están dentro del dominio de interés. Una vez establecida la relevancia, lo que importa es saber si los ítems constituyen una muestra representativa del universo de conductas que podrían haberse elegido como indicadores del atributo en cuestión. La validez de contenido se centra en establecer de la mejor manera lo anterior.

75

Validez de criterio

Podemos decir que en el caso de la validez de criterio, lo que se persigue, es un fin más práctico, no se trata únicamente de establecer que se mida adecuadamente un constructo, sino fundamentalmente relacionar las puntuaciones del instrumento con otras variables a las que llamaremos criterio.

La validez de criterio nos es útil especialmente cuando deseamos hacer inferencias a partir de los puntajes que se obtienen en el test respecto de alguna otra variable de interés. Por ejemplo, si nos interesara establecer en que medida los puntajes obtenidos en la variable de personalidad Neuroticismo, nos permiten inferir la predisposición para adquirir determinadas conductas con características psicopatológicas, o en que medida pueden servirnos para predecir una mejor evolución terapéutica, o menores recaídas; relacionaríamos dicha variable de personalidad con los distintos criterios mencionados. Si lo que quisiéramos fuera establecer la validez de criterio de un test de inteligencia, podríamos usar algún indicador de rendimiento académico (por éj. notas escolares), como criterio, para relacionar con el test de inteligencia.

Dentro de la validez de criterio se habla de validez concurrente y validez predictiva. La diferencia entre ambas formas de validez, radica en la temporalidad del criterio. Si las puntuaciones del test se utilizan para predecir alguna medida del criterio que se va a realizar a futuro, sería validez predictiva. Si por el contrario relacionamos las puntuaciones del test con alguna medida del criterio tomada en el mismo momento sería validez concurrente. Por ejemplo, si aplicáramos el EPQ-A (Cuestionario de Personalidad de Eysenck para Adultos), y lo utilizáramos para predecir que pacientes depresivos, pasado un año, tendrán una mejor respuesta al tratamiento, sería validez predictiva. Si por el contrario aplicáramos el EPQ-Ay el Inventario de Depresión de Beck (como criterio), en forma simultánea, y relacionáramos los puntajes de ambos instrumentos entre sí, para analizar en qué medida el Neuroticismo puede predisponer a la adquisición de conductas depresivas, sería validez concurrente.

Nos parece conveniente aclarar lo siguiente: cuando hablamos de validez predictiva, no debemos confundir ésta con el poder predictivo propio de las investigaciones científicas. Si

76

de poder predictivo se trata, éste está presente, tanto en la validez predictiva como en la concurrente. Cuando se ha hecho un estudio de validez concurrente y se ha establecido que tal variable de un test correlaciona con tal criterio, estamos prediciendo esa correlación, y eso es poder predictivo. O sea, que la diferencia entre ambas formas de validez, no tiene que ver con si son predictivas o no (desde un punto de vista científico), sino más bien con el diseño que involucran en cuanto a su dimensión temporal. La validez concurrente implica un diseño transeccional o transversal, los cuales como bien mencionan Sampieri, Collado y Lucio (1997), “recolectan datos en un solo momento, en un tiempo único”; mientras que la validez predictiva implicaría un diseño prospectivo.

Validez de constructo

Gran parte de las variables psicológicas, no son observables directamente, o sea, que constituyen constructos hipotéticos, que forman parte de las diversas teorías que tratan de explicar la conducta humana. Estas variables al no poder ser observadas directamente, para toda investigación, deben ser operacionalizadas, o sea, indicarse los procedimientos de medida para observar la variable, hacerla empírica. Los instrumentos psicométricos se refieren a constructos hipotéticos, siendo el instrumento una forma de operacionalizar los mismos. De esta manera la validez de constructo, consiste en tratar de probar que las conductas que registra el test, pueden ser consideradas indicadores válidos del constructo al cual refieren.

Es importante tener en cuenta que en la validación de constructo, no se trata de hacer corresponder en forma única la puntuación del test con el constructo, ya que un mismo constructo, puede tener, varios indicadores, es decir, varias operacionalizaciones. De lo que se trata es de establecer que las puntuaciones del test constituyen en forma válida una de las manifestaciones del constructo. También hay que tener cuidado, en el sentido de que puede ocurrir, que en algunos casos, diferentes tests que tratan de medir el mismo atributo, no sean en realidad distintas operacionalizaciones del mismo constructo, sino constructos diferentes, lo cual dependerá de las características de la teoría en que cada uno esté inserto, y el grado de similitud entre las mismas.

La validez de constructo, es el principal tipo de validez y a su vez, la más difícil de

77

comprobar. Si queremos establecer que las conductas que registra el test, son indicadores válidos del constructo, tendremos que considerar que sólo podremos aproximar a ese objetivo. Ya que suponer que se puede comprobar que un término conceptual, se corresponde exactamente con un término empírico, implicaría negar la diferencia de niveles entre ambos, que prácticamente imposibilita comprobar una correspondencia exacta. Con esto no queremos decir que ambos términos no puedan corresponderse exactamente, sino que no podríamos justificarlo. Solo aportar una serie de evidencias, más o menos convincentes que apunten en ese sentido.

Además, en este caso, lo que cuenta no son tanto cuestiones de utilidad en la aplicación del instrumento, las cuales eran importantes en la validez de criterio, sino el atributo que subyace a las conductas observables del test. O sea, que la cuestión es eminentemente teórica, y comporta gran parte de los problemas que podemos encontrar en la justificación de teorías.

Lo que importaría en este caso, si tomamos por ejemplo la variable Neuroticismo medida por el EPQ-A, no sería tanto si las puntuaciones de Neuroticismo pueden servir para establecer predisposición para la adquisición de determinadas psicopatologías. Lo que se consideraría más relevante sería establecer si este factor que mide el test se corresponde con el constructo Neuroticismo, ubicado en la teoría de la Personalidad de Eysenck, de la cual se deriva el instrumento al que nos referimos.

Hay distintos procedimientos para evaluar la validez de constructo, mencionaremos algunos de ellos:

• Análisis factorial:

Esta forma de evaluar la validez se utiliza cuando el test está dividido en factores y sirve para medir la validez de constructo, debido a que desde la teoría del instrumento se plantean los distintos factores como atributos diferenciados. Para comprobar la validez de constructo

(factorial)

se

utiliza

el

Análisis

factorial.

Esta

técnica

analiza

las

intercorrelaciones de un conjunto de datos, para establecer determinadas agrupaciones de ítems correlacionados entre sí, las cuales remiten a factores subyacentes, que no son

78

observables, o sea que constituyen distintos constructos. Estos constructos forman parte de la teoría del test. El análisis factorial, se utiliza no solo para evaluar la validez del instrumento, sino también en su construcción. Una vez construido el test y establecidos los correspondientes factores, la técnica puede aplicarse sobre los datos obtenidos a partir de una muestra de sujetos para establecer si la estructura factorial planteada, puede ser replicada, lo cual nos permitiría hablar de la validez factorial del instrumento.

Hay que aclarar al respecto que, en general, las estructuras factoriales pueden tender a ser inestables y dependen mucho del tamaño de la muestra. El tamaño necesario depende en parte de la cantidad de ítems involucrados en el análisis y hay diferentes criterios para establecer el número de sujetos indicado. Uno de los criterios, es que el número de sujetos no sea menor a cinco veces la cantidad de ítems del instrumento. Aún con este número de sujetos las estructuras factoriales pueden seguir siendo inestables, y no es sencillo replicar exactamente las mismas, máxime cuando el instrumento se aplica en un país o cultura diferente a aquella en que ha sido construido.

Por tal motivo, consideramos, que al replicar la estructura factorial, deberíamos considerar la validez factorial, como una cuestión de grado, desde una replica perfecta, hasta la obtención de una estructura de los factores, por lo menos similar a la original. De todos modos, cuando la estructura factorial, no es exactamente igual, pero guarda suficiente similitud con la predicha, tenemos la opción de considerar que el instrumento tiene validez factorial y aplicarlo tal cual, o introducir modificaciones acordes con los datos obtenidos en el nuevo análisis factorial, tratando de preservar mayormente las características originales del test. Esta última opción nos parece la más adecuada, principalmente si el test se está validando en un contexto diferente al de su construcción original y se dispone de los medios para hacer la adaptación correspondiente.

• Diferenciación entre grupos:

Se aplica el instrumento a dos o más grupos, los cuales debieran diferir en el atributo que se mide, en razón de alguna característica que se usó para formar los grupos, y que se podría inferir a partir de la teoría del constructo que mide el instrumento, que dicha característica estaría relacionada con diferencias predecibles en el atributo.

79

Como ejemplifica Martínez Arias (1996): Si tenemos un test que mide inteligencia, teniendo en cuenta que las habilidades cognitivas varían con la edad, podríamos formar grupos de distintas edades, de acuerdo a las diferencias cognitivas que fueran esperables, y esperaríamos encontrar diferencias entre los grupos en cuanto al nivel de inteligencia que mide el test.

• Correlaciones con otras medidas del constructo:

Cuando ya existe otro test ya validado que mide el mismo constructo, o varios tests, se puede correlacionar el nuevo con aquél, o con los varios tests ya existentes, para establecer su validez de constructo. Este procedimiento, depende de que exista, por lo menos un test, con un constructo idéntico o muy similar, al que se intenta validar.

• Las Matrices multimétodo-multirasgo:

Para poder aplicar esta técnica se precisa que existan como mínimo dos métodos diferentes para medir el constructo que se va a validar. También se necesitan otros constructos que puedan ser medidos por los mismos métodos. Se miden en los sujetos de la muestra los distintos constructos con métodos diferentes. Se calculan las correlaciones entre todas las medidas y se forma con ellas una matriz que contendría los siguientes datos:

- Coeficientes de fiabilidad: serían las correlaciones obtenidas entre medidas del mismo constructo con el mismo método. Se espera que sean elevados.

- Coeficientes de validez convergente: son las correlaciones entre las medidas del mismo constructo, obtenidas con métodos diferentes. Se espera que las correlaciones sean altas.

- Coeficientes de validez divergente: son las correlaciones de constructos diferentes medidos con igual método y las correlaciones de diferentes constructos medidos con distintos métodos. Se espera que sean mucho más bajas que las obtenidas en la validez convergente y en el cálculo de la confiabilidad.

80

Conclusiones

La falta de confiabilidad de un instrumento, por lo general, afecta la validez de alguna forma, pero esto no significa que pueda tomarse entonces la confiabilidad como un indicador de validez, ya que un test podría tener muy alta confiabilidad y no por eso que esa medida sea válida, es decir, que esté midiendo el atributo que se espera.

Tanto la validez como la confiabilidad, son importantes, porque es relevante que un instrumento sea lo más exacto posible, que contenga el menor número de errores; pero de qué nos sirve la precisión, que el instrumento tenga escaso margen de errores aleatorios, si lo que mide no es lo que suponemos, o sea, que no está midiendo la variable que realmente nos interesa medir. Por este motivo el test debe tener para ser adecuado, confiabilidad y también validez.

Consideramos que hay dos aspectos para pensar los análisis de validez: 1) desde un punto de vista teórico, o 2) con un sentido esencialmente práctico, focalizado en la utilidad del instrumento.

Desde un punto de vista teórico, nos interesa fundamentalmente la relación del instrumento con el constructo y las cuestiones relacionadas con la teoría que incluye al constructo, en cuanto a las hipótesis que pudieran derivarse de la misma para someter a prueba al instrumento mediante dichas hipótesis.

Si la validez la pensamos con un sentido práctico, no importaría tanto el constructo que se mide, como los resultados empíricos obtenidos y sus posibles aplicaciones. De esta manera podemos hablar de que un instrumento sea válido, pero también de que sea útil. Por éj, si un instrumento tuviera claro poder predictivo, que pudiera derivarse en aplicaciones útiles (establecidas a través de la validez de criterio); si no pudiera demostrarse con claridad su validez de constructo, ¿eso invalidaría su uso práctico? Seguramente que no.

En el caso del constructo, estaríamos en el orden de lo explicativo y esto sirve

81

fundamentalmente para generar nuevas ideas y, para mejorar la capacidad de predecir, ya que la explicación, implica necesariamente la predicción. Ahora, como ocurre en la ciencia en general, podemos tener poder predictivo, en ausencia de poder explicativo y eso no quita que ese poder predictivo, nos permita generar aplicaciones útiles.

Las investigaciones de validez nos proporcionan información, que al estar corroborada, nos permite avanzar hacia resultados con aplicaciones prácticas. Interesa establecer la validez relacionada con el constructo, pero sin perder de vista las investigaciones de validez que derivan en usos prácticos.

Podemos establecer un paralelismo, entre la investigación en psicometría y la investigación psicológica en general. Las formas y procedimientos de investigar en psicometría, no debiéramos considerarlos como absolutamente específicos de la misma.

En general la psicometría encuadra en métodos de investigación generales, por éj., la confiabilidad por test- retest, puede ser equiparada a un diseño longitudinal de panel, la validez predictiva con diseños prospectivos y la concurrente con diseños transversales.

En general la metodología usada es correlacional, pero no es la única posible. El constructo forma parte de teorías. De estas teorías se pueden derivar hipótesis, que al ser sometidas a prueba, aportan a la validez de criterio y/o a la de constructo, pero que en definitiva, también sirven para enriquecer el campo de conocimiento a que se refieren, más allá de la psicometría. En dichas investigaciones, al plantearse hipótesis funcionales, podrían haberse usado, tanto diseños experimentales, como diseños de grupos naturales, formados a partir de las medidas obtenidas en algún instrumento.

O sea, que investigaciones realizadas con fines estrictamente psicométricos de análisis de validez, pueden aportar a diversas áreas de conocimiento, y al mismo tiempo, investigaciones no realizadas con fines psicométricos de validación, sino de investigación en áreas diversas de la psicología, pueden aportar a los estudios de validez, al elegir instrumentos psicométricos como formas de operacionalización de las variables en estudio. Por ej., si hiciéramos un estudio sobre como ciertos factores de personalidad pueden intervenir facilitando o dificultando la evolución terapéutica en determinada

82

psicopatología, puede ser que la investigación se hiciera dentro de estudios sobre personalidad o en estudios clínicos y no como un análisis de validez, pero si en la operacionalización de la personalidad utilizamos una técnica psicométrica, el mismo estudio podría considerarse como un estudio de validez. No debemos olvidar que los tests operacionalizan variables y que estas formas de operacionalizar, son sumamente prácticas, motivo por el cual se utilizan en las áreas de investigación más diversas, al igual que en las más variadas aplicaciones, tanto clínicas, como en psicología laboral, en educación, etc. Esto da la razón de ser de la técnica, que en última instancia es creada para ser utilizada en investigación, o en distintas áreas de la psicología y crea un nexo indubitable entre la investigación psicométrica y la investigación psicológica en general.

Las distintas formas de validez, se encuentran muy relacionadas entre sí y, muchas veces, no diferenciadas claramente. Por ejemplo, una investigación sobre validez predictiva puede aportar a la validez de constructo, en la medida que la predicción pudo haberse deducido de la teoría que incluye al constructo. Consideramos entonces, que quizá, una diferenciación más clara, sea la que pase no tanto por las características de la investigación, sino por el propósito con que se la utilice. Si se la utiliza para analizar o justificar cuestiones teóricas relacionadas con el constructo, sería validez de constructo; si el propósito con el que se la realiza es establecer la utilidad del instrumento en aplicaciones prácticas o para corroborar hipótesis que vinculan el constructo con otras variables, sería validez de criterio.

Si bien en las técnicas psicométricas la validez y la confiabilidad son esenciales, no es menos cierto que, en cual de estas cuestiones o en que tipos de validez y confiabilidad se deba poner mayormente el énfasis, o en que elementos de los estudios se deba reparar especialmente y bajo que perspectiva, depende mucho, del instrumento que se vaya a utilizar, del propósito que se persiga y del contexto en que se piense emplear.

Por último, digamos que el uso adecuado de una técnica psicométrica, no se reduce a conocer como se aplica a los sujetos. Sino que fundamentalmente se trata de poder interpretar lo más correctamente posible las puntuaciones obtenidas. Para lo cual se requiere, conocer bien sobre validez y confiabilidad, en general y en particular sobre el test que se desee aplicar. Además de conocer lo más posible la teoría de la cual se derive el

83

instrumento, lo cual nos va a permitir establecer relaciones teóricas del instrumento con otras variables relevantes y poder extraer de su aplicación la mejor información que redunde en variados y útiles usos prácticos.

Bibliografía

Arnau Gras, J. (1982). Psicología experimental. México: Editorial Trillas.

Eysenck, H. J. (1978). Usted y la neurosis. Buenos Aires: Editorial Abril.

Martinez Arias, R. (1996). Psicometría: Teoría de los tests psicológicos y educativos. Madrid: Editorial Síntesis.

Morales, P. (1988). Medición de actitudes en Psicología y Educación. Construcción de escalas y problemas metodológicos. San Sebastián: Editorial Tarttalo en colaboración con la Universidad de Comillas.

Polit, D. F. y Hungler, B. P. (1997). Investigación científica en Ciencias de la Salud (5º ed). México: McGraw –Hill Interamericana.

Sampieri, R. H., Collado, C. F. y Lucio, P. B. (1997). Metodología de la Investigación. Colombia: McGraw-Hill.

Articulo tomado de: http://www.uces.edu.ar/publicaciones/archivos/revista_subjetividad/numero8/1533.pdf

84

UNIDAD DIDÁCTICA II APROXIMACIÓN AL USO DE PRUEBAS ESTANDARIZADAS Evaluación de la Personalidad En algunos aspectos, medir la personalidad, se asemeja mucho a evaluar la inteligencia, En uno u otro caso se intenta cuantificar algo que no podemos ver ni tocar, y en ambos casos una buena prueba ha de ser confiable y valida a la vez. Al evaluar la personalidad, no nos interesa la mejor conducta, lo que queremos averiguar es la conducta típica del sujeto, es decir, como suele comportarse en situaciones ordinarias. En la intrincada tarea de medir la personalidad los psicólogos recurren a cuatro instrumentos

básicos:

la

entrevista

personal,

la

observación

directa

del

comportamiento, los test objetivos y los test proyectivos. Cada ves que un psicólogo se enfrenta a la difícil tarea de medir la personalidad de un individuo, asumen un reto ya que la personalidad es algo que ellos no pueden ni ver ni tocar, pero que saben que esta presente en cada una de las persona, y tratar de ver como es la personalidad de un individuo en particular no es tarea fácil para los mismos. Para ilustrar esta temática veremos tres instrumentos, dos de carácter objetivo y uno proyectivo. CUESTIONARIO DE LA PERSONALIDAD 16 PF

FICHA TÉCNICA

Nombre original :

"Sixteen Personality Factor Questionnaire (16 PF)". Institute for

Personality and Ability Testing, Champaign, Illinois, U.S.A.

85

Autor:

R.B. Cattell.

Nombre en la Adaptación Española: Cuestionario de Personalidad 16 PF.

Adaptación Española: Sección de Estudios de TEA Ediciones, S.A. Madrid, 1.975.

Administración: Individual y Colectiva.

Duración:

Variable, 45 a 60 minutos.

Aplicación:

Adolescentes y Adultos, con un nivel cultural equivalente al de la Enseñanza Media para las Formas A Y B.

Significación: Apreciación de dieciséis rasgos de primer orden y cuatro de segundo orden de la personalidad; posible medida de la distorsión motivacional en las Formas A, C y D, y de la Negación en la Forma A.

Material: Manual, Cuadernillos, Hojas de respuestas y plantillas de corrección.

El Cuestionario de Personalidad de 16 Factores es un instrumento de valoración objetiva, elaborado mediante investigación psicológica con el fin de ofrecer en el menor tiempo posible una visión muy completa de la personalidad.

El 16 PF se diseño para ser aplicado a sujetos de 16 años en adelante y existen en uso o en preparación, seis formas diferentes; la C y la D están destinadas a sujetos con formación medio-baja; la A y la B para personas con nivel de formación igual o superior al de bachillerato superior. Las restantes formas del cuestionario E y F, están proyectadas para sujetos que presentan algún déficit en su formación y nivel de comprensión lectora.

86

La visión global de la personalidad que intenta el 16 PF se basa en la evaluación de 16 dimensiones funcionalmente independientes y psicológicamente significativas, aisladas y definidas repetidamente durante más de treinta años de investigaciones factoriales, en grupos de sujetos normales y clínicos.

Los rasgos de personalidad evaluados por el 16 PF no están únicamente aislados y definidos por el Cuestionario, sino que se encuadran dentro del contexto de una teoría general de la personalidad; la primera publicación comercial de la prueba (1949) fue precedida de una fase de cerca de diez años de investigación empírica factorial.

Las dimensiones del 16 PF se especifican y definen brevemente más adelante; los factores, identificados por letras, se describen en sus dos polos o extremos mediante una denominación técnica y unos cuantos adjetivos de uso corriente.

Además de los 16 factores primarios mencionados, el cuestionario puede evaluar ocho dimensiones secundarias que, como se indica posteriormente, son rasgos más amplios, obtenidos a partir de los factores primarios.

INSTRUCCIONES PARA LA APLICACIÓN

Las contestaciones se recogen en una Hoja de respuestas separada, nunca sobre el mismo Cuadernillo. En primer lugar se le pide al sujeto que anote los datos de identificación (apellidos, nombre, edad, etc.), en la parte superior de la Hoja de Respuestas. A continuación se le indica que lea, a la vez que lo hace el examinador en voz alta, las instrucciones de la portada del Cuadernillo y conteste en la Hoja a los cuatro ejemplos que se proponen.

87

En ocasiones es preferible leer y discutir con el sujeto ciertos puntos de las instrucciones, aunque el examinador debe ser siempre juez crítico en cualquier situación particular. Para contestar en la Hoja y señalar sus respuestas, el sujeto debe colocar la Hoja de forma apaisada; el espacio dedicado a los cuatro ejemplos de entrenamiento se encuentran en la parte superior, fuera del recuadro dedicado a los elementos, y éstos están dispuestos en forma de columnas, una para cada página del Cuadernillo.

Es probable que ayude al examinado conocer este diseño intencional en columnas, de modo que al final de cada columna y página tenga un control de que viene contestando a cada elemento en el lugar correspondiente.

Aunque el Cuestionario no tiene un tiempo limitado, es preferible recordarles que no deben entretenerse demasiado en cada cuestión, sino contestar de un modo natural, sincero y rápido.

Terminada la aplicación se recoge la Hoja de respuestas y el Cuadernillo, comprobando si se han anotado bien los datos de identificación y si se ha dado una y sólo una respuesta a cada cuestión.

NORMAS PARA LA CORRECCIÓN Y PUNTUACIÓN

Las hojas de respuestas pueden ser corregidas manualmente. Cada respuesta puede recibir 2, 1 ó 0 puntos, excepto en el factor B (Inteligencia), cuyas contestaciones reciben 1 ó 0 puntos. La puntuación de cada elemento contribuye sólo a un factor o escala (excepto en DM de la Forma A).

La utilización de la plantilla, preparada al efecto, facilita la corrección manual; en ella se pueden obtener las puntuaciones directas en los 16 factores. Basta

88

colocarla sobre la hoja de respuestas de modo que por los espacios transparentes de referencia - en la parte izquierda y fuera del recuadro dedicado a las contestaciones - aparezcan las estrellas superior e inferior de la hoja.

Cada una de las escalas ocupa en la plantilla una zona aproximadamente horizontal, separada por líneas y claramente diferenciadas. La puntuación directa de cada escala se puede hallar comenzando por la izquierda y sumando los puntos obtenidos por las contestaciones del sujeto que aparezcan a través de los espacios transparentes; al terminar en el margen derecho de la plantilla, se anota el resultado en la casilla existente en el margen derecho de la hoja de respuestas.

FIABILIDAD

La consistencia de las 16 escalas, puede mostrarse de muy diferentes modos. El primer tipo de consistencia es la fiabilidad o concordancia de los resultados a través del tiempo. La fiabilidad puede, a su vez, subdividirse en:

a. Coeficiente de permanencia o correlación test-retest en dos ocasiones distintas separadas por un pequeño intervalo de tiempo;

b. Coeficiente de estabilidad o correlación test-retest con un intervalo de tiempo más largo.

En diferentes aplicaciones de 16PF de diversas formas o diversas combinaciones se ha encontrado coeficientes de permanencia entre 0,70 y 0,90 aproximadamente. En todos los casos, el retest se realizo dentro de la semana siguiente a la primera aplicación. En otras aplicaciones, igualmente se han encontrado coeficientes de estabilidad del orden del 0,71 y 0,88 con muestras de 132 personas y con un intervalo de tiempo de 2 meses. Los coeficientes de estabilidad más bajos se

89

presentan en aplicaciones test-retest con intervalos de 4 años con valores entre 0,41 y 0,64.

VALIDEZ

El concepto de validez exige la elección de los elementos que sean buenas medidas de los factores de personalidad tal como estos factores son definidos por los estudios de investigación. Este concepto de validez de las escalas puede evaluarse directamente correlacionando las puntuaciones directas con los factores puros. En aplicaciones de diversas formas de PF16 se ha encontrado que la validez es mayor cuando se combinan las Formas y los índices son relativamente elevados, incluso en las escalas que contienen menos elementos.

El concepto de validez también puede evaluarse indirectamente determinando en que grado las correlaciones obtenidas entre las escalas del 16 PF y un grupo representativo de variables psicológicas diversas, están de acuerdo con aquellas que se esperaría obtener a partir de los criterios conceptuales o factores puros. Para ello, en una aplicación de las formas A, B, C y D a 606 varones y mujeres se encontró coeficientes de validez entre 0.90 y 0,96.

En ambas estimaciones de la validez, directa e indirecta, se encuentra gran congruencia. En ambos estudios los índices más elevados son obtenidos por las escalas A y F, y los más bajos por las escalas M, N, O y Q1.

NORMAS INTERPRETATIVAS

CONVERSIÓN DE PUNTUACIONES DIRECTAS EN DECATIPOS

El significado de las puntuaciones directas de una forma o combinación de formas del 16 PF depende, naturalmente, de la forma o formas utilizadas.

90

Consecuentemente, antes de que las puntuaciones directas puedan ser evaluadas e interpretadas, deben convertirse a una escala común y única que sitúe la puntuación del sujeto (adolescentes, universitario o de la población general adulta) en relación con las obtenidas por un grupo normativo y definido de la población. Las tablas construidas en la tipificación permiten la conversión de las puntuaciones directas en otras denominadas decatipos, una escala típica de diez puntos que ha mostrado en la práctica un grado bastante bueno, en la discriminación de los resultados.

Los decatipos se distribuyen sobre una escala de diez puntos equidistantes en unidades típicas (supuesta la distribución normal), con una media en el decatipo 5,50 y una desviación de 2 decatipos. Así, pues, los decatipos 5 y 6 se extienden, respectivamente, a media desviación típica a ambos lados de la media, y comprenden el grupo central de la población, mientras que los extremos superior del decatipo 10 e inferior del decatipo 1 se encuentran a dos y media desviaciones típicas a ambos lados de la media.

Se puede, por tanto, considerar que los decatipos 5 y 6 son valores medios, 4 y 7 muestran una pequeña desviación (en una y otra dirección, respectivamente), 2-3 y 8-9 indican una gran desviación, y 1 y 10 son valores extremos, entendiendo todas estas posiciones como relativas a la población especifica sobre la cual se realizó la tipificación.

La selección del baremo adecuado permite obtener los decatipos correspondientes a las puntuaciones directas alcanzadas por cualquier sujeto en las 16 escalas. Las tablas cubren, para cada una de las formas del cuestionario, las poblaciones adolescentes y adultos de uno y otro sexo. Para su elaboración, se han conjugado los criterios de significación estadística y de utilización práctica. El Psicólogo debe

91

elegir aquel baremo que mejor se ajuste a los sujetos examinados y a la finalidad de su estudio.

INTERPRETACIÓN

Cada uno de los factores primarios evaluados por el 16 PF tiene una denominación alfabética (desde A a Q ) y un 4 nombre técnico. La definición e interpretación de los mismos, tal como se presenta en los párrafos siguientes, es breve, no técnica y, naturalmente, menos exacta que la descripción critica y más profunda que presenta el "Handbook" u otras obras similares; si el Psicólogo desea profundizar mas en el significado y operatividad de los factores debería examinar los numerosos perfiles estudiados en el "Handbook" para grupos clínicos o profesionales bien definidos.

En las siguientes descripciones interpretativas de las puntuaciones bajas (decatipos 1-3) y altas (decatipos 8-10) el nombre técnico se incluye entre paréntesis; previamente se da una breve definición menos técnica, con varios adjetivos descriptivos que suelen utilizarse frecuentemente en la práctica.

FACTOR A

PUNTUACIONES BAJAS (1-3)

Reservada, alejada, crítica, fría. (Sizotimia)

La persona que puntúa bajo tiende a ser dura, fría, escéptica y a mantenerse alejada. Le gustan más las cosas que las personas, trabajar en solitario y evitar las opiniones comprometidas. Suele ser precisa y rígida en su manera de hacer las cosas y en sus criterios personales, rasgos que son deseables en muchas ocupaciones. En ocasiones puede ser crítica, obstaculizadora e inflexible.

92

PUNTUACIONES ALTAS (8-10)

Abierta, afectuosa, reposada, participativa. (Afectotimia)

La persona que puntúa alto tiende a ser afable, reposada, emocionalmente expresiva (de aquí el polo de afectotimia), dispuesta a cooperar, solícita con los demás, bondadosa, amable y adaptable. Le gustan las ocupaciones que exijan contactos con la gente y las situaciones de relación social. Fácilmente forma parte de grupos activos, es generosa en sus relaciones personales, poco temerosa de las críticas y bastante capaz de recordar los nombres de las personas.

FACTOR B

PUNTUACIONES BAJAS (1-3)

Inteligencia baja, pensamiento concreto. (Poca capacidad mental para los estudios)

La persona que puntúa bajo tiende a ser lenta para aprender y captar las cosas; corta e inclinada a interpretaciones concretas y literales. Su cortedad puede ser debida a una escasa capacidad intelectual o a la influencia de factores psicopatológicos que limitan su actuación.

PUNTUACIONES ALTAS (8-10)

Inteligencia alta, pensamiento abstracto, brillante. (Mucha capacidad mental para los estudios).

93

La persona que puntúa alto tiende a ser rápida en su comprensión y aprendizaje de las ideas. Existe alguna relación con el nivel cultural y con la viveza mental. En una situación de diagnóstico psicopatológico, estas puntuaciones altas contraindican la existencia de un deterioro mental.

FACTOR C

PUNTUACIONES BAJAS (1-3)

Afectada por los sentimientos, poco estable emocionalmente, turbable. (Poca fuerza del ego)

La persona que puntúa bajo tiende a presentar poca tolerancia a la frustración; cuando las condiciones no son satisfactorias es voluble, plástica, evade las necesidades y llamadas de la realidad, neuróticamente fatigada, displicente, de emoción y turbación fácil, activa cuando se encuentra insatisfecha; presenta síntomas neuróticos (fobias, alteraciones del sueño, quejas psicosomáticas, etc). Estas puntuaciones bajas son comunes a casi todas las formas de alteraciones neuróticas y a algunas psicóticas.

PUNTUACIONES ALTAS (8-10)

Emocionalmente estable, tranquila, madura, afronta la realidad. (Mucha fuerza del ego)

La persona que puntúa alto tiende a ser emocionalmente madura, estable, realista acerca de la vida, tranquila, con buena firmeza interior y capacidad para mantener una sólida moral de grupo. A veces puede presentar ajustes conformistas en el caso de problemas no resueltos.

94

FACTOR E

PUNTUACIONES BAJAS (1-3)

Sumisa, débil, acomodaticia, conformista. (Sumisión)

La persona que puntúa bajo tiende a ceder ante los demás, a ser dócil, y a conformarse. Es, a menudo, dependiente, acepta las ideas de los otros, y se muestra ansiosa por una exactitud obsesiva. Esta pasividad es parte de muchos síndromes neuróticos.

PUNTUACIONES ALTAS (8-10)

Dominante, independiente, agresiva, competitiva, obstinada. (Dominancia)

La persona que puntúa alto es dogmática, segura de sí misma, de mentalidad independiente. Tiende a ser austera, autoreguladora, hostil y extrapunitiva, autoritaria (en el manejo de los demás), y a hacer caso omiso de toda autoridad.

FACTOR F

PUNTUACIONES BAJAS (1-3)

Sobria, prudente, seria, taciturna. (Desurgencia)

La persona que puntúa bajo tiende a ser reprimida, reticente, introspectiva. A veces es terca, pesimista, indebidamente cauta; es considerada por los demás como

95

presumida y estiradamente correcta. Suele ser una persona sobria y digna de confianza.

PUNTUACIONES ALTAS (8-10)

Descuidada (confiada a la buena ventura), animada e impulsiva, entusiasta. (Surgencia)

La persona que puntúa alto tiende a ser jovial, activa, charlatana, franca, expresiva, acalorada y descuidada. Frecuentemente se le escoge como líder electo. Puede ser impulsiva y de actividad imprevisible o cambiante.

FACTOR G

PUNTUACIONES BAJAS (1-3) Despreocupada, evita las normas, acepta pocas obligaciones. (Poca fuerza del superego)

La persona que puntúa bajo suele ser inestable en sus propósitos. Sus acciones son casuales y faltas de atención a los compromisos del grupo y las exigencias culturales. Su alejamiento de la influencia del grupo puede llevarle a actos antisociales, lo cual le hace ser más efectiva, a la vez que su negativa de sujeción a las normas le permite tener menos conflictos somáticos en situaciones de tensión.

PUNTUACIONES ALTAS (8-10)

Escrupulosa (consciente), perseverante, sensata, sujeta a normas. (Mucha fuerza del superego)

La persona que puntúa alto tiende a ser de carácter exigente, dominada por el

96

sentido del deber, perseverante, responsable, organizada, y 'no malgasta un minuto'. Normalmente es escrupulosa y moralista. Más que a tipos graciosos prefiere como compañeros a personas trabajadoras. Hay que distinguir el íntimo 'imperativo categórico' de este superego esencial (en el sentido sicoanalítico), del 'yo social ideal' del Q3 aparentemente similar. FACTOR H

PUNTUACIONES BAJAS (1-3) Cohibida, reprimida, tímida, falta de confianza en sí misma. (Trectia)

La persona que puntúa bajo suele ser tímida, alejada, cautelosa, retraída, que permanece al margen de la actividad social. Puede presentar sentimientos de inferioridad. Tiende a ser lenta y torpe al hablar y expresarse, no le gustan las ocupaciones con contactos personales. Más que un grupo amplio, prefiere uno o dos amigos íntimos, y no es dada a mantenerse en contacto con todo lo que está ocurriendo a su alrededor.

PUNTUACIONES ALTAS (8-10) Emprendedora, socialmente atrevida, espontánea, no inhibida (Parmia)

La persona que puntúa alto tiende a ser sociable, atrevida, dispuesta a intentar nuevas cosas, espontánea, de numerosas respuestas emocionales. Su indiferencia (falta de vergüenza) le permite soportar sin fatiga el 'toma y daca' del trato con la gente y las situaciones emocionales abrumadoras. Sin embargo, puede despreocuparse por los detalles, e invertir mucho tiempo charlando. Tiende a ser emprendedora y estar activamente interesada por el otro sexo.

97

FACTOR I

PUNTUACIONES BAJAS (1-3)

Sensibilidad dura, confiada en sí misma, realista (Harria)

La persona que puntúa bajo tiende a ser práctica, realista, varonil, independiente, responsable y, a la vez, escéptica de las elaboraciones culturales subjetivas. A veces es inamovible, dura, cínica, pagada de sí misma. Tiende a mantener el grupo trabajando sobre unas bases prácticas, realistas y acertadas.

PUNTUACIONES ALTAS (8-10)

Sensibilidad blanda, dependiente, impresionable, superprotegida. (Premsia)

La persona que puntúa alto suele dejarse afectar por los sentimientos, idealista, soñadora, artista, descontentadiza femenina. A veces solicita para sí la atención y ayuda de los otros; es impaciente, dependiente, poco práctica. Le disgustan las personas y profesiones rudas. Suele frenar la acción del grupo y turbar su moral con actividades inútiles e idealistas.

FACTOR L

PUNTUACIONES BAJAS (1-3)

Confiable, adaptable, no afectada por los celos o envidia, de trato fácil. (Alaxia)

98

La persona que puntúa bajo suele no presentar tendencia a los celos o envidia; es adaptable, animosa, no competitiva, interesada por los demás, buena colaboradora del grupo.

PUNTUACIONES ALTAS (8-10) Suspicaz, engreída, difícil de engañar. (Protensión)

La persona que puntúa alto suele ser desconfiada y ambigua. A menudo se encuentra complicada con su propio yo, le gusta opinar sobre sí misma, y está interesada en la vida mental íntima. Suele actuar con premeditación, es despegada de los otros y colabora deficientemente con el grupo.

NOTA: Este Factor no es necesariamente 'Paranoia'; de hecho, los datos de los esquizofrénicos paranoicos no son tan claros como cabría esperar a partir de los valores típicos del Factor L.

FACTOR M

PUNTUACIONES BAJAS (1-3)

Práctica, cuidadosa, convencional, regulada por realidades externas, formal y correcta. (Praxernia)

La persona que puntúa bajo suele mostrarse ansiosa por hacer las cosas correctamente, atenta a los problemas prácticos y sujeta a los dictados de lo que es evidentemente posible. Se preocupa por los detalles, capaz de serenidad en situaciones de emergencia, aunque a veces es poco imaginativa.

99

PUNTUACIONES ALTAS (8-10)

lmaginativa, centrada en sus necesidades íntimas, abstraída, despreocupada de los asuntos prácticos.

(Autia) La persona que puntúa alto tiende a ser poco convencional, despreocupada de lo cotidiano, bohemia, motivada por si misma, creadora, imaginativa, preocupada por lo 'esencial' y despreocupada de las personas particulares y la realidad física. Sus intereses, dirigidos hacia su intimidad, la llevan a veces a situaciones irreales, con explosiones expresivas. Su individualidad le empuja a verse excluido de las actividades del grupo.

FACTOR N

PUNTUACIONES BAJAS (1-3)

Franca, natural, sencilla, sentimental. (Sencillez)

La persona que puntúa bajo suele ser sencilla, sentimental, llana, poco sofisticada. Se le satisface fácilmente y se muestra contenta con lo que le acontece; es natural, espontánea, poco refinada y torpe.

PUNTUACIONES ALTAS (8-10) Astuta, calculadora, mundana, perspicaz. (Astucia) La persona que puntúa alto suele ser refinada, experimentada, mundana y astuta. A menudo es 'cabeza dura' y analítica. Su enfoque es intelectual y poco sentimental, aproximándose a las situaciones de una manera casi cínica.

100

FACTOR O

PUNTUACIONES BAJAS (1-3)

Apacible, segura de sí, flexible, serena. (Adecuación imperturbable)

La persona que puntúa bajo tiende a ser plácida, de ánimo invariable. Su confianza en sí misma y su capacidad para tratar con cosas es madura y poco ansiosa; es flexible y segura, pero puede mostrarse insensible cuando el grupo no va de acuerdo con ella, lo cual puede provocar antipatías y recelos.

PUNTUACIONES ALTAS (8-10)

Aprensiva, preocupada, depresiva, turbable. (Tendencia a la culpabilidad)

La persona que puntúa alto suele ser depresiva, preocupada, llena de presagios e ideas largamente gestadas. Ante las dificultades presenta tendencia infantil a la ansiedad. En los grupos no se siente aceptada ni con libertad para actuar. Una puntuación alta es muy corriente en los grupos clínicos de todo tipo.

FACTOR Q1 PUNTUACIONES BAJAS (1-3)

Conservadora, respetuosa de las ideas establecidas, tolerante de los defectos tradicionales.

101

(Conservadurismo)

La persona que puntúa bajo confía en lo que le han enseñado a creer y acepta lo 'conocido y verdadero', a pesar de sus inconsistencias, aunque se le presente algo que pudiera ser mejor. Es precavida y puntillosa con las nuevas ideas, tiende a posponer u oponerse a los cambios, a seguir la línea tradicional, a ser conservadora en religión y política, y a despreocuparse de las ideas analíticas e 'intelectuales'.

PUNTUACIONES ALTAS (8-10)

Analítico-critica, liberal, experimental, de ideas libres y pensamiento abierto. (Radicalismo)

La persona que puntúa alto suele interesarse por cuestiones intelectuales y dudar de los principios fundamentales. Es escéptica y de espíritu inquisitivo en las ideas, sean tradicionales o nuevas. Suele estar bien informada, poco inclinada a moralizar y más a preguntarse por la vida en general y a ser más tolerante con las molestias y el cambio.

FACTOR Q2 PUNTUACIONES BAJAS (1-3)

Dependiente, buena compañera y de fácil unión al grupo. (Adhesión al grupo)

La persona que puntúa bajo prefiere trabajar y tomar decisiones con los demás, le gusta y depende de la aprobación social. Tiende a seguir las directrices del grupo, incluso mostrando falta de decisiones personales. No es necesariamente gregaria

102

por decisión propia, sino que necesita del apoyo del grupo.

PUNTUACIONES ALTAS (8-10)

Autosuficiente, prefiere sus propias decisiones, llena de recursos. (Autosuficiencia)

La persona que puntúa alto es temperamentalmente independiente, acostumbrada a seguir su propio camino; toma sus decisiones y actúa por su cuenta. No tiene en consideración la opinión del grupo, aunque no es necesariamente dominante en sus relaciones con los demás. No le disgusta la gente, simplemente no necesita de su asentimiento y apoyo.

FACTOR Q3 PUNTUACIONES BAJAS (1-3)

Autoconflictiva,

despreocupada

de

protocolos,

orientada

por

sus

propias

necesidades. (Baja integración)

La persona que puntúa bajo no está preocupada por aceptar y ceñirse a las exigencias sociales. No es excesivamente considerada, cuidadosa o esmerada. Puede sentirse desajustada, y muchas de sus desadaptaciones (especialmente las afectivas, pero no las paranoicas) puntúan en esta dirección de la variable.

PUNTUACIONES ALTAS (8-10)

Controlada, socialmente adaptada, llevada por su propia imagen. (Mucho control de su autoimagen)

103

La persona que puntúa alto suele tener mucho control de sus emociones y conducta en general, y ser cuidadosa y abierta a lo social; evidencia lo que comúnmente se llama 'respeto hacia sí misma'; tiene en cuenta la reputación social. No obstante, a veces tiende a ser obstinada. Los líderes eficaces y algunos paranoicos puntúan alto en Q3.

FACTOR Q4 PUNTUACIONES BAJAS (1-3) Relajada, tranquila, aletargada, no frustrada.

(Poca tensión érgica) La persona que puntúa bajo suele ser sosegada, relajada, tranquila y satisfecha (no frustrada). En algunas situaciones, su estado de mucha satisfacción le puede llevar a la pereza y al bajo rendimiento, en el sentido de que no tiene motivación para intentar algo (como un alto nivel de tensión érgica puede desbaratar también el rendimiento escolar o Profesional).

PUNTUACIONES ALTAS (8-10)

Tensa, frustrada, presionada, sobreexcitada. (Mucha tensión érgica)

La persona que puntúa alto suele ser tensa, excitable, intranquila, irritable e impaciente. Está a menudo fatigada pero incapaz de permanecer inactiva. Dentro del grupo tiene una pobre visión del grado de cohesión, del orden y del mando. Su frustración representa un exceso del impulso de estimulación no descargada.

104

INVENTARIO MULTIFASICO DE LA PERSONALIDAD DE MINNESOTA (MMPI).

DESCRIPCIÓN GENERAL

FICHA TÉCNICA

Nombre:

Inventario Multifásico de la Personalidad de Minnesota.

Autores:

S. R. Hathaway y J. C. Mc Kinley.

Administración:

Individual y Colectiva.

Duración:

Variable, de 45 a 60 minutos.

Aplicación:

Sujetos cuyas edades oscilen entre 14 y 64 años, con una

cultura equivalente a seis años de escolaridad y saber leer con fluidez; los sujetos no deben presentar alteraciones severas en su contacto con la realidad y limitaciones en su dotaci6n intelectual.

Significación:

Evalúa

las

características

de

personalidad,

de

manera

multifásica puesto que intenta abarcar diversos aspectos de la persona mediante el uso de 14 escalas; 4 de validez y 10 Clínicas.

ANTECEDENTES

Este inventario fue construido originalmente por el Psicólogo Starke Hathaway y el Psiquiatra J.C. Mckinley; los primeros estudios sobre el tema aparecieron hacia 1.940. Posteriormente, en 1.943, la Universidad de Minnesota publicó el cuestionario y, en 1.945, autorizó su publicación a la Corporación de Psicología. Los autores de la prueba pretendían que el MMPI fuera útil para la evaluación

105

diagnóstica de rutina. A finales de la década de 1.930 y principios de 1.940, un objetivo primordial para el Psicólogo Clínico y el Psiquiatra era asignar clasificaciones Psico-diagnósticas apropiadas a casos individuales.

Desde su primera publicación en 1.943, ha sido uno de los instrumentos de Psicoevaluación más objetivo y útil tanto en la investigación como en la práctica clínica ya que su uso se facilita por la alta calidad interpretativa de sistemas actuariales que ayudan en el proceso Clínico de elaboración de decisiones.

Por otra parte para su elaboración Hathaway y Mckinley, tuvieron en cuenta la educación y cultura de los sujetos a quienes se les administró, para que las frases fueran comprendidas aún por personas de bajo nivel intelectual.

En su elaboración los autores utilizaron un enfoque de codificación empírica en la construcción de las diversas escalas del MMPI. Inicialmente se procedió a reunir una gran cantidad de reactivos potenciales para el inventario, seleccionando una amplia variedad de enunciados afirmativos de tipos de personalidad extraídos de fuentes tales como: historias de casos e informes Psicológicos y Psiquiátricos; luego se seleccionaron grupos criterio apropiados y se procedió a elaborar las escalas administrando los 504 reactivos originales a "Grupos Normales" y a "Grupos Clínicos", realizando un análisis de estos reactivos; poco tiempo después se elaboraron 2 escalas clínicas adicionales, primero la escala de MasculinidadFeminidad (MF) y la escala de introversión social (IS) desarrollada por Drake en 1.946.

ESTRUCTURA DEL INVENTARIO

El Inventario Multifásico de la Personalidad de Minnesota (MMPI) incluye 566 enunciados afirmativos de autoreferencia. La tarea de la persona que resuelve la

106

prueba consiste en dar respuesta a cada afirmación como verdadera si se aplica a sí misma y como falsa si se considera que no es aplicable a sí misma.

El contenido de los ítems de este instrumento es muy variado. Estos dan información sobre conductas exteriores, sentimientos que puedan observarse y actitudes generales de tipo social; además algunos ítems intentan detectar "síntomas morbosos", mientras que otros parecen no poseer ningún sentido favorable o desfavorable.

DESCRIPCIÓN DE LAS ESCALAS

Como ya se ha visto el MMPI está formado por 14 escalas de validez: frases omitidas (?), sinceridad (L), puntuación de validez (F) y factor corrector (K); 10 escalas clínicas: escala 1 (Hipocondriasis), escala 2 (Depresión), escala 3 (Histeria), escala 4 (Desviación Psicopática), escala 5 (Masculinidad-Feminidad), escala 6 (Paranoia), escala 7 (Psicastenia), escala 8 (esquizofrenia), escala 9 (hipomanía), escala 0 Si (introversión o extroversión social).

ESCALAS DE VALIDACIÓN

ESCALA DE FRASES OMITIDAS (?) Comprende todos aquellos elementos clasificados por el sujeto como NO SE o "No puedo decir"; el valor de esta puntuación afecta el significado de las demás puntuaciones.

ESCALA DE SINCERIDAD (L) Se construyó con el fin de detectar un intento deliberado por parte del sujeto para presentarse a sí mismo de una manera favorable evaluando el grado de franqueza del sujeto.

107

PUNTUACIÓN DE VALIDEZ (F) Se desarrolló para detectar formas desviadas de responder a los reactivos de la prueba; puntuaciones altas indican el descontrol de las emociones, como también indican síntomas del Neurótico y Psiquiátrico.

FACTOR CORRECTOR (K) Se elaboró como un índice de los intentos del examinado por negar su patología y presentarse a sí mismo de una manera favorable o para aparecer de manera muy desfavorable. Está integrada por 30 frases, es una escala de corrección para las Escalas Clínicas: 1 (Hs), 4 (Dp), 7(Pf), 8 (Es) y 9 (Ma) y se relaciona con la actitud defensiva ante la debilidad Psicológica o exhibicionismo Psicológico.

ESCALAS CLÍNICAS

Se encuentran subdivididas en tres zonas así:

l. - ZONA PSICONEUROTICA

Comprende las siguientes Escalas:

ESCALA 1 HS (Hipocondriasis o Somatización) Se desarrolló para identificar pacientes que manifestaran un patrón de síntomas asociados con la clasificación de hipocondría y/o Somatización localizada (se caracteriza por una preocupación anormal por las propias funciones corporales y temores concomitantes a la enfermedad), Esta escala consta de 33 reactivos asociados con preocupaciones Somáticas o con el funcionamiento físico en general.

ESCALA 2 D (Depresión).

108

Se elaboró con el propósito de evaluar el grado en que un sujeto puede presentar depresión sintomática caracterizada por pesimismo, falta de esperanza en el futuro e insatisfacción general con la propia situación de vida. Esta escala consta de 60 reactivos que tratan diversos aspectos de la depresión (negación de la felicidad y el mérito personal, retardo psicomotor, ausencia de interés en lo que les rodea.

ESCALA 3 Hi (Histeria). Se desarrolló para identificar individuos que utilizaban reacciones histéricas ante las situaciones de tensión, además de determinar Somatización no Localizada sin determinación de una causa real. Consta de 60 reactivos de dos tipos generales; algunos tienen que ver con una negación general de la Salud Física y una variedad de quejas sintomáticas algo más especificas.

ZONA SOCIAL

Comprende las siguientes escalas:

ESCALA 4 Dp (Desviación Psicótica) Se elaboró con el fin de identificar personas asociales, antisociales, sociales y disociales. Esta escala consta de 50 reactivos que cubren un amplio rango de temas incluyendo falta de satisfacción en la vida, problemas sexuales y dificultad con la autoridad.

ESCALA 5 MF (Masculinidad- Feminidad) Se desarrolló para definir los intereses que son propios de hombres y mujeres; además de identificar la homosexualidad. Consta de 60 reactivos relacionados con material sexual y diversidad de temas.

ZONA PSIQUIATRICA

109

Comprende las siguientes escalas:

ESCALA 6 PA (Paranoia) Se elaboró a fin de identificar pensamientos o ideas paranoides (sentimientos de persecución, ideas de grandeza, suspicacia, opiniones, actitudes rígidas, etc). Consta de 40 a 60 reactivos relacionados con conductas Psicóticas.

ESCALA 7 Pt (Psicastenia) Se desarrolló con el propósito de encontrar características de la personalidad clasificada como Psicastenia (reacciones fóbicas - obsesivo compulsivas y excesivas dudas); sin embargo en la actualidad no es de uso común. Esta escala consta de 48 reactivos que cubren una variedad de síntomas y conductas relacionadas con pensamientos obsesivos, sentimientos de temor y/o ansiedad y dudas sobre la propia capacidad.

ESCALA 8 Es (Esquizofrenia) Se elaboro para identificar individuos asociados con la esquizofrenia, aislamiento emocional, las relaciones inadecuadas con las familias, apatía e indiferencia. Esta escala consta de 78 reactivos que cubren un amplio grupo de conductas; siendo la más amplia de todas las escalas clínicas.

ESCALA 9 Ma (Manía - Hipomanía) Se desarrolló básicamente para identificar estados de ánimo de las personas con características maníaco depresivas, tipo maníaco.

ESCALA O Si (Introversión - Extroversión Social) Aunque esta escala se desarrolló después de las otras Escalas Clínicas, ha sido tratada como estándar. Se diseñó para evaluar la tendencia de los sujetos a aislarse de los contactos y responsabilidades sociales; además de identificar aspectos relacionados con la extroversión social. Consta de 70 reactivos de dos

110

tipos generales: un grupo se refiere a la participación social, en tanto que el otro a una inadaptación neurótica general y autodesprecio.

MATERIAL DE LA PRUEBA

FORMA INDIVIDUAL

- Hoja de anotación y perfil. - 12 Plantillas de corrección.

FORMA COLECTIVA

- Cuadernillo con 566 reactivos. - Hoja de respuestas y Perfil. - Clave de corrección. - 15 plantillas de corrección (incluyendo escalas adicionales).

ESCALAS ADICIONALES

Comprende las siguientes Escalas:

FUERZA DEL YO (Es) La desarrolló Barron (1.953), específicamente para predecir la respuesta de pacientes neuróticos a la Psicoterapia individual. Consta de 68 reactivos que hacen referencia al funcionamiento físico, aislamiento, actitudes hacia la religión, posición moral, adecuación personal y habilidad para enfrentar fobias y ansiedades.

DEPENDENCIA (Dy) La desarrolló Navran (1.954), para evaluar la intensidad de las necesidades de dependencia. Consta de 57 reactivos.

111

DOMINANCIA (Do) La desarrollaron Gough, McClosky y Meehl (1.951); esta variable de la personalidad puede ser importante en la psicología de la participación social. Consta de 28 reactivos que permiten detectar la iniciativa social, capacidad para el mando, persistencia, acciones esforzadas, preocupación e identificación con la comunidad o sociedad y sentimiento de la responsabilidad.

RESPONSABILIDAD (Re) La desarrollaron los mismos autores de la Escala de Dominancia en 1.952. Consta de 32 reactivos los cuales se refieren a la preocupación por temas sociales y morales, desaprobación de privilegios, énfasis en los deberes y la autodisciplina, seguridad personal, etc. (Gough, 1.952).

CONTROL (Cn) La desarrolló Cuadra, (1.953) para estudiar el problema de la necesidad de hospitalización. Consta de 50 reactivos que incluyen la conciencia de las propias debilidades, sensibilidad a las críticas sociales, ciencias religiosas y participación en actividades riesgosas.

FUNDAMENTO ESTADÍSTICO

CONFIABILIDAD

En los cuestionarios de personalidad, la estimación de este estadístico depende en gran medida de que el grupo comprenda sólo sujetos normales, incluya sólo enfermos Psiquiátricos hospitalizados, o esté formado por personas de ambos grupos. Es muy probable que los rasgos de personalidad sean más estables en los sujetos normales que en los enfermos Psiquiátricos; por esto teniendo en cuenta

112

las dificultades aludidas para una prueba como el MMPI, los datos que se citan a continuaci6n parecen bastante satisfactorios.

Hathaway y Mc Kinley (1.942) y Mc Kinley y Hathaway (1.942, 1.944), han aplicado la forma individual a un grupo de 47 sujetos normales no seleccionados, presentan coeficientes de fiabilidad en seis de las variables básicas; utilizando el procedimiento de test-retest con un tiempo de intervalo entre tres días y más de un año.

Cottle (1.950) obtiene coeficientes de confiabilidad test-retest aplicando la forma individual y la forma colectiva en un grupo de 30 enfermos Psiquiátricos no seleccionados; Holaberg y Alessi (1.949), citan coeficientes de confiabilidad obtenidos mediante la aplicación de la forma individual completa y una versión reducida de la misma.

VALIDEZ

El criterio de validez se obtuvo principalmente en la predicción de casos clínicos; el valor del pronóstico del MMPI se halló comparando sus resultados con el diagnóstico final elaborado por Profesionales Neuropsiquiátricos de los Centros Clínicos. De esta manera, se ha observado que una puntuación alta en una escala predice positivamente el diagnóstico clínico final del profesional, y discrimina en más de un 60% las nuevas admisiones de enfermos psiquiátricos. Este porcentaje ha sido obtenido en la diferenciación entre varios tipos de casos clínicos.

INSTRUCCIONES PARA LA APLICACIÓN Y CORRECCIÓN

APLICACIÓN

113

Esta prueba puede administrarse con facilidad en forma individual o colectiva y dicha aplicación puede ser realizada por examinadores no profesionales (familiarizados con todo el material presentado en el Manual); aunque necesita de un clínico experimentado para su interpretación. Además la disponibilidad de diversas formas básicas asegura que puede administrarse a un amplio espectro de personas de la manera más conveniente para los sujetos y el examinador.

Las formas se encuentran disponibles para administraciones individuales, en grupo, para individuos ciegos u otros que no pueden leer y formas abreviadas que siempre conducen a una pérdida de información.

Las instrucciones que deben darse al sujeto son las indicadas en la primera página del cuadernillo forma colectiva.

Seisdedos y Cordero en el Manual publicado por TEA Ediciones, 1.986, afirman que el MMPI debe ser presentado como una tarea seria e importante, brindando al sujeto la seguridad de que las respuestas serán estudiadas en su propio beneficio. Si se consigue esta actitud, se favorecerá en gran medida la cooperación de los examinados; algunos pueden necesitar posteriores aclaraciones sobre el propósito perseguido y el uso que van a tener los resultados. Si es posible, deben darse respuestas sinceras, evitando eludir o desviar la responsabilidad.

CORRECCIÓN Y VALORACIÓN

Algunos autores afirman que en primer lugar, deben separarse las hojas de respuestas según el sexo de los examinados, y también borrar las respuestas que tengan señaladas las dos contestaciones (V y F), que se considerarán como respuestas NO SE.

114

Otros consideran que se realiza observando detalladamente la hoja de respuestas y anotando el número de respuestas omitidas; luego se procede a contar cuidadosamente el número de respuestas que caen dentro de las plantillas, anotando las puntuaciones en bruto de las diferentes escalas; en caso de no tener disponibles las plantillas se podrá utilizar la clave de corrección.

Posteriormente se anotan las puntuaciones en bruto de las diferentes escalas con el mayor cuidado convirtiendo esta puntuación en Puntajes T que vienen relacionados en la hoja del perfil arriba del nombre de la escala.

Por otra parte hay cinco escalas Clínicas que son modificadas por diversas proporciones del valor en bruto obtenido por la Escala K. De esta forma, la escala 1Hs, deberá ser incrementada en su puntaje en bruto, por el 0.5 (la mitad) del valor de la Escala K en bruto.

Al puntaje en bruto de la Escala 4 Dp, se le agrega el 0.4 de K.

Al puntaje en bruto de la Escala 7 Pt, se le agregará el puntaje completo de K.

Al puntaje en bruto de la Escala 8 Es, se le agregará el puntaje completo de K y al puntaje en bruto de la Escala 9 Ma, se le agregará el 0.2 de K.

Una vez modificados los puntajes de estas cinco escalas, se elabora el perfil, ubicando cada puntaje en bruto en el nivel de su conversión correspondiente en calificaciones T.

CODIFICACIÓN DEL PERFIL

115

Con respecto al MMPI se han utilizado dos sistemas de codificación: el sistema original de Hathaway (1.947) y un sistema más completo desarrollado por Welsh (1.948). En la actualidad existe una gran cantidad de material publicado en ambos sistemas. A continuación se describirán los pasos de cada uno de ellos:

- CODlGO DE WELSH

Paso 1. Escribir los dígitos que representan las escalas ordenadas según la cuantía de la puntuación T, de mayor a menor.

Paso 2. Introducir los símbolos que indiquen la cuantía de los valores T (90 o mayor, 80 -89, - 70 -79, - 60 - 69, -50 - 59,- 40 – 49, 30-39 # 29 o menor a la derecha de #) .

Paso 3. Se pueden codificar las escalas de validación y colocarlas separadamente a la derecha del código de las escalas clínicas.

- CODIGO DE HATHAWAY.

Paso 1. Se registra el número de la Escala que tiene la mayor puntuación T.

Paso 2. Se anotan a continuación de este número, y por orden descendente de las puntuaciones T, los números de las escalas que tengan valores superiores a 54.

Paso 3.

116

Insertar un apóstrofe (‘) después del último número de escala en la clave que tenga una puntuación T de 70 o más.

Paso 4. Se subrayan los números de las escalas cuyos valores T sean iguales o se diferencien en solo un punto.

Paso 5. Utilizar un guión (-) y luego registrar el número de la escala menor en el perfil si dicha escala tiene una puntuaci6n T menor que 46.

Paso 6. Siga la misma regla para subrayar esas puntuaciones bajas como se indicó en el paso 4 para puntuaciones altas.

Paso 7. A la derecha y separada de las escalas clínicas, registre los puntajes crudos para L, F y K en ese orden y separada por dos puntos (:). Si la puntuación directa de L es igual o mayor que 10, o si la F es igual o mayor que 16, se coloca un "X"; a fin de sugerir que el perfil puede ser inválido.

INTERPRETACIÓN

A continuación se presenta de manera breve algunos indicadores para la interpretaci6n del MMPI, a fin de ser una guía didáctica en dicha explicación. Es muy importante para la interpretación del MMPI tener un conocimiento previo de las características clínicas correspondientes a los nombres de las escalas; además es importante tener en cuenta las características cuantitativas del MMPI, que son las que permitirán la organización de las escalas en el perfil; se podrá observar, que se

117

utilizarán con frecuencia los términos elevada o baja, para designar la ubicación general de cada escala dentro del perfil.

Cuando se hable de una Escala elevada se hará referencia a que tiene un puntaje por arriba de la media estadística y, en comparación con las demás, tiende a sobresalir. Su puntaje es el más alto o uno de los más altos.

Se hablará de Escalas bajas, cuando el puntaje de la misma sea inferior a la media estadística o en comparación con los demás, sea uno de los más reducidos o el más reducido.

Otro aspecto importante al aplicar el MMPI es tener en cuenta la finalidad de la aplicaci6n y las situaciones que la rodean. Para poder interpretar los perfiles del MMPI en forma integral, se debe tomar en cuenta que en esta técnica concurren dos aspectos fundamentales: una parte cuantitativa y otra cualitativa.

La parte cuantitativa proporciona una información, tanto de la severidad con que un rasgo se acentúa en la personalidad (por la elevación de cada escala), como de la comparación de las características de un sujeto con otros de su mismo grupo o de otros grupos sociales.

El aspecto cualitativo del inventario debe ser entendido en base a los elementos clínicos que proporcionan cada una de las escalas y de las combinaciones en que se encuentran relacionadas; en este punto se debe tener en cuenta que todas las escalas del perfil tienen relación entre sí, además de la configuración que se puede observar con la clave.

118

PRUEBAS PROYECTIVAS EL TEST DE RORSCHACH Se ha discutido desde hace algún tiempo la utilización de las pruebas proyectivas, ya que no cumplen con los requisitos psicométricos (confiabilidad, validez y normas), por eso algunos autores opinan que no se les debe dar el titulo de pruebas, sino utilizar uno menos comprometedor como el de técnicas o métodos proyectivos de evaluación. Levy en 1963 propuso llamarlas «técnicas de provocación de respuestas», ya que dependen de la habilidad del clínico para hacer interpretaciones, otros más estrictos, sugieren que se deben retirar del arsenal de pruebas psicológicas. Se abordan los argumentos a favor y en contra de las pruebas proyectivas y su valor de uso como instrumentos propios del quehacer psicológico. Veamos aquí el test de Rorschach El test de Rorschach es una técnica y método proyectivo de psicodiagnóstico, creado por el psicoanalista suizo Hermann Rorschach (1884-1922). Se publicó por vez primera en 1921 y alcanzó una amplia difusión. El test consiste en una serie de láminas en las que encontramos manchas aleatorias de tinta. El psicoterapeuta pide al sujeto que dé sentido a esas manchas. A partir de estas interpretaciones el psicoterapeuta intenta ver lo que sucede en la mente del paciente. El test de Rorschach es quizás el más conocido de los test, debe su nombre al psiquiatra suizo Hermann Rorschach (1884-1922). Básicamente es un test proyectivo aunque a partir de él se ha estudiado su cuantificación. Por lo que se lo considera una de las pruebas más completas. Pero su mayor logro es la amplia difusión que posee, ya que a partir de ella existe una

119

amplia cantidad de investigaciones y casuística. El material actual disponible es inmenso. El test de Rorschach consta de 10 láminas compuestas por manchas de tinta (negras y policromáticas) sobre un fondo blanco. Estas láminas poseen una morfología vaga por lo que resultan especialmente sugerentes. Las láminas son presentadas de manera sucesiva a un paciente preguntándole lo que ve en ellas y como y donde manifiesta lo observado. Esta basado en lo que las personas perciben, ya que visualizan en las manchas diferentes aspectos. El análisis del test está basado en lo percibido. Para mencionar solo algunos pocos ejemplos que ilustran sobre las características del test, cabe mencionar que interesa (entre otras cosas) la localización de lo observado, su forma, si presenta movimientos (que tipos de movimientos) si se perciben diferentes aspectos, si se perciben utilizando toda la lámina o parte de ella (en que detalles de una lámina se visualizan los elementos), si lo observado tiene dimensión, profundidad, color, reflejo, sombra, brillo, si se observan objetos inanimados, humanos, animales, paisajes, el tipo de respuestas, etc. Sería interminable describir la infinidad de respuestas posibles. Varios caminos han tenido un desarrollo independiente. Los de mayor desarrollo y difusión fueron los de Klopfer y Rapaport, también alcanzaron un importante desarrollo las lecturas de Beck, Hertz y Piotrowsky entre otros. El nombre de John Exner merece una mención particular, integró las cinco principales corrientes en un único Sistema Comprensivo, y es en la actualidad la corriente de mayor desarrollo, difusión, utilización y expansión en el mundo. A diferencia de los anteriores posee un enfoque menos complicado en sus lecturas y desarrollos diagnósticos. Se presenta a si mismo como un medio y no un fin, por lo que se promociona como un test para ser utilizado en diferentes ámbitos y por diferentes lecturas teóricas. Proporciona más de cincuenta rasgos de la Personalidad estudiada, superando a cualquier otra prueba. Del sujeto estudiado, nos habla entre otros rasgos de:

120

•

Inteligencia: Capacidad. Estilo. Fantasía. Complejidad. Ajuste. Distorsión.

•

Afectos: Interés. Formas de mostrarlos. Control. Influencia de las emociones en la

resolución

de

problemas.

Constricción

de

las

muestras

afectivas.

Oposicionismo. •

Vivencialidad: Recursos psicológicos disponibles. Modos de afrontamiento: Reflexivo. Impulsivo. Ambigual. Activo o pasivo.

•

Autopercepción:

Autoestima:

Egocentrismo,

narcisismo,

dependencia,

aislamiento. Preocupación corporal. •

Interrelaciones: Modelos de lo humano. Interés por los demás. Habilidad social. Interés por lo convencional. Visión de las relaciones sociales bien como de cooperación o bien como agresivas.

•

Estrés: Nivel. Presiones que inciden en él

•

Tono de humor: Valoración de las interacciones con el entorno. Nivel de Depresión. Potencialidad suicida.

En la descripción de la Personalidad, no sólo se refiere a lo patológico, sino también a rasgos positivos en los que la terapia puede apoyarse o incluso potenciarlos. Con frecuencia descubre problemas que el propio sujeto ignoraba, haciéndole involucrarse más en la terapia. Libre del error de deseabilidad social, el Rorschach es insustituible cuando de la evaluación dependan consecuencias ajenas al mero diagnóstico: Custodia de hijos, puestos de trabajo, mejor trato por parte de la Justicia, etc. Es ideal para la Selección de Personal de alta cualificación, ya que, además de lo dicho, la rica información que proporciona señalará a los sujetos más idóneos para desempeñar tareas concretas.

121

Requiere mayor nivel de conocimientos que otras pruebas. No solo sobre el propio Rorschach sino también sobre Personalidad y Psicopatología, solo así se logra conseguir toda la amplitud de información que es capaz de proporcionar.

El Rorschach como test perceptivo El test de Rorschach no es propiamente un test proyectivo, sino que nació como un test perceptivo. Esto es, da cuenta de qué y cómo la persona ve el mundo; su capacidad para resistir el estrés, su tendencia a la introversión o extroversión, si sufre de algún tipo de problema emocional, la mucha o poca adecuación a la realidad social, etc. Métodos de interpretación Rorschach murió en 1922, a un año de presentar su test. Esto, sumado a su difusión un tanto tardía, llevo a que distintos psicólogos americanos y europeos

122

definieran sus propios métodos de interpretación del test. Los métodos de mayor renombre fueron los de Klopfer y Rapaport, junto a los de Beck, Hertz y Piotrowsky. Con el tiempo, la diversidad de métodos y la falta de un método común llevo al desprestigio del test por su falta de confiabilidad; esto es, cada psicólogo tenía su propio método y era casi imposible comparar resultados. A inicios de los 70, la Fundación Rorschach comenzó una serie de estudios para determinar cuales eran los métodos de tabulación e interpretación más utilizados, para después iniciar una serie de investigaciones sobre aquellos indicadores que proveían de información clínica relevante. El resultado de estos esfuerzos es el ahora conocido Método Comprehensivo de Exner, editado por primera vez el año 1974. El método comprehensivo de Exner El método comprehensivo de Exner es el resultado de las investigaciones iniciadas en los 70 por la Fundación Rorschach para generar un método único de codificación, tabulación e interpretación del Rorschach. Cada una de las variables que presenta el modelo cuenta con investigaciones empíricas que respaldan su validez. En estos momentos, es el estándar de facto para la aplicación e interpretación del Rorschach y, según la experiencia del autor, da resultados bastante válidos. Si bien las propiedades psicométricas del test de Rorschach son limitadas, el procedimiento se está fortaleciendo en tanto los sistemas de codificación se hacen más específicos y los investigadores dedican más atención a la comprobación empírica de sus conceptos. La validez de la interpretación puede mejorar con el uso frecuente de la técnica y con la mayor experiencia clínica. Para complementar información sobre este test, recomendamos ver las siguientes páginas:

123

www.rorschach.org http://www.serymp.org

124

PRUEBAS DE INTELIGENCIA En la medición de estas capacidades con test de inteligencia nos encontramos con un gran problema derivado del hecho de que la expresión de las mismas está muy influenciada por el momento en que se realizan. El cansancio, el estado de humor y otros múltiples factores pueden afectar significativamente su expresión de un día a otro o entre el comienzo y el final de un mismo día. El segundo gran problema es que cada medición concreta utiliza un test de inteligencia específico y particular y que los resultados pueden variar en gran medida en función de si el individuo ha realizado un test de inteligencia similar en el pasado o por la mayor o menor simpatía o afinidad cultural con el mismo, aunque si está bien diseñados este aspecto debería ser bastante reducido. Una conclusión sencilla sería el pensar que estas capacidades no son estables a lo largo de la vida y que se encuentran muy influenciadas por el medio ambiente. Sin embargo, algunos expertos opinan que existe una gran estabilidad de las capacidades a lo largo de la vida, especialmente a partir de los 6 años. Por su parte, el lenguaje, como expresión del inconsciente colectivo, claramente opina que la inteligencia es una cualidad fija puesto que utiliza el verbo ser y no el verbo estar en expresiones como "Esa persona es muy inteligente". Para ilustrar la relación entre el desarrollo de la comprensión de la inteligencia y la medición psicológica, ilustraremos la temática a partir de la prueba WISC-R

125

WISC - R, ESCALA DE INTELIGENCIA DE WECHSLER PARA NIÑOS REVISADA David Wechsler

CARACTERÍSTICAS

Versión revisada, modificada y actualizada del WISC. El WISC-R mantiene un gran número de elementos del WISC tradicional, sustituyendo o eliminando los que resultaban obsoletos y añadiendo otros, en ciertas pruebas, para aumentar su fiabilidad; se ha modificado el orden de aplicación a fin de que sea más ameno para el niño.

Algunas pruebas amplían sus instrucciones con nuevos ejemplos, evitando así posibles ambigüedades y garantizando que el niño comprenda la naturaleza de la tarea que ha de realizar.

Aplicación: Individual.

Tiempo: Aproximadamente 1 hora y 30 minutos. Edad: De 6 a 16 años.

Juego completo con 25 cuadernos de anotación y material manipulativo.

En la escala del WISC-R se incluyen las siguientes pruebas: Escala verbal:

Escala de ejecución:

Información.

Figuras Incompletas.

Semejanzas.

Ordenación de Dibujos.

Aritmética.

Diseños con Cubos.

126

Comprensión.

Composición de Objetos

Un buen ejemplo de su uso lo encontrará en el artículo anexo: Estructura factorial de la Escala de Inteligencia para Niños de Wechsler-Revisada (WISC-R). Un acercamiento desde el ámbito clínico (http://www.cop.es/delegaci/andocci/VOL.%2019_3_6.pdf) CONCLUSIÓN Lea y discuta con sus compañeros los aspectos más importantes del artículo anexo Importancia del Avance en la Investigación Psicométrica ubicado en la siguiente dirección electrónica: http://www.salvador.edu.ar/psic/ua1-9pub02-7-01.htm

127

REFERENCIAS USADAS Y BIBLIOGRAFÍA RECOMENDADA

Anastasi, A. (1968). Psychological testing. New York: MacMillan.

Anastasi, A. y Urbina, S. (1997). Psychological Testing (7ª ed.). Englewood Cliffs, NJ: Prentice-Hall.

Arnau, J. (1989). Metodología de la investigación y diseño. En J. Arnau y H. Carpintero (Eds.). Historia, teoría y método. Madrid: Alhambra Universidad.

Canpintero, H. (1996). Historia de las ideas psicológicas. Madrid: Pirámide.

Cronbach, L.J. y Meehl, P.E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52, 281-302.

Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart and Winston.

Hambleton, R.K. y van der Linden, W.J. (1982). Advances in IRT and applications: An introduction. Applied Psychological Measurement, 6(4), 373-378.

Lord, F.M. (1980). Applications of item response theory to practical testing problems. Hillsdale, New Jersey: Lawrence Erlbaum Associates.

Lord, F.M. y Novick, M.R (1968). Statistical theories of mental test scores. New York: Addison-Wesley.

Martínez-Arias, R (1995). Psicometría: Teoría de los tests psicológicos y educativos. Madrid: Síntesis.

128

Meliá, J.L. (1990). La construcción de la Psicometría coma ciencia teórica y aplicada. Valencia: Cristóbal Serrano.

Messick, S. (1989). Validity. En Linn, R.L. (Ed.). Educational measurement. New York: MacMillan.

Muñiz, J. (1991). Introducción a los métodos psicofísicos. Barcelona: PPU.

Muñiz, J. (1998). La teoría clásica de los tests. Madrid: Pirámide.

Nunnally, J. C. (1973). Introducción a la medición psicológica. Buenos Aires: Paidós.

Rust, J. y Golombok, S. (1989). Modern psychometrics: The science of psychological assessment. London: Routledge.

Thorndike, R. M. (1997). The early history of intellegence testing. En D. P. Flanagan, J. L. Genshaft y Harrison, P.L. (Eds.), Contemporary intelectual assessment, theories, tests and issues, (pp. 3-17). New York: The Guildford Press.

Van der Linden, W. J. (1986). The changing conception of measurement in education and psychology. Applied Psychological Measurement, 10, 325332. Yela, M. (1968). Apuntes de psicometría y estadística. Madrid: Universidad Complutense de Madrid.

129

documentación complementaria en castellano

ANEXO 1

puede consultarse en la sección de la Comisión de Tests incluida en la página web del COP

DIRECTRICES INTERNACIONALES PARA EL

(http://www.cop.es/tests/).

USO DE LOS TESTS Las directrices reflejan principios generales

International Test Commission (ITC)

implicados en el uso adecuado de los tests, pero no pretenden uniformar las diferencias legítimas

INTRODUCCIÓN

existentes entre la práctica en los diferentes Los tests constituyen una de las tecnologías

países o áreas profesionales. Existen bastantes

más utilizadas por los psicólogos en el ejercicio

razones

de la profesión. Como ocurre con la tecnología

directrices para el uso de los tests con carácter

de otras áreas científicas, los tests pueden

internacional. Veamos algunas de ellas.

utilizarse

correcta

o

incorrectamente.

por

las

que

se

necesitan

unas

Las

directrices que se proponen en este documento

a. Los países difieren ampliamente en el grado de control legal que pueden ejercer sobre el

tienen como objetivo fundamental mejorar el uso

uso de los tests y sus consecuencias para

que los profesionales hacen de los tests.

las personas evaluadas. Por tanto, la elaboradas

existencia de un conjunto de directrices

originalmente por la Comisión Internacional de

internacionalmente aceptadas proporcionará

Tests (ITC), bajo la dirección del profesor Dave

a las asociaciones nacionales de psicología

Bartram.

que

y otras organizaciones profesionales una

presentamos aquí ha sido realizada en el seno

buena base documental para completar

de la Comisión de Tests del Colegio Oficial de

directrices ya existentes o proceder a

Psicólogos (COP). El Colegio, a través de sus

crearlas.

Las

directrices

La

han

versión

sido

en

castellano

Comisión

b. El derecho a comprar y utilizar materiales

Internacional de Tests y en la Comisión Europea

psicométricos varía mucho de unos países a

sobre Tests de la Federación Europea de

otros. En algunos países el uso de los tests

Asociaciones

está restringido a los psicólogos, en otros a

representantes

en

la

citada

Profesionales

de

Psicólogos

(EFPPA), que también ha respaldado las

quienes

directrices, ha participado activamente en la

distribuidores de las pruebas, e incluso en

elaboración de las mismas, consciente de la

algunos los usuarios pueden obtener el

necesidad de contribuir a mejorar la práctica de

material

los tests en nuestro país.

restricciones. c.

Los

documentos

libremente,

los

sin

Algunos tests bien conocidos han aparecido

elaboración de las directrices, junto con otros en

editores, violando los derechos de copyright,

citados

en

psicométrico

por

en Internet sin la autorización de autores y

aparecen

utilizados

registrados

la

castellano,

más

estén

al

final;

130

y sin ninguna precaución en relación con la

DIRECTRICES

seguridad del test. d. En el ámbito de la psicología del trabajo, el

Objetivo

aumento de la movilidad internacional de los trabajadores ha incrementado la demanda de tests para utilizarlos con aspirantes de diferentes países. A menudo los tests son aplicados

en

un

país

para

empresas

ubicadas en otros países. e. En

países

como

El objetivo fundamental de las directrices es mejorar el uso de los tests, describiendo la forma adecuada de utilizarlos. Un usuario competente utilizará los tests de forma adecuada, profesional y ética, prestando

Estados

Unidos

e

Inglaterra, entre otros, se están llevando a cabo trabajos sobre evaluación a distancia vía Internet en las áreas de Trabajo y Educativa. Esto plantea todo un conjunto de problemas en relación con las normas de aplicación, control del proceso de evaluación y seguridad de los resultados.

la debida atención a las necesidades y derechos de las personas implicadas en el proceso de evaluación, y teniendo muy en cuenta las razones para utilizar los tests, así como el contexto en el cual se lleva a cabo su aplicación. Este objetivo se alcanzará asegurándose de que el usuario de los tests tiene las competencias y conocimientos necesarios para llevar a cabo el

Por todas estas razones, y otras que se podrían enumerar, parece conveniente disponer de unas

proceso evaluativo. Ámbito de aplicación

directrices internacionales que permita una referencia común a la hora de establecer

Resulta difícil dar una definición muy precisa de

normas nacionales para la mejora del uso de los

test o de su práctica, pues al hacerlo pueden

tests.

dejarse

fuera

algunos

procedimientos

que

debieran incluirse, o, por el contrario, incluir Las presentes directrices recogen el trabajo de especialistas

en

evaluación

psicológica

y

educativa (psicólogos, psicómetras, editores y constructores de tests) de diferentes países, entre ellos España. La idea no ha sido tanto el inventar unas nuevas directrices, como juntar las hebras comunes que se encuentran en las distintas directrices, códigos de práctica y estándares

ya

existentes,

formando

una

estructura coherente que resulte comprensible y de uso práctico.

otros que deberían quedar fuera. En estas directrices los términos test y práctica de los tests

se

directrices

utilizan son

en

sentido

aplicables

amplio. a

Las

muchos

procedimientos de evaluación que no suelen denominarse tests, o que incluso tratan de evitar su designación como tests. Más que proponer una

definición

cerrada,

se

describe

a

continuación el ámbito que tratan de cubrir las directrices.

131 •

•

•

•

Los tests incluyen un amplio abanico de

se autodenominen o no tests. Deben de tenerse

procedimientos utilizados en la evaluación

en cuenta para cualquier procedimiento de

psicológica, educativa y ocupacional.

evaluación utilizado en situaciones en las que la

Los tests incluyen procedimientos para la

evaluación tiene serias implicaciones para las

medición de conductas tanto normales como

personas, pudiendo causarles daños personales

anormales o disfuncionales.

o psicológicos si no se realiza adecuadamente.

Los tests son procedimientos diseñados

Las directrices no se aplican al uso de

para

condiciones

materiales que pueden tener una semejanza

controladas o estandarizadas, y conllevan la

superficial con los tests, pero que los propios

utilización de protocolos de puntuación

participantes reconocen que se utilizan con fines

rigurosos.

de diversión o entretenimiento (por ejemplo, los

Estos procedimientos proporcionan medidas

cuestionarios de estilos de vida de los periódicos

de ejecuciones y conllevan la obtención de

y revistas).

ser

aplicados

inferencias

a

partir

conducta.

También

procedimientos

bajo

de

que

muestras

pueden

de

incluir

proporcionan

clasificaciones cualitativas u ordenamientos de las personas. Cualquier procedimiento utilizado de la forma descrita arriba puede considerarse como un test, independientemente de su forma de aplicación, el tipo de profesional que lo haya construido, o si requiere contestar a ítems o ejecutar ciertas tareas u operaciones.

Destinatarios Las directrices se aplican al uso de los tests en la práctica profesional, por tanto van dirigidas fundamentalmente a: •

Los

compradores

y

vendedores

de

materiales psicométricos •

Los responsables de elegir los tests y el uso que se hará de ellos

•

Quienes aplican, puntúan e interpretan los tests

Los tests deben de estar apoyados por datos

•

Quienes aconsejan a otros basándose en

empíricos sobre su fiabilidad y validez para

los resultados de los tests (consultores en

medir los objetivos que se proponen. Hay que

ámbitos educativos y laborales, orientadores

aportar datos que justifiquen las inferencias que

escolares y profesionales, etc.)

se hacen a partir de las puntuaciones de los

•

Las

personas

encargadas

de

dar

tests. Estos datos tiene que estar disponibles

información sobre los resultados de los tests

para los usuarios de los tests, así como para los

a las personas evaluadas

profesionales e investigadores que deseen llevar

•

Los constructores de tests

a cabo una evaluación o revisión independiente.

•

Los editores de tests

•

Las

Las directrices que se presentan aquí son aplicables a todos los procedimientos descritos,

personas

implicadas

en

entrenamiento de los usuarios de los tests

el

132 • •

Los propios evaluados y las personas

•

Quienes

son

cercanas a ellos (padres, cónyuges, etc.)

resultados

Organizaciones

padres

profesionales

y

otras

los

(los

o

receptores

propios

responsables

de

los

evaluados,

los

legales,

los

asociaciones interesadas en el uso de los

constructores de los tests, los empleadores,

tests

etc.)

•

Legisladores y responsables políticos

•

Usuarios

de

los

tests

con

fines

•

Diferencias según el uso de los resultados de

de

los

tests

(por

ejemplo,

toma

de

decisiones frente a orientación)

investigación •

Grado en el que la situación permite la

Si bien las directrices no pretenden cubrir todo

posibilidad de comprobar la precisión de las

tipo de técnica o situación evaluativa, muchas

predicciones y su posible modificación a la

de las directrices pueden ser aplicables en

luz de los resultados posteriores

situaciones evaluativas que no se identifican estrictamente con la práctica de los tests, tales como

los

centros

de

evaluación

para

Conocimientos

la

entrevistas

Unos conocimientos psicológicos psicométricos

estructuradas y semiestructuradas, orientación

sólidos y una comprensión profunda de todos

escolar y profesional, etc.

los aspectos implicados en el proceso evaluativo

selección

de

personal,

las

constituyen la base fundamental para el uso pertinente de los tests. Los expertos suelen

Aspectos contextuales

estar de acuerdo en que la causa más Las

aplicables

importante del uso inapropiado de los tests es

internacionalmente, pero a la hora de utilizarlas

una formación deficiente de los usuarios. Los

a nivel local en un país determinado deben de

conocimientos concretos requeridos en cada

tenerse en cuenta diversos factores o aspectos

caso variarán en función de la situación y área

que pueden modular su aplicación. Entre otros,

de aplicación, por tanto no es fácil describir de

estos factores contextuales incluyen:

forma general los conocimientos requeridos para

•

directrices

son

la utilización adecuada de los tests en todas las Diferencias

sociales,

políticas,

institucionales, lingüísticas y culturales • • • •

situaciones, ejemplo,

depende

no

se

de

cada

requieren

caso.

los

Por

mismos

La legislación del país en el que se utilizan

conocimientos para aplicar un test colectivo a un

los tests

grupo que para interpretar las puntuaciones, o

Directrices

y

estándares

ya

existentes

construir el propio test, por citar un caso obvio.

establecidos por asociaciones profesionales

Las

Diferencias entre la evaluación individual y

detalladas

la colectiva

pretenden. No obstante, a la hora de aplicarlas a

Diferencias en función de la situación

una situación concreta habrá que tener muy

evaluativa (educativa, clínica, trabajo, otras)

presente

directrices de

y

no estos

describir

hacen

descripciones

conocimientos,

con

ni

precisión

lo

los

133

conocimientos requeridos para el caso. Esta

1.1.4. Asegurarse de que las personas para las

descripción ha de cubrir las distintas áreas de

que trabajan, o con quienes trabajan, se acogen

conocimientos implicadas en la situación de que

a estándares éticos y profesionales adecuados

se trate, entre ellas deberían de incluirse las

1.1.5. Actuar con el debido respeto para la

siguientes: a) Conocimientos sobre teoría de los

sensibilidad de las personas evaluadas y de

tests y propiedades técnicas de los tests, tales

otras personas o instituciones implicadas

como fiabilidad, validez, estandarización, sesgo,

1.1.6. Presentar la práctica de los tests de forma

análisis de ítems, etc. b) Conocimiento de los

positiva y equilibrada cuando interactúan con los

tests y principios de la medición para entender

medios de comunicación

adecuadamente

c).

1.1.7. Evitar las situaciones en las que pueda

Conocimientos sobre la teoría, modelos y

parecer que existen determinados intereses en

constructos medidos, que permita una elección

los resultados de la evaluación, o en las cuales

pertinente de las pruebas e interpretación de los

la evaluación pueda dañar su relación con los

resultados. d). Conocer el abanico de tests

clientes

disponibles,

los

así

resultados.

como

correspondientes.

e).

los

editores

Avances

técnicos

recientes, tales como los tests informatizados, bancos

de

ítems,

etc.

Otros

muchos

1.2. Asegurarse de que son competentes para el uso de los tests 1.2.1. Trabajar de acuerdo con los principios

conocimientos específicos han de ponerse en

científicos

funcionamiento para llevar a cabo una utilización

1.2.2.

adecuada de los tests, cada una de las

estándares personales de competencia

directrices puede servir como indicador de la

1.2.3.

naturaleza de éstos.

competencia y no actuar fuera de ellos

Establecer

Conocer

los

y

mantener

límites

de

elevados

la

propia

1.2.4. Mantenerse al día de los cambios y 1. Uso ético de los tests

avances en relación con el uso de los tests y de su construcción, incluyendo los cambios de

Los usuarios competentes deberían:

normas y legislación, los cuales pueden influir en los tests y su uso

1.1 Actuar de forma ética y profesional 1.1.1. Mantener y promover estándares éticos y

1.3. Responsabilizarse del uso que hacen de

profesionales

los tests

1.1.2.

Estar

al

corriente

de

los

debates

1.3.1. Ofrecer solo servicios y usar tests para los

profesionales y éticos sobre el uso de los tests

cuales están preparados

en su campo de especialización

1.3.2. Aceptar la responsabilidad por los tests

1.1.3. Llevar a cabo una política explícita sobre

elegidos

los tests y su uso (véase ejemplo en el Apéndice

proporcionadas

A)

1.3.3. Dar una información clara y adecuada a

y

por

las

recomendaciones

los participantes en el proceso evaluativo sobre

134

los principios éticos y las disposiciones legales

1.5.2. Explicar los niveles de confidencialidad

que regulan el uso de los tests

antes de dar los resultados

1.3.4. Asegurarse de que el contrato entre los

1.5.3. Limitar el acceso a los resultados

evaluados y los evaluadores es claro y se ha

únicamente a quienes tengan la necesidad y

comprendido (véase un ejemplo de contrato en

derecho a conocerlos

el Apéndice B)

1.5.4. Obtener las autorizaciones pertinentes

1.3.5. Estar atentos a cualquier consecuencia

antes de proporcionar los resultados a otros

imprevista del uso de los tests

1.5.5. Proteger los datos archivados de tal forma

1.3.6. Esforzarse para evitar cualquier tipo de

que sólo puedan acceder a ellos quienes tengan

daño o perjuicio a las personas evaluadas

derecho a hacerlo 1.5.6. Establecer una directrices claras en

1.4. Asegurarse de que los materiales del test están seguros 1.4.1.

Asegurar

relación con el tiempo que se van a mantener archivados los datos

un

almacenaje

seguro

y

1.5.7.

Suprimir

el

nombre

y

otros

datos

controlar el acceso a los materiales del test

identificatorios de los resultados si así lo solicita

1.4.2. Respetar el copyright y los acuerdos que

la persona evaluada

existan sobre el test, incluyendo cualquier

1.5.8.

prohibición sobre la copia y transmisión de los

identificativos de las bases de datos de los

materiales, bien sea electrónicamente o de otra

resultados,

forma. Asimismo se respetarán rigurosamente

elaboración de baremos, u otros tratamientos

los términos del acceso de otras personas,

estadísticos

Suprimir

el

con

nombre

fines

de

y

otros

datos

investigación,

cualificadas o no, a los materiales. 1.4.3. Proteger la integridad del test, no entrenando a las personas con los propios materiales del test, o con otros materiales de prácticas

que

puedan

influir

de

forma

inapropiada en el rendimiento de las personas

2. Utilización adecuada de los tests 2.1. Estimar la utilidad potencial de los tests en una situación evaluativa Los usuarios competentes deberían:

en el test 1.4.4. Asegurarse de que la tecnología del test

2.1.1. Ofrecer una justificación razonada para el

no se expone públicamente de tal modo que su

uso de los tests

utilidad quede deteriorada

2.1.2. Asegurarse de que se ha llevado a cabo un análisis riguroso de las necesidades del

1.5. Asegurarse de que los resultados de los tests se tratan confidencialmente

cliente, categoría diagnóstica, condiciones, o trabajo para el que se utilizará la evaluación

1.5.1. Especificar quienes tendrán acceso a los

2.1.3.

resultados

destrezas, aptitudes, u otras características, que

y

confidencialidad

definir

los

niveles

de

Comprobar

que

los

conocimientos,

miden los tests correlacionan con las conductas

135

pertinentes en el contexto en el que se van a

f.

Aspectos prácticos, tales como tiempo

llevar a cabo las inferencias

requerido,

2.1.4. Buscar otras fuentes fuentes adicionales

necesitan

coste,

o

recursos

que

se

de información 2.1.5. Sopesar las ventajas e inconvenientes de

2.2.3. Evitar el uso de tests que tengan una

utilizar

documentación técnica inadecuada o poco clara

tests

frente

a

otras

fuentes

de

información

2.2.4. Utilizar tests sólo para aquellos objetivos

2.1.6. Asegurarse de que se utilizan todas las

para los cuales se dispone de una validez

fuentes de información colateral disponibles

empírica adecuada y pertinente 2.2.5. No aceptar un test basándose únicamente

2.2. Elegir tests técnicamente correctos y

en su validez aparente, recomendaciones de

adecuados a cada situación

otros usuarios, o consejos de quienes tienen intereses comerciales

Los usuarios competentes deberían:

2.2.6. Responder a las preguntas de las

2.2.1. Examinar toda la información disponible sobre los tests potencialmente adecuados antes de elegir un test concreto 2.2.2. Comprobar que la documentación técnica

personas

implicadas

(personas

evaluadas,

padres, supervisores, representantes legales, etc.), dándoles suficiente información para que entiendan por qué se eligió el test

sobre el test proporciona suficiente información

2.3.

para evaluar los siguientes aspectos:

relacionados con el sesgo de los tests

a. Amplitud y representatividad del contenido

Cuando los tests se van a utilizar con personas

del

test,

adecuación

de

los

atención

a

los

aspectos

grupos

de diferentes grupos (por ejemplo: género,

normativos utilizados, nivel de dificultad de

cultura, educación, etnia, origen, o edad, entre

los contenidos, etc.

otros), los usuarios competentes de los tests

b. Precisión de la medición y fiabilidad para las poblaciones pertinentes c.

Prestar

harán

todos

los

esfuerzos

posibles

para

asegurarse de que:

Validez para las poblaciones pertinentes y su aplicabilidad para el uso que se hace del

2.3.1. Los tests son imparciales y adecuados

test

para todos los grupos evaluados

d. Ausencia de sesgo para los grupos con los que se utilizará

son relevantes para cada uno de los grupos

e. Aceptación por parte de quienes están implicados

en

2.3.2. Los constructos que se están midiendo

su

uso,

incluyendo

pertinencia y validez aparente percibidas

la

evaluados 2.3.3. Existen datos disponibles sobre las diferencias de rendimiento de los grupos en el test

136

2.3.4.

el

2.3.12. Se ha recabado consejo de los expertos

Funcionamiento Diferencial de los Ítems cuando

acerca de los efectos de la discapacidad sobre

ello es pertinente

el rendimiento en el test

2.3.5. Hay datos sobre la validez que apoyan el

2.3.13. Se han consultado las personas a

uso del test en diferentes grupos

evaluar y se ha dado un tratamiento adecuado a

2.3.6.

Hay

Se

datos

disponibles

minimizan

los

sobre

efectos

de

las

sus necesidades y deseos

diferencias grupales no relacionadas con el

2.3.14. Se han llevado a cabo los ajustes

objetivo de la medición

oportunos cuando se evalúa a personas con

2.3.7. Las directrices sobre la imparcialidad de

discapacidades auditivas, visuales, motoras,

los tests se interpretan dentro del marco de la

dislexia, u otras

legislación al respecto existente en cada país.

2.3.15. Se ha contemplado la posiblidad de utilizar

procedimientos

de

evaluación

Cuando se utilizan los tests en más de un idioma

alternativos en vez de modificaciones o ajustes

(idiomas distintos, dialectos, lenguaje de signos,

de los tests

etc.) los usuarios competentes harán todos los

2.3.16. Se ha solicitado consejo a expertos en el

esfuerzos posibles para asegurarse de que:

caso de que el grado de modificación requerido por el test esté más allá de la experiencia y

2.3.8. Las versiones de los distintos idiomas o dialectos hayan sido elaboradas utilizando una metodología rigurosa

aspectos

de

2.3.17.

Las

modificaciones,

cuando

sean

necesarias, se ajustan a la naturaleza de la

2.3.9. Los constructores hayan sido sensibles a los

conocimientos del usuario

contenido,

culturales

e

idiomáticos

discapacidad y se han diseñado para minimizar el impacto sobre la validez de las puntuaciones 2.3.18. La información relativa a cualquier ajuste

2.3.10. Quienes aplican los tests sean capaces de comunicarse perfectamente en el idioma en el que se aplica el test

o modificación hechos en el test o en su aplicación se comunica a quienes interpretan o utilizan las puntuaciones del test, para así

2.3.11. El dominio de la lengua (en la que se aplicará el test) de las personas evaluadas sea

facilitar una interpretación apropiada de las puntuaciones

comprobado sistemáticamente, utilizándose la versión más adecuada, o una bilingüe si fuese

2.4. Hacer los preparativos necesarios para la

necesario

aplicación del test

Cuando se utilizan los tests con personas que

El usuario competente hará todo lo posible para:

tienen

alguna

discapacidad,

los

usuarios

competentes harán todo lo que sea posible para

2.4.1. Proporcionar en el momento oportuno una

asegurarse de que:

información clara a las personas implicadas en la evaluación acerca de la finalidad del uso de

137

los tests, la mejor forma de prepararse para la

2.4.8. Prever posibles problemas y solventarlos

sesión de tests y los procedimientos a seguir

mediante

2.4.2. Aconsejar a los evaluados acerca de los

instrucciones

la

preparación

de

materiales

e

idiomas y dialectos para los que es apropiado el 2.5. Aplicar los tests adecuadamente

test 2.4.3. Proporcionar información a quienes van a hacer el test sobre el tipo de práctica permitida, así como la documentación donde pueden encontrar ejemplares y materiales oportunos

derechos y deberes (véase Apéndice B)

de

sus

responsables

o

representantes legales antes de aplicar los tests 2.4.6. explicar

Cuando a

los

las

tests

sean

personas

opcionales,

implicadas

las

consecuencias de hacerlos o no, para que puedan tomar una decisión con fundamento

para asegurarse de que: preparativos

coinciden

con

los

b. Los locales y otras facilidades para aplicar los tests se han reservado con antelación, el físico

es

accesible,

seguro,

tranquilo, libre de distracciones, y se ajusta a las necesidades c.

crear o reforzar ansiedad innecesaria 2.5.3.

Eliminar

Hay suficiente material disponible y se ha comprobado que no han quedado señales de usuarios previos en los cuadernillos o en las hojas de respuestas

d. Las personas implicadas en la aplicación de los tests son competentes e. Se han hecho los ajustes oportunos para aplicar los tests a las personas con alguna discapacidad (véase Apéndice C)

fuentes

potenciales

de

distracción, tales como alarmas de relojes de pulsera, teléfonos móviles, buscas, etc. 2.5.4. Asegurarse de que todas las personas

responder al test antes de comenzar éste 2.5.5.

establecidos en el manual del test

entorno

personas a las que se va a evaluar, evitando

disponen de los materiales necesarios para

2.4.7. Hacer los necesarios ajustes prácticos

a. Los

dirigiéndose a ellas de forma positiva 2.5.2. Tratar de reducir la ansiedad de las

2.4.5. Obtener el consentimiento explícito de los o

2.5.1. Establecer una buena relación con las personas evaluadas, dándoles la bienvenida y

2.4.4. Explicar claramente a los evaluados sus

evaluados

Los usuarios competentes deberían:

Supervisar

convenientemente

la

aplicación de los tests 2.5.6. Dar las instrucciones en la lengua dominante de las personas evaluadas siempre que sea posible, incluso cuando el test está diseñado para proporcionar datos sobre el conocimiento o dominio de una lengua distinta de la dominante 2.5.7. Ajustarse estrictamente a las instrucciones del manual del test, haciendo los ajustes pertinentes para las personas con alguna discapacidad 2.5.8.

Leer

las

instrucciones

pausada

y

claramente 2.5.9. Dar el tiempo adecuado para hacer los ejemplos

138

2.5.10.

Observar

y

anotar

las

posibles

2.6.4.

Elegir

los

tipos

de

escala

más

desviaciones de los procedimientos estándar del

convenientes de acuerdo con el uso que se vaya

test

a hacer de las puntuaciones del test

2.5.11. Registrar los tiempos de respuesta con

2.6.5.

precisión cuando se requiera

transformaciones de las escalas, así como la de

2.5.12. Asegurarse de que están todos los

cualquier tipo de análisis o tratamiento que se

materiales al final de cada sesión

haga con los datos

2.5.13. Realizar la aplicación de modo que

2.6.6.

permita

una

conclusiones erróneas debido a la utilización de

comprobación de la identidad de cada una de

baremos desfasados, o inadecuados para las

las personas evaluadas

personas evaluadas

2.5.14. Permitir a los ayudantes hacerse cargo

2.6.7. Calcular las puntuaciones compuestas

de la aplicación sólo si han sido entrenados

cuando proceda, utilizando las fórmulas y

adecuadamente

ecuaciones propuestas en el manual del test

2.5.15. Asegurarse de que durante la sesión

2.6.8. Inspeccionar los resultados para detectar

aplicación no se deja desatendidas o sujetas a

posibles

distracción a las personas evaluadas

puntuaciones

2.5.16. Proporcionar una asistencia adecuada a

2.6.9. Describir e identificar con precisión los

las personas evaluadas que muestran signos

resultados, normas, tipos de escalas, fórmulas,

excesivos de ansiedad o desazón

etc. utilizados

2.6. Puntuar y analizar los resultados de los

2.7.

tests con precisión

adecuadamente

Los usuarios competentes deberían:

Los usuarios competentes deberían:

2.6.1. Seguir al pie de la letra los procedimientos

2.7.1. Tener una buena comprensión profesional

estandarizados de puntuación

de las bases teóricas y conceptuales del test, de

2.6.2. Asegurarse de la precisión al asignar las

la documentación técnica y de las directrices

puntuaciones, especialmente en aquellos casos

para el uso e interpretación de las puntuaciones

en los que entra en juego el juicio de los

2.7.2. Tener una buena comprensión profesional

evaluadores. Para cerciorarse de la precisión

de las escalas utilizadas, de las normas y

puede volver a puntuarse una muestra de las

baremos, así como de las limitaciones de las

personas

puntuaciones

una

supervisión

evaluadas,

adecuada

comprobando

y

así

la

Comprobar

Asegurarse

errores

Interpretar

la

de

o

precisión

que

no

anomalías

los

de

se

en

las

sacan

las

resultados

coincidencia entre las puntuaciones

2.7.3. Tratar de minimizar cualquier sesgo que

2.6.3. Llevar a cabo las transformaciones de las

pueda existir hacia las personas evaluadas en la

puntuaciones directas a otros tipos de escalas

interpretación de las puntuaciones del test

pertinentes

139

2.7.4. Utilizar normas o grupos de comparación

disponga de datos sobre los efectos de dicha

apropiados cuando estén disponibles

experiencia sobre el rendimiento en la prueba

2.7.5. Interpretar los resultados a la luz de la información

disponible

sobre

la

persona

evaluada (edad, género, escolaridad, cultura, etc.),

teniendo

en

cuenta

las

limitaciones

técnicas del test, el contexto de la evaluación, y las necesidades de las personas o instituciones con intereses legítimos en el resultado del proceso evaluativo

de un test a rasgos o características de la persona que no han sido medidos por el test

medida de cada escala, así como otros factores que puedan alterar artificialmente los resultados a la hora de interpretar las puntuaciones muy

en

cuenta

los

medido en relación con las características de los grupos evaluados, tales como cultura, edad, clase social, género, etc. Utilizar

puntos

corte

en

la

se disponga de datos empíricos sobre su validez 2.7.10. Ser conscientes de los estereotipos sociales que pueden existir sobre las personas evaluadas (en relación con su cultura, edad, clase social, género, etc.), evitando interpretar los tests de forma que se perpetúen dichos estereotipos

individual o colectiva que se haya hecho procedimiento

estándar

en

la

aplicación de las pruebas 2.7.12.

2.8.2. Elaborar informes orales o escritos para los receptores de los resultados, siempre con el explícito

de

las

personas

evaluadas o de sus representantes legales 2.8.3. Asegurarse de que el nivel técnico de los contenidos de los informes es adecuado para su

2.8.4. Dejar muy claro en los informes que los resultados de los tests son confidenciales, y especificar

el

tiempo

que

se

mantendrán

archivados los resultados

representan una sola fuente de información que debe

analizarse

conjuntamente

con

otras

fuentes 2.8.6. Explicar el peso que debe de darse a las puntuaciones de los tests en relación con otras fuentes de información acerca de las personas evaluadas 2.8.7. Proporcionar la información sobre los resultados en un lenguaje comprensible para el

2.7.11. Tener en cuenta cualquier variación

al

pertinentes que pueden recibir los resultados de

2.8.5. Dejar claro que los datos de los tests de

interpretación de las puntuaciones sólo cuando

respecto

2.8.1. Identificar las personas o instituciones

comprensión por los receptores datos

disponibles sobre la validez del constructo

2.7.9.

Los usuarios competentes deberían:

consentimiento

2.7.7. Tener en cuenta la fiabilidad y el error de

Tener

y precisa

los tests

2.7.6. Evitar la generalización de los resultados

2.7.8.

2.8. Comunicar los resultados de forma clara

Tomar

en

consideración

receptor, de modo que se minimice la posibilidad de interpretaciones incorrectas 2.8.8. Utilizar una forma y estructura para el informe que encaje en el contexto de la

cualquier

experiencia previa que la persona evaluada haya tenido con el test, en el caso de que se

evaluación

140

2.8.9. Si procede, proporcionar información a

baremos,

quienes toman las decisiones acerca de como

proporcionando los datos pertinentes a los

pueden usar los resultados de los tests para

constructores, editores o investigadores

fiabilidad

y

validez

del

test,

mejorar sus decisiones 2.8.10. Explicar y fundamentar la utilización que se hace de los resultados en los tests para la clasificación de las personas en categorías con fines diagnósticos, u otros. 2.8.11. Incluir un resumen claro en los informes escritos,

y,

cuando

sea

pertinente,

recomendaciones concretas 2.8.12.

Dar

información

Apéndice A Directrices

para

el

establecimiento

de

políticas sobre el uso de los tests Las directrices que siguen se refieren a la

a

las

personas

evaluadas de forma constructiva y positiva

necesidad de las organizaciones de considerar su política sobre la práctica de los tests de forma

2.9. Revisión de la adecuación del test y de

sistemática, asegurándose de que todas las personas implicadas en la evaluación tienen

su uso

clara esta política. La necesidad de una política explícita sobre la práctica de los tests no atañe

Los usuarios competentes deberían:

sólo

a

las

grandes

organizaciones.

Las

2.9.1. Seguir y revisar periódicamente los

empresas de tamaño medio o pequeño, al igual

posibles cambios en la población de personas

que las grandes, deben de prestar atención a la

evaluadas, así como los criterios utilizados para

política sobre la práctica de los tests, de la

la validez

misma forma que lo hacen en relación con la

2.9.2.

Estar

atentos

a

posibles

impactos

salud

y

seguridad

laboral,

igualdad

de

negativos de los tests

oportunidades, discapacidades, u otras áreas

2.9.3. Ser conscientes de la necesidad de

relacionadas con una práctica adecuada en el

reanalizar la utilización de un test si se ha

tratamiento y atención al personal.

llevado a cabo algún cambio en su forma, Aunque las siguientes consideraciones pueden

contenidos, o forma de aplicación de

necesitar una adaptación para su utilización por

reconsiderar la validez del test si se ha

parte de usuarios individuales de los tests

cambiado la finalidad para la que se utilizaba

cuando actúan como profesionales, sigue siendo

2.9.5. Siempre que sea posible, validar los tests

importante que tengan muy clara su propia

para los usos para los que fueron elaborados y

política y que puedan comunicarla a otros.

2.9.4.

Tener

presente

la

necesidad

participar en los trabajos rigurosos de validación que se lleven a cabo 2.9.6. Ayudar en la medida de sus posibilidades a mantener al día la información sobre los

Los objetivos de una política sobre el uso de los tests serían:

141 •

Asegurar

que

se

alcanzan

las

metas

Cualquier política que se establezca sobre tests

personales y organizacionales

tiene

•

Evitar el posible uso inadecuado de los tests

actualizándola de acuerdo con los avances

•

Demostrar explícitamente el compromiso

producidos en los tests o en su utilización. Hay

con una práctica adecuada

que permitir el acceso e informar sobre la

Asegurar que el uso de los tests se ajusta a

política establecida a las partes implicadas en la

los fines establecidos

utilización de los tests. La responsabilidad de la

Asegurar que los tests se utilizan de forma

política de una organización debe recaer en un

no discriminativa

usuario cualificado, que tenga autoridad para

Asegurar que las evaluaciones se basan en

asegurar su implementación y cumplimiento.

• • •

que

ser

revisada

periódicamente,

información comprensiva y pertinente •

Asegurar que los tests son utilizados por personas cualificadas para ello

Directrices para desarrollar contratos entre

Una política sobre el uso de los tests deberá abordar los siguientes aspectos.

las partes implicadas en la evaluación Los contratos entre los usuarios de los tests y las personas evaluadas deben de estar de

•

Uso adecuado de los tests

•

Seguridad de los materiales y puntuaciones

•

Quién puede aplicar, puntuar e interpretar

acuerdo con los criterios de una práctica

los resultados •

Apéndice B

adecuada, la legislación correspondiente y la política establecida sobre el uso de los tests. Los puntos que siguen se ofrecen como un ejemplo

Cualificaciones de quienes van a usar los tests

del tipo de aspectos que un contrato de este tipo debe abarcar. Los detalles variarán en función

•

Entrenamiento de los usuarios

•

Preparación de las personas a evaluar

•

Acceso a los materiales y seguridad de los

del contexto de la evaluación (ocupacional, educativo, clínico, jurídico, etc.), y de las leyes y regulaciones locales y nacionales.

tests • • •

•

Acceso a los resultados y confidencialidad

Los contratos entre los usuarios, las personas

de las puntuaciones

evaluadas y otras partes implicadas aparecen

Información sobre los resultados a las

con

personas evaluadas

explícitamente, al menos en parte. Dejando

Responsabilidades hacia los evaluados,

claros

antes, durante y después de la sesión de

responsabilidades de cada una de las partes

tests

ayuda a evitar los malentendidos, los perjuicios y

Responsabilidades

individuales

de

los

frecuencia

los

implícitos,

objetivos,

el

no

formalizados

papel

la necesidad de acudir a los tribunales.

usuarios de los tests El usuario se compromete a:

y

las

142

1. Informar a las personas evaluadas de sus

10. Asegurarse de que las personas evaluadas

derechos en cuanto a cómo se utilizarán sus

saben que se les explicarán los resultados

puntuaciones de los tests, así como sus

después de hacer el test tan pronto como

derechos de acceso a ellas

sea posible y en términos que les resulten

2. Advertir con anterioridad suficiente sobre cualquier carga económica que conlleve el proceso

saben que sus resultados son confidenciales

responsable de los pagos y fechas en las

hasta el punto que permitan la ley y una

que deben de hacerse efectivos

práctica profesional adecuada

a

cortesía,

evaluación,

las

personas

imparcialidad

quién

es

11. Asegurarse de que las personas evaluadas

el

3. Tratar

de

comprensibles

evaluadas y

con

12. Informar a las personas evaluadas sobre

respeto,

quienes tendrán acceso a los resultados y

independientemente de su raza, género,

las

edad, discapacidad, etc.

proporcionarán

condiciones

bajo

las

cuales

se

4. Utilizar tests de calidad probada, adecuados

13. Asegurarse de que las personas evaluadas

a las personas evaluadas y a la situación de

conocen los procedimientos para elevar

evaluación

quejas o comunicar algún problema

5. Informar antes de la aplicación de los tests sobre la finalidad de la evaluación, el tipo de

El usuario comunicará a las personas evaluadas

test, a quién se enviarán los resultados y el

que se espera de ellas:

uso que hará de ellos 6. Avisar con antelación donde se aplicarán los tests, cuando se darán los resultados, y si pueden o no obtener una copia del test una vez hecho, de su hoja de respuestas, o de

personas

cualificadas

para

la

aplicación de los tests y la interpretación de los resultados 8. Asegurarse de que las personas a evaluar saben si el test es opcional o no, y, cuándo lo sea, asegurarse de que conocen las consecuencias de hacerlo o no hacerlo 9. Asegurarse de que las personas que van a hacer el test conocen las condiciones (si las hubiera) en las que podrían volver a hacer el test, ser calificados de nuevo, o anulárseles la prueba

las

personas

durante

el

proceso

de

evaluación 15. Preguntar antes del test si no están seguras acerca de por qué se aplica el test, cómo se

sus puntuaciones 7. Utilizar

14. Un trato cortés y respetuoso con el resto de

aplicará, qué tienen que hacer exactamente, y que se hará con los resultados 16. Informar sobre cualquier circunstancia que consideren

que

puede

invalidar

los

resultados del test, o que deseen que se tenga en cuenta 17. Seguir las instrucciones de la persona que aplica el test 18. Ser consciente de las consecuencias que se siguen de no hacer el test, si deciden no hacerlo, y estar preparado para aceptar dichas consecuencias

143

19. Si se requiere abonar alguna cantidad para

tiempo de aplicación, el uso de Braille, o

hacer la prueba, los pagos se harán en la

versiones auditivas de los tests en casete,

fecha acordada

deben

de

utilizarse

como

guía

para

las

modificaciones que se lleven a cabo. Aunque Apéndice C

una estricta estandarización de la versión

Aplicación de los tests a personas con alguna discapacidad

para

aplicarlo

personas

con

alguna

discapacidad hay que proceder con sumo cuidado y experiencia. Como siempre, si existe alguna legislación local o nacional específica debe respetarse, así como el derecho a la privacidad de la persona evaluada. Cuando se recoge la información sobre los tipos y niveles de

discapacidad

hay

que

limitarse

a

la

información relativa a la capacidad de cada persona para llevar a cabo las tareas requeridas por el test. Hay que poner especial cuidado cuando los tests se utilizan en el ámbito ocupacional,

bien

sea

para

selección,

promoción, u otros fines.

correctamente que sea generalizable a todas las personas con algún tipo de discapacidad. Queda a juicio del profesional si es mejor utilizar una forma alternativa de evaluación o modificar el test, o su forma de aplicación. En la práctica no suele ser posible baremar los tests modificados muestras

amplias

Dada la escasez de información sobre el rendimiento en los tests (modificados o no) de las personas con alguna discapacidad, suele ser más adecuado utilizar los resultados de forma más cualitativa. Puede tomarse como una indicación

de

la

característica

evaluada,

complementándola con información recogida por otros métodos. En el caso de aplicaciones individuales el evaluador

suele

poder

ajustar

los

procedimientos evaluativos a las capacidades de la persona evaluada. Sin embargo, en el caso

de

aplicaciones

colectivas

aparecen

problemas especiales, como ocurre por ejemplo

No hay una regla sencilla para aplicar un test

en

lo sea deben de llevarse a cabo estudios piloto con muestras pequeñas.

Cuando se modifica la forma de aplicación de un test

modificada tal vez no sea posible, siempre que

de

personas

con

discapacidades equivalentes, de modo que se pueda asegurar la comparabilidad del test con la versión estándar. No obstante, cuando haya datos al respecto, por ejemplo, en el caso de los efectos producidos por la modificación del

en selección de personal. En estos casos puede haber dificultades prácticas para modificar la forma de aplicación para determinadas personas dentro del marco de una aplicación colectiva. Además, los tratamientos diferenciados podrían ser vistos por algunos como discriminatorios. Por ejemplo, si se concede más tiempo para hacer el test, las personas discapacitadas podrían tener la sensación de que son tratadas de forma diferente, mientras que quienes no tienen ninguna discapacidad pueden pensar que el tiempo extra concedido proporciona a los otros una ventaja.

144

Consejos sobre necesidades especiales pueden

3. Cuando

una

discapacidad

ajena

al

obtenerse habitualmente de las organizaciones

constructo medido influye en el rendimiento

de discapacitados, así como de las propias

en el test, deben de llevarse a cabo los

personas con discapacidades a las que se van

ajustes convenientes en la prueba

aplicar los tests. Suele ser de gran ayuda dirigirse

directamente

a

las

personas

4. Los usuarios deben de consultar siempre el

y

manual del test y los editores para buscar

preguntarles si hay alguna circunstancia que

información sobre las modificaciones de las

consideran que debe de tenerse en cuenta. En

pruebas

muchos casos esta consulta va a permitir llevar

procedimientos alternativos

a cabo las modificaciones oportunas en el

y

sobre

posibles

formatos

y

5. Los usuarios de tests deben de consultar a

contexto de aplicación de la prueba, sin tener

las

organizaciones

que modificar el propio test.

discapacitados acerca de las implicaciones de

Las

siguientes

reglas

generales

una

correspondientes

discapacidad

concreta,

de

la

pueden

documentación sobre la discapacidad, y el

utilizarse como guía a la hora de decidir si se

tipo de modificaciones que podrían ser

modifica el proceso evaluativo y cómo hacerlo.

convenientes 6. Cualquier tipo de modificación que se haga

1. Si la discapacidad no afecta al rendimiento

en el test o en el proceso de aplicación debe

en el test, no es necesario hacer ajustes en

de

la prueba 2. Cuando

estar

rigurosamente

documentada,

exponiendo claramente las razones que la

discapacidad

influye

en

el

justifican la modificación

rendimiento en el test hay que distinguir si esta influencia es incidental o forma parte

DOCUMENTACIÓN

del constructo medido. Si es incidental hay que modificar el test, pero si forma parte del

Inglés:

constructo medido no. Por ejemplo, una •

American

Educational

problemas con un test de velocidad que

Association,

American

conlleve escribir. Si la capacidad para

Association,

escribir rápidamente formase parte del

Measurement

constructo medido, entonces no debería de

Standards for Educational and Psychological

cambiarse el test. Sin embargo, si la

Testing.

finalidad fuese, por ejemplo, medir la rapidez

Psychological Association.

persona con artritis en las manos tendrá

de percepción visual, habría que buscar una

•

&

Research Psychological

National in

Council

Education.

Washington

DC:

on

(1985).

American

Bartram, D. (1995). The Development of

forma de respuesta a la prueba más

Standards for the Use of Psychological

adecuada, pues la artritis estaría influyendo

Tests

negativamente en el constructo medido.

Competence Approach. The Psychologist,

in

Occupational

May, 219-223.

Settings:

The

145 •

Bartram, D. (1996). Test Qualifications and

Assessment of Test User Qualifications: A

Test Use in the UK: The Competence

Research-Based Measurement Procedure.

Approach.

American Psychologist, 50, 14-23.

European

Journal

of •

Psychological Assessment, 12, 62-71. •

•

Schafer, W. D. (1992). Responsibilities of

Canadian Psychological Association. (1987).

Users

Guidelines

Statement

for

Educational

and

of

Standardized Revised.

Tests:

RUST

Alexandria,

VA:

Psychological Testing. Ottawa: Canadian

American Association for Counseling and

Psychological Association.

Development.

Eyde, L. D., Moreland, K. L. & Robertson, G.

•

Van de Vijver, F. & Hambleton, R. (1996).

J. (1988). Test User Qualifications: A Data-

Translating tests: some practical guidelines.

based Approach to Promoting Good Test

European Psychologist , 1, 89-99.

Use. Report for the Test User Qualifications Working Group. Washington DC: American Psychological Association. •

Eyde, L. D., Robertson, G. J., Krug, S. E. et

Castellano: •

Deontológico. Madrid: Colegio Oficial de

al (1993). Responsible Test Use: Case Studies For Assessing Human Behaviour. Washington DC: American Psychological

Psicólogos. •

Fremer, J., Diamond, E. E. & Camara, W. J. (1989). Developing a Code of Fair Testing Practices

in

Education.

Hambleton, adapting

R.

(1994).

educational

and

•

Committee

on

Guidelines

for

psychological

Testing

• •

Psychological

(1993).

Revista

de

Historia

de

la

Muñiz,

J.

(1997).

Aspectos

éticos

y

A.

Cordero

(Ed.),

La

evaluación

psicológica en el año 2000. Madrid: TEA •

Moreland, K. L., Eyde, L. D., Robertson, G. J., Primoff, E. S. & Most, R. B. (1995).

Muñiz, J. y Hambleton, R. K. (1996). Directrices para la traducción y adaptación de los tests. Papeles del Psicólogo, 66, 63-

Tests.

Australian Psychological Society. •

R.

Franca Tarragó, O. (1996). Ética para

En

Clancy, D. (1997). Supplement to Guidelines of

Ballesteros,

Ediciones.

Kendall, I., Jenkinson, J., De Lemos, M. &

use

Tests:

deontológicos de la evaluación psicológica.

Practices.

on Testing Practices.

the

de

psicólogos. Bilbao: Desclée de Brouwer.

Education. Washington DC: Joint Committee

for

Comisión

Psicología, 14, 97-114.

(1988). Code of Fair Testing Practices in

•

Fernández

aplicación.

of Psychological Assessment, 10, 229-244. Joint

COP,

Evaluación psicológica en sus contextos de

American

tests: A progress report. European Journal •

del

http://www.cop.es/tests/

Psychologist, 44, 1062-1067. •

Colegio Oficial de Psicólogos (1999). Página web

Association. •

Colegio Oficial de Psicólogos (1987). Código

70. •

Rodríguez Sutil, C. (1996). La ética de la devolución en el psicodiagnóstico clínico. Papeles del Psicólogo, 66, 91-94.

146

COMISIÓN DE TESTS DEL COLEGIO OFICIAL DE PSICÓLOGOS o

José Muñiz (Coordinador). Universidad de Oviedo

o

Mª

Teresa

Anguera.

Universidad

de

Barcelona o

Rocío Fernández Ballesteros. Universidad Autónoma de Madrid

o

José

Ramón

Fernández

Hermida.

Universidad de Oviedo o

Manuel García Pérez. ALBOR-COHS

o

Miguel Martínez. EOS

o

Rosario

Martínez

Arias.

Universidad

Complutense de Madrid o

Eduardo Montes. COP

o

Gerardo Prieto. Universidad de Salamanca

o

Carlos

Rodríguez

Complutense de Madrid o

Nicolás Seisdedos. TEA

Sutil.

Universidad

Curso de Psicometria

Short Description

Description

Comments

We need your help!