Hogan Pruebas Psicológicas Cap. 3

August 17, 2017 | Author: Angie Valdés | Category: Statistics, Standard Deviation, Quantile, Normal Distribution, Variance
Share Embed Donate


Short Description

Descripción: Hogan-Pruebas Psicológicas-Cap.-3.pdf...

Description

46 • Pruebas psicológicas. Una introducción práctica

sen al lector, tomar nota de la longitud y el estilo de las revisiones. c. Suponiendo que se encontró con una de las listas completas (TIP V, Test Critiques, etc.), anotar la información que contienen varias entradas. Luego, seleccionar un tema como autoconcepto o razonamiento crítico y utili­ zar el índice temático para buscar pruebas sobre ese tema. 3. Suponiendo que se tiene acceso a la base de datos, en CD o en Internet, del Mental Measu­ rements Yearbook de SilverPlatter:

a. Buscar el título de una determinada prueba y acceder al texto completo de una de las revi­ siones. b. Realizar una búsqueda basada en palabras cla­ ve -por ejemplo, self-concept (autoconcepto), attention deficit disorder (trastorno por défi­ cit de atención) o mathematics achievement (desempeño en matemáticas). Luego, exami­ nar los registros obtenidos (al desarrollar este ejercicio, activar Display Options para que no se recupere el Full Text (Texto completo de las revisiones.)

4. Para asegurarse de que ya sabe cómo utili­ zar ciertas fuentes, buscar las entradas si­ guientes:

(Capítulo 2)

c. Una de las publicaciones expuestas en las pá­ ginas 41 y 42. 6. Con ayuda de las direcciones electrónicas de las editoriales que aparecen en el Apéndice C, trate de acceder al catálogo de una de las edito­ riales. ¿Se presenta todo el catálogo? De ser así, ¿qué información proporciona? 7. Si dispone del catálogo impreso de una de las editoriales, examine las entradas. ¿Qué tan pa­ recidas son a la entrada que aparece en la figura 2-5? 8. Determinar si la biblioteca local cuenta con alguna de las colecciones para fines especia­ les que se plantean en las páginas 39 y 40. Anotar los números de acceso pues se usarán más adelante. 9. Elija alguna de las tres publicaciones periódi­ cas que aparecen en las páginas 41 y 42 y deter­ mine si la biblioteca local está suscrita a ellas. Explore los números recientes de las publica­ ciones para averiguar qué temas y pruebas se tratan. Se recomienda tomar en cuenta que al­ gunos de los artículos serán muy técnicos y qui­ zá no los comprenda hasta haber estudiado los capítulos 3 a 6. 10. Pregunte a un psicólogo clínico, un asesor psico­ lógico, un psicólogo escolar o algún otro profe­ sional de una disciplina afín qué pruebas utiliza normalmente; pida su opinión sobre los instru­ mentos y averigüe por qué utiliza esa y no otra.

a. Stanford Achievement Test (Prueba de Apro­ vechamiento Stanford) en TIP V.

b. W oodcock-Johnson PsychoEducational Battery (Batería Psicoeducativa WoodcockJohnson) en Tests. c. La Dysfunctional Attitude Survey (Encuesta de Actitudes Disfuncionales) en el Directory o f U n p u b lished E xperim ental M ental Measures, Volume 7. Para cada uno de estos tres ejercicios, anotar el tipo de información que dan las fuentes. 5. Para cada una de las fuentes de información si­ guientes, revisar uno de los libros o publicacio­ nes —no los lea de modo detallado— y hará anotaciones sobre el tipo de información que ofrece la fuente.

a. Una de las colecciones para fines especiales abordada en las páginas 39 y 40.

b. Uno de los libros sobre una sola prueba trata­ dos en las páginas 40 y 41.

Nota: Los dos siguientes ejercicios son proyectos muy sustanciales, tal vez convengan como proyectos de final de curso. A diferencia de los ejercicios anterio­ res, no constituyen algo que pueda completarse en unos cuantos minutos.

11. Utilizando el formato propuesto en el Apéndice A: Revisión y selección de pruebas, hacer la re­ visión formal de una prueba; para este ejercicio, se requiere tener la prueba físicamente. También convendría contar con la entrada del catálogo de la editorial de la prueba. 12. Utilizando el formato propuesto en el Apéndice A para la selección de pruebas, elija una prueba a manera de ejercicio. Entre los ejemplos de áreas en las que podría hacerse este ejercicio se en­ cuentran: pruebas de diagnóstico de lectura para estudiantes de enseñanza elemental, pruebas de pensamiento creativo para estudiantes universi­ tarios, exámenes de admisión a la universidad, pruebas de depresión, ansiedad o trastornos de la conducta alimentaria.

í ix u b o i

p & iQ O ÍégtC O S

T ho i^q j P. -fj-c-Qd>0 fóF

'±J»3 F Q

Capítulo O Normas de las pruebas

Objetivos 1 . D efinir la finalidad de las norm as de las pruebas. 2. Actualizar los conocim ientos del lector sobre estadística descriptiva: tipos de escalas, distribuciones de frecuencia, térm inos para d e scrib ir las formas de las distribuciones, m ediciones de tendencia central, m ediciones de variabilidad y puntuaciones 1. 3 . Identificar los diversos tipos de puntuaciones naturales de las pruebas. 4 . Reconocer el significado de theta.

ao o o tjo S §C i Uj /a o § ©

5. D efinir cada uno de estos tipos de norm as: percentiles y rangos percentilares, puntuaciones estándar, norm as de desarrollo. 6. Resumir las fortalezas y debilidades de cada tipo de norm a. 7. Precisar las características de cada tipo de grupos de norm as: nacional, conveniente, de usuarios, subgrupo, local e institucional. 8. D iferenciar entre las interpretaciones referidas al criterio y a la norm a. 9 . Explicar cóm o se determ ina la utilidad de un grupo norm ativo. 47

48 • Pruebas psicológicas. Una introducción práctica

FINALIDAD DE LAS NORMAS

Matt realizó correctamente 36 reactivos en la prueba de vocabulario, ¿eso es bueno o malo? Meg respon­ dió “sí” a 14 de los 30 reactivos en un indicador de ansiedad en la prueba, ¿significa eso que es inusual­ mente ansiosa o tranquila al someterse a una evalua­ ción? Dan respondió correctamente a 52 de los 80 reactivos en una prueba de lectura y a 24 de 40 en una prueba de ciencias, ¿es relativamente mejoren lectu­ ra o en ciencias? Esta clase de preguntas se abordan bajo el tema de normas de las pruebas. La idea fun­ damental consiste en traducir lo que se denomina pun­ tuación natural en algún tipo de puntuación nor­ malizada. La puntuación natural es el resultado más o menos inmediato de las respuestas de un individuo a una prueba. En el sistema de puntuación normali­ zada, la puntuación natural del individuo se compara

con las puntuaciones de los individuos que forman parte del grupo normativo; estas puntuaciones se conocen también como derivadas o escalares. Este ca­ pítulo aborda dos preguntas cmciales sobre las normas de las pruebas, a saber: ¿cuáles son los tipos de nor­ mas que suelen ser utilizadas?, y ¿qué son los grupos normativos, es decir, de dónde provienen las normas? A las p untuaciones n atu ra le s las determ inan, e n p ar­ te, ca racte rísticas co m o la lo ng itu d de la prueba, la elección del lím ite d e tie m p o, la s dificultades de los reactivos y las circu n sta n cia s en las que se aplica el In stru m e n to . E sto d ific u lta la in te rp re ta ció n de las puntuaciones n aturales en ausen cia de m ás inform a­ ción. La in te rp re ta ció n y el aná lisis estadístico puede facilitarse al c o n ve rtir la s p un tua cio n es naturales en un co n jun to co m p letam e n te d istin to de valores llam a­ d o s p u n t u a c io n e s d e r iv a d a s o p u n tu a c io n e s e s c a la re s . E stándares... (AE R A /A PA /N C M E , 1999, p .4 9 )1

Las nociones fundamentales sobre las normas no son exclusivas del campo de las pruebas psicológicas, las

1 En el capítulo 1, se describe la importante función que desempeñan los Standards for Educational and Psycho­ logical Testing (Estándares para las Pruebas Educativas y Psicológicas), publicados en forma conjunta por la American Educational Research Association, la American Psychological Association y el National Council on Measu­ rement ¡n Education (AERA, APA, NCME, 1999). Los capítulos 3 a 6 contienen extractos breves de este docu­ mento, abreviado, ya que suele figurar en la bibliografía, sencillamente como “Estándares” para ayudar a ilustrar los aspectos planteados en el texto.

(Capítulo 3)

nociones de puntuación natural y posición relativa dentro de un grupo se utilizan en diversas circunstan­ cias cotidianas. Considere estos ejemplos, ¿Resulta alto la estatura de 1.94 metros?, no para un árbol, pero sí para un humano e incluso entre los humanos, no es muy impresionante en el caso de un jugador de la National Basketbal! Association, aunque sí impresio­ nante para un estudiante de sexto grado. ¿Qué pasa con un pulso de 100?, no sorprende en un bebé recién nacido o en un adulto que acaba de realizar un ejerci­ cio vigoroso, pero sería un signo de peligro para un adulto en estado de reposo. ¿Qué opina usted de co­ rrer los 100 metros planos en 24.01 segundos?, para un equipo de atletismo de bachillerato o universitario es un tiempo malísimo, pero Erwin Jaskulski hizo ese tiempo en mayo de 1999 y estableció una marca mun­ dial en la categoría de mayores de 95 años de edad (.Runner's World, 1999). Estos ejemplos ilustran la tendencia de los seres humanos a valerse de las com­ paraciones dentro de un grupo para diversos tipos de interpretaciones en la vida cotidiana. En psicometría, estas comparaciones se vuelven operativas, a manera de normas. Algunos ejemplos adicionales de puntuaciones naturales ofrecen un adecuado contexto para el análi­ sis de las normas que se hará más adelante en el capí­ tulo. • Matt resolvió de manera correcta 36 reactivos en la prueba de memoria de corto plazo. ¿Qué tan buena es su memoria? • Meg respondió “sí” a 14 preguntas en el indicador de ansiedad en la prueba. ¿Se le facilita someterse a exámenes o es un caso perdido? ■ Dan realizó correctamente 32 reactivos en la prue­ ba de lectura y 24 en la de matemáticas. ¿Es relati­ vamente mejor en lectura o en matemáticas? • Sheri mide 1.57 metros. ¿Es especialmente alta, baja o como el promedio? • El pulso de Tom es de 71 latidos por minuto. ¿Es normal? • La pequeña Abigail obtuvo una calificación de 7 en la escala de 10 puntos sobre afabilidad. ¿Es un en­ canto o una fiera?

REVISIÓN DE ESTADÍSTICA: PRIMERA PARTE

Las normas de las pruebas se basan en nociones ele­ mentales de la estadística descriptiva. Se da por hecho que el lector realizó ya un curso de introducción a la

Normas de las pruebas • 49

estadística, aunque se supone que tal vez necesite ha­ cer un repaso de los temas cubiertos en ese curso. Tal es el objetivo de esta sección, no pretende repetir todo un curso de estadística o enseñarle cómo calcular estas o dísticas, sino revisar brevemente algunos temas y plan­ tear las ideas clave de la estadística univariada. El capítulo 4 incluye un repaso de la estadística bivariada, es decir, la correlación y la regresión. — En los ejemplos de esta sección se emplean algu­ nos conjuntos pequeños de datos para ¡lustrar diversas estadísticas. En la práctica, por lo general se cuenta con conjuntos de datos mucho más grandes, a menudo mi­ les de casos; para aplicar la estadística a estos grandes conjuntos de datos se utiliza paquetería computacional. Entre los paquetes más empleados se encuentran el SPSS, el SAS, Minitab y SYSTAT; el programa Excel de Microsoft, orientado más hacia otras aplicaciones, también elabora estadísticas. En el Apéndice D apare­ cen varios conjuntos de datos que el lector puede utili­ zar para calcular cualquiera de las estadísticas revisadas en esta sección. Entender el material de este capítulo no exige estar familiarizado con ninguno de esos pa­ quetes estadísticos; sin embargo, a algunos lectores tal vez les resulte útil aplicar alguno de estos paquetes a los conjuntos de datos del Apéndice D.

¡INTÉNTELO!....................................................... Si no está familiarizado con algunos de los programas esta­ dísticos presentados en el párrafo anterior, averigüe cuál de ellos está disponible. Los ejercicios al final de los dos si­ guientes capítulos le permitirán aplicar el paquete.

la evidencia objetiva de dificultades significativas para realizar actividades de la vida cotidiana. En un segundo nivel, la variable es medida; se trate de su definición operacional. La psicometría aborda estas mediciones, estudia sus características y cataloga las mediciones existentes. En el tercer nivel, se obtienen datos naturales, es decir, los números que resultan de la aplicación de las mediciones. Las estadísticas operan sobre datos naturales, el nivel más específico de una variable. Dado que los datos naturales provienen de las mediciones que los investigadores obtienen, la estadística ofrece los re­ súmenes y tratamientos de las mediciones (pruebas) de mayor interés para los profesionistas. Por supues­ to. desde el principio hay mayor motivación al nivel de constructo de la variable. Las dos principales divisiones de la estadística son la descriptiva y la inferencial. En la mayor parte de los estudios se obtienen muchos datos naturales; por ejem­ plo, es posible contar con varias puntuaciones de prue­ bas de cientos de individuos. La estadística descrip­ tiva ayuda a resumir o describir estos datos naturales para que los datos se entiendan mejor. Con mucha fre­ cuencia, éstos provienen de una muestra de individuos y al especialista le interesa principalmente conocer la población de la cual se extrajo esta muestra. La esta­ dística inferencial ayuda a sacar conclusiones — inferencias— sobre lo que tiene probabilidades de ser verdadero en una población, sobre la base de lo que se descubrió acerca de la muestra.

TIPOS DE ESCALAS Las variables se miden en escalas, Stevcns (1951) las clasificó en cuatro clases, a las que se alude mucho en estadística y psicometría. Las distinciones entre estos

© E d it o ria l E l m a n u a l m o d e r n o F o to c o p ia r s in a i

VARIABLES ¿Cómo se relaciona el campo de la estadística con el de las pruebas psicológicas? Para responder a esta pre­ gunta, es imprescindible entender los matices del tér­ mino variable. Una ciencia se constituye en torno a las variables que estudia; algunos ejemplos de éstas en psicología son inteligencia, extraversión, desadaptación y agudeza visual. Los objetos de estudio (humanos, ratas, etc.) varían a lo largo de cada una de estas cate­ gorías de arriba hacia abajo, de más a menos o algún conjunto similar de calificativos. Las variables pueden describirse en tres niveles de generalidad. En el nivel más general, una variable es un constructo, aquí, se hacen descripciones verbales y definiciones de ella. Por ejemplo, es posible definir inteligencia como la capa­ cidad para manipular símbolos abstractos; desadap­ tación puede describirse ya sea como el sentimiento o

Resumen de puntos clave 3-1 Tres niveles para definir una variable C onstru cto

D efinición general de la variable

i M edición

D efinición operacional, a m enudo una prueba

I Datos naturales

N úm eros que resultan de la m edición

(Capítulo 3)

50 • Pruebas psicológicas. Una introducción práctica

tipos de escalas son importantes porque permiten rea­ lizar ciertas operaciones aritméticas y estadísticas con algunas escalas, pero no con otras. Las escalas se tipifican en orden de complejidad creciente. En el nivel menos complejo o más primitivo se encuentra la escala nominal, que distingue los obje­ tos codificando a cada uno con un número; los núme­ ros no significan más o menos, más grande o más pequeño o alguna otra distinción cuantitativa. Ejem­ plos de esto son los numerales en las camisetas de ba­ loncesto, los números del Seguro Social o los códigos 0 y 1 que se asignan a varones y mujeres, respectiva­ mente, para fines de codificación de cómputo. En una escala ordinal, a los objetos se les asig­ nan numerales que indican un ordenamiento, como sería más o menos de un rasgo, sin especificar nada sobre las distancias entre los objetos en la escala. Es­ tos ordenamientos de rango ilustran un escalamiento ordinal, por ejemplo, las reservas del fútbol america­ no colegial ofrecen una clasificación de los equipos: 1, 2, 3, 4 ... 25. Como se entiende, estos números es­ tán en una escala ordinal, no puede inferirse que el equipo 2 sea mucho mejor que el 3, pues el equipo 1 es mejor que el 2. De hecho, los equipos 1 y 2 tal vez sólo sean ligeramente distintos, mientras que el equi­ po 3 puede ser muy inferior al equipo 2. La escala de intervalo ubica los objetos en or­ den y lo hace a intervalos iguales. Por tanto, en una escala de intervalo, la distancia entre 2 y 4 es la mis­ ma que la distancia entre 6 y 8 o entre 2Q y 22. No obstante, la escala de intervalo carece de un punto cero verdadero, por lo común cuenta con un punto cero, pero éste no indica la ausencia completa de la varia­ ble medida. El ejemplo clásico de una escala de inter­ valo es el termómetro Fahrenheit, donde cero no indica la ausencia completa de calor. La suma y la resta son operaciones legítimas en una escala de intervalo, así, la diferencia entre 30° y 40° significa lo mismo que la

diferencia entre 50° y 60°. No obstante, no son legíti­ mas la multiplicación y la división: 60°F no represen­ ta el doble de calor que 30°F o la mitad que 120°F. Para hacer tales afirmaciones, se necesitaría utilizar la escala Kelvin, que cuenta con un punto cero verda­ dero, punto en el que no hay calor en absoluto. La escala de razón, la más compleja, ubica los objetos en orden y lo hace a intervalos iguales; además posee un punto cero verdadero. Casi todas las medi­ ciones físicas cotidianas que se realizan, como las de longitud y peso, son sobre escalas de razón. En con­ traste, la mayor parte de las mediciones psicológicas hechas son sobre escalas ordinales o de intervalo. ¿Cuál es la importancia de estas distinciones al parecer crípticas para quien se interesa en las medi­ ciones psicológicas? Considérese el caso de la escala de Cl, que es tan familiar; no se trata de una escala de razón —carece de un punto cero verdadero— , por tanto, no es legítimo decir que una persona con un CI de 150 es el doble de inteligente que alguien que tie­ ne un CI de 75; además, si la escala de CI es sólo ordinal, no se puede afirmar que la diferencia entre los CI 80 y 100 signifique lo mismo que la diferencia entre los CI 120 y 140. Es necesario que los profe­ sionistas se interesen en la naturaleza de sus escalas para hacer afirmaciones fundadas sobre sus propias mediciones o, en todo caso, para no decir cosas ab­ surdas sobre ellas. El método de clasificación de es­ calas de Stevens (1951), aunque muy citado, no es la única forma de pensar en las escalas, pero es un re­ curso muy útil para considerarlas.

ORGANIZACIÓN DE DATOS NATURALES Al enfrentar una masa de datos naturales, normalmente se quiere organizarlos; la manera más común de ha­ cerlo es con una distribución de frecuencia, la cual

Resumen de puntos clave 3 -2

Resumen de tipos de escalas E sca la Nom inal O rdinal

P ro p ie d a d e s C la sifica, asig na num erales + U bica en orden de m a gn itu d

D e in tervalo D e razón

i “ f

’ " 1" " 1" " ’ 1'

+ P unto ce ro ve rda d e ro

Normas de las pruebas • 51

o ai c s í 1

ordena los datos por grupos de puntuaciones adya­ centes. La figura 3-1 presenta un conjunto de datos naturales y una distribución de frecuencia de éstos; si bien es difícil dar sentido a una serie de este tipo de datos, la distribución de frecuencia revela con facili­ dad características como el rango de las puntuaciones y el área en la que éstas se concentran. La distribu­ ción de frecuencia de la figura 3-1 muestra los inter­ valos de las puntuaciones en los que éstas se encuentran categorizados, la frecuencia o el conteo de las puntuaciones que caen en cada intervalo y la frecuencia acumulativa (f acum), es decir, la frecuen­ cia que hay en y por debajo de cada intervalo. Una distribución de frecuencia suele convertirse en forma gráfica. Las dos modalidades más comunes para esta conversión son el histograma de frecuen­ cia y el polígono de frecuencia. La figura 3-2 pre­ senta estas gráficas para la distribución de frecuencia de la figura 3-1.

La mediana es la puntuación intermedia cuando las puntuaciones están distribuidas en orden de inferior a superior, divide la distribución de las puntuaciones por la mitad. La moda es la puntuación que ocurre con mayor frecuencia. La figura 3-3 expone ejem­ plos de las tres medidas de tendencia central en un pequeño conjunto de datos.

TENDENCIA CENTRAL

i INTÉNTELO!...........................................................

Aunque la distribución de frecuencia, el histograma y el polígono de frecuencia son resúmenes útiles de los da­ tos naturales, conviene contar con un índice que repre­ sente mejor el conjunto completo de datos. Tal índice se conoce como medida de tendencia central —el centro en torno del cual los datos naturales tienden a agrupar­ se—. Son tres las medidas de tendencia central que se emplean con mayor frecuencia: media, mediana y moda.

Se sugiere al lector determinar las tres medidas de tenden­ cia central de este conjunto de puntuaciones.

102 120 73 114 129 91 71 102 96 105

110 92 128 134 108 121 101 79 114 77

130 118 115 117 99 103 93 99 106 100

P untuaciones 99 127 109 135 105 112 91 92 83 149 147 110 88 78 111 117 111 119 131 106

La media es el promedio aritmético, se represen­ ta ya sea con M o X (léase X-barra, o simplemente “media”). Su fórmula es: M=

yy

Fórmula 3-1

N

donde X = puntuación o dato natural N = número de puntuaciones X = signo de sumatoria, que indica “sumar todo esto (X)"

Puntuación: 2

5

4

5

3

4

Media = ______

Mediana = _______

(W = 100) 107 116 138 98 103 90 105 98 101 108

113 103 100 96 95 122 145 115 123 113

76 150 158 125 95 94 90 112 109 143

100 91 103 155 82 124 94 116 132 102

89 126 86 88 133 65 87 80 100 88

D istrib u ció n de fre cu e ncia 1 0

3. tí E 0

In te rva lo

F

F ¡acum

150-159 140-149 130-139 120-129 110-119 100-109 90-99 80-89 70-79 60-69

3 4 7 10 18 23 19 9 6 1

100 97 93 86 76 58 35 16 7 1

1

Figura 3-1. Ejemplo de muestra de puntuaciones naturales y distribución de frecuencia.

5

2

6

Moda = ______

52 •

(Capítulo 3)

Pruebas psicológicas. Una introducción práctica

F ig u ra 3 -2 . H istogram a de frecuencia y polígono de fre cu e ncia

VARIABILIDAD Una medida de tendencia central ofrece un resumen de datos muy conveniente, pero priva de cualquier sentido de variabilidad en los datos. Por ejemplo, dos conjuntos de datos pueden tener la misma media, pero en un conjunto todas las puntuaciones se encuentran dentro de dos puntos de la media, en tanto que en el otro conjunto las puntuaciones están muy dispersas. De modo que para describir mejor los datos natura­ les, se ofrece un índice de variabilidad. El índice de variabilidad más sencillo es el ran­ go, es decir, la distancia de la puntuación más baja a la más alta. Para indicar el rango, se identifican las puntuaciones más baja y más elevada o la diferencia entre éstas. Para los datos naturales de la figura 3-1, se puede decir que el rango es 65-158 o que el rango es 93. La desviación estándar es el índice de variabili­ dad más utilizado. Se denota en varios contextos me­ diante cualquiera de estos símbolos: S, DE o a 2 Su fórmula es: V s ( X - M)2 N

Fórmula 3-2

en una muestra pero se entiende como estimación de la DE en una población, la “AT en la fórmula se reem­ plaza por “Ai - 1”. La fórmula ofrece pocos indicios sobre la forma en que la DE mide la variabilidad, no obstante, tiene consecuencias matemáticamente acertadas para uso ulterior, de modo que el especialista se acostumbra sin más a “su presencia desgarbada”. En secciones posteriores se emplea constantemente la DE. Un índice de variabilidad bastante relacionado es la varianza, que es simplemente la DE2. A la inversa, la DE es la raíz cuadrada de la varianza. En ciertos trabajos avanzados de estadística, ésta se utiliza más que la DE. En las pruebas psicológicas, se recurre a la DE con mayor frecuencia, aunque no de manera ex­ clusiva. La figura 3-4 presenta la DE, la varianza y el rango de un pequeño conjunto de datos.

¡INTÉNTELO!........................................................... El lector habrá de calcular la DE estándar y el rango de este conjunto de datos. Puntuaciones:

1

4

7

También suele escribirse como: DE=_________

Rango = _________

donde x = X - M . Estas fórmulas dan la definición for­ mal de la desviación estándar. Cuando ésta se calcula Datos naturales: 2, 5, 3, 6, 6, 7, 6, 4, 8, 3, 4

2 El símbolo a que se lee como sigma, es la letra griega j (minúscula). En estadística, se recurre a las letras del alfa­ beto griego para designar medidas de toda una población y letras del alfabeto latino (p. ej„ S) para designar medi­ das sobre muestras. Por tanto, S es la desviación estándar de una muestra, s es la desviación estándar de la pobla­ ción. La distinción no se observa con mucho rigor en la bibliografía sobre psicometría.

Media: M= 1XJN = 54/11 = 4.91 Mediana: 5

Moda: 6

F ig u ra 3 -3 . M edid a s de ten d en cia central de un p equeño conjunto d e datos.

Normas de las pruebas ■ 53

Puntuaciones': 6

9

(X - M) = x

4 -1 0

1

x 2 = 1 16 D E = 2 .3 8

4

5 5

1

M=

SX/N = 30/6 = 5

0 -4

1 0 0

16

/ £ x 2/ N = / 34/6 = 2.38

Varianza = D E 2 = 5.66

Rango = 1 - 9

Figura 3 -4 . Medidas de variabilidad de un pequeño conjunto de datos.

Una cuarta medida de variabilidad es el rango semiintercuartilar. Como su nombre lo indica, se trata de la mitad de la distancia entre los cuartiles pri­ mero y tercero, los cuales corresponden a los per­ centiles 25 y 75, respectivamente. Si ya se dispone de percentiles, como suele suceder con los datos de las pruebas psicológicas, el rango semiintercuartilar se determina con facilidad, aunque pocas veces se utili­ za en la práctica.

PUNTUACIONES z Una puntuación z o, sencillamente z, se define como: z_ X- M

© E d it o ria l E ! m a n u a l m o d e r n o F o to c o p ia r s in a i

DE

Fórmula 3 -4

donde X es una puntuación individual o datos puntua­ les, M es la media y DE es la desviación estándar. La distribución de las puntuaciones z tiene una media = 0 y una DE = 1. Por tanto, al margen de cuales sean los valores de las puntuaciones originales, cuando se convierten en puntuaciones z, siempre son idénticas su media y desviación estándar. Las puntuaciones z se usan para “delinear” la cur­ va normal en términos de áreas bajo la curva. La figu­ ra 3-5 ilustra el uso de las puntuaciones z para marcar áreas bajo la curva normal, se tendrán presentes las tablas de áreas bajo la curva normal de la estadística

elemental. Dado que las puntuaciones z poseen una media (0) y una £>£(]) común sin importar los valo­ res de las puntuaciones originales, desempeñan una función crucial en el desarrollo de algunas de las nor­ mas de las pruebas

FORMAS DE LAS DISTRIBUCIONES Hay una referencia frecuente en la psicometría a la forma de la distribución de frecuencia de las puntua­ ciones de las pruebas, es menester familiarizarse con los términos empleados para describir estas formas. El parámetro o distribución de referencia es la curva normal o distribución normal. Su nombre populares “curva de campana”, aunque sólo tiene la forma de una campana en forma aproximada. La curva, gene­ rada por una fórmula bastante limitada,3 es una fun­ ción de densidad, es decir, que el área bajo la curva está llena de datos puntuales. La distribución en la figura 3-5 es una curva normal, está dispuesta con una media de 0 en su centro y un escala establecida por unidades de estándar DE (llamadas en ocasiones unidades o) en su base. Obsérvese con atención la posición de las unidades de la DE.

3 Esta ecuación genera la curva normal: Y = (NI (ojzñ)) (e-W - v-W )

Figura 3 -5. Ejemplos de puntuaciones z que marcan áreas bajo la curva normal.

(Capítulo 3)

54 * Pruebas psicológicas. Una introducción práctica

Esta distribución es unimodal: cuenta con una moda o “monte”. Es simétrica alrededor de su eje central, una línea imaginaria erigida en forma perpen­ dicular a la base en la media. Alrededor de este eje central, el lado izquierdo es el reflejo del lado dere­ cho de la curva. Las “colas” (o extremos) de la curva son asintóticas con relación a la base, es decir, conti­ núan hasta el infinito, acercándose cada vez más a la base, pero sin alcanzarla nunca. Por supuesto, esto sólo se aplica en la curva normal teórica; en la prácti­ ca, los datos se detienen en algún punto finito. Ad­ vierta el lector que casi todas las áreas (cerca de 99.8%) bajo la curva están dentro de +/- 3 unidades a Las distribuciones pueden “desviarse de la nor­ malidad”, es decir, ser diferentes de la curva normal, de varias maneras. La figura 3-6 representa estas des­ viaciones de la normalidad. La primera es en térmi­ nos de curtosis, el “punto máximo” de la distribución. Una distribución leptocúrtica está más acentuada y una distribución platocúrtica está más plana que la distribución normal. Otra forma de desviación de la normalidad se da en términos del sesgo, el grado de simetría de los la­

dos derecho e izquierdo de la curva. El sesgo negati­ vo o hacia la izquierda tiene un extremo alargado ha­ cia la izquierda y una acumulación de puntuaciones hacia la derecha. El sesgo positivo o hacia la derecha cuenta con un extremo alargado hacia la^dgrecha^y una acumulación de puntuaciones hacia la izquierda. Un último tipo de desviación de la normalidad es en términos de la modalidad de la distribución. Si bien la distribución normal es unimodal, una distribución puede tener más de una moda, por ejemplo, una dis­ tribución bimodal, como se aprecia en la parte infe­ rior de la figura 3-6. ¿Por qué es importante la curva normal en la psicometría? Muchos fenómenos que ocurren en for­ ma natural tienden a distribuirse en forma normal. Por ejemplo, para personas de un determinado sexo y edad, las siguientes variables que se miden con facilidad suelen distribuirse normalmente: estatura, rango de memoria a corto plazo de dígitos, tiempo de reacción, fuerza de sujeción y muchas otras variables. Esta ten­ dencia hacia la normalidad es tan frecuente que cuan­ do la distribución real de una variable se desconoce, no es aventurado suponer que quizá sea normal. Así

Figura 3 -6. Ejemplos de varias distribuciones.

Normas de las pruebas • 55

que muchas pruebas se elaboran con la finalidad de generar una distribución de puntuaciones aproxima­ damente normal. Sin embargo, en ocasiones de ma­ nera intencional se diseñan pruebas que generan distribuciones con sesgo positivo o negativo, como se verá en el capítulo 6. También sucede que algunas distribuciones que ocurren de manera natural no son normales, como las distribuciones del ingreso, el peso y la población urbana. Con este repaso de la estadística basta por ahora para profundizar en este capítulo, se ampliará la revi­ sión de la estadística al principio del capítulo 4.

PUNTUACIÓN NATURAL

En la figura 3-7 se aprecia una muestra de este tipo de puntuación natural en una prueba de 6 reactivos de ac­ titudes hacia las matemáticas; en este ejemplo, ios reactivos con formulación o connotación negativa ha­ cen necesario invertir los valores de la escala con la finalidad de determinar la puntuación natural. Las mediciones antropométricas y fisiológicas también pueden considerarse como puntuaciones na­ turales. Sheri mide 1.57 metros de estatura; el pulso de Dan es de 54 latidos por minuto; Amanda nada en estilo mariposa 180 metros en 2:20...todas estas me­ diciones son puntuaciones naturales. Ubicarlas en un contexto normativo ayuda a interpretarlas. Las nor­ mas son útiles para responder preguntas como éstas: ¿Sheri es muy alta para su edad?, ¿el pulso de Dan es normal?, ¿Amanda tiene un nivel de natación para competencia olímpica? Por lo genera!, la ca lifica ció n e m p ie za con respues­

¡

Todas las normas de las pruebas son transformaciones de puntuaciones naturales, por tanto, conviene tomarla en consideración antes de definir los tipos de normas de las pruebas. La puntuación natural es el resultado más inmediato de la calificación de una prueba, se pre­ senta en formas diferentes. La puntuación natural pue­ de ser la cantidad de respuestas correctas que se dan a una prueba de aprovechamiento, o el total de pregun­ tas a las que se responde en cierta dirección, por ejem­ plo, “sf ’ o “de acuerdo” en un inventario de personalidad o de intereses. También puede ser la suma de las res­ puestas numéricamente codificadas en una serie de reactivos de actitudes, por ejemplo, una escala de acti­ tudes puede contar con 10 reactivos, cada uno de los cuales exige una respuesta en una escala de 5 puntos, que van de Completamente en desacuerdo (1) a Com­ pletamente de acuerdo (5). La puntuación natural es la suma de las respuestas numéricas a los 10 reactivos.

tas a reactivos a islad o s en las p ruebas, que a m enu­ d o está n co d ific a d o s co n 0 o 1 p a ra re p re s e n ta r respu e sta s in c o rre c ta /c o rre c ta o n e g a tiva /p o sitiva , pero a veces c on va lo re s n u m é rico s para in dica r g ra ­ dos de respuesta m ás fin o s. E ntonces, las p un tua ­ c io n e s del re a c tiv o se c o m b in a n , a m e n u d o p or adición, pero en ocasion e s se hace m ediante un p ro ­ cedim iento m ás e laborado, p ara o b te n e r u n a puntua­ ción natural. E stándares... (A E R A /A P A /N C M E , 1999, p. 49)

Los procedimientos de algunas pruebas exigen una puntuación natural “corregida” o “ajustada”. El más popular de estos ajustes es la corrección por adivi­ nación que se aplica a ciertas pruebas de capacidad o de aprovechamiento en las que se utiliza u n formato de opción múltiple. La teoría plantea que en una prueba de opción múltiple es posible obtener algunas respuestas correctas adivinando. De manera más precisa, alguien

Respuesta C o m pletam ente en d esacuerdo

C o m pletam ente de acu erd o

(P u n tu a ció n del reactivo)

Reactivo

1

2

3

4

5

1. El álgebra es muy divertida.

l l

[X]

11

11

11

(2)

2. La geometría es para los pájaros.

II

11

n

11

[X]

(1)

3. Me gusta realizar cálculos.

[XI

11

ii

n

N

0)

4. Las matemáticas me son muy útiles.

[ ]

11

[XI

ii

n

(3)

5. Me gusta la estadística.

11

[X]

n

i i

n

(2)

6. Las ecuaciones me causan escalofríos.

11

11

11

[X]

I ]

(2)

Puntuación natural = 11 F igura 3 -7 . Derivación de la puntuación natural para una escala de actitud hacia las matemáticas.

(Capítulo 3)

56 • Pruebas psicológicas. Una introducción práctica

puede responder de manera correcta a \/K de las pre­ guntas adivinando, donde K es la cantidad de opcio­ nes en el reactivo de opción múltiple. En un reactivo de verdadero o falso, K es 2. En una prueba de 100 preguntas, compuesta por reactivos de opción múlti­ ple con cuatro opciones por cada uno, la puntuación esperada de adivinar todos los reactivos es de 25 co­ rrectos. Por supuesto que un examinado pocas veces adivinaría en todos los reactivos, sin embargo, tal vez él conozca la respuesta a 50, conteste éstos correcta­ mente, deje 10 reactivos en blanco y adivine en los 40 restantes. De estos últimos 40, 10 serán correctos por razones debidas al azar, lo que genera una puntuación de 50 + 10 = 60. Las respuestas a 30 reactivos son incorrectas, sin incluir los 10 que quedaron en blan­ co. En la corrección por adivinación, se aplica la fór­ mula siguiente: PNC= PN0 -

I K- 1

Fórmula 3 -5

donde PNC= puntuación natural corregida PN0 = puntuación natural original I = cantidad de respuestas incorrectas K = cantidad de opciones en los reactivos de opción múltiple Nota: los reactivos omitidos no se cuentan como incorrectos. Véase algunos ejemplos adicionales que ilustran el funcionamiento de la fórmula: • En una prueba de 50 reactivos compuesta de reactivos de opción múltiple con cinco opciones, Tom obtuvo 40 correctos y 10 incorrectos. ¿Cuál es la puntuación cuando se aplica la corrección por adivinación? 40 - [(10/(5 - 1 )] = 40 - 2.5 = 37.5 • Suponga que Tom realizó con acierto 40 y omitió los 10 reactivos restantes. ¿Cuál es su puntuación corregida? 40 - 0 = 40 • En una prueba de 50 preguntas de verdadero-falso, Jen realizó de manera correcta 25 reactivos y 25 incorrectamente. ¿Cuáles su puntuación corregida? 25 - [25/(2 - 1)] = 25 - 25 = 0 La corrección por adivinación supone que una per­ sona adivina en forma aleatoria entre las opciones dis­ ponibles, desde luego, en ocasiones puede eliminar algunas de las opciones incorrectas y luego adivinar

entre las opciones restantes. Las correcciones o ajus­ tes también aplican a algunas puntuaciones en prue­ bas de personalidad para adecuar ciertos conjuros de respuestas. Para un análisis só b re n te tema, véase el capítulo 12.

EL CASO ESPECIAL DE theta (0) El lector recordará el análisis de la teoría de respuesta al ítem (TRI) que se planteó en el primer capítulo. Si bien una prueba calificada en la forma convencional genera una puntuación natural que es la suma de las respuestas a todos los reactivos en la prueba, una prue­ ba calificada según la TRI no es la simple suma de las respuestas. La puntuación TRI es una función de las

respuestas del examinado que interactúan con las características de los reactivos. La puntuación TRI suele denominarse theta (q), considérese dos ejemplos de cómo puede darse q, en ambos es crucial que los reactivos se seleccionen por unidimensionalidad y se escalen por dificultad en un programa de investigación previo. En el capítulo 6, se consideran más a fondo las características TRI de los reactivos; su calificación real según los procedimientos TRI es compleja, ya que exige programas de cómputo com­ plejos. No consiste tan solo en sumar respuestas co­ rrectas, aunque en este momento, es posible dar una idea aproximada del modo en que metodología TRI genera una puntuación theta. En primer lugar, se deben considerar los datos de la figura 3-8, los reactivos están dispuestos en orden de dificultad de izquierda a derecha, aquellos con la numeración más baja son muy sencillos y los que tie­ nen la numeración más elevada son muy difíciles. Por ejemplo, si ésta fuese una prueba de operaciones arit­ méticas para estudiantes de enseñanza elemental, el reactivo 1 podría ser 6 + 3 = ______ , el reactivo 10 sería 740 - 698 = ______ y el reactivo 20 sería .56 x 1.05. Aquí se han clasificado simplemente los reactivos como fáciles, moderados o difíciles. En una aplica­ ción real, se utilizarían valores de dificultad exactos. (Los reactivos de una prueba deben disponerse física­ mente en orden de dificultad, pero para los ejemplos que aquí se muestra conviene mostrar la disposición de esta manera.) Cada “x” en la figura representa una respuesta correcta. A Mike se le presentaron los reactivos 1 a 10 y respondió de manera correcta a 7; a Ned se le dieron los reactivos 11 a 20 y contestó con acierto a 7. Dado que Ned respondió en forma conec­ ta a los reactivos más difíciles, obtiene una puntua­ ción theta más elevada, pese al hecho de que ambos examinados realizaron 7 reactivos correctamente. Desde luego, este procedimiento no funcionaría a menos que los reactivos se escalaran, en primer lugar, por grado de dificultad.

Normas de las pruebas • 57

Reactivo

1 2 3

Dificultad del reactivo: M ike

4

5

6

7

a 9

10 11

X

X

Fácil x x

12

13

14

15

16

Moderada

x x

X

Ned

X

X

17

18

19 20

Difícil

X

X

X

X

X

x = respuesta correcta

F ig u ra 3 -8 . D erivación de u n a p untuación Iheta de d iferentes co n jun to s de reactivos.

¡INTÉNTELO!...........................................................

una adivinación afortunada. Kristen respondió con acierto a casi todos los reactivos, pero falló en uno muy sencillo (el 2), tal vez por descuido. Muchos procedimientos de calificación TRI consideran el pa­ trón de respuestas total para determinar la puntuación theta de la persona, pero existen numerosos procedi­ mientos específicos para calificar las pruebas según los métodos TRI; dichos procedimientos dependen del modelo particular utilizado para ajustar los datos. Aquí no se revisarán estos modelos, no obstante se exami­ narán las características de los reactivos según la TRI en el capítulo 6. Theta posee ciertas propiedades de una puntua­ ción natural y de una normalizada. Es como una pun­ tuación natural en cuanto a que es un resultado relativamente inmediato de las respuestas del exami­ nado. Además, como puntuación natural, tiene en sí poco sentido. Theta es como una puntuación norma­ lizada en cuanto a que no es una suma simple de las respuestas del examinado, depende no sólo de si la respuesta es correcta (o “sí” u otra respuesta así), sino también de los valores TRI de los reactivos a los que se dan las respuestas. Theta ubica al examinado en un rasgo o capacidad que se supone que subyace al con­ junto completo de reactivos en el banco de la prueba; no obstante, los valores numéricos de la dimensión son arbitrarios y, por ende, no se interpretan con faci­ lidad. Si bien los valores numéricos theta son arbitra-

Hay una demostración excelente en Internet de la interacción de las respuestas del examinado con las características de los reactivos que emplean la metodología TRI, la dirección es: ERI-CAE.NET/scripts/cat. Se trata del mismo portal ERICAE utilizado como fuente clave de información en el capítulo 2. Se sugiere al estudiante registrarse y responder la prueba; luego observar como se ajusta la “estimación de capacidad” después de cada respuesta. Aunque las puntuaciones se in­ formarán como percentiles o alguna otra puntuación norma­ lizada, estas puntuaciones son transformaciones de theta, que se actualizan luego de cada respuesta.

© E d it o ria l E l m a n u a l m o d e r n o F otoco piar

AI menos algunas aplicaciones de la metodología TRI permiten examinar el patrón de respuestas, lo mis­ mo que la cantidad de respuestas correctas; ese pa­ trón puede generar ajustes en la cantidad de respuestas correctas al determinar theta. Considérense los datos de la figura 3-9, ahí a ambos examinados se les pre­ sentan los 20 reactivos. Una vez más, se conocen los 1 datos de la dificultad de los reactivos y éstos están 1 dispuestos en orden de dificultad. S Jen, en general, no tiene un desempeño muy | elevado;sin embargo, se observa que realizó de maJ ñera correcta un reactivo muy difícil (el 20), quizá

Reactivo

1 2

3 4

X

X

Dificultad del reactivo: Jen Kristen

5

6

7 8 9

10

X

X

Fácil X

X

X X

X

11

12

13

14

15

Moderada X X X X

X

X

X

16

17

18

19 20

D ifícil X

X

X

X

X

X

x = respuesta correcta

Figura 3 -9 . Los patrones de respuesta p ue d e n a yu da r a determ inar una pun tua ció n theta.

X

X

X

X

^

o

(Capítulo 3)

58 • Pruebas psicológicas. Una introducción práctica

ríos, suelen establecerse con 0.Ü0 como valor central y un rango de cerca de -4.0 a +4.0. En consecuencia, pueden verse como puntuaciones z, aunque no alu­ den a una posición dentro de un grupo normativo bien definido. Aunque estos valores theta pueden ser el resulta­ do inmediato de las respuestas del examinado en un entorno TRI, su interpretación práctica con mucha fre­ cuencia se logra mediante el uso de las puntuaciones normalizadas presentadas en este capítulo, es decir, se convierten en percentiles, puntuaciones estándar, equi­ valentes de grado, etc. De hecho, en un informe de pun­ tuaciones de prueba, se podría considerar un percentil o puntuación T sin percatarse siquiera de que es una transformación de la puntuación theta, en lugar de una puntuación natural convencional.

EL CASO ESPECIAL DE LAS PUNTUACIONES IPSATIVAS Las puntuaciones ipsativas (del latín ipse, que significa “yo”) son autorreferenciadas, ocurren cuando una prue­ ba genera más de una puntuación y los reactivos de la prueba se califican de tal modo que una determinada respuesta produce el incremento de una puntuación y, al mismo tiempo, la disminución de otra puntuación o, al menos, impide que otra puntuación aumente. De modo que las puntuaciones ipsativas muestran la fuer­ za “relativa” de las puntuaciones en lugar de su fuerza “absoluta”. Un ejemplo aclarará la situación. A fin de medir los intereses de la gente en activi­ dades verbales y cuantitativas, tome en cuenta los dos métodos siguientes para realizar esta tarea. • Formato A En cada par de reactivos, marque el que más le guste: a. Sumar números o b. B uscar pala­ bras en un dic­ cionario a. Resolver ecuaciones o b. Leer libros • Formato B Marque si le gusta (G) o le disgusta (D) cada acti vidad: G D a) Sumar números D b) Buscar palabras en un diccionario G D G c) Resolver ecuaciones G D d) Leer libros En el formato B, al lector tal vez le gusten o disgusten todos los reactivos o puede utilizar cualquier otra com­ binación de respuestas. Al asignar 1 punto por cada respuesta “Gusta”, su puntuación puede ser 2,1 o 0 en Interés Verbal y 2, 1 o 0 en Interés Cuantitativo. No obstante, en el formato A, conforme aumenta su pun­

tuación Verbal, disminuye (o no aumenta) su puntua­ ción Cuantitativa. Los posibles patrones de puntuación son 2 Verbal y 0 Cuantitativo, 1 Verbal y 1 Cuantitati­ vo, o 0 Verbal y 2 Cuantitativo. En el formato A, no se puede calificar 2 en ambas áreas de interés, tampoco es posible calificar 0 en ambas áreas. El formato A genera puntuaciones ipsativas. Las puntuaciones muestran una fuerza relativa y no una fuerza absoluta de intereses; por ejemplo, tal vez odie todas las actividades, pero repudie más los reactivos cuantitativos que los verba­ les. O bien, tal vez le agraden todas las actividades, aunque las verbales más que las cuantitativas. Las puntuaciones ipsativas se emplean con cier­ tas pruebas de personalidad e inventarios de intere­ ses. Se sugiere consultar los capítulos sobre estas pruebas para conocer casos concretos. Las puntuacio­ nes ipsativas se contrastan con las puntuaciones nor­ mativas, se dice que las primeras aluden al individuo en tanto que las segundas refieren al grupo normati­ vo. Sin embargo, ese es un contraste potencialmente engañoso ya que las puntuaciones ipsativas también pueden referirse a normas. Las puntuaciones naturales y las puntuaciones theta en sí mismas por lo común carecen de significa­ do, son bastante estériles y difíciles de interpretar. La forma más común de darles cierto significado en las puntuaciones naturales consiste en convertirlas o trans­ formarlas en algún tipo de norma. La puntuación nor­ malizada — también llamada puntuación derivada— ubica la puntuación del individuo en el contexto de las puntuaciones que obtienen otros examinados; es­ tos últimos constituyen el grupo normativo.

TIPOS DE NORMAS

En esta sección se analizan los tipos de normas que se utilizan con mayor frecuencia en las pruebas psicoló­ gicas. Hay tres principales categorías de normas, con varias subcategorías, aquí se describe cada tipo de norma y después se identifican sus fortalezas y debi­ lidades. Se dispone de varios tipos de normas, no sólo de uno, para muchas pruebas; casi todos ellos se rela­ cionan en forma sistemática entre sí, de modo que es posible hacer una conversión de un tipo de prueba a otro, aunque esto no puede realizarse con todos los tipos de normas. Estas relaciones son importantes, suelen conceptuarse en el contexto de la curva nor­ mal que ya se revisó en este capítulo. Muchas de las relaciones se muestran en la figura 3-10, la cual me­ rece un estudio cuidadoso; en este libro se aludirá a ella con frecuencia en las secciones subsiguientes de

J



Normas de las pruebas * 5 9 “

-

RANGO PERCENTILARES Y PERCENTILES Resumen de puntos clave 3 -3

Principales categorías de las normas de las pruebas •

R a ng o s percentilares



P untuaciones estándar



N o rm a s de desarrollo

este capítulo. Muchas de las relaciones representadas en la figura 3-10 se representan en forma tabular en el cuadro 3-1.

Uno de los tipos más comunes de normas para las prue­ bas psicológicas es el rango percentilaropercentil. Hay una distinción técnica entre estos dos términos. El ran­ go pereentilar (RP) indica el porcentaje de casos en ci,,-- grupo normativo que se ubican por debajo de una de­ terminada puntuación natural. Si una puntuación natu­ ral de 48 tiene un RP de 60, esto significa que 60% de los casos en el grupo normativo se califican en o por debajo de una puntuación natural de 48. Por supuesto, algunos casos en el grupo normativo obtienen una pun­ tuación exacta de 48; esta puntuación se considera como un intervalo de 47.5 a 48.5, en el cual 48.0 es el punto medio del intervalo; por tanto, en algunas aplicacio-

Porcentaje de casos bajo las partes de la curva normal Desviaciones estándar

_ 4G

-3 a

-2 a i 2.3%

l 0.1%

1 ___ I I

Equivalentes de percentil

1

.0

© E d ito ria l E ! m a n u a l m o d e r n o F o to c o p ia r s in au to riz a c ió n

Puntuaciones CEEB

1 200

;f

1 1

Escalas W echsler J________ Subpruebas Cl derivados

L_

a 15 Otis-Lennon

l_

+ 1a

+2a

1 50.0% 50%

i 84.1% 84%

i 97.7% 98%

1 l.l, .1.1 1 lL Ü J l l i l i l í 20 130 40 50 60 70 1 80

0 1 50 1 500

40 400 20

30

40

50

4

5

1 2 7%

Porcentaje en estanina

0

i 15.9% 16%

-1.0

300

Puntuaciones ECN

Estaninas

10

-2.0 1 30

-3.0 1 20

Puntuaciones T

5

-1 a

3 12%

60

1 17%

20%

1

90

1

99

95

+1.0 1 60

+2.0

1 600

1 700

70

l 80

70

901



17%

+4.0

1 800 1

1

99

1

1 6

+3.0 1 80

7

8

12%

7%

9

13

16

19

—I_

_I_

1

55

115

_1—

_ l__

Figura 3-10. Equivalencia de varios tipos de normas en la curva normal.

1

(Capítulo 3)

60 • Pruebas psicológicas. Una introducción práctica

Cuadro 3 -1 . Equivalentes de percentil de varios sistem as de puntuación estándar %il 98 97 96 95 94 93 92 91 90

89 88

87 86

85 84 83 82 81 80 79 78 77 76 75 74 73 72 71 70 69 08

67 66 65 64 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 35 34 33 32

E stanina

ECN

9 9 9 9 8 8 8 8 8 8 8 7 7 7 7 7 7 7 7 7 7 7 7 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 4 4 4 4 4 4 4 4

99 93 90 87 85 83 81 80 78 77 76 75 74 73 72 71 70 69 68 68 67 66 66 65 64 64 63 62 62 61 60 60 59 59 58 58 57 56 56 55 55 54 54 53 53 52 52 51 50 50 50 49 48 48 47 47 46 46 45 45 44 44 43 42 42 41 41 40

Cl (15) 133 130 129 127 125 123 122 121 120 119 118 117 116

Cl (16) 135 132 130 128 126 125 124 122 121 120 119 118 117

115

116

114 113

114

112

113

111

112

110

111

109

110

P untuación T

SAT

74 70 69 68 66

740 700 690 680 660

P untuación z 2.4 2.0 1.9 1.8 1.6

65 64

650 640

1.5 1.4

63

630

1.3

62

620

1.2

61

610

1.1

60

600

1.0

59

590

0.9

58

580

0.8

57

570

0.7

56

560

0.6

55

550

0.5

54

540

0.4

53

530

0.3

52

520

0.2

51

510

0.1

50

500

0.0

49

490

-0.1

48

480

-0 .2

47

470

-0 .3

46

460

-0 .4

109 108 108 107 107 106 106 105 105 104 104 103

103

102

102

101 101 100

100 99

99 98

98

97

97 96

96 95 95 94 94 93 93

%il 99 98 97 96 95 94 93 92 91 90 89 88 87 86 85 84 83 82 81 80 79 78 77 76 75 74 73 72 71 70 69 68 67 66 65 64 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 35 34 33 32

VE

Normas de las pruebas • 61

Cuadro 3 -1 . (C ontinuación) % il

E sta n in a

ECN

31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1

4 4 4 4 4 4 4 4 4 3 3 3 3 3 3 3 3 3 3 3 3 2 2 2 2 2 2 2 1 1 1

40 39 38 38 37 36 36 35 34 34 33 32 32 31 30 29 28 27 26 25 24 23 22 20 19 17 15 13 10 7 1

C l (15)

Cl (16)

P u n tu a c ió n T

92

S AT

P u n tu a c ió n z

45

450

-0 .5

44

440

-0 .6

43

430

-0 .7

42

420

-0 .8

41

410

-0 .9

40

400

-1 .0

39

390

-1.1

38

380

-1 .2

37

370

-1 .3

36 35

360 650

-1 .4 -1 .5

34 32 31 30 29

340 320 310 300 290

-1 .6 -1 .8 -1 .9 -2 .0 -2 .4

92 91 91

90

90

89

89

88

88

87

87 86

86

85 84 83 82 81 80 79 78 77 76 74 72 70 67

85 84 83 82 81 80 79 78 76 75 74 72 70 68 65

% il -^

o 31 30 29 28 27 - 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1

«

El Cl (15) es para pruebas de Cl con una M = 100 y una D E - 15. p.ej., las puntuaciones de las escalas Wechsler Verbal, de Ejecución y Total. El C1 (16) es para pruebas de Cl con una M = 100 y una DE= 16, como la Stanford-Binet y la Otls-Lennon. El SAT abarca cualquiera de varias pruebas que utilizan una M - 500 y una DE = 100. Reproducido de Hogan.T, P. (1988). Abreviaturas: ECN, equivalente de curva normal.

© E d it o ria l E i m a n u a l m o d e r n o Fotocopie

nes, el RP se calcula de modo que incluya a la mitad de los casos en el intervalo de la puntuación natural. Un percentii (que suele abreviarse como %il) es un punto en una escala por debajo del cual se ubica I un porcentaje específico de los casos. La diferencia ° entre un percentii y un rango percentilar podría $ resumirse de la siguiente manera: en el percentii, se s empieza con un determinado porcentaje, luego se en| cuentra la puntuación natural correspondiente a ese | punto. En el caso de un rango percentilar, se inicia § con una puntuación determinada, luego se halla el por­ centaje de casos que se encuentran por debajo de esa puntuación. En la práctica, los términos percentii y rango percentilar suelen emplearse en forma indistin­ ta sin problema. A veces los investigadores se topan con ramifi­ caciones del sistema de percentiles, las cuales inclu­ yen a los deciles, los quintiles y los cuartiles. Como se deriva de sus raíces latinas, estos sistemas dividen la distribución en décimos, quintos y cuartos, respec­ tivamente. En consecuencia, es posible considerar los percentiles como un sistema que divide la distribu­ ción en centésimos.

La figura 3-10 ilustra el lugar de los rangos percentilares en la curva normal. El RP (rango percentilar) de una puntuación baja de 1 a una elevada de 99, don­ de 50 es el punto intermedio o mediana. La relación entre los rangos percentilares y las puntuaciones z se define por el cuadro de áreas bajo la curva normal que se estudia en la introducción a la estadística.

¡INTÉNTELO! Se sugiere al estudiante usar la figura 3 -1 0 para responder a estas preguntas. Dar estimaciones. Poner la puntuación z aproximada en cada uno de estos rangos percentilares. Lue­ go, con ayuda del cuadro 3 -1 , revisar las estaninas. RP 50 84 16 25 99

z estimada (figura 3-10) ________ ________ ________ ________ ________

z del cuadro (cuadro 3 -1 ) ________ ________ ________ ________ ________

(Capítulo 3)

62 • Pruebas psicológicas. Una introducción práctica

Fortalezas y debilidades de los rangos percentilares Los RP poseen varias características atractivas, pri­ mero, porque el concepto de RP as-senélllo, fíe ii de captar y se explica con rapidez incluso a alguien que no está versado en estadística. Además, los RP se cal­ culan con facilidad a partir de un grupo normativo; por tales razones, los RP se utilizan en forma muy generalizada. Los RP tienen dos principales inconvenientes. En primer lugar, el lego con frecuencia confunde el RP con la puntuación de porcentaje correcto, la cual se utiliza en muchas pruebas que se realizan en las aulas. Según la tradición, en el sistema de puntuación de por­ centaje correcto, 90% equivale a una A, 60% equivale a reprobar y así sucesivamente. Por tanto, un RP de 72, que se encuentra por encima del desempeño prome­ dio, puede mal interpretarse como desempeño apenas aprobatorio. Un RP de 51, que se halla cerca del pro­ medio, suena como si se tratara de un desempeño pési­ mo en el sistema de porcentaje correcto. Los psicólogos deben distinguir con sumo cuidado entre RP y puntua­ ciones de porcentaje correcto, sobre todo al interpretar las puntuaciones para los legos. El segundo inconveniente importante del RP es la marcada desigualdad de las unidades en diversos puntos en la escala. En concreto, los RP se “agrupan” a la mitad de la distribución y se “dispersan” en los dos extremos de ella. Al principio, esta peculiaridad parecería un tecnicismo trivial, no obstante, tiene con­ secuencias prácticas muy sustanciales. Una determi­ nada diferencia de puntuación natural, por ejemplo de 3 puntos, abarcará muchos puntos de percentil a la mitad de la distribución, pero sólo unos cuantos pun­ tos de percentil en cualquiera de sus extremos. El fe­ nómeno puede indicarse en las normas del RP de cualquier prueba. Esta dificultad no es una propiedad de los RP, sino del hecho de que se aplican a una va­ riable que tiene una distribución normal, lo cual se adjudica de manera aproximada a la mayor parte de las pruebas psicológicas. La dificultad no surgiría en la circunstancia inusual en la que la variable tuviese una distribución rectangular, el fenómeno se reverti­ ría en realidad en una distribución en forma de U. La figura 3-11 muestra las normas percentilares de una de estas facetas en la escala de escrupulosidad del NEO PI-R.4 En estas normas, el pasar de una pun­ tuación natural de 10 a 13 genera un movimiento in­ significante en la escala de percentiles, sólo de un punto, del percentil 2 al 3. Empero, ir de una puntua­ ción natural de 20 a 23 corresponde a una diferencia 4 El NEO PI-R es una prueba de personalidad que se utiliza en forma generalizada. Se describe con mayor detalle en el capítulo 12.

percentilar de 27 puntos (43-70). También es posible observar este fenómeno al revisar la figura 3-10.

PUNTUACIONES ESTÁNDAR Las puntuaciones estándar son otro tipo de norma que se utiliza con frecuencia con las pruebas educativas y psicológicas. Constituyen una familia de normas, exis­ ten versiones de puntuaciones estándar muy utiliza­ das y una variedad en potencia infinita de otras versiones. Aquí se describirá primero lo que es co­ mún a todas las puntuaciones estándar y luego se iden­ tificarán las propiedades de las versiones específicas. En el cuadro 3-2 se muestran algunos ejemplos. Un sistema de puntuación estándar es una con­ versión de puntuaciones z (ya comentadas en este ca­ pítulo) en un nuevo sistema que tiene una media (Ai) y una DE elegidas de manera arbitraria. Las nuevas M y DE suelen elegirse para que sean cifras fáciles de recordar como 50 y 10 o 500 y 100. En contados ca­ sos se buscan otras características deseables. A fin de convertir una puntuación natural en una puntuación estándar, primero se traducirá la puntua­ ción natural en puntuación z. Luego, se multiplicará la puntuación z por la nueva DE (puntuación estándar) y se sumará la nueva media (puntuación estándar). Las etapas se resumen en la figura 3-12. La fórmula siguiente realiza estas etapas:

PE =

(X - M„) + M e DEn

Fórmula 3 -5

donde PE = puntuación estándar deseada DEe = desviación estándar en el sistema de puntuación estándar DE„ = puntuación estándar en el sistema de puntuación natural Mn = media en el sistema de puntuación na­ tural Me = media en el sistem a de puntuación estándar X = puntuación natural Cuando la puntuación (X) se traduce en forma de pun­ tuación z, la fórmula es: PE = z ( DEe) + M e

Fórmula 3 -6

En la práctica común, todas estas etapas ya se han rea­ lizado y sólo se utiliza un cuadro del manual de la prueba para convertir una puntuación natural en una puntua­ ción estándar. En la figura 3-13 aparece un ejemplo de este tipo de cuadros, sólo se incluye una sección del cuadro, no el rango de puntuaciones completo.

« N o n m s de las pruebas • 63

Puntuación natural

10

11

12

13

14

15

Percentil

2

2

2

3

4

7

16 17 11

14

18

19 20 21

22 23 24

26

33

60 70

43 52

25 26

27

28

29 30

79 83 88

93

96

98

99

Figura 3 -1 1 . P un tu a ció n natural para conversión a percentil d e a escala N E O Pl-R .

Transformaciones lineales y no lineales La mayor parte de las puntuaciones estándar son

transformaciones lineales de puntuaciones natura­ les, siguen la fórmula 3-5. No obstante, algunas pun­ tuaciones naturales se derivan de una transformación no lineal, en tales casos, ni esa fórmula ni el ejemplo

de la figura 3-12 aplican. Las transformaciones no lineales se emplean para generar una distribución de puntuaciones normales, por lo cual, el resultado en ocasiones se denomina puntuación estándar norma­ lizada; su efecto se ilustra en la figura 3-14. Por lo común, la transformación no lineal se consigue ba­ sándose en la relación entre puntuaciones z y per­ centiles, en áreas bajo la curva normal, por tal razón, a veces se la conoce como transformación de área. Aunque parezca complicado, el proceso es bastante simple. En este capítulo se asume que las puntuacio­ nes estándar son transformaciones lineales, a menos que se indique de otro modo.

© E d it o ria l E l m a n u a l m o d e r n o F o to c o p ia r s in a u to riz a c ió n e s u n de lito.

Puntuaciones T Las puntuaciones T, conocidas también como pun­ tuaciones T de McCall, son puntuaciones estándar con M = 50 y DE = 10. El rango efectivo de puntuaciones T es de casi 20 (correspondientes a -3 z) a alrededor de 80 (+ 3 z). Las puntuaciones T (en mayúscula) de­ ben distinguirse de los valores / de Student (en mi­ núscula) utilizados en pruebas de significancia esta­ dística. Las puntuaciones T se emplean de manera generalizada con las pruebas de personalidad, aun­ que también con otro tipo de instrumentos, como en el Inventario Multifásico de la Personalidad Minnesota que se describe en el capítulo 12 y en el Strong Interest Inventory (Sil; Inventario de Intereses Strong) que se analiza en el capítulo 14. La figura 3-10 muestra la distribución de puntuaciones T.

Sistem a de puntuación natural Puntuación z Puntuación estándar Fórm ula 3-5:

M = 38

DE = 6

X = 47

z = ( X - M ) ID E = (47 —38)/6 M = 50

D E = 10

P E = 65

P E = (DEsID E r ) ( X - M , ) + Ms PE = (10/6) (47 - 38) + 50 = 65

Figura 3-12. Ilustración de conversión de un sistema de puntuación natural a uno de puntuación estándar.

(Capítulo 3)

64 • Pruebas psicológicas. Una introducción práctica

P u n tu a ció n natu ra l:

... 60 61

62 63 64 65

66 67

68 69 ...

P u n tu a ció n estándar: ... 55 56

56 57 58 59

60 61

62 63

Figura 3 -1 3 . Ejemplo de puntuación natural convertida a puntuación estándar (puntuación 7).

Las pruebas SAT y GRE En la Scholastic Assessment Test (SAT; Prueba de Eva­ luación Académica) y en los Graduate Record Exa­ minations (GRE) (Exámenes de Registro de Gradua­ dos) se utiliza un sistema de puntuación estándar con M = 500 y DE = 100, mismo que también se aplica a las principales pruebas de esta serie: Verbal y Mate­ máticas en el SAT, y Verbal, Cuantitativa, Analítica y las diversas pruebas Avanzadas en los GRE. Las prue­ bas a menudo se combinan para generar una puntua­ ción total, por ejemplo, en el SAT se utiliza a menudo una puntuación combinada de las pruebas Verbal y de Matemáticas. Cuando así sucede, las medias son aditivas, pero las DE no; es decir, la media de la pun­ tuación combinada o Total es 500 + 500. pero la DE de la puntuación total no es 100 + 100. La DE de las pun­ tuaciones totales es menor de 200, ya que las dos pruebas que se integran no están correlacionadas a la per­ fección. Este fenómeno no es particular de las pruebas SAT y el GRE, se emplea en cualquier fusión de prue­ bas que no están correlacionadas-en forma perfecta.

Cl de desviación La definición tradicional del CI (coeficiente de inteli­ gencia) es: CI = (EM/EC) x 100, donde EM es edad mental (para una descripción de edad mental, véase más adelante), EC es edad cronológica y 100 es un multiplicador que sirve para eliminar el punto deci­ mal. Así, por ejemplo, la EM de Zelda es de 10 años,

su EC es de 8 años, de modo que su CI es (10/8) x 100 = 125. Lo anterior se denomina razón de CI ya que representa la razón de EM a EC.

¡IN TÉN TELO !................................................................ Se sugiere al estudiante calcular los Cl de razón de estos casos. La EM de Matt es de 78 meses (6 años, 6 meses), su EC es de 84 meses (7 años, 0 meses). ¿Cuál es su razón de Cl? La edad mental de Meg es de 192 meses, su EC es de 124 meses. ¿Cuál es su razón de Cl?

La razón de CI se utilizó con las primeras prue­ bas de inteligencia, pero se observó que la DE de es­ tos CI no eran iguales a niveles de edad diferentes; en concreto, las DE tendían a aumentar con la edad. Así, una razón de CI de 120 se desvía menos del promedio (100) a los 18 que a los 6 años de edad y, a la inversa, una razón de CI de 70 se desvía más de 100 a los 7 que a los 17 años de edad. Tal variación en el signifi­ cado de un CI a diferentes niveles de edad es desafor­ tunada e indeseable.

Resumen de puntos clave 3 -4

Modalidades de puntuaciones estándar P untuaciones T S c h o la s tic A s s e s s m e n t T e st (SA T) y G ra d u a te Record E xam inations (G RE) C l de desviación E sta n ina s E quivalentes de cu rva norm al P untuaciones e stá n da r m ultinivel (o escaladas)

F ig u ra 3 -1 4 . Ilustración de la transform ación no lineal de una d istrib ució n no norm al de puntuaciones n atu ra le s en el sistem a de p untuación estándar que la a pro xim a a u n a dis­ tribución norm al.

o

■"

Normas de las pruebas • 65

Cuadro 3 -2 . Sistem as de puntuación estándar utilizados en form a generalizada P ru e b a

M e d ia

DE

E scalas W e ch sler Verbal, de Ejecución y Total Pruebas S tanfo rd -B in e t y O tis-Lennon P untuaciones de las su b esca la s W echsler P ruebas de adm isió n a las facultades de dere ch o S cholastic A sse ssm e n t Test (SAT) G raduate R ecord E xam inations (GRE)

100 100 10 150 500 500

15 16 3 10 100 100

Los CI que se obtienen de las pruebas de inteli­ gencia modernas no son de razón, son puntuaciones estándar con M = i 00 y una DE establecida normal­ mente en 15 o 16. Estas puntuaciones estándar se sue­ len conocer como CI de desviación. La M = 100 se utiliza por deferencia a la definición (razón) tradicio­ nal del CI. Los CI de razón en la prueba StanfordBinet original generaban una DE de 16 a ciertas edades, esta DE se adoptó como la DE de las pun­ tuaciones estándar empleadas en algunas pruebas de inteligencia. Otras pruebas, de las cuales destacan las de Wechsler (WAIS, WISC, WPPSI), optaron por una DE= 15. Algunos segmentos de la comunidad psicológica luchan con todas sus fuerzas por evitar el término “CI”, aunque mantienen la tradición de emplear un sistema de puntuación estándar con M = lOOy D E = 15o 16. Lo que aquí se denomina CI de desviación en ocasio­ nes aparece en los manuales de las pruebas y los in­ formes de las puntuaciones con nombres diferentes, como índice de capacidad escolar. Esos nombres alternos suelen reconocerse con facilidad como siste­ mas de puntuación estándar, que cuentan con las M y DE ya familiares para los lectores de este texto.

= 5 y DE = 2 (aproximadamente). Se elaboraron para: a) dividir la distribución normal en 9 unidades y, b) hacer que las unidades abarcaran distancias igua­ les sobre la base de la curva normal, excepto por aquellas que cubren los extremos de la distribución, es decir, la 1 y la 9. Cuando se cumple con estas dos condiciones, la Ai será de 5 y la D £ un poco superior a 2; estas dos propiedades de las estaninas se ilus­ tran en la figura 3-10. vea también la figura 3-15 y note que las unidades 2-8 involucran distancias igua­ les sobre la base de la curva normal. Como la densi­ dad de la curva varía en diferentes secciones, estas distancias iguales cubren varios porcentajes de los casos en la distribución, por ejemplo, la estanina 2 comprende 7% de los casos (del percentil 4 al 11), en tanto que la estanina 4 cubre 17% de los casos (del percentil 23 al 40).

¡INTÉNTELO !................................................................ Con ayuda de la figura 3 -1 0 o 3 -15, el lector determinará la estanina correspondiente a cada uno de estos percentiles. Percentil:

2

36

52

90

Estaninas Estanina: Las estaninas, contracción en inglés de “standard nine ”, son un sistema de puntuación estándar con M Las estaninas siempre se derivan en relación con las desviaciones de los percentiles que se aprecian en la figura 3-15 y no por medio de la fórmula 3-5. Las estaninas generan una transformación no lineal de puntuaciones naturales (a menos que la distribución original ya sea perfectamente normal). Se emplean de manera generalizada para informar puntuaciones

Estaninas Por debajo de 4 | 4-10 | 11-22 | 23-39 | 40-59 | 60-76 | 77-86 | 89-95 | Porenguade»

Rangos de percentil

Figura 3-15. Distribución de ias estaninas.

(Capítulo 3)

66 • Pruebas psicológicas. Una introducción práctica

en pruebas de aprovechamiento estandarizadas y en algunas pruebas de capacidad mental, en las escuelas de enseñanza elemental y secundaria; no se usan mu­ cho en otros contextos. Una ligera variación de la estanina es la estén, contracción en inglés de “standard ten". Se trata de un sistema de puntuación estándar con valores que van de 1 a 10 y con M = 5.5 y DE = 2 (aproximada­ mente). Los estén 2 a 9 cuentan con distancias iguales sobre la base de la curva normal, en tanto que los es­ tén 1 y 10 que cubren los extremos de la distribución son abiertos. Los estén se encuentran en publicacio­ nes del Institute for Personality and Ability Tests (1PAT; Instituto para las pruebas de personalidad y capaci­ dad); la mejor conocida de estas pruebas es el Cues­ tionario de 16 factores de la personalidad (16PF)*.

Equivalentes de curva normal El equivalente de curva normal (ECN) es un siste­ ma de puntuaciones estándar desarrollado para que los ECN sean iguales a los rangos percentilares en los puntos 1,50 y 99. Cuando se cumple con esta condi­ ción, el sistema ECN tiene M = 50 y DE (más o me­ nos) 21. Los ECN se emplean en forma casi exclusiva para cumplir con ciertos requisitos federales de infor­ mación sobre las pruebas de aprovechamiento en las escuelas públicas. En la figura 3-10, se aprecia la re­ lación entre los ECN y otras normas.

Puntuaciones estándar de multinivel Una prueba multinivel es un instrumento que cuenta con pruebas distintas, al menos en parte, para dife­ rentes edades o en distintos grados. Los principales ejemplos de estas pruebas son las baterías de apro­ vechamiento (véase el capítulo 11) y las pruebas de capacidad cognitiva aplicadas a grupos (véase el ca­ pítulo 9) que se utilizan en las escuelas de enseñanza elemental y secundaria. Si bien una de estas pruebas tal vez tenga el mismo nombre (p. ej., la Metropolitan A chievem ent Test [Prueba de Aprovechamiento Metropolitan] o la Otis-Lennon School Ability Test [OLSAT; Prueba de Capacidad Escolar Otis-Lennon]) a lo largo de un amplio margen de edades o grados, obviamente no se utilizan los mismos reactivos en el rango completo. La prueba se divide en varios niveles diferentes, uno puede usarse en los grados 1 a 2, otro en ios grados 3 a 4 y así de manera sucesiva. Las puntuaciones estándar obtenidas a partir de diferentes niveles en tales pruebas suelen relacionarse mediante un sistema de puntuaciones estándar que abar­ ca todos los niveles; en ocasiones se alude a ellas como * N. del E.: Publicado en español por Editorial El Manual Moderno, México.

puntuaciones escaladas. Las puntuaciones estándar de niveles múltiples son difíciles de interpretar, poseen una media y una DE convenientes (p. ej., 500 y 100) en un nivel, por lo general para un grado o edad a la mitad del rango que cubre toda la serie, pero la media y la DE diferirán en otros niveles de edad o de grado. Por tanto, una puntuación estándar de 673 de un estudiante de séptimo grado en la prueba de lectura no tiene un sig­ nificado que resulte fácil de interpretar. Las puntuaciones estándar de niveles múltiples pueden ser útiles para medir el crecimiento por gra­ dos o edades, el sistema de calificación suele desarro­ llarse con el fin de aproximarse a una escala de intervalo; sin embargo, para la interpretación común de las pruebas, las puntuaciones estándar de niveles múltiples no son muy útiles.

Fortalezas y debilidades de las puntuaciones estándar Las puntuaciones estándar constituyen un sistema métrico conveniente para interpretar el desempeño en las pruebas en muy diversas circunstancias. Dado que muchos rasgos de interés para los psicólogos, se su­ pone, están distribuidos en forma normal, son útiles las conexiones entre las puntuaciones estándar y las puntuaciones z. Con las puntuaciones estándar se evi­ ta el problema del percentil respecto a la desigualdad marcada de unidades en diversas regiones de la distri­ bución normal, por ello, estas puntuaciones son más acordes a los cálculos estadísticos. Empero, las puntuaciones estándar tienen algunos inconvenientes. En primer lugar, hay que reconocer que sólo una fracción sumamente pequeña de la raza huma­ na tiene idea de lo que es un curva nonnal o una puntua­ ción z; así que vincular las puntuaciones estándar con el contexto de la curva normal y de las puntuaciones z tie­ ne poco valor, salvo cuando se trabaja con entendidos en la materia. En segundo lugar, para que una puntuación estándar tenga sentido, se debe recordar la M y la DE del sistema. En párrafos anteriores se mencionaron algunos de los conocidos sistemas de puntuación estándar en los que se reduce al mínimo este problema, por ejemplo, M = 100 y DE = 15 en el caso de los CI de desviación en las pruebas de capacidad mental. No obstante, hay muchos otros sistemas de puntuación estándar —quizá una va­ riedad infinita, ya que se puede elegir cualquier valor para M y DE— , Por ejemplo, la Law School Admission Tests (LSAT; Pruebas de Admisión a las Facultades de Leyes) y la prueba de ingreso a la universidad ACT tie­ nen, cada una, sistemas de puntuación estándar distinti­ vos. ¿Qué implica una puntuación de 130 en el LSAT? ¿Qué significa una puntuación de 26 en el ACT? Es im­ posible saberlo sin consultar el manual de la prueba y ver cuáles son los valores de M y DE en estos sistemas de puntuación estándar.

Normas de las pruebas • 67

Es preciso hacer una observación especial acerca de las estaninas: tienen la virtud de ser sencillas para informar las puntuaciones individuales. Es fácil de explicar, por ejemplo a los padres, que el desempeño de su hijo se informa en una escala del 1 a jjl. En general, no se necesita una expliCSctón adicional so­ bre medias, desviaciones estándar, distancias iguales sobre la base de la curva normal u otros, esta sencillez es una ventaja. Por otra parte, las estaninas son bas­ tante burdas para informar promedios de grupos. Los equivalentes de curva normal son una crea­ ción desafortunada. Como puntuaciones estándar, no ofrecen una ventaja con relación a otros sistemas de puntuación estándar, no obstante, parecen percentiles y, por ello, se confunden con facilidad con éstos. Como ya se dijo, estos equivalentes corresponden, de he­ cho, a los percentiles en tres puntos de la distribu­ ción, pero en otros son diferentes de manera notoria.

NORMAS DE DESARROLLO Cuando el rasgo que se mide se desarrolla en forma sistemática en el tiempo, es factible crear lo que puede denominarse norm a de desarrollo. Son dos las nor­ mas de esta índole más utilizadas; los equivalentes de edad (EE) y los equivalentes de grado (EG). Los EE se usan en algunas pruebas de capacidad mental, en este contexto, la puntuación se denomina edad mental (EM); con mucho el más conocido de los equivalentes de edad. Los EG se emplean con muchas pruebas de aprovechamiento. Las normas de desarrollo son signi­ ficativas sólo para el rango en que el rasgo que se mide se desarrolla o crece en el tiempo en la población perti­

nente. En una norma de desarrollo, una nueva puntua­ ción se interpreta en términos de la edad o el grado en que es característica la puntuación natural.

Edad mental (EM) Las edades mentales son el principal ejemplo de equi­ valentes de edad, fueron de las primeras normas utili­ zadas con las pruebas psicológicas; se originaron con las escalas Binet. Las EM se determinan hallando la puntuación común o mediana de los examinados a eda­ des sucesivas. Los grupos de edad pueden formarse por intervalos de un año, medio año, un trimestre o cual­ quier otra de estas agrupaciones de individuos. Luego, se determina la puntuación mediana en la prueba de cada grupo. Los resultados se indican mediante puntos y con una ligera curva se unen los puntos, como en la figura 3-16. Cada en la figura es una mediana obte­ nida a partir del programa de normalización de la prue­ ba. La figura ilustra cómo obtener una EM de 88 meses, o 7 años con 4 meses (la cual suele escribirse como 7-4 en la jerga de los equivalentes de edad). En la práctica, las puntuaciones naturales se convierten en edades mentales mediante un cuadro preparado a partir de la curva de desarrollo. En la figura 3 - 17, apar ece un ejem­ plo de cuadro de esta índole.

¡INTÉNTELO !................................................................ Con ayuda de la figura 3-17, estime la EM (edad mental) correspondiente a las puntuaciones naturales siguientes: Puntuación natural EM

11

Figura 3-16. Ilustración de curva para desarrollar edades mentales.

22

47

(Capítulo 3)

68 • Pruebas psicológicas. Una introducción práctica

P u n tu a ció n natural: Edad m ental:

15

20

25

30

35

40

45

4 -0

4 -2

4 -5

5 -0

5 -4

6 -2

8 -8

Figura 3 -1 7 . P arte de una puntuación natural p ara cu a dro de edad m ental desarrollada a p a rtir de la figura 3 -1 6 .

Equivalentes de grado (EG) Los equivalentes de grado se desarrollan aplicando una prueba a estudiantes de diferentes grados, esto se lleva a cabo en el programa de normalización. Luego se obtiene el desempeño típico o mediano en cada grado. Las medianas se señalan con puntos y una cur­ va une los puntos como en la figura 3-18. De manera similar al procedimiento de las EM, los EG de una puntuación natural se leen de la curva y se prepara un cuadro de conversiones de puntuación natura] a EG. La convención para los EG consiste en dividir el año escolar en décimos, como se aprecia en la figura 3-19. Se informa un EG, por ejemplo, como 6.3, lo que signi­ fica el tercer mes del sexto grado. Los EG superiores a 12.9 (el último mes del decimosegundo grado) suelen informarse como 12.9+ o con alguna clasificación ver­ bal (quizá “Posterior al bachillerato”). La escala de EG no suele extenderse a los años universitarios.

Otras normas de desarrollo Aunque las edades mentales y los equivalentes de grado son los principales ejemplos de normas de desarrollo, se debe comentar con brevedad otros dos ejemplos. Prime­ ro, hay pruebas que se basan en las teorías de las etapas

del desarrollo humano, como las de Piaget sobre el de­ sarrollo cognitivo y de Kohlberg sobre el desarrollo moral. Las pruebas basadas en estas perspectivas gene­ ran resultados que ubican al individuo en cierta etapa, así, una tarea piagetana puede ubicar a un niño en la “etapa preoperacional” del desarrollo cognitivo; una prueba kohlberiana tal vez sitúe a un individuo en la “eta­ pa convencional” del desarrollo moral. Tales pruebas por lo general no producen una puntuación numérica aun­ que, en algunas aplicaciones, estas etapas también se relacionan con las edades a las que con frecuencia se les alcanza. En cualquier caso, las nociones fundamentales asociadas con las normas basadas en etapas de estas prue­ bas son las mismas, en esencia que las nociones de EM y EG. Por supuesto, la utilidad de las normas de las teo­ rías basadas en etapas depende de la validez de la teoría de las etapas y características psicométricas de la prueba. Un segundo ejemplo lo constituyen las medicio­ nes antropométricas, como la estatura y el peso, que suelen interpretarse en términos de normas de desa­ rrollo. Se trata en esencia de equivalentes de edad, por ejemplo, se informa que un menor “tiene una es­ tatura típica de un niño de 6 años”. Como sucede con las edades mentales, tales afirmaciones se interpretan en relación con la edad cronológica del menor, como “Mike es muy alto para su edad”.

Figura 3-18. Ilustración de la curva para desarrollar equivalentes de grado.

Normas de las pruebas • 69

Sept

Oct

.0 _ , o1

Nov -o .2

Dic

Ene

Feb

Mar

Abr

May

Jun

.3

.4

.5

.6

.7

.8

.9

F ig u ra 3 -1 9 . D ivisión del año e sco lar en el siste m a de e quivalentes de grado.

Fortalezas y debilidades de las normas de desarrollo

I ” » i | | | | § £ | | ^ | £ I | ^

Todas las normas de desarrollo tienen algunas forta­ lezas y debilidades comunes, por el lado positivo, el significado de las normas de desarrollo suele por natu­ raleza ser muy atractivo. Cuando se dice que un chico de 16 años funciona a nivel mental como un niño de tres años o que un estudiante de segundo grado lee como uno de octavo, tales afirmaciones al parecer transmiten un significado considerable, libre de lajerga estadística estéril de los rangos percentilares y las pun­ tuaciones estándar. Las ideas sobre las pautas de de­ sarrollo normales están arraigadas de modo profundo en las ideas que se tienen sobre los seres humanos; la noción fundamental de las normas de desarrollo se utiliza en muchas situaciones. Al adulto que mani­ fiesta un berrinche, se le acusa de “actuar como si tuviera dos años”; se dice que en Japón, los estudian­ tes de sexto grado realizan ejercicios de álgebra “nor­ malmente reservados para los estudiantes de noveno en EUA” ; a Mike lo elogian por “desempeñarse en su primer juego de primer grado como si fuera un exper­ to”. Los equivalentes de edad y los equivalentes de grado formalizan este modo de pensar natural, ayu­ dan a lograr la meta de hacer que las puntuaciones naturales resulten significativas. Una segunda ventaja de las normas de desarrollo radica en que ofrecen una base para medir el crecimiento en las pruebas de niveles múltiples. Así, durante los años de enseñanza elemental, a un niño tal vez lo sometan al nivel Primario 1, al nivel Elemental y al nivel Intermedio de una prueba de aprovechamiento en el primer, cuarto y séptimo grados, respectivamente. Los equivalentes de grado (desarrollados en el programa de escalamiento, descrito en el subtílulo Puntuaciones estándar de muitinivel, antes) relacionan todos estos niveles de la prueba. Las normas de desarrollo tienen dos ¡nconvenientes principales. En primer lugar, sólo son aplicables a variables que muestran pautas de desarrollo claras, por tanto, no suelen aplicarse en áreas como los rasgos de personalidad, las actitudes y los intereses vocacionales. No significa nada decir que alguien tiene la extroversión de un chico de 10 años o de uno de tercer grado; además, hasta las variables que presentan pautas de desarrollo en ciertos niveles por lo general no siguen pautas de crecimiento en forma indefinida. La capaci­

dad mental, según la miden muchas pruebas, se desa­ rrolla sistemáticamente alrededor de los 18 años de edad, pero no después. La capacidad de lectura se incrementa con rapidez durante los años de enseñanza elemental, pero esto no prosigue de manera indefinida. Para fines interpretativos de las pruebas, existe una útil distinción entre la capacidad mental de un niño de 5 años de edad y de uno de 15, pero no entre una persona de 25 y una de 35. No se trata de un asunto de todo o nada, no es que las normas de desarrollo dejen de ser útiles en un preciso momento, sino que van perdiendo poco a poco su utilidad conforme la curva de desa­ rrollo se vuelve menos pronunciada (como las que se observan en las figuras 3-16 y 3-18): cuando ésta deviene plana, las normas de desarrollo pierden por completo su significado. Una segunda desventaja de las normas de desarro­ llo son sus DE incontroladas, ya que no son iguales en niveles diferentes ni tampoco en distintas pruebas. En muchas pruebas, las DE tienden a incrementarse de for­ ma sistemática con el nivel de edad o de grado. Las DE varían de modo no sistemático entre diferentes pruebas dentro de la misma batería, aun cuando las normas se basen en el mismo grupo normativo. Tal vez éste parez­ ca un aspecto técnico trivial, pero tiene repercusiones prácticas sustanciales; por ejemplo, un niño de 5 años de edad que está un año por debajo del promedio en capa­ cidad mental (a saber, EC = 5-0, EM = 4-0), se encuen­ tra muy por debajo del promedio en unidades de DE o en unidades percentilares en comparación con uno de 16 años de edad que aparece con un año por abajo del promedio (a saber, EC = 16-0, EM = 15-0). El estudian­ te del grado 1.5 que lee con un EG = 3.5 está casi fuera de la distribución de los estudiantes de primer grado, en tanto que no resulta tan inusual el pupilo del grado 7.5 que posee un EG de 9.5 en lectura. Además, considérese al alumno del grado 3.5 que tiene un EG de 4.5 en cálcu­ lo matemático y un EG de 4.5 en lectura, en relación con otros estudiantes quizá se encuentre mucho más avanza­ do en cálculo que en lectura. Estas diferencias en cuanto a la DE entre varias pruebas no son sistemáticas, pueden diferir de una serie de evaluaciones a otra. Una tercera crítica suele reservarse a los equiva­ lentes de grado. Ya se dijo que, por ejemplo, los estu­ diantes en tercer grado pueden tener un EG de 6.5, no por conocer el mismo material que el estudiante co­ mún de sexto grado, sino por responder sin error a todos los reactivos de segundo, tercero y cuarto grados;

« ( Capítulo J )

70 • Pruebas psicológicas. Una introducción práctica

en tanto que el alumno común de sexto grado resuel­ ve con acierto algunos, más no todos los reactivos de un rango de grados de segundo a séptimo. Tal situa­ ción se representa en la figura 3-20. Dicho argumento, normalmente mencionado sólo en relación con los equivalentes de grado, puede apli­ car a cualquier tipo de puntuación normalizada. Dos estudiantes que obtienen una puntuación que corres­ ponde al percentil 75 o una puntuación estándar de 60, no por fuerza responden de modo correcto a los mismos reactivos. Las pruebas elaboradas según la teoría de respuesta al ítem tratan de reducir al mínimo este pro­ blema, pero eso está en función del método de elabora­ ción del instrumento y no del tipo de norma utilizada.

El cuadro 3^ f muestra parte del cuadro de normas de la Piers-Harris Children’s Self-concept Scale (Esca­ la de Autoconcepto para Niños de Piers-Harris). Se tra­ ta de un caso mucho más sencillo, uno de los cuadros contiene todas las puntuaciones; en éste, uno ubica la puntuación natural en la columna de la izquierda, lue­ go lee hacia la derecha para convertirla en un rango de percentil, estanina o puntuación estándar (en este caso una puntuación T). Por supuesto, para procesamiento de cómputo, los cuadros de normas de estos dos ejem­ plos se leen en un archivo de computadora y las con­ versiones se hacen en forma electrónica.

INFORMES NARRATIVOS Y NORMAS EJEMPLOS DE CUADROS DE NORMAS Ahora que ya se han considerado cada uno de los princi­ pales tipos de normas, conviene observar como se pre­ sentan las normas en los manuales de las pruebas. ¿Cómo es un cuadro de normas? En realidad, estos cuadros pre­ sentan una variedad enorme; aunque hay algunos esque­ mas estándar. Luego de ver unos cuantos ejemplos, es fácil descifrar las variaciones a estos esquemas; aquí se presentan dos ejemplos comunes de cuadros de normas, uno de una prueba en la que se utilizan diversas normas y el otro de un caso mucho más sencillo. El cuadro 3-3 es un cuadro compuesto de varios cuadros relacionados en la Otis-Lennon School Ability Test, séptima edición. En la prueba total, se empieza con una puntuación natural, luego se la convierte en una escalar, puntuación estándar de niveles múltiples. Con ayuda de otro cuadro, esta puntuación escalar puede traducirse en el índice de capacidad escolar (ICE), una puntuación estándar parecida a un CI con M = 100 y DE = 16. Sin embargo, otro cuadro con­ vierte la puntuación escalar en un rango de percentil y una estanina; por último, basándose en la relación fija entre percentiles y ECN (cuadro 3-1), la puntua­ ción escalar puede convertirse en un ECN.

Nivel de contenido: Reactivos

Recuérdese que la finalidad básica de las normas con­ siste en ofrecer un contexto de interpretación a una puntuación natural. En general, la información nor­ mativa es cuantitativa: otra serie de cifras. Sin embar­ go, las puntuaciones de las pruebas se informan cada vez más como narraciones generadas por computa­ dora. Quizá el usuario no vea ningún número, aunque la mayoría de los reportes incluyen ambos números — la clase usual de normas— así como un informe narrativo. ¿Cómo se originan estos últimos? La esencia de los informes narrativos siempre inicia con la puntuación de una prueba, al menos una puntuación natural o theta y, las más de las veces, con una puntuación normalizada. A partir de esto, dichos informes varían de forma considerable en cuanto a su complejidad. En el nivel más simple, tal vez sólo tra­ duzcan una puntuación normalizada en una descrip­ ción verbal; por ejemplo, una computadora cuenta con un cuadro que muestra la siguiente correspondencia entre puntuaciones estándar (en un sistema con M = 100, DE = 15) y clasificaciones verbales: 130+ 120-129

E xce p cion a lm en te elevado M uy p o r e ncim a del prom edio

110-119

L igeram ente p o r e ncim a del prom edio

Segundo grado

Tercer grado

Cuarto grado

Quinto grado

xxxxx

xxxxx

xxxxx

xxxxx

Estudiante de tercer grado

/////

/////

/////

Estudiante de sexto grado

lili

11/

m

III

Sexto grado xxxxx

/

Séptim o grado

PN

EG

15

6.5

15

6.5

xxxxx

/

Cada x es un reactivo de la prueba. Cada / es una respuesta correcta. F ig u ra 3 -2 0 . D ife ren tes fo rm a s de o btener un EG d e 6 .5. A bre via tu ra s: EG , equ iva le ntes d e grado; PN , puntuación natural.

Normas de las pruebas • 71

Cuadro 3 -3 . C om puesto de puntuaciones norm alizadas de algunas puntuaciones naturales de la O tis-lenn on Shool Ability Test, 7 a edición. Adaptado del cuadernillo de normas m ultinivel OLSAT7 PN

PE

ICE

RP

P

ECN

64 54 35

705 667 620

115 101 83

82 50 10

7 5 2

69 50 23

PN a PE vía cuadro 9. PE a ICE vía cuadro 22. ICE a P vía cuadro 37. RP a ECN vía cuadro 3. Puntuadones del nivel F, grupo de edad 16 años 9-11 meses, grado 11 otoño. Abreviaturas: ECN, equivalente de curva normal: ICE, índice de capacidad escolan P, puntuación; PE, puntuación estándar; PN, puntuación natural; RP, rango de percentil.

9 0-1 0 9 8 0-8 9

P rom edio Ligeram ente p or d e b a jo d e l prom edio

7 0 -7 9 M uy por d ebajo el pro m e d io P or deb a jo de 7 0

Excepcionalm ente bajo

Con este cuadro, el perfil de las puntuaciones de un individuo en las pruebas A, B y C se vería de la si­ guiente manera:

está ligeramente por encima del promedio de los ni­ ños de su edad”. Algunos informes narrativos van más allá de la traducción de puntuaciones normalizadas en clasifi­ caciones verbales, consideran la información sobre la confiabilidad y la validez de la prueba; estos aspectos se abordan en los capítulos dedicados a estos temas.

¡INTÉNTELO!......................................................... P ru e b a

P u n tu a c ió n

A B

98 82

C

94

N ive l d e d e s e m p e ñ o P rom edio

Para utilizar en un inform e narrativo, diseñe una serie de etiquetas que distingan entre las estaninas 1-3, 4-6 y 7-9. Las clasificaciones pueden ser algo más que pala­ bras aisladas.

L ige ra m e n te p or debajo del pro m e d io P rom edio

La columna de “Puntuación” tal vez ni siquiera apa­ rezca en el informe, aunque las puntuaciones son la base del informe. Con un poco más de sofisticación en programación, el informe podría leerse como si­ gue: “El desempeño de Jim en la prueba A y C estuvo en el rango promedio, en tanto que su desempeño en la prueba B estuvo ligeramente por debajo del pro­ medio” . Los informes narrativos suelen incorporar referencias al grupo normativo; por ejemplo, “En com­ paración con los demás niños de su grado, Jim se en­ cuentra en el percentil 60 en aptitud mecánica, lo cual

Grupo de estaninas ' 1-3 ' 4-6 7-9

Etiqueta verbal _____________ _____________ ____________

En la figura 3-21, se aprecian partes de un infor­ me narrativo del NEO PI-R, prueba que se describe con todo detalle en el capítulo 12. El informe narrati­ vo completo tiene entre 5 y 6 páginas, el extracto aquí

Cuadro 3 -4 . Parte del cuadro de normas de la Piers-Harris Children’s Self-Concept Scale P u n tu a c ió n n a tu ra l

P erce n til

E s ta n in a

P u n tu a c ió n T

69 68 67 66 65 64 63 62 61 60

91 89 87 85 82 79 77 74 71 69

8 7 7 7 7 7 6 6 6 6

63 62 61 60 59 58 57 56 56 55

© «

72 •

(Capítulo

Pruebas psicológicas. Una introducción práctica

— ín d ice s de validez — Los índices de validez se encuentran dentro de los límites normales y los datos obtenidos de la prueba al parecer son válidos. — B ase de la in te rp re ta ció n — Este informe compara al entrevistado con otro varón adulto. Se basa en autorreportes del entrevistado. En términos generales, la personalidad puede describirse en función de cinco dim ensiones básicas o factores. Las puntua­ ciones de dominio del NEO-PI-R ofrecen estimaciones de cada uno de estos cinco factores. Sin embargo, las puntuaciones factoriales del NEO-PI-R proporcionan mediciones más precisas, las cuales pueden diferir ligeramente de las puntuaciones de dominio indicadas en el perfil del individuo. Las puntuaciones factoriales son las siguientes: E scala Neuroticismo Extraversión Apertura Agradabilidad Escrupulosidad

(N) (E) (A) (Ag) (Es)

P u n tu a ció n T fa cto ria l 53 44 56 50 50

R ango PROMEDIO BAJO ELEVADO PROMEDIO PROMEDIO

Estas puntuaciones factoriales se emplean para describir al individuo en un nivel general. Las puntuaciones factoriales se basan en un compuesto de las puntuaciones escalares de los aspectos. En la medida en que hay una dispersión amplia entre las puntuaciones de los aspectos dentro de un dominio, se vuelve más com pleja la interpretación del dominio y del factor. En estos casos, debe prestarse particular atención a las escalas de los aspectos y su interpretación. — D e scrip ció n general de la p erso n a lid a d: lo s c in c o fa c to re s — La característica más distintiva de la personalidad de este individuo es la posición que ocupa en el factor de extraversión. Tales personas son ligeramente introvertidas, prefieren hacer muchas cosas solas o con un grupo reducido de personas. Evitan las fiestas grandes y ruidosas y suelen ser silenciosas y reservadas en las interacciones sociales. Quienes conocen a estas personas es probable que las describan com o retraídas y serias (McCrae, Costa, 1987). El hecho de que estos individuos sean introvertidos no por fuerza significa que carezcan de habilidades sociales, de hecho muchas personas con esta característica funcionan muy bien en situaciones sociales, aunque preferirían evitarlas. Obsérvese también que la introversión no supone introspección, estos individuos tal vez sean atentos y reflexivos, sólo si tienen un grado elevado de apertura. — Esta persona tiene un grado elevado de apertura. Las personas que poseen este rasgo se interesan en la experiencia por el gusto de experimentar, disfrutan la novedad y la variedad; son sensibles a sus propios sentimientos y poseen una capa­ cidad superior al promedio para reconocer las emociones de los demás; aprecian m ucho la belleza en el arte y la naturaleza; están dispuestos a considerar ideas y valores nuevos y tal vez sean poco convencionales en sus opiniones. Sus com pañeros los califican como individuos originales y curiosos. Luego, tómese en cuenta el nivel del individuo en neuroticismo. Las personas que califican en este rango se encuentran en el promedio en términos de estabilidad emocional, experimentan una cantidad norm al de angustia psicológica y tienen un equilibrio común entre satisfacción e insatisfacción en la vida; cuentan una autoestim a elevada o baja; su capacidad para enfrentar el estrés es tan buena com o la del individuo promedio. La persona se encuentra en el promedio en térm inos de agradabilidad. Q uienes califican en este rango son tan agrada­ bles como la persona promedio. Pueden ser comprensivos aunque tam bién firm es. Son confiados mas no crédulos, y están preparados para competir y cooperar con los demás. Por último, el individuo califica en el rango promedio en térm inos de escrupulosidad. Quienes califican en este rango cuentan con un nivel normal de necesidad de logro, son capaces de hacer de lado el trabajo en la búsqueda del placer o la recreación; son moderadamente bien organizados y bastante confiables, y tienen una disciplina personal que se ubica en el promedio. — In te rp re tació n deta lla d a: asp ecto s de N, E, A, A g y Es— Cada uno de los cinco factores abarca muchos otros rasgos específicos, o aspectos. El NEO-PI-R mide seis facetas en cada uno de los cinco factores. Un examen de las puntuaciones de los aspectos ofrece una imagen más detallada de la forma distintiva en que se ven estos factores en esta persona. N e u ro ticism o Este individuo es ansioso, en general aprehensivo y tiende a preocuparse. En ocasiones se molesta con los demás y se muestra propenso a sentirse triste, solo y desalentado. La vergüenza o la tim idez para enfrentar a los extraños no es un problema para él. Reporta que no controla muy bien sus impulsos y deseos, pero que puede manejar el estrés tan bien como la mayoría de la gente.

F ig u ra 3 -2 1 . E xtractos de un inform e narra tivo del N E O P l-R .

V

Normas de las pruebas

)

presentado ofrece una idea de tal reporte. Nótese que el informe empieza con las puntuaciones normaliza­ das, puntuaciones T en este caso; luego procede a in­ terpretar estas puntuaciones. La figura 3-22 proviene de la prueba STAR Math, una prueba de desempeño en matemáticas adaptada por computadora para los grados 1 a 12. Este informe empieza también con puntuaciones normalizadas, que en este caso incluyen una puntuación estándar (PE), un equivalente de grado (EG), un rango percentilar (RP) y un Rango del RP, así como un equivalente de curva normal (ECN). El reporte interpreta el desem­



peño del estudiante y hace recomendaciones relacio­ nadas con la instrucción; además, combina elemen­ tos de interpretación referidos a normas y criterios.

Efecto Barnum Al evaluar los informes narrativos de las puntuacio­ nes de las pruebas, se debe estar alerta en no incurrir en el efecto Barnum, el cual recibe su nombre en ho­ nor del promotor de circo, P. T. Barnum, reconocido por su capacidad para hacer que la gente creyera (y

Informe de diagnóstico de Melissa Barrett STAR Math™ : Miércoles, 09/09/99,10:31 a. m. Fecha de la prueba: 09/09/99 Gregory Middle School C lase: m a te m ática s 9 para sé p tim o grado G rado: 7

M aestro: Robert W illiam s Id:

Este reporte presenta información de diagnóstico sobre las habilidades generales del estudiante en matemáticas, con base en su desempeño en una prueba STAR Math.

PE

EG

RP

Rango RP

667

5.0

18

RP y Rango RP

Por debajo del promedio

p,o|Md|0 ,

}

11-26

50

Por encima del promedio 99

ECN

30.7 ♦

Estas puntuaciones indican que es probable que Melissa domine los hechos matemáticos básicos de las cuatro operacio­ nes. Es razonablemente competente en la reagrupación de las combinaciones de números enteros más difíciles y capta bien el sistema decimal de números enteros. Melissa quizá aún no domine conceptos y operaciones con fracciones y decimales, pero está preparada para trabajar en este ámbito con intensidad. Para un crecimiento óptimo en matemáticas, Melissa necesita: • Mantener la competencia con los conceptos y las operaciones de números enteros, mediante práctica periódica. • Recibir instrucción minuciosa en los conceptos de fracciones y decimales, desarrollar una comprensión conceptual mediante el uso de modelos manipulativos y concretos. • Practicar suma, resta, multiplicación y división de fracciones y decimales. • Relacionar operaciones simples y problemas de palabras con modelos concretos. • Empezar a trabajar con operaciones más difíciles que involucren fracciones y decimales. Las habilidades matemáticas de esta estudiante se encuentran por debajo del promedio de su grado. M elissa tal vez se beneficie si cuenta con más tiempo del que a diario suele tener en instrucción de matemáticas. Quizá tam bién necesite más tiempo con las representaciones concretas de conceptos y procesos matemáticos. Se recomienda asegurarse de que Melissa alcance un buen nivel en matemáticas y luego vea material nuevo; evitar la repetición innecesaria de operaciones y conceptos matemáticos simples. Si con Melissa se emplea el software de manejo de matemáticas Accelerated Math™ , asígnesele al 4 o o 5o grado de Library. Pueden presentársele los primeros objetivos del 4 o grado de Library en la modalidad de diagnóstico. Si Melissa domina estos objetivos, debe pasársele de inmediato al 5o grado de Library; en caso contrario, debe trabajar en el 4o grado de Library. Repita los objetivos de los grados 4o o 5 o si es necesario, hasta que ella sienta confianza con el material.

Figura 3 -2 2 . Inform e narrativo com pleto de STAR M ath. A breviaturas; ECN, equivalente de curva norm a l; EG, equivalente de grado; PE, pun tua ció n estándar; RP, rango percentilar.

(Capítulo 3)

74 8 Pruebas psicológicas. Una introducción práctica

comprara) cualquier cosa. En lo que atañe a las prue­ bas psicológicas, el efecto Barnum tiene que ver con la tendencia de la gente a creer en declaraciones gran­ dilocuentes que quizá sean verdaderas sobre cualquier persona, pero que carecen de información específica y singular derivada de una prueba. Considérense estas declaraciones, supuestamente basadas en una prueba de personalidad: • “Sus puntuaciones indican que con algunos grupos, usted puede ser muy extrovertido; sin embargo, en ocasiones desea ser usted mismo.” 8 “La combinación de las primeras tres escalas seña­ la que normalmente puede controlar su tempera­ mento, aunque a veces ‘hierve por dentro’.” • “Según esta prueba, hay ocasiones en que usted con­ sidera injusto que las personas se aprovechen unas de otras.” Ahora obsérvense estas declaraciones que se supone están basadas en pruebas de capacidad mental y apro­ vechamiento, aplicadas a un estudiante de enseñanza elemental: • “Esta batería de pruebas muestra que Ned no es igualmente bueno en todas las áreas. Su maestro necesita aprovechar sus fortalezas y al mismo tiem­ po motivarlo para que se desempeñe bien en otras áreas.” 8 “Los resultados de esta prueba son especialmente útiles para abordar un caso como el de Abigail, quien ciertamente puede mejorar de diversas maneras.” Todas las afirmaciones anteriores podrían hacerse en relación con cualquier persona, no contienen in­ formación que se funde de manera específica en los resultados de una prueba, de hecho, podría ela­ borarse todo un informe basado en declaraciones al estilo Barnum. Esta clase de aseveraciones no son de gran ayuda, los informes narrativos deben ofrecer datos que caractericen en forma singular al individuo y que se deriven directamente de los re­ sultados de una prueba.

GRUPOS NORMATIVOS

Hasta aquí, todos los flpos de normas tratados se ba­ san en grupos normativos. La prueba se aplica al grupo normativo en lo que se denomina un programa de normalización o programa de estandarización. El valor de las normas de una prueba depende de la na­ turaleza de este grupo. El grupo normativo que se emplea para derivar las normas, independientemente del tipo de normas derivadas, influye mucho en la in­ terpretación de las puntuaciones de la prueba. En con­ secuencia, es importante considerar la clase de grupos normativos que podrían encontrarse. Los grupos normativos de las pruebas psicológi­ cas muestran una enorme variedad, en tal sentido, re­ sulta difícil formular categorías distintivas dentro de una variedad así. En esta sección, el autor presentará un esquema de categorización que representa puntos a lo largo de un continuo y no modelos diferenciados con claridad. En la práctica, cada quien encontrará ejem­ plos en puntos intermedios a lo largo del continuo.

NORMAS NACIONALES Algunas pruebas aspiran a contar con normas nacio­ nales, es decir, normas basadas en un grupo que sea representativo del segmento de la población del país para el cual se ideó la prueba. Este segmento poblacional puede estar conformado en su totalidad por adultos, niños en grados K-12, personas que quieren ingresar a la universidad o que legalmente sean invidentes. El grupo — o población— meta suele defi­ nirse junto con la finalidad de la prueba. En el cuadro 3-5 se aprecian declaraciones que aparecen en los manuales de pruebas, en las que se afirma que los ins­ trumentos cuentan con normas representativas a nivel nacional; compárense con las del cuadro 3-6, en las cuales se niega que los instrumentos tengan representatividad de algún grupo bien definido.

NORMAS INTERNACIONALES ¡INTÉNTELO!...........................................................

Elabore una declaración al estilo Barnum, en el ámbito de la personalidad, que aplique a casi cualquier persona conoci­ da. Habrá de empezar con algo como esto: ‘ Los resultados de la prueba demuestran que usted_____________”.

En el contexto de los estudios internacionales sobre desempeño escolar, en los últimos años se han creado normas internacionales, basadas en niños en edad es­ colar provenientes de varios países —por lo general sólo de naciones económicamente avanzadas— quie­ nes optaron por participar en estos estudios. La ma­ yor parte de las interpretaciones se fundan en compa­ raciones de puntuaciones totales y en el porcentaje de alumnos que respondieron correctam ente a los

o

o

Normas de las pruebas • 75

C uadro 3 -5 . Ejem plos de declaraciones en las que se afirma que los instrum entos cuentan con norm as representativas de la nación “Las norm as de la W IS C -lll pre se n ta d as en este m anual se d erivan d e una m uestra de e sta n da riza ció n que es represen­ tativa de la p oblación infantil de EUA.” (W echsler, 1991, p. 20) “La m uestra [de la M S C S ] es m uy representativa de la población esta d ou n id en se y corre sp o n de m uy bien a los parám etros de la p oblación d e EUA en la m ayor parte de las variables.” (Bracken, 1992, p. 15) "La PPVT-R se e sta n d a rizó en una m uestra nacional representativa de niños y jóvenes.” (D unn, D unn, 1981, p. 35)

reactivos en lo individual, por tanto, poco se utilizan normas como los rangos de percentil o las puntuacio­ nes estándar. Para conocer ejemplos de estas normas internacionales, consulte el capítulo 11.

GRUPOS NORMATIVOS CONVENIENTES

o

Algunas pruebas aspiran a tener una norma nacional, pero no simulan contar en realidad con tal norma si no la tienen; más bien, poseen normas basadas en uno o varios grupos convenientes, de los que con facilidad se puede disponer para evaluación. Con frecuencia, tales grupos provienen de un solo lugar geográfico, son un tanto homogéneos en cuanto a antecedentes culturales y quizá estén limitados en términos de rango de edad, nivel educativo y otras variables importantes. Algunas pruebas presentarán varias normas di­ ferentes basadas en distintos grupos, por ejemplo, una prueba de autoconcepto tal vez presente una norma basada en 250 pupilos de octavo grado en una ciudad del noroeste, otra norma basada en 150 per­ sonas de entre 15 y 18 años de edad canalizadas para asesoría psicológica y otra norma basada en 200 adul­ tos que participaron en una encuesta de actitudes del consumidor. Al menos, el usuario de la prueba confía en que el manual del instrumento cuente con una descrip­ ción franca y cuidadosa de las características de estos grupos normativos ad hoc\ muchas veces ni siquiera de eso se dispone. Las normas basadas en estos gru­ pos convenientes deben interpretarse con sumo cui­ dado, el usuario de la prueba se abstendrá de suponer que tales normas pueden usarse como sustituto de una norma nacional o de una norma de subgrupo definida de manera clara.

NORMAS DE LOS USUARIOS En algunas pruebas se emplean lo que ha dado en denominarse normas de usuario, las cuales se basan en cualquier grupo que en realidad se somete a la prue­ ba, por lo general dentro de cierto periodo específico. Conforme a nuevos grupos se les administra la prue­ ba, la editorial agrega estos casos a la base de datos normativos.5 Las normas del rango percentilar en la SAT son normas de usuario (véase el capítulo 9, p. 270) y se basan en todos los estudiantes que resol­ vieron la prueba en el año más reciente; las normas de las Major Field Tests (Pruebas de Campo de las Prin­ cipales Asignaturas) (véase el capítulo 11, p. 325) se basan en todos los individuos que se sometieron a la prueba en un periodo de tres años. Con las normas de usuario no hay un intento a priori por asegurar que el grupo es representativo de alguna población bien definida. Las normas de usua­ rio son, en realidad, una modalidad de norma conve­ niente; como ya se señaló, se confía en que estén acompañadas de una descripción detallada.

NORMAS DE SUBGRUPOS Algunas pruebas ofrecen normas de subgrupos. Los subgrupos se toman del grupo normativo en su totali­ dad, por ejemplo, tal vez se proporcionen normas se­ paradas por sexo, raza, grupo socioeconómico, grupo ocupacional o región geográfica. 5En consecuencia, este tipo de norma suele encontrarse sólo en casos en los cuales la editorial que publica la prueba, califica todas o al menos una fracción sustancial de las pruebas aplicadas.

Cuadro 3 -6 . Ejem plos de declaraciones en las que no se afirma representatividad “Es im portante que las instituciones recuerden que los datos de esta G uía provienen de los usuarios [...] Las instituciones incluidas en los datos de ca d a prueba no representan proporcionalm ente a los diversos tipos d e instituciones de educación superior; se trata de lo s b achilleratos y universidades que han presentado las M a jor Field Tests.” (ETS, 1997, p. 3) "Para la p untuación to ta l, la m uestra norm ativa con sistió en 1 183 n iño s en edad e sco lar d e u n a e scu e la pública en un pequeño pueblo d e P ennsylvania [...] [los datos n orm ativos] tal ve z cu e nten con una ca p acid a d de g eneralización limitada.” (Piers, 1996, p. 50)

V

(Capítulo 3)

76 • Pruebas psicológicas. Una introducción práctica

Las normas de subgrupos tal vez sólo sean útiles si hay diferencias sustanciales entre los subgrupos en la variable que mide la prueba, si éstos no difieren en la variable, entonces dichas normas no divergirán de la norma basada en el grupo total. Dependiendo del objetivo de la evaluación psicomètrica, es posible preferir usar sólo una norma de grupo total o sólo una norma de subgrupo. En mu­ chas circunstancias, el empleo tanto de una norma de grupo total como de una norma de subgrupo mejora­ rá la interpretación de la prueba. Por ejemplo, puede resultar útil el saber que la puntuación de Zeke se en­ cuentra en el percentil 60 en la norma nacional esta­ dounidense, pero en el percentil 30 para las personas de su grupo ocupacional.

quizá resulte engañoso; por ejemplo, en la situación de evaluación escolar antes señalada, el estudiante común en cada grado estará en “la norma”, lo cual no es muy ilustrativo, ya>que es cierto por definición; en una norma local es posible determinar si el individuo común está por debajo o por encima del promedio, en términos de cierto marco de referencia externo. La figura-3-23 ofrece un ejemplo, donde el gru­ po local está ligeramente por encima de la norma na­ cional, una puntuación natural de “X” se ubica en el percentil 55 en las normas nacionales, pero en el per­ centil 45 en la norma local. Diferencias mucho mayo­ res se observarán cuando el grupo local está muy por encima o muy por debajo del promedio.

NORMAS INSTITUCIONALES NORMAS LOCALES Una escuela utiliza las MetropolitanAchievementTest, las puntuaciones de sus alumnos se informan en tér­ minos de normas nacionales; además, la escuela pre­ para una distribución de las puntuaciones de sus propios estudiantes e interpreta la puntuación de cada pupilo comparándolas con las de sus otros alumnos. Esto se denomina norma local, mismas que casi siem­ pre se expresan como percentiles. Considérese otro ejemplo. Una empresa utiliza una prueba de aptitud cuantitativa para seleccionar a oficinistas, cada año evalúa a 200 solicitantes a los puestos. Aunque hay normas nacionales sobre la prue­ ba, la empresa se vale de los 200 solicitantes que so­ mete a prueba para desarrollar una norma local. Las normas locales pueden ser útiles para ciertos fines de interpretación, una ventaja es que el interesa­ do en verdad conoce las características del grupo nor­ mativo, ya que en rigor son las personas que están en la situación local. Por supuesto, en una norma local, el individuo común se ubicará en el promedio, esto

Algunas pruebas, sobre todo las de aprovechamiento, ofrecen normas basadas tanto en instituciones como en individuos. Las normas institucionales se sustentan en promedios de individuos dentro de las instituciones, por ejemplo, se aplica una prueba a 5 000 estudiantes en 200 universidades, se determinan las puntuaciones promedio de cada una de las 200 universidades, se ob­ tiene una distribución de frecuencia de estos prome­ dios y se crea una norma, por lo general una norma percentilar, para los promedios. Esta es una norma institucional, podría denominarse norma escolar, de grupo o alguna otra designación semejante. Por lo común, las distribuciones de las puntua­ ciones individuales y los promedios de los grupos contarán con casi el mismo centro, pero las puntua­ ciones individuales serán sustancialmente más varia­ das que los promedios grupales. En consecuencia, una determinada puntuación natural, salvo a la mitad de la distribución, estará más desviada en la norma

Resumen de puntos clave 3 -5

Principales tipos de grupos normativos

I



N orm as nacion a les



N orm as in te rn a cio n a le s



G rupos n orm a tivo s convenientes



N orm as de u suario



N orm as d e su b g ru p o s



N o rm a s lo ca le s



N orm as institu cio n ale s

Fig ura 3 -2 3 . E jem plo de com paración de norm a s nacional y local.

Normas de las pruebas • 77

institucional que en las— de los individuos. Las pun­ tuaciones por encima del promedio serán muy supe­ riores en la norma institucional que en la individual y a la inversa, en el caso de las puntuaciones por debajo del promedio. Las diferencias pueden ser asombro­ sas. En la figura 3-24 se aprecia una comparación de normas individuales e institucionales; se trata sólo de un ejemplo. El grado de traslape real entre los dos tipos de normas variará en función de las diferentes pruebas y grupos normativos. Si no se distingue con cuidado entre normas indi­ viduales e institucionales, se generará más confusión. Considérese, por ejemplo, la afirmación siguiente: “La puntuación del sudoeste se encuentra en el percentil 95 en las normas nacionales”. Muchas personas interpre­ tarían esto en el sentido de que el estudiante común en el sudoeste obtiene calificaciones mejores que 95% de los estudiantes del país. No obstante, ese percentil 95 se basa en normas institucionales, bien puede ser que el estudiante común del sudoeste haya obtenido una calificación mejor al exclusivo 70% de los estudiantes de la nación.

INTERPRETACIÓN REFERIDA AL CRITERIO Para ilustrar este tema, imagine que a un grupo de adultos se le aplica una prueba de 50 reactivos, para evaluar su capacidad aritmética básica. La prueba in­ cluye reactivos como 7 x 9 = _____ , 417 + 236 = _____ y 2596 - 1688 = ______. Un individuo realiza correctamente 30 preguntas (60%); es posible que ese desempeño un maestro o padreTo juzgue “insatisfac­ torio”. Esta es una muestra de interpretación referida Norm a institucional

= %¡l 95 en ei norma institucional F ig u r a 3 - 2 4 . C o m p a ra c ió n d e n o rm a s in d iv id u a le s e institucionales.

al criterio sobre el desempeño en la prueba. Al emitir el juicio de que 60% de los reactivos correctos fue insatisfactorio, no hubo referencia a ningún grupo nor­ mativo. Por tanto, la interpretación referida al criterio entra en contraste con aquella referida a la norma. La interpretación referida a la norma fue tema de las pri­ meras secciones de este capítulo. Lgs mismas pruebas en ocasiones se caracterizan como referidas al criterio o a la norma, esta termino­ logía es inapropiada. No es la prueba, sino el marco de referencia para interpretar el desempeño en la prue­ ba, lo que se refiere al criterio o a la norma; de hecho, ambos tipos de interpretación pueden utilizarse en una determinada prueba. Por ejemplo, en la prueba del párrafo anterior, podría señalarse que una puntuación natural de 30 ubica al individuo en el percentil 75, de un grupo normativo que representa en general a la población adulta estadounidense. En la figura 3-25, Calvin y su padre tienen cierto desacuerdo acerca de la interpretación referida al criterio sobre el desempe­ ño de Calvin en matemáticas. Convendría agregar una interpretación referida a la norma en su conversación. La interpretación referida ai criterio es aplicable sólo en ciertos ámbitos de contenido debidamente definidos como aritmética, ortografía o todas las ha­ bilidades necesarias para cierta ocupación. A menu­ do se hace una interpretación con respecto al criterio de las puntuaciones en los exámenes para obtener una licencia profesional y a los exámenes de competen­ cias mínimas para graduarse del bachillerato. (En la sección sobre “puntuaciones de corte” del capítulo 11, se examina este tema.) Cuanto menos definido esté el ámbito, más difícil se torna la interpretación referida al criterio. El método de evaluación psicométrica tam­ bién adquiere importancia cuando se aplica una inter­ pretación referida al criterio; por ejem plo, en la referida prueba de aritmética, la interpretación del desempeño puede diferir de manera sustancial, depen­ diendo de si los reactivos de la prueba fueron de res­ puesta libre o de opción múltiple, si se utilizó una calculadora y si se asignó un límite de tiempo. ¿Cómo cambiaría la interpretación del “60% correcto” si se hubiera permitido un tiempo ilimitado o si cada reac­ tivo se hubiese completado en 10 segundos? La inter­ pretación referida al criterio a menudo parece una idea simple, pero se vuelve problemática cuando se la exa­ mina más de cerca. La interpretación referida al criterio suele em­ plearse en los exámenes resueltos en el salón de cla­ ses. El esquema de clasificación familiar “90% es A, 80% es B...menos de 60% es reprobado” constituye un ejemplo de interpretación referida al criterio. El ámbito de contenido puede definirse como “lo que el maestro abordó en clase” o “todo lo que aparece en los capítulos 1 a 4 del libro de texto” . Eljuicio consis­ te en que los estudiantes deben haber aprendido todo

(Capítulo 3)

78 • Pruebas psicológicas. Una introducción práctica

F ig u ra 3 -2 5 . C alvin y su p a d re in te ntan interpretar ei desem peño d e C alvin.

ese material. Luego, se aplica el esquema de clasifi­ cación familiar. Por supuesto, puede trazarse una cur­ va con las calificaciones de modo que la puntuación promedio sea “C”, etc. Este “torcimiento” es en reali­ dad un tipo de interpretación referida a la norma, en concreto, la aplicación de una norma local.

EL GRUPO DE ESTANDARIZACIÓN: CÓMO DETERMINAR SU UTILIDAD Se prueba a los individuos del grupo normativo en lo que se denomina un program a de normalización o programa de estandarización, que de manera común constituye una de las últimas etapas en la elaboración de pruebas. En el capítulo 6, se describe con mayor detalle el proceso completo de desarrollo de pruebas; aquí se aborda la interrogante de cómo determinar si el programa de estandarización es adecuado. El uso competente de pruebas psicológicas exige no sólo conocimientos sobre estos tipos de normas — percen­ tiles, puntuaciones estándar y demás—, sino también la capacidad para juzgar la utilidad de las normas. Utilidad aquí significa hasta qué punto las normas ofrecen un marco de referencia significativo para la interpretación de las pruebas; en casi todos los casos esto significa contar con una norma que sea 1) estable y 2) representativa de cierta población bien definida. De modo que hay dos aspectos; la estabilidad y la representatividad. La estabilidad de una norma la determina en gran medida el tamaño del grupo normativo, es decir, la cantidad de casos en el programa de estandarización. Se trata de un verdadero problema, no se requiere de muchos casos para lograr una estabilidad estadística; varios cientos de casos generarán la suficiente estabi­ lidad para la mayor parte de los usos prácticos de las normas. Considérese la norma en un sistema de pun­ tuación estándar con M = 100 y DE = 15; con N= 300,

el error estándar de la media es menos de un punto y el intervalo de confianza de 95% es +/-1.7 puntos, que implica una buena estabilidad. En la práctica, las nor­ mas de muchas pruebas se basan en miles de casos. Al considerar la cantidad de casos en un grupo normativo, es necesario determinar el tamaño del gru­ po en el que se basa una determinada norma. La canti­ dad total de casos agregados sobre varios grupos normativos no es la cantidad crucial. Por ejemplo, una prueba puede presumir que sus normas se basan en cerca de 1 000 casos pero si, por ejemplo, las normas reales se dan separadamente por género y grado, sobre 10 grados, en realidad hay 20 grupos normativos, cada uno con tan solo unos 50 casos. El número importante aquí para determinar la estabilidad es 50 y no I 000. Como ya se indicó, la estabilidad pocas veces es un problema y, en cualquier caso, se determina con facilidad; no obstante, la estabilidad no garantiza la representatividad. La diferencia entre estabilidad y representatividad es una de las distinciones más im­ portantes que debe aprenderse sobre las normas. Es posible contar con grupos normativos muy grandes, que generen normas muy estables, que sean muy poco representativos de la población meta de una prueba. ¿Cómo se determina la representatividad de un grupo normativo? Formular una respuesta a esta pregunta depende de los planteamientos que haga el autor de la prueba sobre las normas. Hay dos posibilidades, una se refiere a que el autor del instrumento quizá asegure que las normas son representativas de una determinada po­ blación; por ejemplo, el planteamiento acaso sea que el grupo normativo es representativo de todos los adultos de EUA entre 20 y 80 años de edad o de todos los estu­ diantes de sexto grado o de todas las mujeres que cursan carreras de cuatro años en las universidades. La otra po­ sibilidad consiste en que tal vez el autor no plantee que las normas sean representativas de ninguna población en particular, sino que sólo presente la muestra normati­ va como norma de grupo conveniente o de usuario.

- t - 3 - iO ü

1 * io Normas de las pruebas • 79

Cuadro 3-7. Tipos de inform ación necesaria para juzgar la utilidad de un grupo norm ativo E dad G énero Nivel de capacidad Nivel educativo

G rupos raciales o étnicos C ondición socioeconóm ica - o '^ T lf lg ió n geográfica Tam año de la ciudad

Los reportes de los e studios de norm alización deben incluir una e sp ecifica ción p recisa d e la población que se m uestreo, lo s p rocedim ientos de m uestreo y las tasas de participa ció n, cu a lqu ie r ponderación d e la m uestra, las fe ch a s d e la evaluación psicom étrlca y estadísticas descriptivas. La inform ación ofrecida debe s e r s uficiente p ara p e rm itir q ue los usuarios juzguen lo a propiado de las n orm a s para interp re ta r las p u n ­ tuaciones de los e xam inados locales. La docum e n ta ­ ción técnica d ebe in dica r la precisión de las norm as m ism as. E stándares... (AE R A /A PA /N C M E , 1999, p. 55)

Cuando se plantea que un grupo normativo es repre­ sentativo de una determinada población, es responsa­ bilidad del autor de la prueba ofrecer la información suficiente que justifique el planteamiento. El usuario necesita estar especialmente alerta a planteamientos en el sentido de que el grupo normativo es represen­ tativo cuando sólo se presenta información mínima sobre la correspondencia entre el grupo normativo y la población en características importantes. Por ejem­ plo, mostrar tan solo que un grupo normativo para una prueba de inteligencia corresponde a la pobla­ ción nacional en términos de edad y género es insufi­ ciente, pues ¿qué ocurre con la condición socioeco­ nómica y el nivel de consecución educativa de los casos en el grupo normativo? Aun cuando un grupo normativo muestre una bue­ na correspondencia con una población meta, en cuanto a las características importantes, hay dos problemas que vician el proceso de establecimiento de una norma ade­ cuada. El primero es el efecto de la no participación, mismo que se deriva del hecho de que la participación en un programa de normalización casi siempre es vo­ luntaria, ya sea para el individuo o para la organización a la cual pertenece. ¿Qué clase de individuos u organi­ zaciones renuncian a participar? ¿Cuáles son sus ca­ racterísticas? ¿Qué efecto podría ejercer su no partici­ pación en las normas? Las más de las veces no se cuenta con buenas respuestas a estas interrogantes. En segundo lugar, los programas de normalización son programas de investigación y no usos comunes de las pruebas; los participantes suelen saberlo. En tales circunstancias, resulta difícil asegurar que los niveles de motivación de los participantes sean iguales a lo s^ que serían en el caso del uso común de la prueba. Como

mo

Considérese el modo de juzgar la representan vidad del grupo normativo en el primer caso, en el cual el planteamiento es que el grupo normativo es represen­ tativo de una población meta. Desde una perspectiva, determinar la calidad de un grupo normativo, cuya meta consiste en ser representativo de una población, es un asunto de teoría de muestreo. El lector, sin duda, estará familiarizado con las técnicas de muestreo aleatorio que se utilizan en los cursos de introducción a la estadísti­ ca; empero, el muestreo aleatorio simple pocas veces se utiliza en la práctica para normar pruebas. Con fre­ cuencia se emplea alguna forma de muestreo de gru­ pos estratificados en los programas más complejos, por ejemplo, en el desarrollo de normas nacionales o inter­ nacionales. Los temas relacionados con el muestreo son complicados por el hecho de que la participación en el programa de normalización suele ser voluntaria. Por tanto, en la práctica, en lugar de centrar la atención en las nociones de la teoría de muestreo, este texto se en­ focará en la evidencia relacionada con la correspon­ dencia entre el grupo normativo y la población meta, en términos de características importantes. Las carac­ terísticas “importantes” en este contexto son peculiari­ dades que se relacionan con la variable que se somete a prueba. Varias características demográficas se utilizan con frecuencia para demostrar la correspondencia en­ tre el grupo normativo y la población meta. Las carac­ terísticas que por lo común se utilizan son edad, género, clasificación racial o étnica, condición socioeconómica y región geográfica. También puede recurrirse al des­ empeño en otras pruebas que en sí cuentan con normas debidamente documentadas. Debe demostrarse que el grupo normativo corresponde bien, en términos razo­ nables, a la población meta en tales características. Con frecuencia, cuando no hay correspondencia entre el grupo normativo y la población meta, los ca­ sos del grupo normativo se ponderan a fin de mejo­ rarla. Por ejemplo, se supone que la población tiene 50% de varones y 50% de mujeres, en tanto que el grupo normativo cuenta con 40% de hombres y 60% de mujeres. Asignar una ponderación de l .5 a cada varón (o .67 a cada mujer) generará un grupo norma­ tivo ponderado con la división de 50-50 necesaria en cuanto a género. En las figuras 3-26 y 3-27 aparecen cuadros que ilustran la correspondencia entre grupos normativos y estadísticas nacionales de dos pruebas, en las que se plantea que poseen normas representativas de pobla­ ciones nacionales (estadounidenses). Las pruebas son la Otis-Lennon School Abilíty Test, séptima edición, y la Peabody Picture Vocabulary Test-III (Prueba Peabody de Vocabulario con Ilustraciones, tercera edición). Los manuales de los instrumentos contienen información adicional sobre los grupos normativos, en donde se ofre­ ce una idea acerca de la información que podría hallar el usuario de las pruebas.

( f U.NAM." -

SO • Pruebas psicológicas. Una introducción práctica

(Capítulo 3)

Porcentaje de matrícula total en escuelas estadounidenses*

Porcentaje de estudiantes en el programa de estandarización Otoño

Prim avera

Región geográfica Noreste 19.6 Región central Sur Oeste

19.6 23.8 24.1 32.4

18.9 24.4 24.7 32.0

19.7 24.6 24.3 31.3

Condición socioeconómica Baja Baja-media Media Alta-media Alta

19.6 21.4 20.8 17.8 20.3

19.6 21.0 21.2 17.8 20.3

19.6 21.4 20.8 17.8 20.3

Urbanidad Urbana Suburbana Rural

26.8 48.0 25.2

26.2 48.0 25.8

26.5 48.0 25.5

Origen étnico Afroestadounidense Hispano Blanco Asiático Indígena

16.1 12.7 66.6 3.6 1.1

14.9 12.1 38.7 3.4 0.9

15.4 12.4 66.8 2.9 2.5

0.2 2.1 0.1 0.1 1.9 0.1 1.3 0.7

0.3 2.9 0.2 0.1 0.1 0.1 1.9 0.6

5.0 5.3

5.2 5.1

Condición de discapacidad Perturbación emocional Discapacidad de aprendizaje Discapacidad mental Deterioro auditivo Deterioro visual Deterioro ortopédico Soltura limitada en inglés Otra Escuelas no públicas Católica Privada

5.4 4.9

* National Center for Education Statistics. United States Department ot Education. 1992-1993. F ig u ra 3 -2 6 . Inform ación d em o g ráfica p ara el program a de e standarización de la O tis-Lennon School A bility Test, séptim a e dición.

sucede con la no participación, a menudo se desconoce el efecto que los niveles de motivación ejercen en las normas. Ahora considérese el segundo caso: cuando no se plantea que el grupo normativo es representativo de una determinada población. ¿Qué criterios se em­ plean entonces para juzgar la calidad de las normas? En esencia, se invierte el proceso aplicado con anterio­ ridad. En el primer caso, se contaba con una población meta y se buscaba demostrar que el grupo normativo era representativo de esa población; la demostración dependía del uso de la información sobre característi­ cas importantes. En el segundo, se esperaba contar con información adecuada sobre el grupo normativo a fin

de proyectar a qué población podría reflejar dicho gru­ po. Por ejemplo, si al tener normas de usuario para una prueba de aprovechamiento que se utiliza en las uni­ versidades, se quisiera información sobre las universi­ dades, como sus dimensiones, lasas de aceptación y retención, énfasis curricular, composición de género y racial, etc. Con base en esta información descriptiva, sena factible inferir que las normas ofrecen una buena representación de las universidades de artes pequeñas, selectivas, liberales, pero no de las universidades gran­ des, urbanas, de admisión abierta. Si se contase con normas convenientes para una prueba de autoconcepto para estudiantes de bachillerato, se querría conocer el

J

Normas de las pruebas • 81

PPVT-III

M uestra de estandarización, por grupo de edad y nivel educativo, en com paración con la población de EUA N ivel educativo del padre o el e xa m in a d o * G raduado d e bachillerato

G rado 1 1 o m enos Muestra PPVT-III

Pobl. EUAV

Uno a tres años e n la universidad o escuela norm al

M uestra P PVT-III

Pobl. EUA6

M uestra PPVT-III

C uatro o m ás años en la universidad

Pobl. EUAb

M uestra PPVT-III

Pobl. EU A 6

G rupo de edad

N

%

%

N

%

%

N

%

%

N

%

%

2 -5 6 -9 1 0 -1 3 1 4 -1 8 1 9 -2 4 2 5 -3 0 3 1 -5 0 5 1 -9 0 +

97 102 91 76 31 11 26 31

3.6 3.7 3.3 2.8 1.1 0.4 1.0 1.1

5.5 3.5 3.0 3.0 1.2 0.6 1.1 1.9

199 167 119 128 42 35 86 78

7.3 6.1 4.4 4.7 1.5 1.3 3.2 2.9

8.0 6.3 4.7 4.9 1.8 1.6 3.1 2.7

262 147 120 128 50 43 54 48

9.6 5.4 4.4 4.7 1.8 1.6 2.0 1.8

8.5 5.9 4.9 4.6 1.7 1.3 2.5 1.4

142 84 70 68 27 36 84 43

5.2 3.1 2.6 2.5 1.0 1.3 3.1 1.6

3.6 2.6 2.1 2.1 0.8 1.1 2 .5 1.3

M uestra total

465

17.1

19.9

854

31.3

33.1

852

31.3

31.0

554

20.3

16.0

a Para los exam inados de 24 años de edad o menores, si no se inform ó ei nivel educativo de am bos padres o tutores, se utilizó ei nivei educativo de uno de ellos. b Datos de la población de EUA provenientes de la Current Population Survey 1994 (Encuesta Poblacional Actual de 1994) [archivo de datos legible en máquina] realizada por la Oficina del censo para la O ficina de estadísticas laborales. Los porcentajes de la población estadounidense de la muestra total son prom edios de los porcentajes del censo de cada uno de los grupos de edad, ponderados por el tamaño de la m uestra de cada grupo de edad en la PPVT-III.

© E d ito ria l E ! m a n u a l m o d e r n o F o to c o p ia r sin au to riz a c ió n

Figura 3 -2 7 . Inform ación dem ográfica p ara el p rogram a de estandarización de la P eabody P icture Vocabulary T est-lll.

nivel de capacidad, el género, la clasificación étnica o racial y la condición socioeconómica de los participan­ tes. Con base en esta información, podría llegarse a la conclusión de que las normas quizá sean representati­ vas de las escuelas de baja condición socioeconómica muy urbanizadas, pero que desde luego no constituyen un grupo representativo a nivel nacional. En el primer o segundo casos, el usuario debe te­ ner mucho cuidado con las normas si pretende hacer una derivación de la prueba original. Sea el caso de alguien que desea crear una “forma resumida” de una prueba originalmente más larga, o bien que desea apli­ car a manera de prueba aislada los 30 reactivos que miden un determinado rasgo de una prueba de perso­ nalidad de 300 reactivos que mide 10 rasgos. No puede darse por hecho que las normas del instrumento origi­ nal sean aplicables a estos trabajos derivados, el cam­ bio de contexto llega a ejercer efectos impredecibles en las respuestas de los examinados a los reactivos. En estas situaciones, la aplicabilidad de las normas origi­ nales debe demostrarse empíricamente. C u an d o se crean form as derivadas de las pruebas, to m a n do para e llo un subconjunto de los reactivos de

una de las fo rm a s d e la p ru e b a existente o reorde­ nando sus reactivos, y hay una razón de peso para considerar que los efectos del contexto de los reactivos pueden in flu ir en las puntua cio n es de estas form as, deben o frecerse e videncias d e que no se g enera una distorsión indebida d e las norm a s en las versiones diferentes o en las vin cu lacio n e s de las relaciones que guardan las p un tua cio n es entre sí. Estándares... (AE R A /A P A /N C M E , 1999, p. 58)

RESUMEN

1. La puntuación natural con frecuencia es el re­ sultado más inmediato de una prueba. Las pun­ tuaciones naturales comunes son la cantidad de respuestas correctas en las pruebas cognitivas y la cantidad de respuestas que tienen una deter­ minada dirección en las pruebas no cognitivas. 2. Las pruebas calificadas según los métodos TRI, que generan una puntuación theta (8), conside-

o

82 •

Pruebas psicológicas. Una introducción práctica

i.is ì

>

ran el nivel de dificultad de los reactivos y en ocasiones, las pautas de respuesta. 3. La distribución de las puntuaciones naturales en un grupo normativo constituye la base para convgjtjr^mntuaciones naturales en puntuaciones nor­ malizadas. Las puntuaciones normalizadas ayu­ dan a dar sentido a las puntuaciones naturales. 4. Para entender las normas de las pruebas, es ne­ cesario familiarizarse con los temas siguientes de la estadística elemental: distribuciones de fre­ cuencia y formas de las distribuciones, medidas . de tendencia central y variabilidad, y puntuacio­ nes z dentro de la distribución normal. 5. Los rangos de percentil indican el porcentaje de individuos en el grupo normativo que obtuvie­ ron una puntuación por debajo de una determi­ nada puntuación natural. 6. Las puntuaciones estándar son normas que con­ vierten la distribución de las puntuaciones natu­ rales en una distribución con una media y una desviación estándar nuevas convenientes. Hay varios sistemas de puntuación estándar de uso generalizado. 7. Las normas de desarrollo expresan el desempe­ ño en términos de la puntuación que es común de un nivel de edad o de grado. Las normas de desarrollo más habituales son las edades menta­ les y los equivalentes de grado. 8. Cada uno de los principales tipos de normas po­ see ventajas y desventajas. _ 9. La calidad de la norma depende de las caracte­ rísticas del grupo normativo. El hecho más im­ portante es el grado de representatividad del gru­ po normativo en relación con una población de­ bidamente definida. 10. Las modalidades comunes de grupos normati­ vos son nacional, conveniente, de usuario y lo­ cal. Son contadas las pruebas que tienen normas internacionales. Algunas pruebas también con­ tienen normas de subgrupo y normas institu­ cionales. 11. En algunas pruebas puede recurrirse a una inter­ pretación de las puntuaciones referida al criterio y no referida a la norma. La interpretación refe­ rida al criterio es un juicio un tanto directo sobre la calidad del desempeño en la prueba sin refe­ rencia a ningún grupo normativo. Ambos tipos de interpretación pueden utilizase con algunas pruebas. 12. Es importante poder juzgar la utilidad de un gru­ po normativo. La información sobre las caracte­ rísticas del grupo normativo es crucial para emi­ tir tales juicios. Al juzgar la utilidad de un grupo normativo, a menudo conviene comparar al grupo con una población, en términos de característi­ cas como edad, género, grupo racial o étnico,

(Capítulo 3)

región geográfica y rasgos socioeconómicos, como nivel educativo e ingreso familiar.

TÉRMINOS CLAVE

cero verdadero CI de desviación constructo corrección por adivinación curtosis curva normal desviación estándar distribución de frecuencia edad cronológica edad menta] efecto Bamum equivalente de curva normal equivalente de edad equivalente de grado escala de intervalo escala de razón escala nominal escala ordinal estadística descriptiva estadística inferencial estandarización estanina estén grupo conveniente grupo normativo histograma de frecuencia informe narrativo media mediana moda norma de desarrollo norma institucional norma local norma nacional normas de subgrupo normas de usuario percentil polígono de frecuencia puntuación de porcentaje correcto puntuación estándar normalizada puntuación ipsativa puntuación natural puntuación normalizada puntuación T puntuación z puntuaciones escalares rango razón de CI

Normas de las pruebas • 83

rango percentilar rango semiintercuartilar referido a la norma referido al criterio sesgo tendencia central theta transformación lineal transformación no lineal variabilidad variable varianza

C l W e c h s le r - ________ E sta n in a = _________ P u n tu a c ió n z = _________

6. Con ayuda del cuadro 3-1, llene los valores exac­ tos para los mismos casos (Nota: para el CI Wechsler, DE = 15, para el CI Otis-Lennon, DE = 16). P u n tu a c ió n z = + 1.0 P e rce n til = 75 P u n tu a c ió n 7 = 3 0 P e rce n til = ________ P u n tu a c ió n z = ________ P e rce n til = _________

EJERCICIOS

E C N = ________ O tis -L e n n o n = ________

1. Con ayuda de los datos de la figura 3-1, elabo­ re una distribución de frecuencia con un inter­ valo de 5 puntos, empezando con 65-69. 2. Calcule la media, la mediana y la desviación estándar de estas puntuaciones: 5, 3, 6, 8, 8 M=

____

Mdn = _______ D E = _______

3. De ser factible, registre la estatura de todos en su salón de clases. Elabore una distribución de frecuencia. ¿Qué forma adquiere la distribución en comparación con los modelos presentados en la figura 3-6? Se le sugiere realizar el mis­ mo ejercicio para el pulso. 4. Aplique la “corrección por adivinación” a estos casos. Esto es para una prueba de 50 reactivos en la que cada reactivo tiene cuatro opciones. Caso Correcto A 40 B 40 C 30 D 30

Incorrecto 10 0 10 20

O m isión

Puntuación corregida 0 ________

10 10 0

5. Con ayuda de la figura 3-10, calcule los valo­ res faltantes. P u n tu a ció n z = + 1.0 P e rce n til = 7 5 P u n tu a c ió n T = 30 P erce n til = _________ P u n tu a ció n z = _________ P e rce n til = _________ E C N = _________ O tis -L e n n o n = _________ E sta n in a = _________

E s ta n in a = ________ C l W e c h s le r = _________ E s ta n in a = ________ P u n tu a c ió n z = ________

7. Remítase a la figura 3-12, convierta una pun­ tuación natural de 32 al sistema de puntuación estándar. 8. Para los datos de la figura 3-12, si la puntuación estándar de una persona es de 70, ¿cuál es su puntuación natural? 9. Para los datos de la figura 3-10, calcule los percentiles correspondientes a los siguientes ECN: ECN 1 25 40 50 65 80 90 99 P e r c e n til_____________________________ __________

10. Con ayuda de la figura 3-16, ¿cuál es la edad mental estimada de una persona cuya puntua­ ción natural es de 35? 11. De nuevo con la figura 3-16, ¿cuál es la puntua­ ción natural estimada de una persona cuya edad mental es de 5-0? 12. Con ayuda de la figura 3-18, ¿cuál es el equiva­ lente de grado estimado de un estudiante cuya puntuación natural es de 45? 13. Una vez más con la figura 3-18, ¿cuál es la pun­ tuación natural estimada de un estudiante cuyo equivalente de grado es de 2.0? 14. Utilizar el cuadro 3-4. ¿Qué rango percentilar y puntuación estándar (puntuación T) correspon­ de a una puntuación natural de 65? 15. Idear una serie de clasificaciones que sé puedan utilizar en un informe narrativo por cada decil, es decir, los percentiles 1-10,11-20,21-30, etc. Las clasificaciones pueden ser de más de una palabra. Para no utilizar la misma clasificación en forma reiterada con un determinado decil, ofrezca al

(Capítulo 3)

84 • Pruebas psicológicas. Una introducción práctica

menos dos clasificaciones equivalentes de cada decil. El programa de cómputo elegirá después una al azar, para cada caso de ese decil. G ru p o

C la s ific a c ió n

C la s ific a c ió n

d e d e c ile s

v e rb a l A

v e rb a l B

1 -1 0 1 1 -2 0 2 1 -3 0

_______ _______ _______

_______ _______ _______

3 1 -4 0

______

_______

4 1 -5 0 5 1 -6 0

_______ _______

_______ _______

6 1 -7 0

_______

_______

7 1 -8 0 8 1 -9 0 9 1 -9 9

_______ _______ _______

_______ _______ _______

16. Elabore estructuras de oraciones para un infor­ me narrativo que se adecúen a las siguientes com­ binaciones de puntuaciones de dos pruebas. Cada examinado contará con dos puntuaciones, una en la prueba A y la otra en la prueba B. Asegúre­ se de que las oraciones fluyan de manera ade­ cuada.

17. Lea el reporte del NEO PI-R que aparece en la figura 3-21. Identifique las afirmaciones narra­ tivas basadas en normas. 18. Consulte una edición reciente del Mental Measu­ rements Yearbook (Anuario de Mediciones Men­ tales), ya sea en su forma impresa o electrónica, seleccione tres revisiones. Identifique lo que se­ ñalan los revisores sobre a) los tipos de normas dadas para la prueba y b) la calidad del grupo normativo. 19. Introduzca los datos del apéndice D 1: GPA en la hoja de cálculo de un paquete estadístico, como el SPSS, SAS o Excel. Aplique el programa para obtener las medias y desviaciones estándar de cada una de las variables. Para cualesquiera dos variables, em plear las distribuciones e histogramas de frecuencia. ¿Cómo describiría las formas de las distribuciones?

P ru e b a B % il 25-75

%¡l < 25

P rueba A

%¡l > 75 % il 2 5-7 5 % il < 25

%¡l > 75

X

X

X

X

X

X

X

X

X __

-

Objetivos 1. Definir la confiabilidad según el uso que se le da al término en la psicología. 2. Actualizar sus conocimientos sobre conceptos estadísticos básicos relacionados con la correlación y el pronóstico, incluidos los factores que influyen en la magnitud de las correlaciones. 3. Distinguir entre confiabilidad y validez, entre los diversos usos cotidianos que se dan al término “confiabilidad”, entre cambio real y funciones temporales, y entre errores constantes y no sistemáticos. 4. Identificarlas principales fuentes de inestabilidad o falta de confiabilidad en las puntuaciones de las pruebas.'

© E d it o ria l E t m a n u a l m o d e r n o F o to c o p ia r s in

5. Describir los componentes de la teoría de la puntuación verdadera. 6. En cada uno de los métodos de confiabilidad siguientes, indicarcómo se realiza el estudio y de qué fuente de inestabilidad o falta de confiabilidad se trata: test-retest, entre calificadores, forma alterna y consisten­ cia interna. 7. Definiry calcular el error estándar de medición y una banda de confianza. 8. Distinguir el error estándar de medición a partir del error estándar de la media y del error estándar de estimación. 9. Definir lo que significa precisión de la medición en la teoría de respuesta al ítem (TRI). 10 . Describirlo que busca la teoria de la generalizabilidad. 11. Establecer cómo influyen los factores que afectan el coeficiente de correlación en los datos de confiabilidad. 12. Ofrecer parámetros para los niveles de confiabilidad aceptables. 85

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF