Analisis Factorial CENEVAL
Short Description
Download Analisis Factorial CENEVAL...
Description
Análisis Anális is factor factorial: ial: una técnica para evaluar la dimensionalidad de las pruebas
6
Análisis factori Análisis factorial: al: una técnica para evaluar la dimensionalidad de las pruebas Cuaderno técnico 6
Análisis factorial: una técnica para evaluar la dimensionalidad de las pruebas Cuaderno técnico 6
Salvador Zamora Muñoz Lucía Monroy Cazorla César Chávez Álvarez Revisión técnica: Antonio Saade Hazin
Análisis factorial: una técnica para evaluar la dimensionalidad de las pruebas Cuaderno técnico 6
D.R. © 2009, Centro Nacional de Evaluación para la Educación Superior, A.C. (Ceneval) (Ceneval) Av. Av. Camino al Desierto de de los Leones Leones 19, Col. San Ángel, Deleg. Álvaro Obregón, C.P. 01000, México, D.F. www.ceneval.edu.m www.ceneval.edu.mxx Diseño: Mónica Cortés Genis Formación: Alvaro Edel Reynoso Castañeda Abril de 2009 2009 Impreso en México • Printed in México
Directorio Dirección General Rafael Vidal Uribe
Dirección General Adjunta de los EGEL Jorge Hernández Uralde
Dirección General Adjunta de los EXANI José O. O. Medel Bello
Dirección General Adjunta de Programas Especiales Rocío Llarena de Thierry
Dirección General Adjunta Técnica y de Inv Investigación estigación Lucía Monroy Cazorla
Dirección General Adjunta de Operación Francisco Javier Apreza García Méndez
Dirección General Adjunta de Difusión Javier Díaz Díaz de la Serna Braojos
Dirección General Adjunta de Administración Francisco Javier Anaya Torres
Dirección de Procesos Ópticos y Calicación María del Socorro Martínez de Luna
Dirección de Tecnologías de la Información Infor mación y las Comunicaci Comunicaciones ones Francisco Manuel Otero Oter o Flores
Índice Prefacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Capítulo I Antecedentes históricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Capítulo II ¿Qué es el análisis factorial? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 El modelo de factores Supuestos del modelo Métodos de extracción de factores Selección del número de factores que serán extraídos Criterio a priori (tipos de análisis factorial) Criterio de la raíz latente (eigenvalor >1) Criterio del gráfico de codo (contraste de caída) Criterio del porcentaje de varianza explicada Interpretación de la matriz de cargas factoriales Un concepto muy controvertido: rotación de factores Rotaciones ortogonales Rotaciones oblicuas Valoración Valoración de las comunalidades Puntajes factoriales factoriale s Bondad de ajuste del modelo de factores Análisis factorial factorial con variables discretas discretas
17 18 19 20 20 21 22 23 23 26 26 27 28 25 28 29
Capítulo III Fundamentos técnicos del análisis factorial. . . . . . . . . . . . . . . . . . . 31 Aspectos formales formales Soluciones múltiples al modelo Número máximo de factores Métodos de estimación
31 34 35 38
Máxima verosimilitud Mínimos cuadrados Mínimos cuadrados generalizados Mínimos cuadrados ponderados Método de rotación de ejes principales Prueba sobre el número de factores en el modelo Puntajes Puntajes factoriales Método de Bartlett o de mínimos cuadrados ponderados Método de Thompson o de regresión
39 40 40 40 41 41 42 42 43
Capítulo IV Aplicación con variables continuas . . . . . . . . . . . . . . . . . . . . . . . . . 45 Descripción general del EXANI-I Definición del ejemplo Análisis en SPSS SPSS Análisis en R
45 46 48 63
Capítulo V Aplicación con variables discretas. discretas . . . . . . . . . . . . . . . . . . . . . . . . . . 69 Objetivo Descripción de las variables Análisis en R Un comentario final
69 69 86 90
Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Anexo 1 Códigos en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Índice de tablas Tabla 1. Artículos publicados publicados sobre análisis análisis factorial factorial en diferentes disciplinas, 1904-2004 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 12
Tabla 2. Matriz de cargas factoriales para un caso hipotético . . . . . . . . . . . . . . . . 24
Tabla 3. Directrices para la identificación de cargas factoriales significativas, basadas en el tamaño de la muestra . . . . . . . . . . . . . . . . . 25
Tabla 4. Medidas de co correlación entre variables . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Tabla 5. Dominios evaluados por el EXANI-I. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Tabla 6. Matr Matriz iz de corr correl elac acio ione ness ent entre re las las var varia iabl bles es que que eva evalú lúa a el el EXA EXANI NI-I -I . . . . . . . 51
Tabla 7. Pruebas KMO y de efericidad de Bartlett . . . . . . . . . . . . . . . . . . . . . . . . . 53
Tabla 8. Comunalidades de del mo modelo un unifactorial de del EX EXANI-I. . . . . . . . . . . . . . . . . 57
Tabla 9. Total otal de la varia varianza nza expli explicad cada a por el el modelo modelo unif unifact actori orial al del del EXANIEXANI-I. I. . . . . 57
Tabla 10. Cargas factoriales de las variables manifiestas. . . . . . . . . . . . . . . . . . . . . 58
Tabla 11. Matriz de correlaciones reproducidas por el modelo . . . . . . . . . . . . . . . . 60
Tabla 12. Matriz de de co correlaciones con ni niveles de si significancia . . . . . . . . . . . . . . . . . 62
Índice de figuras Figura 1. Crec Crecim imie ient nto o en las publ public icac aciiones ones sobre bre aná anális lisis facto actorrial ial . . . . . . . . . . . . . 13
Figura 2. Representación del modelo unifactorial . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Figura 3. Representación del modelo multifactorial . . . . . . . . . . . . . . . . . . . . . . . . 16
Figura 4. Explicación de la ecuación del modelo de factores. . . . . . . . . . . . . . . . . . 18
Figura 5. Gráfico de codo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 22
Figura 6. Modelo unifactorial del EXANI-I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 47
Prefacio
E
l Centro Nacional de Evaluación para la Educación Superior (Ceneval) es una institución de carácter eminentemente técnico. A lo largo de tres lustros su actividad esencial ha sido promover la calidad de la educación mediante eva-
luaciones válidas, conables y pertinentes de los aprendizajes. Primordialmente, evalúa los conocimientos y habilidades adquiridos por los individuos individuos en los procesos de enseñanza-aprendizaje enseñanza-aprendizaje,, formales o no formafor males, de los sistemas educativos. Así contribuye a la toma de decisiones fundamentadas. De hecho, con sus servicios de evaluación atiende instituciones de educación media superior y superior, autoridades educativas, organizaciones profesionales y otras instancias públicas y privadas y, y, desde luego, lueg o, al destinatario
nal –y el más importante– de sus pruebas: el propio sustentante. Con la serie Cuadernos técnicos el el Centro promueve también el uso de herramientas de análisis en círculos cada vez más amplios. El propósito de estos títulos es contribuir a elevar la calidad de la educación mexicana y fomentar una auténtica cultura de la evaluación. La inteligencia, el nivel de ansiedad o el grado de satisfacción no pueden medirse directamente. Los especialistas las denominan variables latentes o
constructos; y para estimarlas lo hacen mediante variables maniestas, como podrían ser la respuesta a un reactivo o el número de aciertos en un examen.
La teoría que sustenta el empleo del análisis factorial –tema de estudio del presente texto– asume que la variable latente es continua: los individuos pueden ordenarse de mayor a menor nivel del atributo bajo estudio. El propósito es analizar la estructura de correlación entre un grupo g rupo de variables variables medidas, asumiendo que la asociación entre ellas puede ser explicada por una o más variables latentes, que en el caso del análisis factorial se les reconoce como factores.
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
9
Capítulo I Antecedentes históricos
E
l primer planteamiento planteam iento del análisis factorial factoria l se remonta remonta a principios del siglo XX , cuando Charles Spearman (1904) hizo un estudio sobre la medición de la inteligencia. intelig encia. Conjeturó que si dos habil habilidades idades están correlacionadas, entonces entonces cada una u na está compuesta por dos factores: uno que les es común, responsable responsable de
la correlación, y otro que es especíco pues determina determi na la diferencia d iferencia entre ambas. En los primeros años de esta herramienta metodológica el enfoque predominante era asumir a priori que en los datos subyacía una estructura unifactorial. unif actorial. priori que Thurstone (1 (1935) propuso propuso un cambio cambio en la conceptua conceptualización lización del análisis anál isis factorial sugiriendo que los datos analizados podrían explicarse por más de una variable variable latente latente (facto (factor) r);; que lo importante era determinar el número de factores factores que podrían ser identicados. El estudio de inteligencia Thurstone (1938) pro puso que la inteligencia puede ser explicada por siete factores. En 1936 1936 la Sociedad de Psicometría Psicometría fundó f undó una revista de investigación especializada: Psychometrika, en cuyas páginas se publicaron entre nales de los años treinta y principios de los cincuenta numerosos artículos sobre cuestiones relacionadas relacionadas con el desarrollo desarrollo del análisis a nálisis factorial, factorial, tales como la estimación esti mación de las comunalidades, la extracción de factores comunes, la determinación del número de factores, la rotación de los factores, la estimación de los puntajes factoriales, los métodos para acelerar la velocidad de los cálculos cálcu los y la indeterminación de los modelos. En la actualidad, el uso del análisis factorial como herramienta metodológi-
ca se ha extendido a diversos ámbitos del quehacer cientíco: la psicología (en estudios de habilidades, motivación, aprendizaje, etcétera); la pedagogía (en estudios relacionados con el aprovechamiento escolar, la tipología de profesores,
etcétera); la sociología (en dimensiones de grupo, actitudes políticas, anidad política, etcétera), y en muchas otras disciplinas (ecología, economía, medicina, metrología...).
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
11
Como una muestra del uso de esta técnica estadística en los años recientes, Kaplunovsky (2006) presentó los resultados de una exploración realizada en internet en mayo de 2004. Detectó 3,460 artículos relacionados con este método
cuantitativo y los clasicó de acuerdo con los campos del conocimiento en que se habían generado los datos, los cuales se muestran en la tabla 1.
En la gura 1 se muestra el incremento que han tenido, en los últimos 15 años, los estudios que utilizan el análisis factorial en la información. Tabla 1. Artículos publicados sobre análisis factorial en diferentes disciplinas, 1904-2004 Área Biología Química Cromatografía Ecología Economía Alimentación Geriatría Procesamiento de imágenes Industria Resonancia magnética Medicina Metodología Investigación de operaciones Fisiología Psiquiatría Psicología Espectroscopia
12
19041980 18 12 4 2 14 1 8 2 4 1 30 10 1 20 15 93 11
19811985 17 14 7 4 12 4 5 7 0 1 32 25 1 26 14 86 27
19861990
19911995
19952000
20002004
Total
20 36 16 11 9 5 10 22 2 3 64 31 1 38 39 159 40
23 53 22 15 4 2 9 27 6 6 67 49 9 39 61 219 50
47 88 24 61 20 17 25 38 38 25 109 125 42 51 137 379 108
41 77 15 45 26 21 31 51 28 13 116 151 41 29 99 344 90
166 280 88 138 85 50 88 147 78 49 418 391 95 203 365 1280 326
Cuaderno técnico
6
Figura 1. Crecimiento en las publicaciones sobre análisis factorial Publicaciones
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
Publicaciones sin Psychology
13
Capítulo II ¿Qué es el análisis factorial?
E
l análisis factorial es una técnica estadística multivariada que se incorpora a la metodología cuantitativa cu antitativa que involucra variables latentes.1 Estas variables no observables obser vables,, denominadas frecuentemente constructos, son variables que no
pueden medirse de manera directa: se estiman a través de variables maniestas (observadas). Ejemplos de variables latentes podrían ser la inteligencia, el nivel de ansiedad, el nivel socioeconómico, el capital cultural, el grado de d e satisfacción con un producto o el nivel de razonamiento verbal. Variables Variables observadas podrían ser la respuesta a un reactivo de un examen, el número de aciertos en un examen, la intensidad con que se lanzó una pelota, el número de computadoras en una vivienda, etcétera. En el análisis factorial se asume que la variable latente es continua: los indi viduos pueden ordenarse ordenarse de mayor mayor a menor nivel nivel del atributo atributo bajo estudio estudio.. El objetivo primordial de esta herramienta es estudiar la estructura de correlación entre un grupo de variables medidas, asumiendo que la asociación entre las variables puede ser explicada por una o más variables latentes, latentes, que en el caso del análisis factorial se les reconoce como factores. Dicho de otra manera, la correlación entre el grupo gr upo de variables se explica por la presencia presencia de los factores subyacentes a ellas. En el caso de que esta estructura de correlación pueda explicarse a través de un solo factor, estaremos ante un modelo unifactorial; por por el contrario, si necesitamos más de un factor para explicar estas correlaciones, utilizaremos un modelo multifactorial . En este último caso, se espera que las variables que componen cada uno de estos factores estén fuertemente correlacionadas, correlacion adas, y con correlaciones débiles con las variables que componen el resto de los factores. Cuando se representa grácamente un modelo latente, como el análisis fac torial, es común representar los factores con un óvalo o círculo, y las variables maniestas con un cuadrado o rectángulo rectángul o. Las echas van del factor a las varia 1
Véase el Cuaderno técnico sobre análisis de clases latentes para una denición más extensa de este tipo de variables.
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
15
bles, indicando que el factor es una variable explicativa y las variables manies tas son variables dependientes. En las guras 2 y 3 se muestra la representación gráca de un modelo unifactorial y otro multifactorial, respectivamente. Figura 2. Representación del modelo unifactorial V 1 V 2 V 3 V 4 Habilidad matemática
V 5 V 6 V 7 V 8 V 9 V 10
Figura 3. Representación del modelo multifactorial
Resolución problemas
Series numéricas
16
V 1 V 2 V 3 V 4 V 5 V 6 V 7 V 8 V 9 V 10
Cuaderno técnico
6
El modelo de factores En este apartado se explicarán los aspectos básicos de la teoría que sustenta el análisis factorial y se pospone su explicación formal, en términos matemáticos, hasta el capítulo 3: Fundamentos técnicos del análisis factorial. Supongamos que tenemos un conjunto de variables observadas X 1, X 2,..., X p y se asume que en este conjunto subyacen k factores (el número de factores debe ser estrictamente menor al número de variables observadas). De acuerdo con lo que hemos planteado en secciones anteriores, los factores son variables latentes que explican la la asociación entre las variables maniestas (en este caso las X’s ); entonces, entonces, podemos pensar el modelo de factores de manera similar similar al X’s modelo de regresión lineal, en el que se exprese esta relación entre factores y variables variables,, de la siguiente siguiente forma:
Los factores f 1, f 2,..., f f k , juegan el papel de variables explicativas, y cada una de
las X’s X’s el el de variables de respuesta; las λ’s son los coecientes asociados a cada factor, y reciben el nombre de cargas factoriales; por por último, los errores del mode-
lo son las u’s. En este sentido, el modelo está determinando por las variables y no por los individuos. Las cargas factoriales indican la correlación entre cada variable y el factor correspondiente; así, una variable con mayor carga factorial será más representativa tativa del factor. De este modo, modo, las cargas carg as factoriales sirven para interpretar la
función que cumple cada variable variable para denir cada uno de los factores. factores. En la gura 4 se identican las variables que intervienen en el modelo factorial.
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
17
Figura 4. Explicación de la ecuación del modelo de factores Variable observada observada
Factores
Cargas factoriales
Error
Supuestos del modelo En el modelo de factores, a f 1, f 2,..., f y a u 1, u 2,... ,u f k se les denomina factores comunes y ,u p factores especícos . Los supuestos básicos sobre los que se construye el modelo son los siguientes: 1. Los factores comunes f j j =1,2,..., =1,2,...,k no están correlacionados y tienen media cero y varianza uno. no están correlacionados cor relacionados y tienen media cero y 2. Los factores especícos ui no =1,2,..., p p. varianza varianza Ψi i =1,2,...,
3. Los factores comunes comunes no están correlacionados con los factores especícos.
Bajo estos supuestos es posible descomponer la varianza de cada una de las variables observables del modelo o variables indicadoras ( ( X ), en dos compoi nentes no correlacionados cor relacionados.. Por un lado la varianza común, conocida como la
18
Cuaderno técnico
6
de la variable y que representa la varianza de la variable X i que es comunalidad de
explicada por los factores factores comunes y, por el otro otro,, la varianza especíca especíc a conocida
como especicidad y y que es la varianza no explicada por estos factores comunes. Los factores comunes y sus características asociadas (comunalidades, especicidades, número, etcétera) representan el objeto de interés en el análisis factorial.
Métodos de extracción de factores Todas Todas las técnicas de estimación del modelo factorial parten del supuesto de que los factores iniciales que serán extraídos de la matriz de correlaciones de las variables variables indicadoras indicadoras no estarán estarán correlacion correlacionados ados.. El objetivo objetivo de los métodos de extracción de factores es minimizar la distancia entre la matriz de correlaciones cor relaciones observada y la matriz de cor correlaciones relaciones que se desprende del modelo (matriz que
especica el modelo de factores). La diferencia entre los métodos radica en la denición de “distancia” que utilizan para llegar a la solución. El método de mí nimos cuadrados, por ejemplo, ejemplo, se ocupa de minimizar la suma de cuadrados de las diferencias entre estas dos matrices, por lo que los valores de los parámetros
que logren este e ste objetivo serán los estimadores nales. Uno de los métodos más comunes para la extracción de factores es el conocon ocido como Factorización de ejes principales pr incipales (Principal axis factoting) fac toting) . Se trata de un método iterativo para estimar las comunalidades y subsecuentemente extraer los factores. Este método es igual al que se usa en la técnica multivariada conocida como Análisis de componentes principales, prin cipales, salvo que no se realiza sobre la matriz original de correlación (véanse detalles en el capítulo 3). Los factores se extraen de manera sucesiva, por lo que la solución nal consiste en factores ortogona les. les. El primer factor se obtiene de forma for ma que explique la mayor cantidad cantidad de la varianza varianza común; el segundo segundo se extrae extrae de una matriz de correlación correlación residual que
se obtiene una vez que se toma en cuenta la inuencia del primer factor. Este
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
19
proceso continúa hasta que se ha extraído un número suciente de factores. f actores. En el siguiente apartado revisaremos algunos criterios para determinar el número de factores con que se debería detener este proceso.
Selección del número de factores por ser extraídos Uno de los objetivos del análisis factorial es la reducción reducció n de los datos originales
a un número menor de variables, pero pero podría ocurrir que –dado un u n conjunto de datos– se tengan soluciones muy diferentes, dif erentes, dependiendo del número de factores considerado. Por tal motivo motivo son varios los criterios que pueden p ueden servirnos ser virnos de guía para determinar cuántos factores extraer. En el capítulo 3 determinaremos el número máximo de factores que se pueden extraer, dependiendo del número de variables indicadoras que se incluyan en el modelo; y a continuación explicaremos la lógica de algunos criterios utilizados para la selección del número de factores por extraer en el análisis; co-
menzaremos con los criterios teóricos que denen el análisis factorial conrmatorio y con algunos criterios estadísticos que nos ayudarán a seleccionar el número exacto de factores por extraer en el marco del análisis factorial exploratorio . Criterio a priori (tipos de análisis factorial)
En muchas ocasiones no se tiene certeza sobre el número de factores k que subyacen en la estructura de datos; por ende, se puede realizar la extracción de factores de manera secuencial, se inicia con k=1 y se llega hasta un número de factores que permita lograr un buen ajuste del modelo a los datos. Este procedimiento de incorporar factores hasta lograr un buen ajuste da lugar al llamado análisis factorial exploratorio, exploratorio, en el que el investigador no conoce de antemano el número de factores f actores que subyacen en las variables observadas. Una desventaja de este tipo de análisis: puede ocurrir que los factores encontrados no tengan
20
Cuaderno técnico
6
ninguna interpretación para el investigador. Por el contrario, cuando en una in vestigación vestigación se determina de forma precisa precisa el número de factores factores,, se está ante un análisis factorial conrmatorio . La forma usual de proponer este número de factores es en atención a alguna teoría propuesta en el área de aplicación. En este caso,
los objetivos objetivos de la investigación se centran en la conrmación conr mación del número de factores y, consecuentemente, en la validación de esta teoría mediante la evidencia empírica proporcionada por los datos. Si el ajuste estadístico de los datos al modelo teórico es satisfactorio, se podrá concluir que el modelo es adecuado. Entonces, cuando el análisis factorial es de tipo exploratorio, se tiene la necesidad de decidir cuántos factores se deben retener en el análisis. análisis. En seguida se enuncian algunos criterios establecidos para decidir este número. Criterio de la raíz latente (eigenvalor >1)
La lógica que sigue este criterio se basa en la idea de que cada uno de los facto-
res extraídos debería justicar, al menos, la varianza de una variable individual (de lo contrario se incumpliría con el objetivo de reducir la dimensión de los datos originales). El análisis factorial –al igual que otras técnicas multivariadas– utiliza eigen valores (raíces latentes) y sus correspondientes cor respondientes eigenvectores para consolidar la varianza en una matriz. En el contexto del análisis factorial, los eigenvalores representan la cantidad de varianza de todas las variables indicadoras que puede ser explicada por un factor determinado. Cada una de las variables contribuye con un valor de 1 en el eigenvalor (varianza) total. 2 Por lo tanto, de acuerdo con este criterio, deberían elegirse los factores con eigenvalores mayores a 1 para garantizar que explican la varianza de al menos una variable.
2
Esto se debe a que el análisis se realiza con variables estandarizadas, por lo que la varianza de cada una de ellas es igual a uno.
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
21
Criterio del gráfico de codo (contraste de caída)
Este criterio consiste en analizar el comportamiento de los eigenvalores asociados a los factores extraídos, para determinar un punto de corte entre la pendiente pronunciada de los eigenvalores altos y la pendiente (más bien plana) de los eigenvalores bajos. La siguiente gura representa los primeros 11 factores extraídos en el análi sis factorial de un conjunto de reactivos que componen el área de un examen. Figura 5. Gráfico de codo Gráfico de codo (scree - plot) 3.5 3.0 r o l a v n e g i E
2.5 2.0
Criterio de contraste de caída
1.5 1.0 0.5 1
2
3
4
5
6
7
8
9
10
11
Del lado izquierdo de la gráca un punto sobresale de los demás, haciendo que la pendiente de la línea que une todos los puntos cambie drásticamente en el lugar correspondiente al segundo factor. En este sitio, todo el conjunto de
22
Cuaderno técnico
6
factores se divide en dos grupos, gr upos, el primero compuesto solamente por el primer factor, que explica una cantidad mayor de varianza que cualquiera de los diez factores restantes pertenecientes al segundo grupo y para los que la cantidad de varianza explicada parece haberse estabilizado. estab ilizado. Por Por lo tanto, con este criterio deberíamos incluir sólo el primer factor. Criterio del porcentaje de varianza explicada
Este criterio consiste en analizar el porcentaje acumulado de la varianza total extraída. Esto es, se busca asegurar que el número de factores extraídos e xtraídos alcance a explicar un porcentaje determinado de la varianza total de los datos. Aunque no se ha determinado un porcentaje preciso de varianza explicada que sirva como umbral para concluir con la extracción de factores, algunos autores sugieren que en el caso de aplicaciones concernientes a las Ciencias Naturales se puede detener el proceso cuando se alcance 95% de la varianza o cuando la inclusión de un factor adicional contribuya con menos de 5% a la varianza explicada acumulada. Para el caso de las Ciencias Sociales los criterios propuestos son más laxos. Se habla de continuar la extracción de factores hasta lograr log rar 60% de la varianza total (Hair et al., 1998/1999).
Interpretación de la matriz de cargas factoriales Una vez que se han estimado las cargas factoriales es importante establecer criterios que permitan interpretar los resultados obtenidos. Esta interpretación hará posible establecer una conexión entre los resultados vertidos por el análisis factorial y los constructos teóricos relacionados con los datos. En este sentido, la extracción de un determinado número de factores por los criterios estadís-
ticos ya mencionados, carecerá de sentido si no podemos darle un signicado lógico a cada uno de ellos, que además esté justicado teóricamente.
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
23
Las cargas factoriales indican la correlación entre cada variable y el factor correspondiente, de ahí que una variable con mayor carga factorial será más representativa del factor. factor. Tomando Tomando en cuenta esto, un análisis de la matriz de
cargas factoriales puede ayudarnos a identicar cómo se agrupan agr upan las variables maniestas para conformar cada uno de los factores resultantes del modelo, e incluso a etiquetarlos. Una vez que sabemos cuáles de las variables maniestas “cargan” en el factor 1, por ejemplo, podemos deducir qué tipo de constructo teórico está representado por dicho factor. En la siguiente tabla se muestra la matriz de cargas factoriales para un ejemplo hipotético en el que se realizó un análisis factorial con las respuestas a 10 reactivos de opción múltiple de una prueba. Los primeros 5 (RM1 a RM5) son reactivos del área de Razonamiento matemático, mientras que los últimos cinco (RV1 a RV5) corresponden al área de Razonamiento verbal. Tabla 2. Matriz de cargas factoriales para un caso hipotético Área
Variable Variable (Reactivo)
Factor 1
2
Razonamiento verbal
RM1 RM2 RM3 RM4 RM5
0.6 0.5 0.6 0.6 0.5
0.1 0.1 0.2 0.1 0.1
Razonamiento matemático
RV1 RV2 RV3 RV4 RV5
0.1 0.2 0.1 0.2 0.2
0.6 0.6 0.6 0.6 0.7
De acuerdo con estos resultados, podemos identicar al factor 1 con una inuencia común en las primeras cinco variables y al factor 2 con una inuen cia común en las últimas cinco. De esta manera podríamos dividir el total de
24
Cuaderno técnico
6
variables (reactivos) (reactivos) en dos grupos, que no se traslapan, y que son indicativos de dos variables latentes diferentes: Razonamiento matemático (factor 1) y Razonamiento verbal (factor 2).
¿Cómo podemos determinar si una carga factorial es lo sucientemente “grande” para concluir que la correlación entre la variable y el factor es signi cativa? Hair et al . (1998/1999) proponen ciertas directrices para determinar si una carga factorial es o no signicativa, dependiendo del tamaño de la muestra utilizada para el análisis (esta tabla se basa en estudios de potencia estadística): Tabla 3. Directrices para la identificación de cargas factoriales significativas, basadas en el tamaño de la muestra Carga factorial
Tamaño muestral necesario para la significancia- (a)
0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75
352 250 200 150 120 100 85 70 60 50
(a) La significancia se basa en un nivel de significación de 0.05, una potencia de 80% y los errores estándar supuestamente dos veces mayores que los coeficientes convencionales de correlación
En el ejemplo anterior la interpretación fue muy sencilla, porque cada va-
riable resultó estadisticamente signicativa para un solo factor. Sin embargo, este no es el caso frecuente. A continuación se describe un procedimiento que
puede ayudar a claricar la interpretación de los resultados.
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
25
Un concepto muy controversial: rotación de factores Cuando el modelo en cuestión está determinado deter minado por un solo factor, su solución es única; sin embargo, las soluciones de los modelos multifactoriales, no son siempre únicas, ya que cuando existen dos o más factores signicativos si gnicativos,, las dis tintas combinaciones posibles pueden interpretarse de distintas maneras (véan-
se “soluciones múltiples al modelo” en el capítulo 3). Este aspecto ha suscitado críticas sobre el análisis factorial, ya que se piensa que depende de cuestiones subjetivas, subjetivas, que pudieran encaminar las soluciones a resultados preconcebidos por el investigador. Estas críticas son erróneas en dos aspectos: primero, el in vestigador no obtiene la solución solución que él desea; segundo, segundo, es más adecuado decir que la misma solución puede expresarse de diferentes maneras; de hecho, varias
características de las soluciones –por ejemplo las comunalidades– permanecen inalteradas. Rotación –nombre –nombre que se le da al proceso de cambiar de una solución a otra– proviene de la representación geométrica de este procedimiento. La razón principal para rotar una solución es claricar la estructura de las cargas factoriales. Los factores deben tener un signicado claro para el inves inves tigador, a partir del contexto de aplicación. Si la estructura que muestran las cargas factoriales de la solución inicial son confusas o difíciles de interpretar, una rotación puede proporcionar una estructura más fácil de interpretar. Rotaciones ortogonales
Uno de los patrones de cargas factoriales más usuales y de hecho más deseables es la llamada estructura simple de cargas factoriales . Se dice que las cargas factoriales presentan una estructura simple si cada variable tiene una gran carga en un solo factor, con cargas cercanas a cero en el resto de los factores. Una de las rotaciones ortogonales (los nuevos ejes después de la rotación siguen siendo ortogonales) que procura generar una estructura estr uctura de cargas simple es la rotación
26
Cuaderno técnico
6
varimax, implementada en la mayoría de los paquetes estadísticos. No hay ga-
rantía de que una rotación produzca necesariamente una estructura de cargas simple, pero, de hacerlo, hacerlo, puede ayudar a una interpretación interp retación mucho más fácil de los factores. Existen Existen otras rotaciones ortogonales ortog onales (como quartimax y y equimax ), pero ninguna tiene la popularidad de varimax. Rotaciones oblicuas
Contrario a las rotaciones ortogonales, las rotaciones oblicuas permiten relajar la restricción de ortogonalidad con el n de ganar simplicidad en la interpre tación de los factores. factores. Con este método los factores resultan correlacionados cor relacionados,, aunque generalmente esta correlación es pequeña. El uso de rotaciones oblicuas se justica porque en muchos contextos es lógico suponer que los factores es tán correlacionados. Pese Pese a que pueden ser de utilidad en algunas situaciones, estas rotaciones raramente se usan, a diferencia de las ortogonales. Entre las rotaciones oblicuas, promax es es conceptualmente simple; sin embargo, la más popular es oblimin .
Valorac V aloración ión de de las las comunalid comunalidades ades
Además del análisis análisis de la matriz matriz de cargas cargas factoriales factoriales,, es importan importante te vericar vericar si cada una de las variables incluidas en el análisis son explicadas aceptablemente por el modelo. Esto puede lograrse analizando la estimación e stimación nal de las comu nalidades. Puesto que la comunalidad representa la proporción de la varianza de la variable indicadora que es explicada por po r los factores comunes del modelo, mode lo, Hair et al. (1998/1999) proponen que las variables con una comunalidad menor a 0.5 y no deberían ser consideradas en la interpretacarecen de una explicación suciente y
ción nal del análisis.
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
27
Puntajes factoriales Una vez realizado el análisis factorial, quizá con alguna rotación de los factores,
el paso nal es asignar los puntajes factoriales (scores) a cada individuo en la muestra. Esta construcción de puntajes genera una nueva variable por cada factor en el modelo. Usualmente estas variables derivadas del análisis factorial pueden utilizarse como insumo para otros procedimientos estadísticos de interés. Existen dos métodos para construir estos puntajes factoriales, a saber: el método de Bartlett o de mínimos cuadrados ponderados y el método de Thompson o de regresión regresión (capítulo (capítulo 3). 3).
Bondad de ajuste del modelo de factores Dado que el análisis factorial se realiza a través de un modelo, ¿qué tan bien ajusta este modelo a nuestros datos? Un primer elemento de juicio lo constituye
la matriz de residuos, denida por:
que es la diferencia entre nuestra matriz observada de correlaciones y la matriz de correlaciones reproducida re producida por el modelo de factores. Si estas diferencias son
pequeñas, se puede armar que el modelo de factores ajusta bien a los datos. Los valores de estas matrices están acotados entre –1 y 1, de modo que las diferencias deben ser realmente pequeñas. Paquetes estadísticos como SPSS remarcan diferencias menores o iguales a 0.05. Obsérvese además que los elementos
en la diagonal de esta esta matriz de residuos son las especicidades del modelo model o. Un buen ajuste signica, en este caso, que el modelo con k factores es adecuado para nuestra información.
28
Cuaderno técnico
6
Análisis Análi sis factoria factoriall con variab variables les discret discretas as El análisis factorial estándar se realiza con variables continuas; sin embargo, en muchas áreas de aplicación lo usual es tener variables medidas en escalas nominal u ordinal. En estos casos, lo adecuado es realizar el análisis respetando el orden de medición de las variables involucradas. involucradas. Dado que el análisis factorial se basa en el uso de la matriz de correlación, cor relación, una manera de considerar la escala de medición de las distintas variables involucradas en el estudio es calcular el tipo de correlación que corresponda cor responda a cada par de variables, variables, de acuerdo con su escala particular. En este sentido, la tabla siguiente muestra el tipo de correlación que conviene calcular, de acuerdo con el orden de medición de las variables involucradas. Tabla 4. Medidas de correlación entre variables Escala de de me medición
Continua
Ordinal
Dicotómica
Continua
Pearson
Polis oliser eria iall
Punto unto bise biseri rial al
Policórica
Policórica
Ordinal Dicotómica
Tetracórica
El análisis factorial supone la existencia de una variable latente continua continua con distribución normal. De esta manera, cuando se utilizan variables discretas (ordinales y dicotómicas), estás se utilizan como si fueran continuas.
Análisis factorial: una técnica para evaluar la dimensionalidad dimensionalidad de las pruebas
29
Capítulo III Fundamentos técnicos del análisis factorial
Aspectos Aspect os formales formales
E
n este apartado presentaremos algunos aspectos formales de la teoría que sustenta este análisis. La presentación se hará de manera general, considerando el modelo multifactorial del que se desprende, como caso particular,
el modelo unifactorial. A lo largo de la exposición se denirán d enirán algunos de los conceptos relacionados con esos modelos. Supongamos que tenemos un conjunto de variables observadas X 1, X 2,..., X p y se asume que en este conjunto subyacen k factores con k
View more...
Comments