ANÁLISIS MULTIVARIADO-DISCRIMINANTE
Short Description
Download ANÁLISIS MULTIVARIADO-DISCRIMINANTE...
Description
ANÁLISIS DISCRIMINANTE Y CORRELACIONES CANÓNICAS Prof. ESPERANZA AYUGA TÉLLEZ
ANÁLISIS DISCRIMINANTE Propuesto por primera vez por Fisher, físico que trab trabaj ajóó en una una estac estació iónn experimental agrícola y célebre por sus estudios genéticos.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Tiene Tiene por por objeto objeto clasificar clasificar un un nuevo nuevo elemento elemento observado, observado, usando usando valores valores de de las las variables variables conocidas, conocidas, en en alguna alguna de de las las poblaciones poblaciones que que originan originan éstas. éstas. Conocido Conocido como como reconocimiento reconocimiento de de patrones clclasificación asificación supe rvisada. patrones oo clasificación clasi ficaciónsupervisada. supervi supervisada. sada. p.e. Clasificar los restos restos de un cráneo descubierto en una excavación como humano, partiendo de medidas físicas de cráneos humanos y de antropoides.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
• Clasificación entre dos poblaciones: Tenemos dos poblaciones, P1 y P2, con un vector aleatorio X continuo, p-dimensional, definido en ambas y con funciones de densidad multivariantes conocidas (f 1(X) y f 2(X)). Queremos clasificar x0 en una de las dos poblaciones. Si conocemos πi, probabilidad “a priori” de que el elemento proceda de Pi, con π1+π2=1, entonces (por Bayes)
x 0 ∈ P2 ⇔ π2f 2 ( x 0 ) > π1f 1 ( x 0 )
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
• Consecuencias de la clasificación errónea: Las decisiones son dos:
Clasificamos Clasificamos en en PP22 si: si: 0 P(1/X) Si x0∈A1 ⇒D1 (clasificar en P1) a) (“a priori”) es más alta (a igualdad del resto) D1 π a) (“a priori”) es más alta (a igualdad del resto) π 2 2 Si x ∈A ⇒ D (clasificar en P ) 0
2
2
2
P(2/X)
C(1/2) b) f (verosimilitud) es más alta (a igualdad del Las consecuencias de los errores b) f 22 (verosimilitud) es másxalta (a igualdad del 0 C(i/j) se miden con el coste de C(2/1) P(1/X) resto) resto) clasificar en Pi un elemento de P j D2 c) El equivocarnos es (a El buscade maximizar la c)decisor El coste coste de equivocarnos es más más bajo bajo (a 0 P(2/X) utilidad de la decisión. igualdad del igualdad del resto) resto)
π2f 2 ( x 0 ) π1f 1 ( x 0 ) Asignamos el elemento a P2 si > C(2 / 1) C(1 / 2)
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
• Caso de dos poblaciones normales: Tenemos dos poblaciones de f 1(X) y f 2(X) normales con V1=V2=V entonces la regla general anterior se reduce a clasificar en P2 si D12>D22, con Di2 = (X- i)’V-1(X- i)= distancia de Mahalanobis O bien, construir la variable indicador z= w’x con w= V-1 ( 2 - 1) y clasificar z en P2 si z-m1> z-m2 con mi= w’ i. Esto equivale a buscar la dirección óptima de proyección para discriminar.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
• Probabilidad de error: P(2/1) = P(1/2) = Φ (-D/2) con Φ función de distribución de la Normal estandar y D2 = (
’V-1( ) 1 2
2
- 1)= distancia de Mahalanobis.
• Probabilidad de acertar: 1 P(1 / x ) = π1 1 2 2 1 + exp − (D2 − D1 ) π2 2 que nos indica la confianza en la clasificación.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
• Generalización a varias poblaciones: Si tenemos G poblaciones, se divide el espacio en G
regiones Ag tales que si x∈ Ag se clasifica el punto en la población Pg. La regla de decisión de máxima verosimilitud es: Ag={x ∈ Ag /πgf g(x)> πif i(x); ∀i≠g}
Esto equivale a calcular las D2 de x al centro de cada población y clasificarla en la Pg que haga esta distancia mínima (si todas las πi son iguales y f i(x) normales con la misma matriz de varianzas). Para G poblaciones se necesitan r=min(G-1,p)
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
• Poblaciones desconocidas: Si sólo disponemos de la muestra: −1 ˆ ′ min ( x x ) S − clasificamos x0 en la población Pg si 0 g w (x0 − x g
o construimos z g,g+1 = wˆ 'g,g+1x 0 , con wˆ g,g+1 = wˆ g − wˆ g+1 y clasificamos en g frente a g+1 si ˆ g < z g ,g+1 − m ˆ g +1 z g,g+1 − m
El error de clasificación es ε= total mal clasificados/total bien clasificados También podemos construir n funciones discriminantes con n-1 observaciones y clasificamos el dato con la regla construida sin él (validación cruzada)
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
V. CANÓNICAS DISCRIMINANTES • Se construyen las variables canónicas que tengan máximo poder discriminante (proyecciones en las direcciones de máxima distancia) mediante los autovalores y que son incorreladas. • Cuando p y G son grandes es frecuente que la mayor discriminación se consiga con pocas variables canónicas.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
OTRAS FORMAS DE DISCRIMINACIÓN Cuadrática:
Si las V son distintas se clasifica la observación en el grupo con más probabilidad “a posteriori” ⇒ f. Discrim. Cuadrática (con regiones no disjuntas y nº de parámetros a estimar mayor).
Bayesiana: Para v.a. con cualquier distribución. Con la probabilidad “a posteriori” ⇒ f. Discrim. Cuadrática.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
USO DEL A. DISCRIMINANTE En muchos casos en que se necesita clasificar elementos con informaciones incompletas
NÁLISIS DISCRIMINANTE
Fases de su aplicación
A. MULTIVARIANT
PREPARACIÓN DE LOS DATOS PARA EL ANÁLISIS Comprobación de los supuestos básicos Elección de las variables predictoras Selección de los casos a analizar Análisis de las distribuciones univariantes de los grupos
1
LAS FUNCIONES DISCRIMINANTES Estimación de las funciones discriminantes Análisis discriminante simultáneo
Análisis discriminante no simultáneo
Derivación de los coeficientes de las funciones discriminantes Significatividad de las funciones Obtención de las puntuaciones discriminantes
2
NÁLISIS DISCRIMINANTE
Fases de su aplicación ESTADÍSTICOS:
A. MULTIVARIANT
•Determinar la importancia relativa de cada v. indep. En la diferenciación los grupos: ESTIMACIÓN DEdeLAS FUNC. DISCRIMINANTES opesos discriminantes estandarizados oCorrelaciones de estructuras discriminantes EVALUACIÓN DE SU ADECUACIÓN PREDICTIVA F parciales de corte óptima DeterminaciónoValores de la puntuación Obtención de lasde matrices de grupales clasificación •Examen las medias en relación con cada función discriminante Aplicación de varios criterios para valorar la clasificación
R E P •Cálculo de los índices de potencialidad L INTERPRETACIÓN DEL MODELO A N Rotación de las funciones discriminantes T GRÁFICOS: E grupales •Centroides A ESTADÍSTICOS GRÁFICOS •Correlaciones discriminantes R
2 3 4
•Mapas territoriales
•Histogramas de puntuaciones discriminantes
VALIDACIÓN DEL MODELO •Diagramas de dispersión para todas las funciones NEGATIVA
POSITIVA
5
Conclusión del análisis
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
DECISIONES INICIALES 1. Elección de variables predictoras: Se basa en técnicas previas de clasificación grupal.
2. Selección de casos a analizar: La eliminación de dichos casos se basará en el estudio detallado de éstos. Si son demasiadas, si son relevantes, etc. Si se emplea la validación cruzada para contrastar las funciones discriminantes hay determinar qué parte de la muestra se elimina de la estimación y se emplea en la validación.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
DECISIONES INICIALES 3. Modalidad de análisis: Dependiendo de si sólo se quiere discriminar o también se quiere emplear un número reducido de variables predictoras: •Análisis discriminante simultáneo: se emplean todas. •Análisis discriminante secuencial: serie reducida en consonancia con su poder discriminatorio. La incorporación es secuencial, se introduce una nueva variable en consonancia con su poder discriminante y se analiza la colinealidad.
4. Descriptiva univariante: Se analizan las diferencias entre grupos de los estadísticos de cada variable.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
ESTIMACIÓN DE LAS FUNCIONES Función discriminante canónica : combinación lineal de “p” variables predictoras que más discriminan entre los grupos definidos “a priori” f km= u0+u1X1km+...+u pX pkm f km = puntuación para el caso m en el grupo k Xikm = valor de la v. X i para el caso m en el grupo k La puntuación discriminante representa la proyección de ese caso a lo largo del eje discriminante definido por la función. Los coeficientes se calculan para maximizar diferencias entre centroides y los valores ui incorrelados entre las diferentes funciones.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
ESTIMACIÓN DE LAS FUNCIONES Nº de funciones y significatividad: N max = min (p, g-1)
p =nº de variables usadas g =nº de grupos
Relevancia de las funciones: se comprueba con la conjunción Autovalores: λi= SCEG/SCIG, cuanto mayor es λi más discriminación Porcentaje de varianza: % de V relativo que representa cada función. Correlación canónica: r i = [λi/(1+ λi)]1/2, mide el grado de asociación entre el grupo y la función, cuanto más próximo a 1 mejor asociación.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
ESTIMACIÓN DE LAS FUNCIONES Nº de funciones y significatividad: Se comprueba con los estadísticos: Lambda de Wilks: se tienen valores pequeños cuando hay mucha variabilidad entre grupos y poca dentro de ellos, valores cercanos a 1 indican que la función no logra diferenciar entre grupos.
Chi-cuadrado: mide la discriminación residual. Si p>0,05 no procede seguir estimando funciones discriminantes.
Estandarización de coeficientes: Las puntuaciones se obtienen con los coef. sin estandarizar. Los coef. estandarizados se emplean como referentes de la contribución
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
ESTIMACIÓN DE LAS FUNCIONES Procedimiento secuencial para elegir v. predictoras : Hacia delante (forward): se van incluyendo variables por su poder discriminante. Hacia atrás (backward): se van eliminando variables. Criterios de selección: Lambda de Wilks: se selecciona la variable con lambda menor La razón F parcial: razón de variabilidad entre y var. intra. Interesan valores elevados. Hay que elegir los valores: F mínimo (F-to enter) para entrar >2, entre 2,5 y 5 F máximo (F-to remove) para salir >2, entre 2,5 y 5
Fmin >Fmax
Para incorporar, F debe ser elevado y α=0,05
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
CAPACIDAD PREDICTIVA Procedimiento para VALORAR la capacidad predictiva: Tabla de clasificación: Se incluyen los casos bien y mal clasificados y en qué grupo. Se determinará una probabilidad “a priori” de asignación a cada uno de los grupos: Para
todos igual
Proporcional Otra
al número de casos en cada grupo.
asignación
El caso se clasifica en el grupo con mayor probabilidad “a posteriori”
El éxito se mide con el porcentaje de casos correctamente clasificados
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
INTERPRETACIÓN 1. DESCRIPCIÓN de las funciones : destacando el poder discriminatorio de las variables que la forman. •Los coeficientes estandarizados •Las correlaciones •Los valores de F parciales
2. EXAMEN de los centroides : su finalidad es obtener una visión global de las diferencias grupales respecto a las funciones obtenidas.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
ULTIMAS APLICACIONES Patrones de comportamiento (2005): Estudio sobre diferencias entre los patrones de asimilación de CO2, eficiencia fotosintética y crecimiento del Schinus frente a cinco especies nativas de Florida en diferentes condiciones de salinidad: neutra, baja y alta.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
ULTIMAS APLICACIONES
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
ULTIMAS APLICACIONES Patrones de comportamiento (2005): Estudio sobre modelos de gestión de organizaciones culturales mediante medidas de los valores del individuo sobre tres ejes: economía-práctica; creatividad-emocional y creatividad ética-social.
ética
economía
Control de procesos (2005): Programa informático para el comprobar si el proceso está o no bajo control, entrando múltiples variables físicas y tratamiento estadístico de éstas, incluido el AD.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
ULTIMAS APLICACIONES Tipología estructural (2005): Asignación de parcelas forestales a diferentes tipologías estructurales de los hayedos burgaleses, atendiendo a variables dasométricas y medidas de la biodiversidad de las parcelas, con un 95% de eficiencia en la clasificación.
NÁLISIS DISCRIMINANTE
Ejemplo 1: Una máquina que admite monedas realiza 3 mediciones de cada moneda para determinar su valor: peso(X1), espesor(X2) y densidad de estrías en su canto(X3). Los instrumentos de medición de estas variables no son muy precisos y se ha comprobado en una amplia experimentación con 3 tipos de monedas M1, M2 y M3, que las medidas son N( , V )
ANÁLISIS MULTIVARIANTE
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 1: 20 8 8 µ1
19,5 7,8 10 µ2 4 0,8 −5 = 0,8 0,25 − 0,9 −5 − 0,9 9 V-1 =
20,5 8,3 5 µ3
Clasificar la moneda de medidas (22; 8,5;7)´ Aparentemente está más próxima a M3 Pero podría ser M1
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 1:
Funciones discriminantes: Z1 = ( 1 − 3 )′ − = 1,77x1 − 3,31x 2 + 0,98x3 Z2 = ( 1 − 2 )′ − = −0,93x1 + 1,74x 2 − 0,56x3 Z3 = ( 2 − 3 )′ − = Z1 − Z2 Z1( 1) =1,77× 20− 3,31×8 + 0,98×8 = 16,71 La media o punto Z1( 2) = 1,77× 20,5 − 3,31×8,3 + 0,98×5 = 13,65 de corte es 15,17
Z1=1,77x22-3,31x8,5+0,98x7=17,61 > 15,17⇒M1
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 1:
Equivale a calcular D2: − 2 1 ′ D1 = ( − 1 ) ( − 1 ) = 1,84 2 1 − ′ D =( − ) ( − ) = 2,01 2 D32
2
=( −
2
−1 ( − ) = 6,69 ′ ) 3 3
D12 es la menor ⇒ clasificamos en M1
La moneda que queremos clasificar tiene mucho peso y espesor (∈M3) entonces la densidad de las estrías debía ser bajo
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 1:
Hemos clasificado la moneda en M1 y no en M3 como pensamos al principio. Para explicarlo estudiamos la matriz de correlaciones entre coeficientes estandarizados.
0,8 − 0,83 1 1 = 0,8 − 0,6 − 0,83 − 0,6 1
La moneda que queremos clasificar tiene mucho peso y espesor (∈M3) entonces la densidad de estrías debía ser bajo (correlación negativa). Sin embargo es alto, valor compatible con una moneda M1 sucia (la suciedad aumenta peso y espesor)
NÁLISIS DISCRIMINANTE
Ejemplo 2: Se tienen 360 observaciones de distintas zonas de la costa, que se han clasificado, atendiendo al grado de salinidad y contaminantes, en aguas no degradadas (1), algo degradadas (2) y muy degradadas (3). Vamos determinar si la presencia de determinados organismos nos permite asignar el ecosistema marino a alguno de estos grados.
ANÁLISIS MULTIVARIANTE
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 2: Las variables que se consideran en la obtención de las funciones discriminantes son:
bivalvos
poliquetos
Nº de sp distintas
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 2: Las variables isópodos/bivalvos y poliquetos/bivalvos están correlacionadas linealmente.
% poliquetos
% anfipodos
% bivalvos
% isópodos
nº de especies
Resumen estadístico % poliq
% anfip
% bivs
% isóp
nº de sp
--------------------------------------------------------------------------------------------------Nº
360
360
360
360
360
X
5,95833
2,9525
4,37028
1,24028
52,5889
S
1,00765
1,20146
1,1505
0,53954
25,8341
16,9116%
40,6929%
26,3256%
43,5015%
CV
49,1247%
El % de isópodos y nº de especies distintas son los más diferentes en cuanto a medias y desviaciones típicas.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 2: Number of complete cases: 360 Number of groups: 3 Valor % Correlación Función propio Relativo Canonica -----------------------------------------------------------------1 9,36485 83,00 0,95054 2 1,91833 17,00 0,81076 Funciones Wilks Chi g.d.l. P-Valor Derivadas Lambda -----------------------------------------------------------------------1 0,0330599 1213,7581 6 0,0000 2 0,342661 381,2804 2 0,0000 -------------------------------------------------------------------------
Las dos funciones son discriminantes (f1> f2) Las dos funciones obtienen grupos con medias diferentes
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 2: Stepwise regression: Method: forward selection F-to-enter: 4,0 / F-to-remove: 4,0 Step 0:
0 variables in the model.
Step 1: Adding variable % isópodos with F-to-enter = 940,328 -------------------------------------------------------------------------------------------------------1 variables in the model. Wilk's lambda = 0,159542 Approximate F = 940,328 with P-value = 0,0000 Step 2: Adding variable nº de especies with F-to-enter = 430,292 --------------------------------------------------------------------------------------------------------2 variables in the model. Wilk's lambda = 0,0466856 Approximate F = 645,813 with P-value = 0,0000 Step 3: Adding variable % bivalvos with F-to-enter = 73,1565 ---------------------------------------------------------------------------------------------------------3 variables in the model. Wilk's lambda = 0,0330599 Approximate F = 532,479 with P-value = 0,0000
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
140
degradaci 1 2 3
Ejemplo 2:
s e 110 i c e80 p s e50 e d º20 n
140
degradación 1 2 3
s e110 i c e 80 p s e 50 e d º 20 n -10
-10
0
0
0,5
1
1,5
2
2
2,5
4
6
8
% bivalvos
% isópodos 2,5 9,6
degradació 1 2 3
s8,6 o Si disminuimos la F de t e7,6entrada a 2,5 incluimos la u q i l 6,6variable % de poliquetos con o =0,0323432 que discrimina p5,6 un poco menos % 4,6
degradación 1 2 3
s 2 o d o1,5 p ó 1 s i % 0,5 0
3,6 0
0,5
1
1,5
2
2,5
0
2
4
6
8
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 2: Grupo tamaño Degradación asignada actual grupo 1 2 3 -----------------------------------------------------------------------1 120 119 0 1 ( 99,17%) ( 0,00%) ( 0,83%) 2 120 0 117 3 ( 0,00%) ( 97,50%) ( 2,50%) 3 120 0 2 118 ( 0,00%) ( 1,67%) ( 98,33%) -----------------------------------------------------------------------% de casos correctamente clasificados: 98,33% G Prob. a priori -----------------------1 0,3333 2 0,3333 3 0,3333 -------------------------
La probabilidad “a priori” es igual para todos los grupos y proporcional al tamaño del grupo
La clasificación más acertada es la de los ecosistemas no degradados
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 2:
Z1= 16,081%biv+36,2747%isop+0,553299nºsp-102,461
Classification Function Coefficients for degradación --------------------------------------------------------------------1 2 3 % bivalvos 16,018 9,24273 12,244 % isópodos 36,2747 11,8938 23,6155 nº de especies 0,553299 0,350885 0,173621 CONSTANT -102,461 -28,5171 -43,9113 ------------------------------------------------------------------------
Z2= 9,24273%biv+11,8938%isop+0,50885nºsp-28,5171 Z3= 12,244%biv+23,6155%isop+0,173621nºsp-43,9113
Clasificamos en el grupo 2 si Z2>Z1 y Z2>Z3
En la f1 todas las variables contribuyen por igual y en f2 la variable de mayor importancia es la diversidad
Coeficientes de la Función Discriminante para degradación Standardized Coefficients ------------------------------------------------------1 2 % bivalvos 0,524842 -0,258276 % isópodos 0,681804 -0,405098 nº de especies 0,456872 0,892658
Unstandardized Coefficients --------------------------------------------------------1 2 % bivalvos 0,887861 -0,436919 % isópodos 3,1549 -1,8745 nº de especies 0,0381303 0,0745006 CONSTANT -9,79838 0,316459
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
Ejemplo 2: Si f2=...>= ρn2 4. Las variables canónicas se obtienen a partir de:
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
VARIABLES CANÓNICAS Det(C12 C22-1 C21-ρi2 C11)=0 Matriz de Covarianzas de y con x
Matriz de Covarianzas de y1 ,...,ym
Matriz de Covarianzas de x1 ,...,xm
Correlaciones canónicas-autovalores
C12 C22-1 C21 ui=ρi2 C11ui Donde (u1i, ...umi ) es el vector canónico. C12 C11-1 C21 vi=ρi2 C22vi D
d (
) es el vector canónico.
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
CONSTRUCCIÓN DE V. C. Una vez obtenidas las dos variables, es posible que esta primera relación entre las 2 v. indicadores explique completamente los dos conjuntos y no exista más relación entre ambas. Si no es así, se puede buscar una 2ª v. Indicadora del primer conjunto incorrelada con la 1ª y que tenga correlación máxima con otra v. Indicadora del segundo conjunto.
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
CORRELACIÓN CANÓNICA Las correlaciones canónicas representan relaciones de dependencia entre los subespacios generados por los dos conjuntos de variables. Los vectores x* e y* están lo más cerca posible (es decir, x* es colineal con la proyección de y* sobre P1 y viceversa.
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
PROPIEDADES DE LAS V. C. Son indicadores de los dos conjuntos de variables que tienen máxima correlación. Los coeficientes de la v. c. son los vectores propios ligados al mismo valor propio de A y B. Si i’x es una v.c. también - i’x lo es. Las correlaciones canónicas son el cuadrado del coeficiente de correlación entre las dos v. c.
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
PROPIEDADES DE LAS V. C. Las correlaciones canónicas λi2 son invariantes ante transformaciones lineales de las variables. La primera correlación canónica λ12 nunca es menor que el mayor coeficiente de correlación simple al cuadrado, entre una variable de cada conjunto.
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
PROPIEDADES DE LAS V. C. La correlación canónica λi2 es el coeficiente de determinación en una regresión múltiple con respecto a la variable y* y variables explicativas las x (idem para la regresión de x* con las y). Las v. c. son los predictores óptimos en el sentido de minimizar E(||x*-y*||2)
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
CONTRASTES Contrastamos que los dos conjuntos de variables están incorrelados que equivale a decir que todas las correlaciones canónicas son nulas . Bajo las hipótesis de que X e Y siguen distribuciones normales de media 0: r
H0: V12=0 H1: V12≠0
λ = −m∑log(1 − λ ) ≈ χ , 2 j
2 pq
j=1
1 m= ny r = min(p,q) 2(p + q + 3)
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
CONTRASTES Podemos contrastar por otra parte que los s 1os coeficientes de la correlación canónica son ≠0 y los restantes nulos. H0: λi>0 i=1,...,s; y λs+1=...= λr =0 H1: λi>0 i=1,...,s; y al menos un λ j>0 con j=s+1,...,r r
λ = − m ∑ log(1 − λ ) ≈ χ j= s +1
2 j
2 (p -s)(q -s)
1 , con m = n 2(p + q + 3)
CORRELACIONES CANÓNICAS
ANÁLISIS MULTIVARIANTE
Ejemplo: Se han medido en 50 poblaciones españolas variables climáticas que se agrupan en variables relacionadas con la pluviometría (conjunto 1) y las relacionadas con las temperaturas (conjunto 2): Conjunto 1: Precipitaciones anuales y número de días de niebla. Conjunto 2: Temperatura media anual y número de días despejados al año. Se comprobó que las variables de cada conjunto estaban incorreladas y se transformaron para obtener normalidad.
CORRELACIONES CANÓNICAS
ANÁLISIS MULTIVARIANTE
Ejemplo: lnR raiz DH T DD
CORRELACIONES CANÓNICAS
ANÁLISIS MULTIVARIANTE
Ejemplo: Correla Correlacion ciones es Canóni Canónicas cas --------------------------------------------------------------------------------------------Nº Valor Correlación Lambda Chi g.d.l. propio Canónica Wilks P-Valor --------------------------------------------------------------------------------------------1
0,863625
0,929315
0,119216
98,8971
4
0,0000
2
0,12582
0,354711
0,87418
6,25279
1
0,0124
---------------------------------------------------------------------------------------------
Correlación alta Correlaciones significativas
CORRELACIONES CANÓNICAS
ANÁLISIS MULTIVARIANTE
Ejemplo: Coefici Coeficient entes es de las variab variables les del prime primerr grupo grupo para para las las dos dos vvcc vvcc -------------------------------------------------------------------------------------lnR
-0,365702
0,93433
raiz raiz DH
-0,961 -0,961068 068
-0,288 -0,288198 198
Coefici Coeficient entes es de las variabl variables es del segund segundo o grupo grupo para para las vvcc vvcc -------------------------------------------------------------------------------------T
1,06964
0,333641
DD
-0,184722
-1,10514
CORRELACIONES CANÓNICAS
ANÁLISIS MULTIVARIANTE
Ejemplo:
Variable canónica 1
Variable canónica 2
3,2
2,5
2,2
1,5
2 o 1,2 p u r 0,2 G
2 o 0,5 p u r -0,5 G
-0,8
-1,5
-1,8
-2,5 -1 6
-0 6
04
14
24
-1 5
-0 5
05
15
25
35
CORRELACIONES CANÓNICAS
ANÁLISIS MULTIVARIANTE
Ejemplo: Las nuevas variables que representan temperatura y pluviometría están muy correlacionadas linealmente según la VC1: -0,365702*lnR - 0,961068*raiz DH=1,06964*T - 0,184722*DD u1
v1
Otra combinación de estas variables correlacionadas más ligeramente es la VC2: 0,93433*lnR - 0,288198*raiz DH=0,333641*T - 1,10514*DD u2
v2
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
RELACIÓN CON OTRAS TÉCNICAS La regresión es un caso particular de las correlaciones canónicas: si cada uno de los conjuntos tiene una sola variable (r 2=λ 2 ) La correlación canónica entre X (v. explicativas) y las G variables yi conduce a los mismos resultados que el análisis discriminante si: si i ∈ grupo i 1 yi = 0 en el resto de casos
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
ANÁLISIS CANÓNICO ASIMÉTRICO El objetivo del estudio es prever cada uno de los componentes de Y mediante las variables X. La correlación canónica no resuelve el problema ya que puede existir alta correlación entre x* e y* y baja entre cada y con las x*. Construyendo q ecuaciones distintas de regresión. una única α’X que tenga buenas propiedades para predecir las Y⇒A. C. Asimétrico. Buscando
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
ANÁLISIS CANÓNICO ASIMÉTRICO Si las variables originales están estandarizadas el coeficiente de redundancia se define como: 1 CR ( y / x′α) = α′R yx R xy α q
La medida de la correlación del conjunto de las r combinaciones lineales x’ 1,...,r x’ r es la redundancia total: R ( y / x ) = CR ( y / x′α i ) ≠ R ( x / y)
∑ i =1
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
A. C. ASIMÉTRICO Para encontrar la combinación lineal x’ con máxima correlación con cada variable y i individualmente de manera que la suma de correlaciones al cuadrado entre x’ y las y hay que maximizar ’R xyR yx con la restricción: ’R xx =1 Por tanto,
es el vector propio de la matriz: −1 xx
H = R R xy R yx
EPENDENCIA ENTRE CONJUNTOS DE VARIABLES
ANÁLISIS MULTIVARIANTE
A. C. ASIMÉTRICO ⌦Como
en A. C. Simétrico podemos buscar una 2ª variable canónica asimétrica, ortogonal a la primera y con máxima correlación con la v. endógena. ⌦Este mismo análisis puede hacerse para explicar las
X con las Y, pero el problema no es simétrico. ⌦R(y/x)
no tiene en cuenta las correlaciones entre las variables y ⇒ no es una medida multivariante de la dependencia entre los conjuntos.
NÁLISIS DISCRIMINANTE
ANÁLISIS MULTIVARIANTE
ULTIMAS APLICACIONES Ictiología (2004): Estudio sobre asociaciones entre variables de tipo morfológico de las sp. de rayas de Bahía Almejas y la composición de sus dietas.
Ecosistemas (2004): Estudio de relaciones entre el número de Zebrasoma flavescens y las características de los arrecifes de coral de Hawai.
View more...
Comments