ANÁLISIS MULTIVARIADO-DISCRIMINANTE

June 18, 2019 | Author: Mamunia Morroco | Category: Correlation And Dependence, Eigenvalues And Eigenvectors, Statistics, Mathematics, Ciencia
Share Embed Donate


Short Description

Download ANÁLISIS MULTIVARIADO-DISCRIMINANTE...

Description

ANÁLISIS DISCRIMINANTE Y CORRELACIONES CANÓNICAS Prof. ESPERANZA AYUGA TÉLLEZ

ANÁLISIS DISCRIMINANTE  Propuesto por primera vez por Fisher, físico que trab trabaj ajóó en una una estac estació iónn experimental agrícola y célebre por sus estudios  genéticos.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Tiene Tiene por por objeto objeto clasificar clasificar un un nuevo nuevo elemento elemento observado, observado, usando usando valores valores de de las las variables variables conocidas, conocidas, en en alguna alguna de de las las poblaciones poblaciones que que originan originan éstas. éstas. Conocido Conocido como como reconocimiento reconocimiento de de  patrones clclasificación asificación supe rvisada.  patrones oo clasificación clasi ficaciónsupervisada. supervi supervisada. sada.  p.e. Clasificar los restos restos de un cráneo descubierto en una excavación como humano, partiendo de medidas físicas de cráneos humanos y de antropoides.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

• Clasificación entre dos poblaciones: Tenemos dos poblaciones, P1 y P2, con un vector aleatorio X continuo, p-dimensional, definido en ambas y con funciones de densidad multivariantes conocidas (f 1(X) y f 2(X)). Queremos clasificar x0 en una de las dos poblaciones. Si conocemos πi, probabilidad “a priori” de que el elemento proceda de Pi, con π1+π2=1, entonces (por Bayes)

x 0 ∈ P2 ⇔ π2f 2 ( x 0 ) > π1f 1 ( x 0 )

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

• Consecuencias de la clasificación errónea: Las decisiones son dos:

Clasificamos Clasificamos en en PP22 si: si: 0 P(1/X) Si x0∈A1 ⇒D1 (clasificar en P1) a) (“a priori”) es más alta (a igualdad del resto) D1 π a) (“a priori”) es más alta (a igualdad del resto) π 2 2 Si x ∈A ⇒ D (clasificar en P ) 0

2

2

2

P(2/X)

C(1/2)  b) f  (verosimilitud) es más alta (a igualdad del Las consecuencias de los errores  b) f 22 (verosimilitud) es másxalta (a igualdad del 0 C(i/j) se miden con el coste de C(2/1) P(1/X) resto) resto) clasificar en Pi un elemento de P j D2 c) El equivocarnos es (a El buscade maximizar la c)decisor El coste coste de equivocarnos es más más bajo bajo (a 0 P(2/X) utilidad de la decisión. igualdad del igualdad del resto) resto)

π2f 2 ( x 0 ) π1f 1 ( x 0 ) Asignamos el elemento a P2 si > C(2 / 1) C(1 / 2)

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

• Caso de dos poblaciones normales: Tenemos dos poblaciones de f 1(X) y f 2(X) normales con V1=V2=V entonces la regla general anterior se reduce a clasificar en P2 si D12>D22, con Di2 = (X- i)’V-1(X- i)= distancia de Mahalanobis O bien, construir la variable indicador z= w’x con w= V-1 ( 2 - 1) y clasificar z en P2 si z-m1> z-m2 con mi= w’ i. Esto equivale a buscar la dirección óptima de  proyección para discriminar.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

• Probabilidad de error: P(2/1) = P(1/2) = Φ (-D/2) con Φ función de distribución de la Normal estandar y D2 = (

’V-1( ) 1 2

2

- 1)= distancia de Mahalanobis.

• Probabilidad de acertar: 1 P(1 / x ) = π1 1 2  2  1 + exp − (D2 − D1 ) π2  2  que nos indica la confianza en la clasificación.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

• Generalización a varias poblaciones: Si tenemos G poblaciones, se divide el espacio en G

regiones Ag tales que si x∈ Ag se clasifica el punto en la población Pg. La regla de decisión de máxima verosimilitud es: Ag={x ∈ Ag /πgf g(x)> πif i(x); ∀i≠g}

Esto equivale a calcular las D2 de x al centro de cada  población y clasificarla en la Pg que haga esta distancia mínima (si todas las πi son iguales y f i(x) normales con la misma matriz de varianzas). Para G poblaciones se necesitan r=min(G-1,p)

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

• Poblaciones desconocidas: Si sólo disponemos de la muestra: −1 ˆ ′ min ( x x ) S − clasificamos x0 en la población Pg si 0 g w (x0 − x g

o construimos z g,g+1 = wˆ 'g,g+1x 0 , con wˆ g,g+1 = wˆ g − wˆ g+1 y clasificamos en g frente a g+1 si ˆ g < z g ,g+1 − m ˆ g +1 z g,g+1 − m

El error de clasificación es ε= total mal clasificados/total bien clasificados También podemos construir n funciones discriminantes con n-1 observaciones y clasificamos el dato con la regla construida sin él (validación cruzada)

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

V. CANÓNICAS DISCRIMINANTES • Se construyen las variables canónicas que tengan máximo poder discriminante (proyecciones en las direcciones de máxima distancia) mediante los autovalores y que son incorreladas. • Cuando p y G son grandes es frecuente que la mayor discriminación se consiga con pocas variables canónicas.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

OTRAS FORMAS DE DISCRIMINACIÓN  Cuadrática:

Si las V son distintas se clasifica la observación en el grupo con más probabilidad “a posteriori” ⇒ f. Discrim. Cuadrática (con regiones no disjuntas y nº de parámetros a estimar mayor).



Bayesiana: Para v.a. con cualquier distribución. Con la probabilidad “a posteriori” ⇒ f. Discrim. Cuadrática.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

USO DEL A. DISCRIMINANTE En muchos casos en que se necesita clasificar elementos con informaciones incompletas

 NÁLISIS DISCRIMINANTE

Fases de su aplicación

A. MULTIVARIANT

PREPARACIÓN DE LOS DATOS PARA EL ANÁLISIS Comprobación de los supuestos básicos Elección de las variables predictoras Selección de los casos a analizar  Análisis de las distribuciones univariantes de los grupos

1

LAS FUNCIONES DISCRIMINANTES Estimación de las funciones discriminantes Análisis discriminante simultáneo

Análisis discriminante no simultáneo

Derivación de los coeficientes de las funciones discriminantes Significatividad de las funciones Obtención de las puntuaciones discriminantes

2

 NÁLISIS DISCRIMINANTE

Fases de su aplicación ESTADÍSTICOS:

A. MULTIVARIANT

•Determinar la importancia relativa de cada v. indep. En la diferenciación los grupos: ESTIMACIÓN DEdeLAS FUNC. DISCRIMINANTES opesos discriminantes estandarizados oCorrelaciones de estructuras discriminantes EVALUACIÓN DE SU ADECUACIÓN PREDICTIVA F parciales de corte óptima DeterminaciónoValores de la puntuación Obtención de lasde matrices de grupales clasificación •Examen las medias en relación con cada función discriminante Aplicación de varios criterios para valorar la clasificación

R  E P •Cálculo de los índices de potencialidad L INTERPRETACIÓN DEL MODELO A  N Rotación de las funciones discriminantes T GRÁFICOS: E grupales •Centroides A ESTADÍSTICOS GRÁFICOS •Correlaciones discriminantes R 

2 3 4

•Mapas territoriales

•Histogramas de puntuaciones discriminantes

VALIDACIÓN DEL MODELO •Diagramas de dispersión para todas las funciones  NEGATIVA

POSITIVA

5

Conclusión del análisis

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

DECISIONES INICIALES 1. Elección de variables predictoras: Se basa en técnicas previas de clasificación grupal.

2. Selección de casos a analizar: La eliminación de dichos casos se basará en el estudio detallado de éstos. Si son demasiadas, si son relevantes, etc. Si se emplea la validación cruzada para contrastar las funciones discriminantes hay determinar qué parte de la muestra se elimina de la estimación y se emplea en la validación.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

DECISIONES INICIALES 3. Modalidad de análisis: Dependiendo de si sólo se quiere discriminar o también se quiere emplear un número reducido de variables predictoras: •Análisis discriminante simultáneo: se emplean todas. •Análisis discriminante secuencial: serie reducida en consonancia con su poder discriminatorio. La incorporación es secuencial, se introduce una nueva variable en consonancia con su poder discriminante y se analiza la colinealidad.

4. Descriptiva univariante: Se analizan las diferencias entre grupos de los estadísticos de cada variable.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

ESTIMACIÓN DE LAS FUNCIONES Función discriminante canónica : combinación lineal de “p” variables predictoras que más discriminan entre los grupos definidos “a priori” f km= u0+u1X1km+...+u pX pkm f km = puntuación para el caso m en el grupo k  Xikm = valor de la v. X i para el caso m en el grupo k  La puntuación discriminante representa la proyección de ese caso a lo largo del eje discriminante definido por la función. Los coeficientes se calculan para maximizar diferencias entre centroides y los valores ui incorrelados entre las diferentes funciones.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

ESTIMACIÓN DE LAS FUNCIONES Nº de funciones y significatividad:  N max = min (p, g-1)

 p =nº de variables usadas g =nº de grupos

Relevancia de las funciones: se comprueba con la conjunción Autovalores: λi= SCEG/SCIG, cuanto mayor es λi más discriminación Porcentaje de varianza: % de V relativo que representa cada función. Correlación canónica: r i = [λi/(1+ λi)]1/2, mide el grado de asociación entre el grupo y la función, cuanto más próximo a 1 mejor asociación.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

ESTIMACIÓN DE LAS FUNCIONES Nº de funciones y significatividad: Se comprueba con los estadísticos: Lambda de Wilks: se tienen valores pequeños cuando hay mucha variabilidad entre grupos y poca dentro de ellos, valores cercanos a 1 indican que la función no logra diferenciar entre grupos.

Chi-cuadrado: mide la discriminación residual. Si p>0,05 no procede seguir estimando funciones discriminantes.

Estandarización de coeficientes: Las puntuaciones se obtienen con los coef. sin estandarizar. Los coef. estandarizados se emplean como referentes de la contribución

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

ESTIMACIÓN DE LAS FUNCIONES Procedimiento secuencial para elegir v. predictoras : Hacia delante (forward): se van incluyendo variables por su  poder discriminante. Hacia atrás (backward): se van eliminando variables. Criterios de selección: Lambda de Wilks: se selecciona la variable con lambda menor La razón F parcial: razón de variabilidad entre y var. intra. Interesan valores elevados. Hay que elegir los valores: F mínimo (F-to enter) para entrar >2, entre 2,5 y 5 F máximo (F-to remove) para salir >2, entre 2,5 y 5

Fmin >Fmax

Para incorporar, F debe ser elevado y α=0,05

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

CAPACIDAD PREDICTIVA Procedimiento para VALORAR la capacidad predictiva: Tabla de clasificación: Se incluyen los casos bien y mal clasificados y en qué grupo. Se determinará una probabilidad “a priori” de asignación a cada uno de los grupos: Para

todos igual

Proporcional Otra

al número de casos en cada grupo.

asignación

El caso se clasifica en el grupo con mayor probabilidad “a posteriori”

El éxito se mide con el porcentaje de casos correctamente clasificados

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

INTERPRETACIÓN 1. DESCRIPCIÓN de las funciones : destacando el poder discriminatorio de las variables que la forman. •Los coeficientes estandarizados •Las correlaciones •Los valores de F parciales

2. EXAMEN de los centroides : su finalidad es obtener una visión global de las diferencias grupales respecto a las funciones obtenidas.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

ULTIMAS APLICACIONES Patrones de comportamiento (2005): Estudio sobre diferencias entre los patrones de asimilación de CO2, eficiencia fotosintética y crecimiento del Schinus frente a cinco especies nativas de Florida en diferentes condiciones de salinidad: neutra, baja y alta.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

ULTIMAS APLICACIONES

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

ULTIMAS APLICACIONES Patrones de comportamiento (2005): Estudio sobre modelos de gestión de organizaciones culturales mediante medidas de los valores del individuo sobre tres ejes: economía-práctica; creatividad-emocional y creatividad ética-social.

ética

economía

Control de procesos (2005): Programa informático para el comprobar si el proceso está o no bajo control, entrando múltiples variables físicas y tratamiento estadístico de éstas, incluido el AD.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

ULTIMAS APLICACIONES Tipología estructural (2005):  Asignación de parcelas forestales a diferentes tipologías estructurales de los hayedos burgaleses, atendiendo a variables dasométricas y medidas de la biodiversidad de las parcelas, con un 95% de eficiencia en la clasificación.

 NÁLISIS DISCRIMINANTE

Ejemplo 1: Una máquina que admite monedas realiza 3 mediciones de cada moneda  para determinar su valor: peso(X1), espesor(X2) y densidad de estrías en su canto(X3). Los instrumentos de medición de estas variables no son muy  precisos y se ha comprobado en una amplia experimentación con 3 tipos de monedas M1, M2 y M3, que las medidas son N(  , V  )

ANÁLISIS MULTIVARIANTE

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 1: 20 8    8  µ1

19,5  7,8     10  µ2  4 0,8 −5  = 0,8 0,25 − 0,9 −5 − 0,9 9  V-1 =

20,5  8,3     5  µ3

Clasificar la moneda de medidas (22; 8,5;7)´   Aparentemente está más próxima a M3  Pero podría ser M1

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 1:

Funciones discriminantes: Z1 = ( 1 − 3 )′ − = 1,77x1 − 3,31x 2 + 0,98x3 Z2 = ( 1 − 2 )′ − = −0,93x1 + 1,74x 2 − 0,56x3 Z3 = ( 2 − 3 )′ − = Z1 − Z2 Z1( 1) =1,77× 20− 3,31×8 + 0,98×8 = 16,71  La media o punto  Z1( 2) = 1,77× 20,5 − 3,31×8,3 + 0,98×5 = 13,65 de corte es 15,17

Z1=1,77x22-3,31x8,5+0,98x7=17,61 > 15,17⇒M1

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 1:

Equivale a calcular D2: − 2 1 ′ D1 = ( − 1 ) ( − 1 ) = 1,84 2 1 − ′ D =( − ) ( − ) = 2,01 2 D32

2

=( −

2

−1 ( − ) = 6,69 ′ ) 3 3

D12 es la menor ⇒ clasificamos en M1

La moneda que queremos clasificar tiene mucho peso y espesor (∈M3) entonces la densidad de las estrías debía ser  bajo

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 1:

 Hemos clasificado la moneda en M1 y no en M3 como pensamos al principio. Para explicarlo estudiamos la matriz de correlaciones entre coeficientes estandarizados.

0,8 − 0,83  1 1 =  0,8 − 0,6  − 0,83 − 0,6 1 

La moneda que queremos clasificar tiene mucho peso y espesor (∈M3) entonces la densidad de estrías debía ser bajo (correlación negativa). Sin embargo es alto, valor compatible con una moneda M1 sucia (la suciedad aumenta peso y espesor)

 NÁLISIS DISCRIMINANTE

Ejemplo 2: Se tienen 360 observaciones de distintas zonas de la costa, que se han clasificado, atendiendo al  grado de salinidad y contaminantes, en aguas no degradadas (1), algo degradadas (2) y muy degradadas (3). Vamos determinar si la presencia de determinados organismos nos  permite asignar el ecosistema marino a alguno de estos grados.

ANÁLISIS MULTIVARIANTE

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 2: Las variables que se consideran en la obtención de las funciones discriminantes son:

bivalvos

poliquetos

Nº de sp distintas

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 2: Las variables isópodos/bivalvos y  poliquetos/bivalvos están correlacionadas linealmente.

% poliquetos

% anfipodos

% bivalvos

% isópodos

nº de especies

Resumen estadístico % poliq

% anfip

% bivs

% isóp

nº de sp

--------------------------------------------------------------------------------------------------Nº

360

360

360

360

360

X

5,95833

2,9525

4,37028

1,24028

52,5889

S

1,00765

1,20146

1,1505

0,53954

25,8341

16,9116%

40,6929%

26,3256%

43,5015%

CV

49,1247%

El % de isópodos y nº de especies distintas son los más diferentes en cuanto a medias y desviaciones típicas.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 2: Number of complete cases: 360 Number of groups: 3 Valor % Correlación Función propio Relativo Canonica -----------------------------------------------------------------1 9,36485 83,00 0,95054 2 1,91833 17,00 0,81076 Funciones Wilks Chi g.d.l. P-Valor   Derivadas Lambda -----------------------------------------------------------------------1 0,0330599 1213,7581 6 0,0000 2 0,342661 381,2804 2 0,0000 -------------------------------------------------------------------------

Las dos funciones son discriminantes (f1> f2) Las dos funciones obtienen grupos con medias diferentes

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 2: Stepwise regression: Method: forward selection F-to-enter: 4,0 / F-to-remove: 4,0 Step 0:

0 variables in the model.

Step 1:  Adding variable % isópodos with F-to-enter = 940,328 -------------------------------------------------------------------------------------------------------1 variables in the model. Wilk's lambda = 0,159542 Approximate F = 940,328 with P-value = 0,0000 Step 2: Adding variable nº de especies with F-to-enter = 430,292 --------------------------------------------------------------------------------------------------------2 variables in the model. Wilk's lambda = 0,0466856 Approximate F = 645,813 with P-value = 0,0000 Step 3: Adding variable % bivalvos with F-to-enter = 73,1565 ---------------------------------------------------------------------------------------------------------3 variables in the model. Wilk's lambda = 0,0330599 Approximate F = 532,479 with P-value = 0,0000

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

140

degradaci 1 2 3

Ejemplo 2:

  s   e 110    i   c   e80   p   s   e50   e    d    º20   n

140

degradación 1 2 3

  s   e110    i   c   e 80   p   s   e 50   e    d    º 20   n -10

-10

0

0

0,5

1

1,5

2

2

2,5

4

6

8

% bivalvos

% isópodos 2,5 9,6

degradació 1 2 3

  s8,6   o Si disminuimos la F de    t   e7,6entrada a 2,5 incluimos la   u   q    i    l 6,6variable % de poliquetos con   o =0,0323432 que discrimina   p5,6 un poco menos    % 4,6

degradación 1 2 3

  s 2   o    d   o1,5   p    ó 1   s    i    % 0,5 0

3,6 0

0,5

1

1,5

2

2,5

0

2

4

6

8

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 2: Grupo tamaño Degradación asignada actual grupo 1 2 3 -----------------------------------------------------------------------1 120 119 0 1 ( 99,17%) ( 0,00%) ( 0,83%) 2 120 0 117 3 ( 0,00%) ( 97,50%) ( 2,50%) 3 120 0 2 118 ( 0,00%) ( 1,67%) ( 98,33%) -----------------------------------------------------------------------% de casos correctamente clasificados: 98,33% G Prob. a priori  -----------------------1 0,3333 2 0,3333 3 0,3333 -------------------------

La probabilidad “a priori” es igual para todos los grupos y proporcional al tamaño del grupo

La clasificación más acertada es la de los ecosistemas no degradados

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 2:

Z1= 16,081%biv+36,2747%isop+0,553299nºsp-102,461

Classification Function Coefficients for degradación --------------------------------------------------------------------1 2 3 % bivalvos 16,018 9,24273 12,244 % isópodos 36,2747 11,8938 23,6155 nº de especies 0,553299 0,350885 0,173621 CONSTANT -102,461 -28,5171 -43,9113 ------------------------------------------------------------------------

Z2= 9,24273%biv+11,8938%isop+0,50885nºsp-28,5171 Z3= 12,244%biv+23,6155%isop+0,173621nºsp-43,9113

Clasificamos en el grupo 2 si Z2>Z1 y Z2>Z3

En la f1 todas las variables contribuyen por igual y en f2 la variable de mayor importancia es la diversidad

Coeficientes de la Función Discriminante para degradación Standardized Coefficients ------------------------------------------------------1 2 % bivalvos 0,524842 -0,258276 % isópodos 0,681804 -0,405098 nº de especies 0,456872 0,892658

Unstandardized Coefficients --------------------------------------------------------1 2 % bivalvos 0,887861 -0,436919 % isópodos 3,1549 -1,8745 nº de especies 0,0381303 0,0745006 CONSTANT -9,79838 0,316459

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

Ejemplo 2: Si f2=...>= ρn2 4. Las variables canónicas se obtienen a partir de:

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

VARIABLES CANÓNICAS Det(C12 C22-1 C21-ρi2 C11)=0 Matriz de Covarianzas de y con x

Matriz de Covarianzas de y1 ,...,ym

Matriz de Covarianzas de x1 ,...,xm

Correlaciones canónicas-autovalores

C12 C22-1 C21 ui=ρi2 C11ui Donde (u1i, ...umi ) es el vector canónico. C12 C11-1 C21 vi=ρi2 C22vi D

d (

) es el vector canónico.

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

CONSTRUCCIÓN DE V. C. Una vez obtenidas las dos variables, es posible que esta primera relación entre las 2 v. indicadores explique completamente los dos conjuntos y no exista más relación entre ambas. Si no es así, se puede buscar una 2ª v. Indicadora del  primer conjunto incorrelada con la 1ª y que tenga correlación máxima con otra v. Indicadora del segundo conjunto.

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

CORRELACIÓN CANÓNICA Las correlaciones canónicas representan relaciones de dependencia entre los subespacios generados por los dos conjuntos de variables. Los vectores x* e y* están lo más cerca  posible (es decir, x* es colineal con la  proyección de y* sobre P1 y viceversa.

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

PROPIEDADES DE LAS V. C. Son indicadores de los dos conjuntos de variables que tienen máxima correlación. Los coeficientes de la v. c. son los vectores  propios ligados al mismo valor propio de A y B. Si i’x es una v.c. también - i’x lo es. Las correlaciones canónicas son el cuadrado del coeficiente de correlación entre las dos v. c.

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

PROPIEDADES DE LAS V. C. Las correlaciones canónicas λi2 son invariantes ante transformaciones lineales de las variables. La primera correlación canónica λ12 nunca es menor que el mayor coeficiente de correlación simple al cuadrado, entre una variable de cada conjunto.

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

PROPIEDADES DE LAS V. C. La correlación canónica λi2 es el coeficiente de determinación en una regresión múltiple con respecto a la variable y* y variables explicativas las x (idem para la regresión de x* con las y). Las v. c. son los predictores óptimos en el sentido de minimizar E(||x*-y*||2)

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

CONTRASTES Contrastamos que los dos conjuntos de variables están incorrelados que equivale a decir que todas las correlaciones canónicas son nulas . Bajo las hipótesis de que X e Y siguen distribuciones normales de media 0: r 

H0: V12=0 H1: V12≠0

λ = −m∑log(1 − λ ) ≈ χ , 2  j

2  pq

 j=1

1 m= ny r = min(p,q) 2(p + q + 3)

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

CONTRASTES Podemos contrastar por otra parte que los s 1os coeficientes de la correlación canónica son ≠0 y los restantes nulos. H0: λi>0 i=1,...,s; y λs+1=...= λr  =0 H1: λi>0 i=1,...,s; y al menos un λ j>0 con j=s+1,...,r r 

λ = − m ∑ log(1 − λ ) ≈ χ  j= s +1

2  j

2 (p -s)(q -s)

1 , con m = n 2(p + q + 3)

CORRELACIONES CANÓNICAS

ANÁLISIS MULTIVARIANTE

Ejemplo: Se han medido en 50 poblaciones españolas variables climáticas que se agrupan en variables relacionadas con la pluviometría (conjunto 1) y las relacionadas con las temperaturas (conjunto 2): Conjunto 1: Precipitaciones anuales y número de días de niebla. Conjunto 2: Temperatura media anual y número de días despejados al año. Se comprobó que las variables de cada conjunto estaban incorreladas y se transformaron para obtener normalidad.

CORRELACIONES CANÓNICAS

ANÁLISIS MULTIVARIANTE

Ejemplo: lnR raiz DH T DD

CORRELACIONES CANÓNICAS

ANÁLISIS MULTIVARIANTE

Ejemplo: Correla Correlacion ciones es Canóni Canónicas cas --------------------------------------------------------------------------------------------Nº Valor Correlación Lambda Chi g.d.l. propio Canónica Wilks P-Valor   --------------------------------------------------------------------------------------------1

0,863625

0,929315

0,119216

98,8971

4

0,0000

2

0,12582

0,354711

0,87418

6,25279

1

0,0124

---------------------------------------------------------------------------------------------

Correlación alta Correlaciones significativas

CORRELACIONES CANÓNICAS

ANÁLISIS MULTIVARIANTE

Ejemplo: Coefici Coeficient entes es de las variab variables les del prime primerr grupo grupo para para las las dos dos vvcc vvcc -------------------------------------------------------------------------------------lnR

-0,365702

0,93433

raiz raiz DH

-0,961 -0,961068 068

-0,288 -0,288198 198

Coefici Coeficient entes es de las variabl variables es del segund segundo o grupo grupo para para las vvcc vvcc -------------------------------------------------------------------------------------T

1,06964

0,333641

DD

-0,184722

-1,10514

CORRELACIONES CANÓNICAS

ANÁLISIS MULTIVARIANTE

Ejemplo:

Variable canónica 1

Variable canónica 2

3,2

2,5

2,2

1,5

2   o 1,2   p   u   r 0,2 G

   2   o 0,5   p   u   r -0,5    G

-0,8

-1,5

-1,8

-2,5 -1 6

-0 6

04

14

24

-1 5

-0 5

05

15

25

35

CORRELACIONES CANÓNICAS

ANÁLISIS MULTIVARIANTE

Ejemplo: Las nuevas variables que representan temperatura y pluviometría están muy correlacionadas linealmente según la VC1: -0,365702*lnR - 0,961068*raiz DH=1,06964*T - 0,184722*DD u1

v1

Otra combinación de estas variables correlacionadas más ligeramente es la VC2: 0,93433*lnR - 0,288198*raiz DH=0,333641*T - 1,10514*DD u2

v2

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

RELACIÓN CON OTRAS TÉCNICAS La regresión es un caso particular de las correlaciones canónicas: si cada uno de los conjuntos tiene una sola variable (r 2=λ 2 ) La correlación canónica entre X (v. explicativas) y las G variables yi conduce a los mismos resultados que el análisis discriminante si: si i ∈ grupo i 1 yi =  0 en el resto de casos

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

ANÁLISIS CANÓNICO ASIMÉTRICO El objetivo del estudio es prever cada uno de los componentes de Y mediante las variables X. La correlación canónica no resuelve el problema ya que puede existir alta correlación entre x* e y* y baja entre cada y con las x*. Construyendo q ecuaciones distintas de regresión. una única α’X que tenga buenas  propiedades para predecir las Y⇒A. C. Asimétrico. Buscando

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

ANÁLISIS CANÓNICO ASIMÉTRICO Si las variables originales están estandarizadas el coeficiente de redundancia se define como: 1 CR ( y / x′α) = α′R yx R xy α q

La medida de la correlación del conjunto de las r combinaciones lineales x’ 1,...,r x’ r es la redundancia total: R ( y / x ) = CR ( y / x′α i ) ≠ R ( x / y)

∑ i =1

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

A. C. ASIMÉTRICO Para encontrar la combinación lineal x’ con máxima correlación con cada variable y i individualmente de manera que la suma de correlaciones al cuadrado entre x’ y las y hay que maximizar ’R xyR yx con la restricción: ’R xx =1 Por tanto,

es el vector propio de la matriz: −1 xx

H = R  R xy R yx

EPENDENCIA ENTRE CONJUNTOS DE VARIABLES

ANÁLISIS MULTIVARIANTE

A. C. ASIMÉTRICO ⌦Como

en A. C. Simétrico podemos buscar una 2ª variable canónica asimétrica, ortogonal a la primera y con máxima correlación con la v. endógena. ⌦Este mismo análisis puede hacerse para explicar las

X con las Y, pero el problema no es simétrico. ⌦R(y/x)

no tiene en cuenta las correlaciones entre las variables y ⇒ no es una medida multivariante de la dependencia entre los conjuntos.

 NÁLISIS DISCRIMINANTE

ANÁLISIS MULTIVARIANTE

ULTIMAS APLICACIONES Ictiología (2004): Estudio sobre asociaciones entre variables de tipo morfológico de las sp. de rayas de Bahía Almejas y la composición de sus dietas.

Ecosistemas (2004): Estudio de relaciones entre el número de Zebrasoma flavescens y las características de los arrecifes de coral de Hawai.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF