Spearman y Pearson
August 10, 2022 | Author: Anonymous | Category: N/A
Short Description
Download Spearman y Pearson...
Description
Correlación, Pearson y Spearman
Introducción La correlación es una medida de la asociación lineal entre dos variables. La correlación fue utilizada por primera vez por Sir Francis Galton, aunque su discípulo Karl Pearson (1857-1936) fue quien estudió en profundidad sus propiedades. Karl Pearson fue profesor de matemáticas aplicadas y mecánica en el “University College of London”, autor de la prueba Chi-Cuadrado y del análisis de componentes principales. Karl Pearson
Charles E. Spearman
La correlación de rangos fue introducida por primera vez por el psicólogo Charles Edward Spearman (1863-1945) en 1904 al intentar construir una teoría de la inteligencia.
1
Fórmulas básicas La correlación mide la relación lineal entre dos variables y su sentido (si es directo o inverso). Cuando la relación es perfectamente lineal dicho coeficiente vale 1 (ó -1). Cuando el coeficiente tiene un valor próximo a cero, o bien no existe relación entre las variables analizadas o bien dicha relación no es lineal. La correlación habitualmente denotada por ρ se puede estimar de dos maneras diferentes: -cuantitativas El coeficiente de correlación de Pearson denotado por r es utilizado cuando ambas variables son siguiendo una distribución normal. - El coeficiente de correlación de Spearman denotado por r s se utiliza cuando alguna de las variables es ordinal o incluso dicotómica o para variables cuantitativas con muestras pequeñas. Ambos coeficientes son adimensionales y se calculan de forma análoga, aunque en el caso del coeficiente de Spearman se utilizan los rangos de los valores en lugar de los valores originales, siendo adecuado para muestras pequeñas puesto que es robusto a la presencia de “outliers” (valores extremos). El coeficiente de correlación de Pearson se obtiene calculando en primer lugar la covarianza entre las variables, que es una medida de asociación con dependencia de las unidades de medida de las variables. Después se divide por el producto de cada una de las desviaciones típicas de ambas variables, resultando una medida de asociación adimensional. Para cada coeficiente obtenido se puede realizar el siguiente el contraste de hipótesis para determinar determinar si el coeficiente es igual a cero: H0 : ρ = 0 H1 : ρ ≠ 0 Mediante estos contrastes se puede establecer aquellos coeficientes que son estadísticamente significativos. Aunque exista una una correlación significativa significativa entre dos variable variables, s, no se debe confundir confundir correlación con causalidad, la relación de causa debe ser determinada mediante el conocimiento del área de estudio.
Correlación de Pearson Se recogen datos experimentales correspondientes a n individuos con información de dos variables Var1 y Var2. Para calcular el coeficiente de correlación r de Pearson entre estas dos variables se necesita calcular previamente la covarianza entre las dos variables y las desviaciones típicas muestrales. Cálculo de la Covarianza Muestral
La covarianza entre dos variables Var1 y Var2 viene dada por: 1 n 2 s xy = ( x i − x ) ( y i − y ) n − 1 i=1 donde xi indica el valor de la variable Var1 para el individuo i, yi indica el valor de la variable Var1 para el
∑
individuo i, x la media de Var1 e – y la media de Var2. Cálculo de las desviaciones desviaciones típicas muestrales
Las desviaciones típicas muestrales sx y s y se calculan a partir de las expresiones siguientes:
s = x
n
1
2
x −x n −1∑ i =1 ( i )
2
n
1
2
∑ (y i − y) n − 1 i =1 siendo sx la desviación típica de la variable Var1 y s y la desviación típica de la variable Var2. sy =
Cálculo del coeficiente de correlación de Pearson
A partir de los coeficientes calculados con anterioridad se calcula el coeficiente de correlación r de Pearson dado por:
s 2xy r = = s s x y Significación del coeficiente de correlación de Pearson
Para realizar el contraste: H0 : ρ = 0 H1 : ρ ≠ 0 se construye el siguiente estadístico de contraste:
t = r
n−2
1 − r 2 que sigue una distribución t-Student con n – 2 grados de libertad.
Correlación de Spearman
El coeficiente de correlación de Spearman es una técnica no paramétrica que se basa en los rangos en vez de en los valores originales de la variable. Cálculo de Rangos
Para los datos de las variables Var1 y Var2 se calculan los rangos de los valores de éstas, a los que se denota por: Ri (Var1) y Ri (Var2), siendo Ri (Var1) los rangos de Var1 asociados al individuo i y Ri (Var2) los rangos de Var2 asociados al individuo i. Cálculo de valores intermedios
A continuación, se realizan los siguientes cálculos intermedio intermedios: s: n
2
i D =∑ 1) − R i ( Var 2)) i =1 (R (Var
Tx =
∑ (n º empates
3
− n º empates )
3
− n º empates )
empates en Var1
Ty =
∑ (n º empates
empates en Var2
A=
n 3 − n − Tx 12 n − n − Ty 3
B=
12
Cálculo del coeficiente de correlación de Spearman
A partir de los coeficientes calculados con anterioridad, se calcula el coeficiente de correlación rs de Spearman dado por:
3
r =
A + B − D
2 AB Se puede demostrar que si se calcula el coeficiente de correlación de Pearson sobre las variables Ri (Var1) y Ri (Var2) se llega al mismo resultado. Significación del coeficiente de correlación de Spearman
Para realizar el contraste: H0 : ρ = 0 H1 : ρ ≠ 0 se construye el siguiente estadístico de contraste:
n−2
t = r s
1 − r s2 que sigue una distribución t-Student con n - 2 grados de libertad.
4
Ejemplo
Correlación de Pearson Se tienen los siguientes datos experimentales, correspondientes a 12 individuos de los que se ha recogido información de dos variables Var1 y Var2: Var2 76 80 92 67 69 70 75 86 87 102 98 67 Calcular el coeficiente de correlación de Pearson.
Var1 72 70 68 86 89 85 70 68 70 70 68 80
Cálculo de la Covarianza Muestral
Para calcular el coeficiente de correlación r de Pearson se necesita calcular previamente la covarianza entre las dos variables que viene dado por: n
1
∑ ( x i − x )(y i − y ) n − 1 i=1 donde xi indica el valor de la variable Var1 para el individuo i, yi indica el valor de la variable Var1 para el s
2 xy
=
individuo i, x la media de Var1 e y la media de Var2. Para los datos del ejemplo:
x= y= s
2 xy
=
n
1
n
1
∑x
n
i
= 74.6667
i =1 n
1
y = 80.7500
i =1 n∑
i
∑ (x − x )(y
n −1
i
i
− y ) = − 74.4545
i =1
Cálculo de las desviaciones desviaciones típicas muestrales
Las desviaciones típicas muestrales sx y s y se calculan a partir de las expresiones siguientes:
sx =
n
1
∑ (x n −1
2
i
− x ) = 63.3333 = 7.9582
i =1
sy =
1
n
∑ (y n −1
2
i
− y ) = 148.2045 = 12.1739
i =1
siendo sx la desviación típica de la variable Var1 y s y la desviación típica de la variable Var2.
5
Cálculo del coeficiente de correlación de Pearson
A partir de los coeficientes calculados con anterioridad se calcula el coeficiente de correlación r de Pearson dado por:
r =
s 2xy s xs y
=
− 74.4545 = −0,7685 7.9582 ⋅12.1739
Significación del coeficiente de correlación de Pearson
Para realizar el contraste: H0 : ρ = 0 H1 : ρ ≠ 0 Se construye el siguiente estadístico de contraste:
n−2
= −3.7981 1 − r 2 que sigue una distribución t-Student con n - 2 = 10 grados de libertad y que tiene asociado un p-valor de 0.0035. t = r
Correlación de Spearman Se tienen los datos experimentales del ejemplo anterior, calcular el coeficiente de correlación de Spearman. Cálculo de Rangos
Para los datos de las variables Var1 y Var2 se calculan los rangos de los valores de éstas a los que se denota por: Ri (Var1) y Ri (Var2), siendo Ri (Var1) los rangos de la Var1 asociados al individuo i y Ri (Var2) los rangos de la Var2 asociados al individuo i, de forma que: Var2 76 80 92 67 69 70 75 86 87 102 98 67
Var1 72 70 68 86 89 85 70 68 70 70 68 80
Ri ( (V Var2) 6 7 10 1.5 3 4 5 8 9 12 11 1.5
Ri (Var1) 8 5.5 2 11 12 10 5.5 2 5.5 5.5 2 9
Cálculo de valores intermedios
A continuación se realizan los siguientes cálculos intermedios: intermedios: n
2
D = ∑ (R i (Var 1) − R i ( Var 2)) = 505 .5 i =1
3
3
Tx = empates n º empates − n º empates ) = (2 − 2 ) = 6 ∑en(Var1
6
Ty =
∑ (n º empates
3
) = (3 − 3) + (4 − 4) = 84 − n º empates
3
3
empates en Var2
A=
B=
n 3 − n − Tx 12 3 n − n − Ty
12
= 142.50 = 136.00
Cálculo del coeficiente de correlación de Spearman
A partir de los coeficientes calculados con anterioridad se calcula el coeficiente de correlación rs de Spearman dado por: A +B− D r = = −0.8153 2 AB Significación del coeficiente de correlación de Spearman
Para realizar el contraste: H0 : ρ = 0 H1 : ρ ≠ 0 se construye el siguiente estadístico de contraste:
t = r s
n−2
1 − r s2
= −4.4526
que sigue una distribución t-Student con n – 2 = 10 grados de libertad y que tiene asociado un p-valor de 0.0012.
7
View more...
Comments