Spearman y Pearson

August 10, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Spearman y Pearson...

Description

 

Correlación, Pearson y Spearman

Introducción La correlación es una medida de la asociación lineal entre dos variables. La correlación fue utilizada por primera vez por Sir Francis Galton, aunque su discípulo Karl Pearson (1857-1936) fue quien estudió en profundidad sus propiedades. Karl Pearson fue profesor de matemáticas aplicadas y mecánica en el “University College of London”, autor de la prueba Chi-Cuadrado y del análisis de componentes principales. Karl Pearson

Charles E. Spearman

La correlación de rangos fue introducida por primera vez por el psicólogo Charles Edward Spearman (1863-1945) en 1904 al intentar construir una teoría de la inteligencia.

1

 

Fórmulas básicas La correlación mide la relación lineal entre dos variables y su sentido (si es directo o inverso). Cuando la relación es perfectamente lineal dicho coeficiente vale 1 (ó -1). Cuando el coeficiente tiene un valor próximo a cero, o bien no existe relación entre las variables analizadas o bien dicha relación no es lineal. La correlación habitualmente denotada por ρ  se puede estimar de dos maneras diferentes: -cuantitativas El coeficiente de correlación de Pearson denotado por r es utilizado cuando ambas variables son siguiendo una distribución normal. - El coeficiente de correlación de Spearman denotado por r s se utiliza cuando alguna de las variables es ordinal o incluso dicotómica o para variables cuantitativas con muestras pequeñas. Ambos coeficientes son adimensionales y se calculan de forma análoga, aunque en el caso del coeficiente de Spearman se utilizan los rangos de los valores en lugar de los valores originales, siendo adecuado para muestras pequeñas puesto que es robusto a la presencia de “outliers” (valores extremos). El coeficiente de correlación de Pearson se obtiene calculando en primer lugar la covarianza entre las variables, que es una medida de asociación con dependencia de las unidades de medida de las variables. Después se divide por el producto de cada una de las desviaciones típicas de ambas variables, resultando una medida de asociación adimensional. Para cada coeficiente obtenido se puede realizar el siguiente el contraste de hipótesis para determinar determinar si el coeficiente es igual a cero: H0 : ρ  = 0 H1 : ρ  ≠  0 Mediante estos contrastes se puede establecer aquellos coeficientes que son estadísticamente significativos. Aunque exista una una correlación significativa significativa entre dos variable variables, s, no se debe confundir confundir correlación con causalidad, la relación de causa debe ser determinada mediante el conocimiento del área de estudio.

Correlación de Pearson Se recogen datos experimentales correspondientes a n individuos con información de dos variables Var1  y Var2. Para calcular el coeficiente de correlación r de Pearson entre estas dos variables se necesita calcular previamente la covarianza entre las dos variables y las desviaciones típicas muestrales. Cálculo de la Covarianza Muestral

La covarianza entre dos variables Var1 y Var2 viene dada por: 1 n 2 s xy = ( x i − x ) ( y i − y ) n − 1 i=1 donde xi  indica el valor de la variable Var1 para el individuo i, yi  indica el valor de la variable Var1 para el



individuo i, x  la media de Var1 e – y  la media de Var2. Cálculo de las desviaciones desviaciones típicas muestrales

Las desviaciones típicas muestrales sx y s y se calculan a partir de las expresiones siguientes:

s = x

n

1

2

  x −x n −1∑ i =1 ( i )

2

 

n

1

2

  ∑ (y i − y) n − 1 i =1 siendo sx la desviación típica de la variable Var1 y s y la desviación típica de la variable Var2. sy =

Cálculo del coeficiente de correlación de Pearson

A partir de los coeficientes calculados con anterioridad se calcula el coeficiente de correlación r de Pearson dado por:

s 2xy r  =  = s s x y Significación del coeficiente de correlación de Pearson

Para realizar el contraste: H0 : ρ  = 0 H1 : ρ  ≠  0 se construye el siguiente estadístico de contraste:

t = r 

n−2

1 − r 2 que sigue una distribución t-Student con n – 2 grados de libertad.

Correlación de Spearman

El coeficiente de correlación de Spearman es una técnica no paramétrica que se basa en los rangos en vez de en los valores originales de la variable. Cálculo de Rangos

Para los datos de las variables Var1 y Var2 se calculan los rangos de los valores de éstas, a los que se denota por: Ri (Var1) y Ri (Var2), siendo Ri (Var1) los rangos de Var1 asociados al individuo i y Ri (Var2) los rangos de Var2 asociados al individuo i. Cálculo de valores intermedios

A continuación, se realizan los siguientes cálculos intermedio intermedios: s: n

2

i D =∑ 1) −  R i ( Var 2)) i =1 (R  (Var 

Tx =

    ∑ (n º empates

3

− n º empates )

3

− n º empates )

empates en Var1

Ty =

    ∑ (n º empates

empates en Var2

A=

n 3 −  n − Tx 12 n −  n − Ty 3

B=

12

Cálculo del coeficiente de correlación de Spearman

A partir de los coeficientes calculados con anterioridad, se calcula el coeficiente de correlación rs  de Spearman dado por:

3

 

r  =

A  + B − D

2 AB Se puede demostrar que si se calcula el coeficiente de correlación de Pearson sobre las variables Ri (Var1) y Ri (Var2) se llega al mismo resultado. Significación del coeficiente de correlación de Spearman

Para realizar el contraste: H0 : ρ  = 0 H1 : ρ  ≠  0 se construye el siguiente estadístico de contraste:

n−2

t = r s

1 − r s2 que sigue una distribución t-Student con n - 2 grados de libertad.

4

 

  Ejemplo

Correlación de Pearson Se tienen los siguientes datos experimentales, correspondientes a 12 individuos de los que se ha recogido información de dos variables Var1 y Var2: Var2 76 80 92 67 69 70 75 86 87 102 98 67 Calcular el coeficiente de correlación de Pearson.

Var1 72 70 68 86 89 85 70 68 70 70 68 80

Cálculo de la Covarianza Muestral

Para calcular el coeficiente de correlación r de Pearson se necesita calcular previamente la covarianza entre las dos variables que viene dado por: n

1

∑ ( x i − x )(y i − y ) n − 1 i=1 donde xi  indica el valor de la variable Var1 para el individuo i, yi  indica el valor de la variable Var1 para el s

2 xy

=

individuo i, x  la media de Var1 e y  la media de Var2. Para los datos del ejemplo:

x= y= s

2 xy

=

n

1

n

1

∑x

n

i

=  74.6667

i =1 n

1

y =  80.7500

i =1 n∑

i

  ∑ (x   − x )(y

n −1

i

i

− y ) = − 74.4545

i =1

Cálculo de las desviaciones desviaciones típicas muestrales

Las desviaciones típicas muestrales sx y s y se calculan a partir de las expresiones siguientes:

sx =

n

1

  ∑ (x n −1

2

i

−  x ) = 63.3333 = 7.9582  

i =1

sy =

1

n

  ∑ (y n −1

2

i

  −  y ) = 148.2045 = 12.1739

i =1

siendo sx la desviación típica de la variable Var1 y s y la desviación típica de la variable Var2.

5

 

Cálculo del coeficiente de correlación de Pearson

A partir de los coeficientes calculados con anterioridad se calcula el coeficiente de correlación r de Pearson dado por:

r  =

s 2xy s xs y

=

− 74.4545 = −0,7685 7.9582 ⋅12.1739

Significación del coeficiente de correlación de Pearson

Para realizar el contraste: H0 : ρ  = 0 H1 : ρ  ≠  0 Se construye el siguiente estadístico de contraste:

n−2

=   −3.7981 1 − r 2 que sigue una distribución t-Student con n - 2 = 10 grados de libertad y que tiene asociado un p-valor de 0.0035. t = r 

Correlación de Spearman Se tienen los datos experimentales del ejemplo anterior, calcular el coeficiente de correlación de Spearman. Cálculo de Rangos

Para los datos de las variables Var1 y Var2 se calculan los rangos de los valores de éstas a los que se denota por: Ri (Var1) y Ri (Var2), siendo Ri (Var1) los rangos de la Var1 asociados al individuo i y Ri (Var2) los rangos de la Var2 asociados al individuo i, de forma que: Var2 76 80 92 67 69 70 75 86 87 102 98 67

Var1 72 70 68 86 89 85 70 68 70 70 68 80

Ri  (  (V Var2) 6 7 10 1.5 3 4 5 8 9 12 11 1.5

Ri  (Var1) 8 5.5 2 11 12 10 5.5 2 5.5 5.5 2 9

Cálculo de valores intermedios

A continuación se realizan los siguientes cálculos intermedios: intermedios: n

2

D = ∑ (R i (Var 1) − R   i ( Var 2)) = 505   .5 i =1

  3

3

Tx = empates n º empates −   n º empates ) = (2 − 2 ) =  6   ∑en(Var1

6

 

Ty =

  ∑ (n º empates

3

) = (3 − 3) + (4 − 4) =  84 − n º empates    

3

3

empates en Var2

A=

B=

n 3 −  n − Tx 12 3 n −  n − Ty

12

= 142.50 = 136.00

Cálculo del coeficiente de correlación de Spearman

A partir de los coeficientes calculados con anterioridad se calcula el coeficiente de correlación rs  de Spearman dado por: A +B− D r  =   = −0.8153 2 AB Significación del coeficiente de correlación de Spearman

Para realizar el contraste: H0 : ρ  = 0 H1 : ρ  ≠  0 se construye el siguiente estadístico de contraste:

t = r s

n−2

 

1 − r s2

= −4.4526

que sigue una distribución t-Student con n – 2 = 10 grados de libertad y que tiene asociado un p-valor de 0.0012.

7

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF