Ejercicios de Regresion Lineal

Share Embed Donate


Short Description

Download Ejercicios de Regresion Lineal...

Description

Capítulo V Capítulo Anális is d e regresión regresión y cor corrrelación l ineal

Introducción

En el capítulo anterior se vio que es mu y frecuen frecuen te encontrar variables que están relac relacionadas ionadas o asociadas entre sí; por ej ejemp emp lo, las las calif cal ific icaci aciones ones d e los estud iantes están r elac elacionadas ionadas con el tiempo que d edican al estud io, el el gasto familiar familiar está relacionad relacionad o con el ingreso fam ili iliar, ar, etc. Existen muchas variables, en especial cuantitativas, que se relacionan relac ionan en algú n grad o con otras; entonces, es posible que un a de las variables variables pu eda expresarse matemáticamente en función de la otra. Frec Frecuentem uentem ente se nos formu formu lan las siguientes siguientes pr eguntas: ¿Ell peso d e las person as está relacionado con la estatu ra? ¿El ¿E ¿El tiempo de servicio de trabajo activo tiene relación con la edad? ¿El ingreso o salario está relacionad relacionad o con el n ivel edu cati cativo? vo? ¿El ¿El ahorro familiar tiene relación relación con los ingresos? ¿L ¿Laa d eman da de u n prod ucto dep enderá d e los precios?, precios?, etc etc.. Estadísticamen Estadístic amen te nos interesa an alizar la relaci relación ón entr e dos o más var iable iables, s, siemp siemp re que se tenga u n ind ic icio io de que entre ellas existe exi ste por lo menos ci cierto erto grad o d e dep enden ci ciaa o asociación. asociación. Lo Lo imp ortante es med ir y expresar funcionalmente esta relación relación mediante un a función o modelo matemático. En el presente capítulo estud iaremos el análisis de regresión entre dos var iable iabless  X  e Y , y el grado d e relación relación entre ellas mediante el análisis de correlación. correlación.

[233]

05_cap5.p65

233

233

31/03/2006, 02:48 p.m.

Análisis de regresión lineal simple

Si se trata de p redecir o explicar explicar el comp comp ortam iento de u na var iable Y , a la la que se den omina d epend iente o variable variable respuesta, en función ci ón d e otra variable  X  denominada independiente o regresora, regresora, Y  =f(  X ), estamos frente a u n p roblema d e análisis análisis de regr esión lineal simp simp le; pero si d eseamos investigar el grad o d e asociaci asociación ón entre las var iables  X  e Y  estamos frente frente a u n p roble roblema ma de an áli álisis sis de correlación.  Diagrama de dispersión

¿Cómo encontrar la relación ¿Cómo relación en tre  X  e Y  ? Una de las formas gráficas fi cas más sencillas sencillas es es realizand realizand o el diagrama de d ispersión, denominado también diagrama diagrama de nu be de puntos. Este tipo tipo de gráfic gráficoo se u tili tiliza za p ara visu alizar la relación relación entre las variables variables y, a partir de d ic icha ha relación, relación, observar en qu é med ida se mantiene el incremento incremento o d isminución de u na variable a partir del aum ento de otra variable. variable. Para su construcci construcción, ón, se trazan en el plano cartesi cartesiano ano los ejes ejes de la abscisa abscisa ( X ) y de la ordenada ( Y  ). En el e je  X  se colocan los valores de u na d e las variables y, en el eje eje Y  , los valores de la otra variable. En la intersección intersección correspond iente a cada v alor de  X  y a cada ca da v alo alorr d e Y  se coloc colocaa un pu nto, y así tend remos la nu be de puntos. Mostrarem os a continu continu aci ación ón algunas formas qu e adqu iere el diagrama d e dispersión. dispersión. Figur Fi gur a 1. Diagramas d e dispersión Y  Y 

.. .

. . Y

.

. . .. .

. . . . .

.  X 

= a + bX bX  

Y

a ) Re la ci ció n lin ea ea l p os os it iv iv a

. . . . . . .

= a − bX bX  

 X 

b ) Re la ci ció n lin ea ea l n eg eg at at iv iv a

234

05_cap5.p65

234

31/03/2006, 02:48 p.m.

Análisis de regresión lineal simple

Si se trata de p redecir o explicar explicar el comp comp ortam iento de u na var iable Y , a la la que se den omina d epend iente o variable variable respuesta, en función ci ón d e otra variable  X  denominada independiente o regresora, regresora, Y  =f(  X ), estamos frente a u n p roblema d e análisis análisis de regr esión lineal simp simp le; pero si d eseamos investigar el grad o d e asociaci asociación ón entre las var iables  X  e Y  estamos frente frente a u n p roble roblema ma de an áli álisis sis de correlación.  Diagrama de dispersión

¿Cómo encontrar la relación ¿Cómo relación en tre  X  e Y  ? Una de las formas gráficas fi cas más sencillas sencillas es es realizand realizand o el diagrama de d ispersión, denominado también diagrama diagrama de nu be de puntos. Este tipo tipo de gráfic gráficoo se u tili tiliza za p ara visu alizar la relación relación entre las variables variables y, a partir de d ic icha ha relación, relación, observar en qu é med ida se mantiene el incremento incremento o d isminución de u na variable a partir del aum ento de otra variable. variable. Para su construcci construcción, ón, se trazan en el plano cartesi cartesiano ano los ejes ejes de la abscisa abscisa ( X ) y de la ordenada ( Y  ). En el e je  X  se colocan los valores de u na d e las variables y, en el eje eje Y  , los valores de la otra variable. En la intersección intersección correspond iente a cada v alor de  X  y a cada ca da v alo alorr d e Y  se coloc colocaa un pu nto, y así tend remos la nu be de puntos. Mostrarem os a continu continu aci ación ón algunas formas qu e adqu iere el diagrama d e dispersión. dispersión. Figur Fi gur a 1. Diagramas d e dispersión Y  Y 

.. .

. . Y

.

. . .. .

. . . . .

.  X 

= a + bX bX  

Y

a ) Re la ci ció n lin ea ea l p os os it iv iv a

. . . . . . .

= a − bX bX  

 X 

b ) Re la ci ció n lin ea ea l n eg eg at at iv iv a

234

05_cap5.p65

234

31/03/2006, 02:48 p.m.





. . . .. . . . . . . . . . . ... . . . . . . ..

. . .. . .. . . . . .. .  X 

Y

=

a

 X 

Y

c) N o h ay ay r e la ció n lin ea ea l entre  X  e Y 

= a + bX b X + cX  

2

d ) Re la ció n n o lin ea ea l

Como se puede ver en el gráfico (a), los valores de Y  se incrementan linealmente conforme  X  crece, es d ecir, el conjun conjun to de da tos se pu ede representar p or una línea recta recta ascend ascend ente. Por ejemp ej emp lo, al aumentar la partid a presu pu estal asignada p or el gobierno a un colegio, colegio, aum enta la posibili posibilidad dad de atend er una m ayor dem and a esc escolar. olar. Es diferente en el gráfico gráfico (b), (b), porqu e cuand o los valores de  X  crecen, los valores d e Y  decrece decrecen, n, es d eci ecir, r, el conjunto conjunto d e d atos se pu ede representar p or un a línea línea recta descenden descenden te. Así, por ejemejemplo, cuand cuand o aum enta el número d e horas semanales semanales que los estud iantes ded ic ican an a las distracciones, distracciones, su rend imiento académico disminuye. En el gráfico gráfico (c) (c) no h ay ningu na r elac elación ión entre  X  e Y  ; m ientras qu e el gráfico (d) mu estra un a relación relación de tipo curv ilí ilínea nea entre Así, por ejemp ejemp lo, cuand o los estud estud iantes ded ic ican an d iaria X  e Y  . Así, mente un mayor nú mero d e horas a ver programas d e televi televisió sión, n, disminu ye su r endim iento académico en en el colegio. colegio. Como se observa en los diagram as de d ispersión, el el término lineal li neal emp leado se refiere al tipo tipo de r elac elación ión entre  X  e Y  . Una vez visu alizada la relación, relación, los los diagram as de d ispersión no son sufic suficientes ientes para d eterminar el grad o d e la relación relación entre las variables, por lo que debem os utilizar procedimiento s estadísticos estadísticos para d eterminar el mod elo mas ap ropiado qu e exprese exprese el comportamiento del conjun conjun to de datos ( xi , yi ) .

235

05_cap5.p65

235

31/03/2006, 02:48 p.m.

 Ajust e de una función d e regresión:  Método de mínimos cuadrados

Ajustar un a fun ción d e regresión significa encontrar, la función que exprese con mayor precisión la relación entre las variables  X  e Y  . Gráficamente será aqu ella función qu e mejor se adecue a la nube de p un tos. En este sentido, es recomend able como p rimer paso construir el diagrama d e dispersión o diagrama d e nube de pu ntos para, luego de analizar su forma, decidir por el tipo de función matem ática (mod elo) o la ecuación d e regresión que expr ese la relación entre las variables  X  e Y  . Luego, se estiman los parám etros del mod elo, par a lo cual existen varios m étodos, siendo el más usad o el método d e mínimos cuad rados. Intentamos describir la dep endencia de u na variable Y  sobre un a variable indep end iente  X  . Emplearemos la ecuación d e regresión a fin de ap oyar la hipótesis que p ostula la posible causalidad de los cambios de Y  med iante los cambios en  X  ; para prop ósitos de p redicción d e Y  en función d e  X  ; y para pr opósitos de explicación d e parte d e la variación de Y  por  X  utilizand o la última variable como control estadístico. Los estudios de los efectos de la temp eratur a en el rend imiento académico, el contenido de nitrógeno en el suelo sobre la tasa de crecimiento de u na p lanta, la edad de un estudiante sobre su presión sangu ínea, la dosis de u n insecticida sobre la mortalidad de u na p oblación de insectos, el núm ero de horas d e estud io sobre el rendimiento académ ico, son ejemp los típicos de regresión para los p ropósitos señalados. Sup ondremos qu e el diagrama de d ispersión sugiere que la relación entre las dos variables se pued e expresar m ediante u na recta L: Y = a + bX  . El métod o de mínimos cuad rad os garantiza que la recta que representa el comportam iento del conjunto de d atos es la recta L, donde la su ma d e los cuad rad os de las d iferencias de las ordenadas  yi de los pun tos observados (  xi , yi ), y de las ˆ ) que están en la ordenadas ˆyi = ˆa+ ˆbx de los puntos ( xi , aˆ + bx i recta L, sea mínim o. Esto es, se trata d e obtener los valores d e a y b de tal manera que el valor de la suma d e cuad rados d e los residu os, SSE, sea mínim o. Es d ecir: 2

n

SSE

= ∑ ( yi − yˆi )

sea mínimo,

(5.1)

i =1

236

05_cap5.p65

236

31/03/2006, 02:48 p.m.

donde:  yi : son los valores observados de la variable dependiente Y  ,  yˆ i : son los valores estimad os de Y  ,

b : es la pen dien te de la recta, llamad a tamb ién coeficiente de

regresión, para p redecir la variable Y  , a : es la constante o intercepto Entonces la ecuación d e regresión estimada se expresa como:

ˆ   Yˆ = aˆ + bX Y 

recta de regresión para predecir Y  .

......................................... . . . . 10 . .  X 

0 0 5 10 15 20 25 30

Según el método de m ínimos cuad rados, se demuestra que aˆ ˆ y b valores de a y b que hacen mínima la SSE , satisfacen el denom inado sistema de ecuaciones normales: n

n

n

∑ y = an+ b∑ x i

n

∑ x y = a∑ x + b∑ x .

i

i =1

n

i

i =1

i =1

i

2 i

i

i =1

i =1

(5.2)

Resolviendo el sistema se ded ucen los siguientes valores para las constantes a y b , denominad os valores estimad os de los coeficientes d e regresión: n

aˆ =

n

∑ ∑ yi

i =1

xi2 −

i =1

n

n

∑ ∑xy xi

i =1

i

i =1 2

 n   n∑ xi2 −  ∑ xi   i =1  i =1   n

i

= Y − bX

 

(5.3)

237

05_cap5.p65

237

31/03/2006, 02:48 p.m.

n

n bˆ =



xi yi

i =1

n

i =1

i =1

2

∑ x −  ∑ x     n

n

n

− ∑ xi ∑ yi n

2 i

i =1

,

(5.4)

i

i =1

La recta de regresión nos p ermite, basándon os en los datos de la muestra, estimar u n valor d e la variable Y  —que denotaremos con  yˆ i — correspondiente a un valor dado  xi de la variable  X  . Para ello es suficiente reemplazar el valor de  xi en la recta de regresión y encontraremos el correspond iente valor estimad o  yˆ i . Ejemplo 1

Con los datos d e la tabla 1, correspond iente al rendimiento académico en el nivel superior ( Y  ) y al rendim iento académico en el nivel secun dar io ( X  ) de 8 estud iantes: a) Construirem os el diagram a de dispersión. b) Aplicaremos el método d e mínimos cuadrad os para encontrar los coeficientes de regresión lineal. c) Averiguarem os: ¿Cuál será el rendimiento en ed ucación su perior de un estudiante con nota prom edio de 12 en la educación secundaria? Tabla 1: Rendimiento académico en secundaria y en educación superior de un grupo de alumnos Estudiantes  X 1 16 2 13 3 15 4 12 5 11 6 16 7 13 8 10



15 11 17 14 11 14 15 12

Solución

a) Usand o los coma nd o del SPSS pr esentad os en el cap ítulo VII, se obtiene el diagrama d e dispersión pr esentado en la figur a 2. También presentam os los cálculos para encontrar los valores aˆ y

238

05_cap5.p65

238

31/03/2006, 02:48 p.m.



de la ecuación de regresión estimada p or el método de mínim os cuadrados. Figura 2

Diagram a de dispersión de rendimiento en secun daria y rendimiento en educación superior 17     a       i     r     a       d 1 5     n     u     c     e     s     n     e 1 3     o      t     n     e       i     m       i       d     n 11     e       R

9 10

12

14

16

18

Rendimiento en educación superior

El diagram a de disper sión nos sugiere que los datos se pueden r epresentar m ediante una recta Y = a + bX  . b) Cálculos n ecesarios par a estimar los coeficientes d e regresión y u sando el método de mínimos cuadrados  xi 16 13 15 12 11 16 13 10 Total 106

8

8

∑ ∑ yi

aˆ =

i =1

8

2

xi

i =1

n

∑x

2 i

i =1

 xi

15 11 17 14 11 14 15 12 109

256 169 225 144 121 256 169 100 1440

 x i y i

240 143 255 168 121 224 195 120 1466

8

− ∑ xi ∑ xi yi i =1

8

2

 yi

i =1 2

−  ∑ xi      i =   8

=

109 ×1440 −106 ×1466 8 ×1440 − (106 )

2

= 5,51

1

239

05_cap5.p65

239

31/03/2006, 02:48 p.m.

n

n bˆ =

n

n

∑x y −∑x ∑ y i

i

i =1

n

n

i

i =1

∑x

2 i

i =1

i

i =1

2

n  −  ∑ xi      i =1  

×1466 −106 ×109 = 0,61 2 8 ×1440 − (106 )

=8

Entonces, la recta d e regresión d e Y  sobre  X  queda expresada como: Yˆ

= 5, 51 + 0, 61X 

Si un estud iante obtiene un r endim iento de 12 en secun dar ia, entonces su rend imiento esperado en ed ucación su perior se obtiene reemplazando  X  por el valor 12 en la recta d efinida, es d ecir: ˆ = 5, 51 + 0, 61 ×12 = 5, 51 + 7, 32 = 12, 83 . Y 

Puede d ecirse que se estima que u n alumn o que tiene un rendimiento de 12 puntos en educación secundaria, en educación superior tendrá un rendimiento de 12,83 pu ntos. Análisis de correlación lineal

Nos p roponemos investigar si dos variables son independ ientes o covarían, esto es, si varían conjun tamen te. No expr esamos u na variable como fu nción de la otra, así como tam poco hacemos d istinción alguna entre variables depend ientes e indep endientes. Puede mu y bien suceder qu e, de u na p areja de variables cuya correlación se estud ia, una sea causa d e la otra, aunqu e nosotros no lo sepamos ni lo sospechem os. Una hip ótesis imp ortant e, aun que no esencial, es que las dos v ariables sean efectos de u na causa comú n y lo qu e se desea conocer es el grad o en el que am bas variables varían conjun tamen te. Así, pod ríamos estar interesad os en la correlación entre las longitud es de las extremidad es sup eriores y extremidades inferiores en un a población d e estudiantes, o entre el peso y la estatura d e un grup o de estud iantes, o entre los días necesarios para la mad urez y el núm ero de semillas en un a siembra. La correlación lineal mid e el grad o d e la asociación lineal entre dos variables denotad as con  X  e Y  . Analizand o el diagram a de d ispersión o nube d e pun tos podemos visualizar el tipo d e correlación lineal entre las variables involucradas.

240

05_cap5.p65

240

31/03/2006, 02:48 p.m.

Figura 3. Tipos de correlación lineal





.. ... ..

. .

...

... . ..

...  X  a) Correlación p ositiva

.. .  X 

b) Correlación negativa



. .. ....... . . . . .. . . . .::: . ........  X  c) Correlación nula Correlación positiva o directa

En la figura 3(a), las variables  X  e Y  están correlacionadas positivamen te o su variación está en razón d irecta; es decir, el aumen to de la med ida de la variable  X  implica el aumento de la med ida de la variable Y  . Ejemplo 2

En la tabla 2 se presentan las pun tuaciones en Literatur a ( X  ) y las pun tuaciones en Lengu aje ( Y ) de un grupo de alumnos de un centro edu cativo. Se observará su relación a través de un d iagram a de dispersión.

241

05_cap5.p65

241

31/03/2006, 02:48 p.m.

Tabla 2: Puntuaciones en Literatura y en Lenguaje de un grupo de alumnos

X

Nº Estudiante 1 2 3 4 5 6 7



5 8 12 16 16 24 28

12 20 30 30 42 40 50

Solución

El diagrama d e dispersión, usand o los comand os del SPSS presentad os en el cap ítulo VII es el sigu iente: Figura 4 Puntuaciones en Literatura y Lenguaje de un grupo de alumnos 60

50

     e       j       a      u      g      n      e       L 40      n      e      s      e      n      o       i      c 30      a      u       t      n      u       P

20

10 0

10

20

30

Puntuaciones en Literatura

Como se pu ede observar, cuand o aum enta el valor d e la variable  X  (pun tuaciones en Literatura) también aum enta el valor de la variable Y  (pun tuaciones en Lenguaje); luego, visualizand o que el tipo de correlación entre las puntuaciones en literatura y lengu aje es positiva. Correlación negat iv a o inversa

Se d ice qu e las variables  X  e Y  están correlacionadas negativamente o su variación está en razón inversa, cuan do el aum ento de

242

05_cap5.p65

242

31/03/2006, 02:48 p.m.

la medid a de la variable  X  imp lica la dism inución de la med ida de la variable Y  , o la dism inución de la med ida d e la variable  X  imp lica el aum ento de la variable Y  , como se p ued e observar en la figur a 3(b). Ejemplo 3

La tabla 3 nos m uestra las pu ntu aciones en Literatura ( X  ) y las pu ntu aciones en Matemática ( Y  ) de un grupo de alumnos de un determ inado centro educativo. Mostrarem os el diagrama d e dispersión. Tabla 3 Puntuaciones en Literatura y en Matemática de un grupo de alumnos Nº Estudiante

 xi

 yi

1 2 3 4 5 6 7 8

10 30 38 40 60 65 80 90

30 15 37 25 35 05 20 10

Solución

El diagrama d e dispersión, usand o los comand os del SPSS presentad os en el cap ítulo VII es el sigu iente: Figura 5 Puntuaciones en Literatura y Matemática de un grupo de alumnos 40

     a      c       i       t 30       á      m      e       t      a       M      n      e 20      s      e      n      o       i      c      a      u       t      n      u 10       P

0 0

20

40

60

80

10 0

Puntuaciones en Literatura

243

05_cap5.p65

243

31/03/2006, 02:48 p.m.

Como se pu ede apreciar, frente al aum ento de las pun tuaciones en literatura ( X  ) disminuyen las pu ntuaciones en Matemática ( Y  ), visualizand o la correlación entr e X  e Y  es negativa o inversa. Correlación nula

En la figu ra 3(c) las var iables no están corr elacionad as entr e sí; es este caso, direm os qu e la correlación entre X  e Y  es nu la; esto lo pod emos observar en el siguiente ejemp lo. Ejemplo 4

En la tabla 4, la variable X  corresponde a las puntuaciones en dep orte y la variable Y  correspond e a las pu ntu aciones en Matemática de un grupo de alumn os. Mostraremos el diagrama de dispersión p ara id entificar el tipo de correlación. Tabla 4: Puntuaciones en deporte y en Matemática de un grupo de alumnos Nº Estudiante 1 2 3 4 5 6 7 8 9 10

 X

02 04 04 08 08 14 14 14 18 18



25 10 35 05 40 05 15 40 20 35

Solución

El diagrama d e dispersión, usand o los comand os del SPSS presentad os en el cap ítulo VII es el sigu iente:

244

05_cap5.p65

244

31/03/2006, 02:48 p.m.

Figura 6 Puntuaciones en deporte y en Matemática de un grupo d e alumnos 50

     a 40      c       i       t       á      m      e       t      a 30       M      n      e      s      e      n      o 20       i      c      a      u       t      n      u       P

10

0 0

10

20

Puntuaciones en deporte

Como se pu ede apr eciar, la correlación entre las pun tuaciones en deporte ( X  ) y las pu ntu aciones en matem ática ( Y  ) es nula. Coeficiente de correlación de Pearson ( r  )

Existen numerosos coeficientes de correlación en Estadística. El más común de ellos es el denom inado coeficiente de correlación prod ucto-momento, cuya form ulación se d ebe a Karl Pearson. El coeficiente de correlación d e Pearson se utiliza en el análisis de información cuantitativa, cuand o se desea med ir el grado d e asociación lineal entre dos variables cuantitativas. Sus valores varían en tre –1 y 1. El valor +1 indica que entre X  e Y  existe una corr elación lineal d irecta y perfecta; el valor –1, un a correlación lineal inversa y perfecta. El valor 0 ind ica au sencia d e correlación lineal. Para obtener este coeficiente hay una gran variedad de expresiones m atemáticas qu e son equivalentes, destacando las siguientes: a) Para puntu aciones directas o datos originales:

∑ x y − (∑ x )(∑ y )  n∑ x − (∑ x )   n∑ y − (∑ y )      n

r  =

2 i

i

i

i

2

i

i

2 i

2

(5.5)

i

245

05_cap5.p65

245

31/03/2006, 02:48 p.m.

b) para pu ntuaciones Z (pu ntuaciones tipificadas): r 

=∑

 Z x Z y S x

,

(5.6)

donde:  Z  x

=  xi

− X 

 Z  y

S x

=  yi

− Y  S y

.

Propiedades

El valor de r se encuen tra entre –1 y +1, de d ond e se ded uce que: a) Si r > 0, existe correlación d irecta o correlación positiva, b) Si r < 0, existe correlación inversa o correlación negativa. En la interpretación clásica del coeficiente de correlación se ded uce, por ejemplo, que si: a) 0 ≤ r  < 0, 20 , la correlación es mu y baja, b) 0, 20 ≤ r  < 0, 40 , existe una correlación baja, c) 0, 40 ≤ r  < 0, 70 , existe una m oderad a correlación positiva, d ) 0, 70 ≤ r  < 1, 00 , existe de m oderad a a bu ena correlación positiva, e) r  = 1, 00 , existe una perfecta correlación p ositiva, f) −1, 0 ≤ r  < −0, 70 , existe de moderada a buena correlación inversa, g) r  = −1, 00 , existe una perfecta correlación inversa. Ejemplo 5

Se desea saber el grado d e relación entre los años de escolarida d d e la madre ( X  ) y las calificaciones d e sus h ijos en u na p rueba de Matemática ( Y  ). Los da tos se presentan en la siguiente tabla. Tabla 5: Años de escolaridad de la madre y calificaciones de sus hijos en una prueba de Matemática Estudiantes 1 2 3 4 5



8 5 3 6 7

Y  12 8 8 10 10

246

05_cap5.p65

246

31/03/2006, 02:48 p.m.

Solución

En la siguiente t abla se p resentan los cálculos auxiliares: Estudiantes 1 2 3 4 5 n= 5

2

2

 xi

 yi

 xi yi

 xi

 yi

8 5 3 6 7 29

12 8 8 10 10 48

96 40 24 60 70 290

64 25 9 36 49 183

144 64 64 100 100 472

Reemplazan do los valores obten idos en la ecuación (5.5) para pu ntu aciones directas obtenemos: r  =

5 (290 ) − (29 )(48 )

5 (183 ) − (29 )  [5](472 ) − (8 )   2

2

=

58 74x56

= 0,9

El valor d el coeficiente d e correlación es 0,9, significa un a alta correlación p ositiva; es decir, el nivel de escolaridad de la m adr e está fuertemente relacionado al rendimiento académico de sus hijos en Matem ática. Ejemplo 6

En la segund a y tercera colum na d e la Tabla 6 se tiene la información sobre coeficientes d e inteligencia y pu nta jes en Matem áticas para u na m uestra aleatoria d e 12 estudiantes que estudiaron el primer año de secundaria en el colegio Cabrera Tapia en el año 2000. Encontr arem os el coeficiente d e correlación d e Pearson . El primer d ía de clases, a tod os ellos se les aplicó un a pr ueba para obtener sus coeficientes de inteligencia ( X  ) en la escala Stanford-Binet y al término d el año se les aplicó un a pr ueba d e 35 ítems para evaluar su rend imiento en Matemática. Solución

 X : pun tajes obtenidos en la pru eba Stanford -Binet Y  : rendimiento en M atemáticas

247

05_cap5.p65

247

31/03/2006, 02:48 p.m.

Tabla 6: Rendimiento de los estudiantes en Matemática y puntajes obtenidos en la pru eba Stanford-Binet

 xi 1 2 3 4 5 6 7 8 9 10 11 12 Tota les

 xi

2

 yi

2

 xi yi

14400 12544 12100 14400 10609 15876 12769 12996 11236 11664 16384 11881 156859

289 225 225 361 144 400 225 289 196 196 361 196 3107

2040 1680 1650 2280 1236 2520 1695 1938 1484 1512 2432 1526 21993

 yi

120 112 110 120 103 126 113 114 106 108 128 109 1369

17 15 15 19 12 20 15 17 14 14 19 14 191

Con la fórm ula (5.5) obtenem os el coeficiente d e correlación de Pearson: r  =

12(21993) − 1369(191)

(12(156859) − (1369 ) ) (12(3107) − (191) ) 2

2

= 0,953

Se observa m uy buena correlación d irecta y p ositiva entre coeficiente de int eligencia y el rend imiento acad émico en el cur so de matemática. Ejemplo 7

En la tabla 7 se tiene informa ción d e un a mu estra aleatoria de 15 alumn os del centro edu cativo Teresa Gonzales de Fanning. Se desea obtener el coeficiente de correlación entr e los pun tajes obtenidos en Aritm ética y Lenguaje para m edir su gr ado d e relación.

248

05_cap5.p65

248

31/03/2006, 02:48 p.m.

Tabla 7: Rendimientos de una muestra de estudiantes del colegio Teresa Gonzales de Fanning, 1998. Es tu d ia n te 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

A r it m ét ica 15 14 13 12 11 13 15 15 16 12 11 8 10 15 13

Le ng u aje 1 15 12 12 10 15 15 16 17 15 12 9 11 14 15

Solución

Se ilustr an los cálculos au xiliares d el coeficiente d e correlación de Pearson con los valores observad os de las variables notas en Aritmética ( X  ) y notas en Lengu aje ( Y ).



i

2

2

Estudiante

 xi

 yi

 xi

 xi yi

 yi

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

15 14 13 12 11 13 15 15 16 12 11 8 10 15 13

16 15 12 12 10 15 15 16 17 15 12 9 11 14 15

225 196 169 144 121 169 225 225 256 144 121 64 100 225 169

240 210 156 144 110 195 225 240 272 180 132 72 110 210 195

256 225 144 144 100 225 225 256 289 225 144 81 121 196 225

x= 193



y= 204

i



x = 2553

2 i

∑x

i

i

y= 2691



y = 2856

2 i

Luego, el coeficiente de correlación entre las nota s d e Aritmética y Lenguaje es:

249

05_cap5.p65

249

31/03/2006, 02:48 p.m.

r  =

15 ( 2691) − 193 (204 ) 2

2

15 (2553 ) − (193 )

15 (2856 ) − (204 )

= 0,878

Se observa u na correlación alta y positiva entre los p un tajes obtenidos en los cursos de Ar itmética y Lengu aje. Ejemplo 8

Para los d atos d el ejemp lo 5, usan do coma nd os del SPSS, se mostrará el diagram a de d ispersión y ajustar á el mod elo de regresión lineal simple. Solución

a) Usando coman dos p resentad os en el capítu lo VII se obtiene el siguiente diagrama de dispersión. Figura 7 Años de escolaridad de la madre y calificaciones de los hijos en una prueba de Matemática 13

12

     a      c       i       t       á      m      e 11       t      a       M      n      e 10      s      e      n      o       i      c      a 9      c       i       f       i       l      a       C

8 7 2

3

4

5

6

7

8

9

Años de escolaridad de la madre

Se observa q ue existe un a relación lineal d irecta y positiva entre los años de escolaridad de la m adr e y las calificaciones en un a pru eba de Matemática que rinden los hijos. b) El siguiente cuad ro, también obtenido a par tir del SPSS, nos prop orciona resultados para encontrar la ecuación d e la recta d e regresión ajustad a por el método de m ínimos cuad rados ord inarios.

250

05_cap5.p65

250

31/03/2006, 02:48 p.m.

Coefficientsa

Standardized

Mode 1

Unstandardized Coefficients B Std. 5,054 1,318

(Constant Años de escolaridad de la madre

,784

,218

Coefficients

Beta ,901

t 3,834

Sig. ,031

3,597

,037

a. Dependent Variable: Calificaciones en u na Prueba de Matemática





La recta d e regresión lineal simple ajustad a por el método d e mínimos cuadrados es: Y ˆ = 5,054 + 0,784  X  ,

dond e nos indica que u n incremento de u n año en los años de escolaridad d e la mad re, incrementará en p romed io 0,784 pu ntos la calificación d e sus hijos en la p ru eba d e matem ática. Ejemplo 9

Usand o la información qu e correspond e a las var iables calificación p romed io y notas en el curso d e álgebra de la base DATOS3educación, se ajusta la recta de regresión usando el método de mínim os cuadr ados. A continuación se presentan el gráfico y las salidas prop orcionad as por el SPSS. Solución

a) Usand o comand os del SPSS se encuentra el siguiente diagrama d e dispersión: Figura 8 Notas d e Álgebra y calificación p romedio d e profesores de educación secundaria

8

10

12

14

16

N otas de Á lgebra

251

05_cap5.p65

251

31/03/2006, 02:48 p.m.

Observ amo s que las notas d e Álgebra y las calificaciones promed io de profesores que p articiparon en el program a de capacitación, tienen u na r elación d irecta o p ositiva. b) El coeficiente de correlación d e Pearson : Model Summary

Adjusted R Square ,852

Std. Error of the Estimate ,52

Model R R S quare a 1 ,925 ,855 a. Predictors: (Constant), NOTAS DE ÁLGE BRA

r  = 0,925 coeficiente d e correla ción lineal.

Se encuentra un a correlación alta y positiva entre las notas de álgebra y las calificaciones p rom edio qu e alcanzaron los profesores que par ticiparon en el progr ama d e capacitación. c) Los coeficientes d e la recta d e regresión : Coefficientsa

M odel 1

U nstand ardized C oefficien ts B S td . E rro r 3 ,8 5 3 ,4 7 7 ,7 0 8 ,0 4 3

(C onstant) N O TA S D E A LG E B R A

S tanda rdi ze d C oefficien ts B eta ,9 2 5

t 1 6,29 9

S ig . ,0 0 0 ,0 0 0

a . D ep en de nt V aria ble : N O TAS P R O M E D IO





con los que se obtiene la ecuación d e la recta de regresión ajustada p or el método de m ínimos cuadrad os: Y ˆ = 3,853 + 0,708 X  ,

dond e vemos que un incremento en la notas de Álgebra de un pu nto, incrementar á la calificación p romed io de los pr ofesores de edu cación secun dar ia, en pr omed io en 0,708 pu ntos.

252

05_cap5.p65

252

31/03/2006, 02:48 p.m.

Análisis de regresión lineal múltiple

La ecuación de regresión lineal simple estudiada en la sección anterior, se pued e generalizar a una ecuación de regresión lineal mú ltiple, cuand o se tenga d os o más variables indep end ientes o regresoras X1 , X2 ,...., Xk  ,  y una variable indep end iente o respuesta Y  . Explicaremos el análisis de regresión lineal múltiple con los da tos del ejemp lo 10, en el que se m uestra n los coeficientes de inteligencia (IQ), los pro med ios de las calificaciones y el tiemp o qu e ded ican al estud io 12 estudiantes. Se desea pr edecir el prom edio de las calificaciones d e estos estud iantes en fu nción de sus coeficientes d e inteligencia y de los tiempos q ue d edican al estud io. Se tienen dos variables regresoras: coeficiente de inteligencia,  X 1 y tiemp o d edicado al estud io, X 2 , para explicar el comportam iento de la variable dep end iente o respu esta Y  : calificación p rom edio de los estudiantes. Para el problema d escrito se postu la la forma general de la ecuación d e regresión lineal mú ltiple: Yˆ

ˆ + cX ˆ 2  = aˆ + bX 1

(5.7)

donde: Y ˆ : valores estimad os de la var iable dependiente o respu esta, aˆ , bˆ , cˆ : coeficiente de regr esión de la ecuacuón de regr esión lineal múltiple,  X 1 ,  X 2 : variables indep endientes o regresoras, Esta ecuación es muy similar a la utilizada en la regresión lineal simp le, excepto qu e agregamos otra variable indep end iente. Para hallar los valores de aˆ , bˆ , cˆ , se toma u na mu estra de los valores (  yi ,  x1i  x2i ) i = 1,..., n , y para cada punto se tiene el sistema de ecuaciones,

yi = a+ bx1i

+

cx2i , donde  yi es el

i-ésimo valor de la variable Y  ,  x1i ,  x2i , los i-ésimos valores de las variables ind epend ientes  X 1 ,  X 2 , . Luego, se usa el métod o

253

05_cap5.p65

253

31/03/2006, 02:48 p.m.

de m ínimos cuadrad os para encontrar los valores aˆ d e a , bˆ d e

b y cˆ d e c , que hacen mínima la suma de cuadrados de los n

error es, es decir, qu e minimizan SSE

2

= ∑ ( yi − yˆi )

.

i =1

Cabe resaltar que el método de m ínimos cuad rados condu ce a un sistema de ecuaciones denominadas ecuaciones normales, a part ir de las cuales, utilizand o conceptos de algebra m atricial se encuentran los estimadores aˆ , bˆ , cˆ de los parámetros a , b , c tema qu e está fuera d e los objetivos del presente libro y que no será abordado aquí. Todos los problemas d e regresión mú ltiple serán resu eltos con el soporte d el SPSS, pu esto qu e en la m ayoría d e las investigaciones el nú mero d e observaciones y el nú mero d e variables es grande, lo que dificulta el trabajo manu al. Ejemplo 10

Para un a mu estra de 12 estud iantes se dispon e de sus coeficientes de inteligencia , tiemp o semanal ded icado al estudio y los promedios d e sus calificaciones . Vamos a ajustar la ecuación de r egresión lineal mú ltiple, la que explique en función de y , usan do el método de m ínimos cuadrados. Promedio de calificaciones, Coeficiente intelectual y Tiempo d edicado al estudio Es tu d ia nt e 1 2 3 4 5 6 7 8 9 10 11 12

IQ

Tiem po d e estu dio

( X 1 )

( X 2 )

110 112 118 119 122 125 127 130 132 134 136 138

8 10 6 13 14 6 13 12 13 11 12 18

Pr om ed io d e calificacion es (Y ) 1,0 1,6 1,2 2,1 2,6 1,8 2,6 2,0 3,2 2,6 3,0 3,6

254

05_cap5.p65

254

31/03/2006, 02:48 p.m.

Solución

Postulam os la ecuación d e regresión Y = a + bX 1 + cX 2  , para estud iar la relación entre Y  y las var iables  X 1 ,  X 2 , donde:  X 1 : Coeficiente intelectual (IQ)  X 2 : Tiempo d e estudio Y  : Prom edio de calificaciones

Usam os las opciones del SPSS: Activar el SPSS y copiar los datos en un archivo de nom bre: COEFICIENTE. En VARIABLE VIEW, definir las sigu ientes v ariables: IQ, TIEMPO y CALIFICA con su s respectivas especificaciones y, en DATA VIEW, colocar los datos de la tabla. Ejecutar ANALYZE/  REGRESSION/ LINEAR/ ingresar en DEPENDENT la variable CALIFICA y en INDEPENDEN T las variables IQ TIEMPO/ OK. El ou tp ut d el SPSS es el sigu iente: Coefficients

Unstandardized ,

,

,

,

aˆ bˆ

cˆ Las estimaciones de los parám etros son:

aˆ = −5,249 , bˆ

=

0,049 cˆ

= 0,118

Luego, la ecuación de regresión lineal mú ltiple ajustad a por el métod o de mínimos cuadrad os es:

255

05_cap5.p65

255

31/03/2006, 02:48 p.m.



= −5, 249 + 0, 049 X 1 + 0,118 X 2

dond e, manteniendo constante la variable tiempo d e estudio, un incremento en el coeficiente intelectual (IQ) de u n p un to, por ejemp lo, es acomp añad o por u n incremento en el promed io de calificaciones de 0,049 pu ntos. En forma sim ilar, manten iend o constante la var iable coeficiente intelectual, un increm ento d e 1 hora en el tiempo d e estudio, es acomp añad o por u n incremento en el promed io de calificaciones d e 0,118 pu ntos . Coeficiente de determinación

El coeficiente de d eterm inación  R 2 , multip licad o por 100, ind ica el porcentaje de la variación de la variable depend iente y que es explicado p or las variaciones d e las variables indep endientes d el modelo. También se dice que m ide la bondad del ajuste o d e la recta de regresión ajustad a por el métod o de mínimos cuad rados. Se pu ede d emostrar que la variabilidad de Y  , expresada p or la sum a de cuadrad os total, SST  =

∑(

 yi

2

− y)

, se pu ede divi-

dir en d os componentes: la sum a d e cuad rados d ebido a la regresión, SSR =

2

∑ ( yˆ − y )

residuos, SSE

i

, y la sum a de cuadr ados debido a los

= ∑ ( yi − yˆ i )

2

. Es d ecir: , do nd e:

SST  : sum a de cuadrad os del total SSR : sum a de cuadrad os debido a la regresión SSE  : suma de cuadrad os debido a los residu os

Por ello, resulta natur al definir el coeficiente de d eterminación como :  R 2

=

SSR

SST  Retomand o nu estro ejemplo en el que la variable dependiente es el promed io de calificaciones de un alum no y la variables inde-

256

05_cap5.p65

256

31/03/2006, 02:48 p.m.

pend ientes, el coeficiente d e inteligencia y el tiempo d edicado al estud io; calcularem os la SST  , SSR , SSE  y el coeficiente d e determinación  R 2, usan d o el SPSS. El outp ut d el SPSS es el sigu iente: ANOVA

Sum of Squares

Model

 R 2

=

SSR SST 

=  R

2

df

,

,

, ,

,

=

6,389 7,022

,

,

= 0,91

El coeficiente d e det erm inación 0,91 significa que el 91% d e las variaciones observad as en la calificación p rom edio d e los alumnos son explicadas por las variaciones del pu ntajes de coeficiente de inteligencia y del tiemp o dedicado al estu dio. El valor 0,09 = 1 – 0,91, llamad o coeficiente de aliena ción, indica que el 9% de las variaciones observadas en la calificación prom edio d e los alumnos no son explicables por las variaciones en los pun tajes del coeficiente de inteligencia y del tiempo d edicado al estud io, sino por otr as variables o factores no considerad os en el modelo. Coeficiente de correlación parcial 

A veces, un a alta correlación entre d os variables cuan titativas se interpreta equ ivocadam ente como un a relación de causa y efecto entre ellas; pero esa alta correlación p ued e d eberse a la influencia de otras variables subyacentes, den ominad as variables espu rias. Así, por ejemplo, si se observa un a relación p ositiva entre la asistencia a la iglesia los domingos y la h onestidad de las person as mayores, esto no implica necesariamente que las personas son honestas porque van a misa los dom ingos, pu es un a razón subyacente para qu e las dos variables estén correlacionadas p ued e en-

257

05_cap5.p65

257

31/03/2006, 02:48 p.m.

contrarse en variables subyacentes como el entrenam iento tempr ano en asistir a la iglesia y en enseñar a los niños a tener actitud es honestas. El coeficiente de correlación parcial mide la relación lineal entre d os variables, eliminan do la influen cia qu e pu edan ejercer otras var iables. Así, para las va riables X 1 , X 2 y X 3, el coeficiente d e correlación p arcial entre las dos p rimeras var iables mid e la relación lineal ent re las variables  X 1 , X 2 eliminan do la influencia que pu ede ejercer la tercera variable  X 3. La fórmula de cálculo es la siguiente:

r 12•3 =

r − r r  (1 − r )(1 − r  ) 12

13

23

2

2

13

23

(5.8)

donde r 12.3 es el coeficiente d e correlación par cial entr e  X 1 , y  X 2, controland o X 3. El coeficiente d e correlación par cial entre  X 1 , y X 2, controlando X 3 y  X 4 se define como:

r 12•34 =

r • − r r  • (1 − r • )(1 − r  • ) 12 3

14.3

24 3

2

2

14 3

24 3

La fórmu la de obten ción d el coeficiente d e correlación p arcial entre las variables  X i y  X  j , c o n t r o l a n d o l a s v a r i a b l e s X1 ,..., Xi −1 , Xi +1 ,...., X j −1 , X j +1 ,.... Xk ,   r    ij •1, 2,....,i −1,i +1,...., j −1, j +1,..., k ,  

es la siguiente:

=

r  •

ij 1,2,...., i −1, i +1,...., j −1, j +1,..., k  

s s•

ij•1,2 ,...., i −1, i+1,...., j−1, j +1,..., k  

ii 1,2,...., i −1, i +1,...., j −1, j +1,..., k

s

jj •1,2,...., i−1, i +1,...., j −1, j +1,..., k  

donde:

s

ii •1,2,....,i −1, i+1,...., j −1, j +1,..., k :varianza  

de la variable  X i ,

controlando las variables X1 ,..., Xi −1 , Xi +1 ,...., X j −1 , X j +1 ,.... Xk ; 

258

05_cap5.p65

258

31/03/2006, 02:48 p.m.

 

s

jj•1,2,...., i−1, i+1,...., j−1, j+ 1,..., k :  varianza

de la variable  X  j , con-

troland o las variables X1 ,..., Xi −1 , Xi +1 , ...., X j −1 , X j +1 ,.... Xk .  

 

Ejemplo 11

Con la base d e DATOS3-edu cación se ilustr a el cálculo del coeficiente d e correlación p arcial entre la nota p rom edio y la nota d e Álgebra, controlando la nota de Aritmética.  X 1 : notas prom edio  X 2 : notas de Álgebra  X 3 : notas de Aritmética Solución

a) Considerar la base DATOS3- educación y calcular los coeficientes d e correlación simp le entre los pares d e variables  X 1 ,  X 2  X 3 , usand o los comand os d el capítu lo VII, la salida es: NOTAS

NOTAS PROMEDIO

PROMEDIO

NOTAS DE ÁLGEBRA

1 ,925 ,903

,925 1 ,893

Pearson Correlation Pearson Correlation

NOTAS DE ÁLGEBRA NOTAS DE ARITMÉTICA Pearson Correlation

NOTAS DE ARITMÉTICA

,903 ,893 1

donde: r 12 = 0, 925; r13

= 0,903;

r 23

= 0,893

y se obtiene el valor d el coeficiente d e correlación p arcial entre la nota promedio (  X 1 ) y la nota de álgebra (  X 2 ), manteniendo constante la nota en a ritmética (  X 3 ), usand o la ecuación (5.8): r 12•3

=

0, 925 − 0, 903 (0, 893 )

(1 − 0, 903 )(1 − 0,893 ) 2

2

=

0,1186 0,0374

= 0,6117

.

El coeficiente d e correlación entre la nota p romed io y la nota en álgebra es 0,925, en tanto que la correlación entre ellas eliminan do la influencia de la not a de ar itmética es 0,6117; lo qu e signi-

259

05_cap5.p65

259

31/03/2006, 02:48 p.m.

fica que la correlación lineal entre la nota de Álgebra y la nota prom edio estaba influenciada por la nota en Aritmética. b) Usand o el SPSS, se abre la base de DATOS3-EDUCACION y con los comand os del capítulo VII se tiene el siguiente cuad ro: Control Variables N O TAS DE ARITMÉTICA

N OTA S PRO MED IO N OTAS DE ÁLGEBRA

N O TAS PROMEDIO Correlation 1,000 Correlation

,611

N OTAS DE ÁLGEBRA ,611 1,000

Como pu ede observa rse, el valor del coeficiente de correlación parcial coincide con el valor ya encontrad o. Ejemplo 12

Se sabe que la disposición d e las mu jeres a trabajar fuera d e casa no ha sido la m isma en todas las épocas, y también qu e varía de un lugar a otr o y d e un os gru pos sociales a otros. En estas condiciones, puede preguntarse qu é variables influyen para que las m ujeres estén más o men os dispu estas a trabajar fuera d e casa. Estas pregu ntas se plantean h oy día los sociólogos y consideran qu e si la variable depend iente fuera el por centaje de m ujeres trabajadoras, estaría explicada p or algun as variables como: el salario que perciben las m ujeres, el salario percibido por el marido, el nú mero de hijos, edad de las mujeres, tasa general de desempleo, entre otras . En la base DATOS7-mu jeres, se tienen los valores obser vados d e las variables:  Z 3 : logaritmo (  X 2 /   X 1 )  X 1 : salario promed io de las mu jeres  X 2 : salario prom edio de los hombr es  X 3 : nú mero prom edio de hijos por familia  X 4 : edad promedio de las mujeres, para una muestra de señoras casadas.

a) Encontrar el coeficiente d e correlación lineal entre los salarios de las mu jeres y los salarios de los hom bres.

260

05_cap5.p65

260

31/03/2006, 02:48 p.m.

b) Se pr opon e encontrar el coeficiente de correlación par cial entre los salarios de los hombr es y las mu jeres, controland o la variable edad de las mu jeres. Solución

a) Abrir la base de DATOS7-mu jeres y seleccionar los coman d os del SPSS del capítu lo VII (procedimient os estadísticos) que p erm iten obten er el coeficiente d e correlación simp le. El outp ut d el SPSS nos p rop orciona el coeficiente d e correlación simp le entre los salarios de los hombres y las m ujeres. Correlations Salario d e m u jeres Salario d e hom bres

Pearson Correlation Pearson Correlation

Salario d e m u jer es 1 ,807

Salario d e hom bres ,807 1

b) Abrir la base DATOS7- mu jeres y seleccionar los comand os del capítu lo VII que per miten obtener el coeficiente d e correlación parcial, de  X 1 y  X 2 controlando  X 4 . El outp ut del SPSS nos prop orciona el coeficiente de correlación p arcial entre los salarios de los hom bres y las mu jeres, controlando la edad d e las mu jeres. Correlations Control Variables Ed ad d e las Salario d e las mujeres mujeres Salario d e los hombres

Correlation Correlation

Salario d e las m u jeres 1,000 ,806

Salario de los hombres ,806 1,000

Así, r 12 = 0,807 es el valor d el coeficiente d e correlación lineal entre los salarios de las mu jeres y los salarios de los hombr es, valor que ind ica un a buen a relación d irecta entre las variables. Por otro lado, r 12•4 = 0,806 , es el valor d el coeficiente d e correlación entr e los salarios d e los hom bres y los salarios de las m ujeres controlando la ed ad de las m ujeres. Se observa qu e la correlación entr e los salarios de las mu jeres y de los hom bres no está influenciada por la

261

05_cap5.p65

261

31/03/2006, 02:48 p.m.

edad de la mu jer, pu esto que se sigue manteniend o alta cuand o la variable edad d e las mujeres es controlada. Ejercicios

1. En los siguientes casos identifique en caso de ser posible la(s) variable(s) dep end iente(s) e indep end iente(s). a) El presup uesto familiar destinado a la educación de los hi  jos y los ingresos familiares. b) El volumen de ventas de una empresa y la inversión en propaganda. c) El nú mero d e hijos por familia y el nivel educativo de los padres. d) El analfabetismo, lugar d e residencia y la expansión del servicio educativo. e) La edad y el tiempo efectivo d e servicio de los docentes afiliados al sindicato de pr ofesores. 2. A 10 cand idatos d el program a d e doctorado en Psicología se les aplica una p rueba de p ersonalidad ( X  ) y un examen general de conocimientos ( Y  ). Las p un tuaciones fueron las siguientes: Can d id ato  X  Y 

A B 2,96 2,46 529 506

C D 3,36 3,40 591 610

E 2,43 474

F 2,12 509

G 2,85 550

H I J 3,12 3,20 2,75 600 575 540

Realice el análisis de reg resión y correlación lineal. 3. Un profesor de Estadística realiza u n estu dio p ara investigar la relación que existe entre la ansiedad y el rend imiento de sus estud iantes en los exámenes. Elige a 10 estudiant es para el experimen to y, antes d e asistir al examen final, los 10 estud iantes respond ieron un cuestionario de ansiedad. A continu ación se tienen las calificaciones de la p ru eba final y los pu ntajes obtenidos en el cuestionario de an siedad. An sied ad Exam en Final

28 82

41 58

35 63

39 89

31 92

42 64

50 55

46 70

45 51

37 72

262

05_cap5.p65

262

31/03/2006, 02:48 p.m.

a) Elabore el diagrama de dispersión. Utilice la ansiedad como la variable regresora o indep endiente. b) Describa la relación que mu estra el diagram a de dispersión. c) Sup onga qu e la relación es lineal y calcule el valor del coeficiente de correlación e interp rete. d) Determine la recta de regresión por mínimos cuadrados pa ra p red ecir la calificación del examen final d ad o el nivel de ansiedad. e) Si un estud iante tiene un n ivel de ansiedad d e 38, ¿qué valor podría predecirse para su calificación en el examen final? 4. Se realiza u n estud io con 10 estudiantes d e postgrad o en Edu cación.  X 1 es el nú mero d e problemas resueltos correctamente por un estudiante en clase,  X 2 son las pun tuaciones obtenidas al aplicarles una p rueba p sicológica que m ide la autoestima, e Y  es el número d e problemas que cada estud iante espera resolver correctamente en el examen final. Con los datos qu e se presentan a continuación realice el análisis de regresión lineal múltiple usan d o el SPSS. Estu d ian te N ú m er o p roblem as resu eltos en clase 1 14 2 8 3 9 4 13 5 10 6 11 7 14 8 15 9 11 10 16

Puntuación en au toestim a 5 15 19 33 39 38 74 74 11 78

N ú mero d e problemas qu e esp era resolver en el examen final 14 5 8 11 15 14 18 19 7 17

5. Se aplicó a un grup o de 18 adolescentes sordom ud os la pru eba de inteligencia d e Wechsler p ara ad ultos (Wais) y cuatro su btest. Las pu ntuaciones de ambas aplicaciones son las siguientes:

263

05_cap5.p65

263

31/03/2006, 02:48 p.m.

A d o le sc en t es W a is R az o n am i en t o Ra z on a m ie n to Re la ci on e s Ve lo cid a d y m ecán ico abstracto esp acia les exact itu d 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

48 48 47 46 46 43 42 42 41 40 39 32 31 30 29 29 28 27

22 19 20 20 17 21 21 19 17 15 15 11 17 16 15 15 16 16

38 38 37 37 35 34 34 33 33 32 32 25 25 23 22 21 20 18

15 15 20 17 19 15 14 20 13 15 12 15 9 9 13 9 11 11

25 40 21 20 18 17 31 35 35 27 17 28 29 37 29 39 28 38

a) Realice un an álisis de regresión lineal simple de Y  con cada un o de los cuatro su btest. b) Realice un aná lisis de regresión lineal mú ltiple. 6. Se conocen las edades ( X  ) y la presión sangu ínea ( Y  ) de 12 mu jeres. Si ∑ xi = 628, ∑ yi = 1684, ∑ x2i = 34416, ∑ yi2 = 238822, ∑ ix yi = 89894. a) Encuentre la recta de regresión de Y  sobre  X  . b) Si una mu jer tiene 49 años, ¿cuál sería su p resión sanguínea? c) Si una mu jer tiene 72 años, ¿cuál es la presión sanguínea esperada? 7. La siguiente tabla muestra las calificaciones obtenidas por 10 estudiantes en d os pru ebas de Estadística:  X  : Primera pru eba 12 10 16 16 14 12 20 8 18 14 Y  : Segund a pru eba 16 14 14 20 10 16 20 12 16 12

264

05_cap5.p65

264

31/03/2006, 02:48 p.m.

a) Construya el diagrama de dispersión. b) Obtenga la recta de regresión de Y  sobre  X  . c) Si un estud iante obtuvo 14,7 en la primera p rueba, ¿cuánto se espera que obtenga en la segunda p rueba? 8. Dos profesores, con el prop ósito de examinar cuál es la influencia qu e los métodos d e enseñanza basad os en el trabajo libre y creativo del alumn o ejercen sobre su ren dim iento escolar, llevaron a cabo u na inv estigación con 122 niños y n iñas, en los que evaluaron los siguientes aspectos: Creativid ad : CREAT Cap acid ad d e or den : O RDEN

Coeficiente intelectu al :C.I. Rend im iento escolar :REN DIM.

CASO ORDEN C.I. RENDIM. CREAT. CASO ORDEN C.I. RENDIM. CREAT.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

8 6 5 3 4 6 7 4 4 3 6,5 5 3 5 5,5 4,5 4 10 7 8 6 10 7 5 9 7 7 6 6 4

114 103 97 94 88 76 116 86 97 91 123 63 92 86 84 63 88 128 102 115 93 130 90 90 102 102 99 100 88 74

0,85 0,87 0,90 0,80 0,70 0,70 1,00 0,73 0,99 0,75 1,50 0,73 0,90 0,82 0,81 0,62 0,77 0,99 0,78 0,98 0,74 0,94 0,76 0,81 0,2 0,85 0,91 0,73 0,64 0,45

8,00 4,00 8,00 2,00 9,00 4,00 10,0 5,50 3,00 8,00 3,50 1,00 6,00 8,00 5,00 5,00 7,00 7,00 6,00 7,00 6,00 7,00 4,00 5,00 8,00 7,00 6,00 6,00 5,00 3,00

31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60

4 7 7 10 7 6 9 6 7 3 3,5 7 8 5 6 4 3 3 6 6 6 4 8 7 5 5 5 5 6 4

109 113 123 106 110 95 125 100 112 53 77 100 105 89 105 92 98 91 90 98 113 92 98 86 88 88 102 101 76 94

0,84 0,88 0,86 0,91 0,74 0,62 0,92 0,62 0,72 0,14 0,21 0,65 0,78 0,48 0,91 0,97 0,62 0,84 0,63 0,89 1,05 0,84 0,74 0,58 0,82 0,82 0,75 0,88 0,81 0,65

4,50 7,50 6,00 8,00 6,00 5,50 7,00 2,00 2,00 5,00 1,50 3,50 5,00 0,00 4,50 6,00 2,00 4,00 0,00 6,50 6,00 3,00 5,00 0,50 2,00 1,50 3,00 6,50 4,00 0,00

265

05_cap5.p65

265

31/03/2006, 02:48 p.m.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF