Ejercicios Propuestos Analisis de Regresion

May 6, 2019 | Author: Madeleine Denise Ahumada Catrileo | Category: Regression Analysis, Correlation And Dependence, Linear Regression, Intelligence Quotient, Coefficient Of Determination
Share Embed Donate


Short Description

Estadística...

Description

EJERCICIOS PROPUESTOS

ANÁLISIS DE REGRESIÓN. 1. a. b. c. 2.

a. b. c. d. e. f.

Interprete cada uno de los siguientes coeficientes de correlación y use gráficos de dispersión para representar como se vería cada una de las relaciones entre dos variables (X, Y) cualesquiera: r = -1,0. r = 0,05 . r = 0,85 . Si el coeficiente de correlación para los datos de la tabla es 0,97, responda a las preguntas siguientes, primero sin realizar ningún cálculo y después, comprobar las respuestas haciendo los cálculos necesarios con su calculadora ó el programa SPSS. X 2 3 4 5 6 Y 5 7 8 13 14 Revise los gráficos de dispersión correspondientes y responda cómo cambiaría este coeficiente si: Sumamos 3 a la variable X. Sumamos 3 en ambas variables. Multiplicamos la variable X por 2. Intercambiamos todos los valores de X por los de Y. Cambiamos el último valor de X por el de Y. Sumamos 10 a ambas variables pero sólo en el primer punto observado.

3.

La correlación lineal de X  con Y  es r=0,60; la correlación de X  con W  es de r=-0,80 . ¿Con cuál de las variables Y ó W, es mayor el grado de asociación lineal?

4.

Cada una de las frases siguientes contiene un error, explique en cada caso qué es lo que está mal. "Existe una alta correlación entre el sexo de los trabajadores en Talca y su salario". "Se encontró una alta correlación (r=1,09) entre las evaluaciones de los estudiantes a los profesores y los salarios de los académicos". "La correlación entre el tamaño familiar y los metros cuadrados del hogar es r=0,65 metros cuadrados".

a. b. c.

5. a. b. c. d. e.

La correlación entre la estatura del padre y la de su hijo hombre adulto es de 0,52. Esto nos dice que: Padres más altos que la media de estatura tienden a tener hijos que son más altos que la media de estatura. Padres más altos que la media de estatura tienden a tener hijos que son más bajos que la media de estatura Los hijos son, en promedio, más altos que sus padres 52% de todos los hijos son más altos que sus padres Casi no hay relación entre la estatura de padres e hijos.

ANÁLISIS DE REGRESIÓN

PÁGINA 1 DE 25

EJERCICIOS PROPUESTOS

6.

En un curso de introducción a la sociología, un profesor hace dos exámenes. El profesor quiere determinar si las calificaciones de los estudiantes en el segundo examen están correlacionadas con las calificaciones del primero. Para facilitar los cálculos, se elige una muestra de ocho estudiantes. Sus calificaciones aparecen en la siguiente tabla. 2 3 4 5 6 7 8 Estudiante 1 Examen 1 60 75 70 72 54 83 80 65 Examen 2 60 100 80 68 73 97 85 90

a.

Construya un gráfico de dispersión para estos datos, utilizando la calificación del primer examen como la variable X. ¿Parece lineal la relación? Suponga que existe una relación lineal entre las calificaciones de los dos exámenes, calcule el valor r de Pearson.

b.

7.

Con el fin de estudiar la relación que existe entre la concentración de oxígeno (volumen por ciento) de la sangre arterial y de la sangre venosa, se hicieron determinaciones simultáneas en 30  individuos normales, con los siguientes resultados: Individuo Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

a. b. c.

Sangre Arterial (X) Venosa (Y) 18,2 20,5 20,9 18,5 21,9 18,4 17,4 22,3 20,4 18,2 19,3 20,3 18,3 20,3 20,3

11,4 14,0 15,1 12,0 14,6 12,0 11,3 15,3 11,9 12,7 12,7 12,8 12,2 14,8 13,4

Individuo Nº 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Sangre Arterial (X) Venosa (Y) 20,6 20,8 18,7 19,6 17,5 18,8 18,8 20,9 20,0 19,4 20,4 20,1 20,1 19,0 18,6

13,5 14,4 13,8 11,7 10,6 13,2 12,5 12,5 13,9 11,9 14,2 13,3 12,6 14,5 11,9

Para estudiar la correlación que pueda existir entre las dos variables, analice el gráfico de dispersión. ¿Cuál es la correlación entre las dos variables? Interprete su valor. Si todos los puntos observados coincidieran en una línea recta: ¿Cuál sería el grado de correlación de ambas concentraciones de oxígeno en tal caso? ¿Qué significación práctica tendría ese hecho? ¿Significaría esto que la concentración de oxígeno en ambos tipos de sangre es la misma? Salidas SPSS: Estadísticos descriptivos

Sangre Arterial

N 30

Mínimo 17,40

Máximo 22,30

Media 19,6167

Desv. típ. 1,22758

Sangre Venosa

30

10,60

15,30

13,0233

1,23419

ANÁLISIS DE REGRESIÓN

PÁGINA 2 DE 25

EJERCICIOS PROPUESTOS

Correlaciones

Sangre Arterial

Correlación de Pearson

Sangre  Arterial 1

Sig. (bilateral) N Sangre Venosa

,000 30

Correlación de Pearson

,720**

Sig. (bilateral)

,000

N

Sangre Venosa ,720**

30

30 1 30

**. La correlación es significativa al nivel 0,01 (bilateral).

8.

a. b. c. 9.

El crecimiento de los niños desde la infancia a la adolescencia generalmente sigue un patrón lineal. Se calculó una recta de regresión mediante el método de mínimos cuadrados con datos de alturas de niñas norteamericanas de 4 a 9  años y el resultado fue: Intercepto a=80  y pendiente b=6. La variable dependiente Y  es la altura en centímetros y X es la edad en años. Interprete los valores estimados del intercepto y de la pendiente. ¿Cuál será la altura predicha de una niña de 8 años? ¿Cuál será la altura predicha de una mujer de 25 años? Comente el resultado. En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la revista Field Crops Research, los datos usados en la investigación son: 92 92 96 100 102 102 106 106 121 143 Duración Rendimiento 1,7 2,3 1,9 2,0 1,5 1,7 1,6 1,8 1,0 0,3 Con X=La duración de la cosecha de porotos de soya en días, Y=Rendimiento de la cosecha en toneladas por hectárea. Se tiene la siguiente salida de SPSS:

ANÁLISIS DE REGRESIÓN

PÁGINA 3 DE 25

EJERCICIOS PROPUESTOS

Estadísticos descriptivos

DURACION

N 10

Mínimo 92,00

Máximo 143,00

Media 106,0000

Desv. típ. 15,47040

RENDIMIENTO

10

,30

2,30

1,5800

,56332

Correlaciones DURACION

Correlación de Pearson

DURACION 1

RENDIMIENTO -,940**

Sig. (bilateral) RENDIMIENTO

,000

Correlación de Pearson

-,940**

Sig. (bilateral)

1

,000

**. La correlación es significativa al nivel 0,01 (bilateral).

Coeficientesa Coeficientes no estandarizados Modelo 1

(Constante)

B 5,207

Error típ. ,471

t 11,047

Sig. ,000

DURACION

-,034

,004

-7,768

,000

a. Variable dependiente: RENDIMIENTO

2,5

2,0

   O    T1,5    N    E    I    M    I    D    N    E    R1,0

0,5

0,0 90

100

110

120

130

140

150

DURACION

ANÁLISIS DE REGRESIÓN

PÁGINA 4 DE 25

EJERCICIOS PROPUESTOS

0,3

0,2

   l   a 0,1   u    d    i   s   e    R    d 0,0   e   z    i    d   r   a    d   n-0,1   a    t   s   n    U -0,2

-0,3

-0,4 90

100

110

120

130

140

150

DURACION

a. b. c. d. 10.

Estime la recta de regresión mediante el método de mínimos cuadrados. Interprete los estimadores en el contexto de la pregunta. ¿Existe una relación lineal entre la duración y el rendimiento de la cosecha? Verifique los supuestos. Estime el rendimiento si la duración de la cosecha fue de 104 días. Un Psicólogo ha construido un cuestionario para medir depresión. Para comparar los datos del cuestionario con los datos de los expertos, 12  individuos con "perturbaciones emocionales" completan el cuestionario. Los individuos son además calificados de manera independiente por dos siquiatras expertos, de acuerdo con el grado de depresión determinado por cada uno como resultado de entrevistas detalladas. Los valores mayores indican a una mayor depresión. Individuo

a.

Cuestionario

Siquiatra A

Siquiatra B

1 48 12 9 2 37 11 12 3 30 4 5 4 45 7 8 5 31 10 11 6 24 8 7 7 28 3 4 8 18 1 1 9 35 9 6 10 15 2 2 11 42 6 10 12 22 5 3 Use las salidas de SPSS adjuntas, comente los gráficos de dispersión y conteste: ¿Cuál es la correlación entre los datos de los dos siquiatras?

ANÁLISIS DE REGRESIÓN

PÁGINA 5 DE 25

EJERCICIOS PROPUESTOS

b. c.

¿Cuál es la correlación entre las calificaciones cuestionario y los datos de cada siquiatra? Informe de su análisis al Psicólogo. Gráficos de dispersión para depresión

Cuestionario

Siquiatra A

Siquiatra B

Correlaciones Cuestionario

Correlación de Pearson Sig. (bilateral) N

Siquiatra A

Siquiatra A .697*

.

.012

Siquiatra B .750** .005

12

12

12

Correlación de Pearson

.697*

1

.846**

Sig. (bilateral)

.012

.

.001

12

12

12 1

N Siquiatra B

Cuestionario 1

Correlación de Pearson

.750**

.846**

Sig. (bilateral)

.005

.001

.

12

12

12

N

*. La correlación es significante al nivel 0,05 (bilateral). **. La correlación es significativa al nivel 0,01 (bilateral).

11.

El Centro de Alumnos de la Escuela de Psicología de la Universidad de Talca, manifiestan su preocupación al momento de egresar de los estudios en las posibilidades de las ofertas laborales. Después de varias discusiones, se pidió realizar un estudio estadístico para determinar si las notas con que egresan los alumnos puede explicar el número de ofertas laborales que ellos reciben después de titularse. Para ello, se recopiló la información de 13  alumnos recién titulados, obteniéndose los siguientes datos: Estudiante Nota Ofertas

ANÁLISIS DE REGRESIÓN

1 2 3 4 5 6 7 8 9 10 11 12 13 6,1 5,3 4,6 4,2 6,4 5,7 5,4 4,8 6,5 6,2 4,4 5,0 5,3 4 3 1 0 5 4 2 2 6 4 1 2 3

PÁGINA 6 DE 25

EJERCICIOS PROPUESTOS

a. b. c. d. e. f.

A partir de las salidas de SPSS adjuntas: Obtenga el coeficiente de correlación entre ambas variables. Interprete el resultado. Encuentre la recta de regresión de mínimos cuadrados. Interprete los valores estimados del intercepto y la pendiente de la recta de regresión. Calcule el residuo para la primera observación (x=6,1; y=4). Bosqueje el gráfico de residuos que usted esperaría encontrar si este análisis de regresión lineal cumple el supuesto de linealidad (no es necesario hacer los cálculos). Si un estudiante egresa con una nota 5,9, ¿Cuántas ofertas laborales esperaría recibir? Correlaciones Nota de egreso Nota de egreso

Correlación de Pearson

Ofertas de trabajo .962**

1

Sig. (bilateral)

.000

N Ofertas de trabajo

13

13

Correlación de Pearson

.962**

1

Sig. (bilateral)

.000

N

13

13

**. La correlación es significativa al nivel 0,01 (bilateral).

ANOVAb

Modelo 1

Regresión Residual Total

Suma de cuadrados 33.037

1

Media cuadrática 33.037

2.656

11

.241

35.692

12

gl

F 136.842

Sig. .000 a

a. Variables predictoras: (Constante), Nota b. Variable dependiente: Ofertas

ANÁLISIS DE REGRESIÓN

PÁGINA 7 DE 25

EJERCICIOS PROPUESTOS

Coeficientesa Coeficientes estandarizad os

Coeficientes no estandarizados Modelo 1

(Constante)

B -8.799

Error típ. 1.005

2.166

.185

Nota

Beta .962

t -8.757

Sig. .000

11.698

.000

a. Variable dependiente: Ofertas

12.

Un Investigador cree que la inteligencia de los niños, medida a través del coeficiente intelectual (CI en puntos), depende del número de hermanos. Toma una muestra aleatoria de 15 niños y ajusta una regresión lineal simple. Los resultados aparecen en la salida adjunta: CI 110 115 120 118 110 108 105 104 98 99 98 100 90 93 90 Hermanos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6 Estadísticos descriptivos

CI

N 15

Mínimo 90,00

Máximo 120,00

Media 103,8667

Desv. típ. 9,59067

HERMANOS

15

,00

6,00

2,9333

1,83095

Correlaciones CI CI

Correlación de Pearson

HERMANOS -,904**

1

Sig. (bilateral) HERMANOS

,000

Correlación de Pearson

-,904**

Sig. (bilateral)

1

,000

**. La correlación es significativa al nivel 0,01 (bilateral).

Coeficientesa Coeficientes no estandarizados Modelo 1

(Constante)

B 117,750

Error típ. 2,132

t 55,227

Sig. ,000

-4,733

,622

-7,604

,000

HERMANOS a. Variable dependiente: CI

ANÁLISIS DE REGRESIÓN

PÁGINA 8 DE 25

EJERCICIOS PROPUESTOS

120

110

   I    C

100

90 0

1

2

3

4

5

6

4

5

6

HERMANOS

10

5

   l   a   u    d    i   s   e    R    d   e   z    i    d 0   r   a    d   n   a    t   s   n    U -5

-10 0

1

2

3

HERMANOS

a. b. c. d. e. f.

Encuentre e interprete el coeficiente de correlación r. Encuentre e interprete el coeficiente de determinación r2. En este problema, ¿cuál de los dos coeficientes encontrados en (a) y (b) usaría? Dé la ecuación de la recta de regresión. Interprete los estimadores en el contexto de la pregunta. ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%. Verifique los supuestos de regresión.

ANÁLISIS DE REGRESIÓN

PÁGINA 9 DE 25

EJERCICIOS PROPUESTOS

13.

Se desea saber si existe alguna relación entre la ingestión y la absorción de grasas en lactantes desnutridos. Se realizan 20 determinaciones de ingestión y absorción cuyos resultados se muestran en la tabla que sigue: INGESTIÓN Y ABSORCIÓN DE GRASAS EN 20 LACTANTES DESNUTRIDOS: Caso Nº

Ingestión (X) 1,4 1,6 2,1 1,7 1,8 2,6 1,5 2,5 2,7 1,8

1 2 3 4 5 6 7 8 9 10

Absorción (Y) 0,7 1,2 1,6 1,1 1,3 2,0 1,2 1,5 2,4 1,5

Caso Nº 11 12 13 14 15 16 17 18 19 20

Ingestión (X) 2,0 1,4 1,9 1,8 1,9 1,6 1,9 2,1 1,6 1,6

Absorción (Y) 1,4 1,1 1,5 1,3 1,5 1,4 1,7 1,7 1,3 1,1

Estadísticos descriptivos N INGESTION

20

Mínimo 1,4

 ABSORCION

20

,7

Máximo 2,7

Media 1,875

Desv. típ. ,3740

2,4

1,425

,3611

Correlaciones

INGESTION

INGESTION 1

Correlación de Pearson

ABSORCION ,866**

Sig. (bilateral)  ABSORCION

,000

Correlación de Pearson

,866**

Sig. (bilateral)

,000

1

**. La correlación es significativa al nivel 0,01 (bilateral).

Coeficientesa Coeficientes no estandarizados Modelo 1

(Constante)

B -,143

Error típ. ,217

t -,659

Sig. ,518

INGESTION

,836

,114

7,353

,000

a. Variable dependiente: ABSORCION

ANÁLISIS DE REGRESIÓN

PÁGINA 10 DE 25

EJERCICIOS PROPUESTOS

2,5

2,0

   N    O    I    C    R    O 1,5    S    B    A

1,0

0,5 1,2

1,4

1,6

1,8

2,0

2,2

2,4

2,2

2,4

2,6

2,8

INGESTION

0,4

0,2

   l   a   u    d    i   s   e    R0,0    d   e   z    i    d   r   a    d   n   a-0,2    t   s   n    U

-0,4

-0,6 1,2

1,4

1,6

1,8

2,0

2,6

2,8

INGESTION

a. b. c. d.

Estime a y b mediante el método de mínimos cuadrados. Interprete los coeficientes de regresión. ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%. Encuentre e interprete el coeficiente de determinación r2. Verifique los supuestos de la regresión.

ANÁLISIS DE REGRESIÓN

PÁGINA 11 DE 25

EJERCICIOS PROPUESTOS

14.

El Centro de Alumnos de la Escuela de Psicología de la Universidad de Talca, manifiestan su preocupación al momento de egresar de los estudios en las posibilidades de las ofertas laborales. Después de varias discusiones, se pidió realizar un estudio estadístico para determinar si las notas con que egresan los alumnos puede explicar el número de ofertas laborales que ellos reciben después de titularse. Para ello, se recopiló la información de 13  alumnos recién titulados, obteniéndose los siguientes datos: Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 Nota 6,1 5,3 4,6 4,2 6,4 5,7 5,4 4,8 6,5 6,2 4,4 5,0 5,3 Ofertas 4 3 1 0 5 4 2 2 6 4 1 2 3

a. b. c. d. e. f. g. h.

A partir de las salidas de SPSS adjuntas: Obtenga el coeficiente de correlación entre ambas variables. Interprete el resultado. Encuentre la recta de regresión de mínimos cuadrados. Interprete los valores estimados del intercepto y la pendiente de la recta de regresión. ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%. Encuentre e interprete el coeficiente de determinación r2. Calcule el residuo para la primera observación (x=6,1; y=4). Bosqueje el gráfico de residuos que usted esperaría encontrar si este análisis de regresión lineal cumple el supuesto de linealidad (no es necesario hacer los cálculos). Si un estudiante egresa con una nota 5,9, ¿Cuántas ofertas laborales esperaría recibir?

Correlaciones

Nota de egreso

Correlación de Pearson

Nota de egreso 1

Sig. (bilateral) N Ofertas de trabajo

.000 13

Correlación de Pearson

.962**

Sig. (bilateral)

.000

N

Ofertas de trabajo .962**

13

13 1 13

**. La correlación es significativa al nivel 0,01 (bilateral).

ANÁLISIS DE REGRESIÓN

PÁGINA 12 DE 25

EJERCICIOS PROPUESTOS

ANOVAb

Modelo 1

Regresión

Suma de cuadrados 33.037

Residual Total

1

Media cuadrática 33.037

2.656

11

.241

35.692

12

gl

F 136.842

Sig. .000 a

a. Variables predictoras: (Constante), Nota b. Variable dependiente: Ofertas

Coeficientesa Coeficientes estandarizad os

Coeficientes no estandarizados Modelo 1

(Constante)

B -8.799

Error típ. 1.005

2.166

.185

Nota

Beta .962

t -8.757

Sig. .000

11.698

.000

a. Variable dependiente: Ofertas

15.

 “PÉRDIDA DE LA MEMORIA”. Después de los 50 años de edad, algunas personas comienzan a tener dificultad para recordar fechas, nombres y otros datos. En algunos casos, haciendo un esfuerzo mental es posible recordar esa información, pero en otros el olvido es permanente. En un grupo de 20 sujetos, se les pidió que escribieran en una hoja el nombre de 15 familiares ó de amistades, y luego realizaran el ejercicio de recordar el nombre de las personas que había registrado en el papel. Considerando las siguientes salidas del SPSS: Correlaciones

Edad en años

Correlación de Pearson

Edad en años 1

Sig. (bilateral)

.000

N Cantidad de nombres que recuerda

Cantidad de nombres que recuerda -.988**

Correlación de Pearson

24

24

-.988**

1

Sig. (bilateral)

.000

N

24

24

**. La correlación es significativa al nivel 0,01 (bilateral).

Coeficientesa

Coeficientes no estandarizados Modelo 1

(Constante) Edad en años

B 32.794

Error típ. .850

-.370

.012

Coeficientes estandarizad os Beta -.988

t 38.587

Sig. .000

-30.023

.000

a. Variable dependiente: Cantidad de nombres que recuerda

ANÁLISIS DE REGRESIÓN

PÁGINA 13 DE 25

EJERCICIOS PROPUESTOS

a. b. c. d. e. f. g. h.

Comente el Diagrama de Dispersión en conjunto con el coeficiente de correlación. Determine el modelo de regresión lineal, en que la cantidad de nombres que recuerde el sujeto dependa de su edad. Interprete ambos coeficientes del modelo de regresión lineal obtenidos en (b). Si una persona tiene 61  años de edad, ¿Cuántas palabras estimamos que va a recordar? ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%. Encuentre e interprete el coeficiente de determinación r2. Realice el análisis del supuesto de la linealidad del modelo ajustado. Comente. Si se tuviera una nueva observación de una persona de 80  años de edad que recuerda 9 nombres, ¿qué efecto tendría este nuevo dato sobre la pendiente que se determinó en (b), aumentaría, se mantendría ó disminuiría? Justifique.

ANÁLISIS DE REGRESIÓN

PÁGINA 14 DE 25

EJERCICIOS PROPUESTOS

16.

En un estudio diseñado para analizar los efectos de añadir avena a la dieta estadounidense tradicional, se dividieron aleatoriamente los individuos en dos grupos diferentes. Dos veces al día, el primer grupo sustituyó con avena otros alimentos que contenían carbohidratos. Los miembros del segundo grupo no hicieron cambios en su dieta. Un resultado interesante es el nivel de colesterol en la sangre de cada individuo ocho semanas después de que comenzó el estudio. Las variables explicativas que podrían afectar esta respuesta incluyen el tipo de dieta, el grado de colesterol en la sangre al inicio del estudio, el índice de masa corporal y el sexo. Los coeficientes calculados y los errores estándares del modelo de regresión múltiple que contiene estas cuatro variables explicativas aparecen a continuación: Variable

Dietas Colesterol inicio Índice de masa corporal Sexo a.

b. c. d.

17.

a.

Coeficiente

Error estándar

-11,25 0,85 0,23 -3,02

4,33 0,07 0,65 4,42

t

Valor_p

0,0126
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF