Ejercicios Propuestos Analisis de Regresion
Short Description
Estadística...
Description
EJERCICIOS PROPUESTOS
ANÁLISIS DE REGRESIÓN. 1. a. b. c. 2.
a. b. c. d. e. f.
Interprete cada uno de los siguientes coeficientes de correlación y use gráficos de dispersión para representar como se vería cada una de las relaciones entre dos variables (X, Y) cualesquiera: r = -1,0. r = 0,05 . r = 0,85 . Si el coeficiente de correlación para los datos de la tabla es 0,97, responda a las preguntas siguientes, primero sin realizar ningún cálculo y después, comprobar las respuestas haciendo los cálculos necesarios con su calculadora ó el programa SPSS. X 2 3 4 5 6 Y 5 7 8 13 14 Revise los gráficos de dispersión correspondientes y responda cómo cambiaría este coeficiente si: Sumamos 3 a la variable X. Sumamos 3 en ambas variables. Multiplicamos la variable X por 2. Intercambiamos todos los valores de X por los de Y. Cambiamos el último valor de X por el de Y. Sumamos 10 a ambas variables pero sólo en el primer punto observado.
3.
La correlación lineal de X con Y es r=0,60; la correlación de X con W es de r=-0,80 . ¿Con cuál de las variables Y ó W, es mayor el grado de asociación lineal?
4.
Cada una de las frases siguientes contiene un error, explique en cada caso qué es lo que está mal. "Existe una alta correlación entre el sexo de los trabajadores en Talca y su salario". "Se encontró una alta correlación (r=1,09) entre las evaluaciones de los estudiantes a los profesores y los salarios de los académicos". "La correlación entre el tamaño familiar y los metros cuadrados del hogar es r=0,65 metros cuadrados".
a. b. c.
5. a. b. c. d. e.
La correlación entre la estatura del padre y la de su hijo hombre adulto es de 0,52. Esto nos dice que: Padres más altos que la media de estatura tienden a tener hijos que son más altos que la media de estatura. Padres más altos que la media de estatura tienden a tener hijos que son más bajos que la media de estatura Los hijos son, en promedio, más altos que sus padres 52% de todos los hijos son más altos que sus padres Casi no hay relación entre la estatura de padres e hijos.
ANÁLISIS DE REGRESIÓN
PÁGINA 1 DE 25
EJERCICIOS PROPUESTOS
6.
En un curso de introducción a la sociología, un profesor hace dos exámenes. El profesor quiere determinar si las calificaciones de los estudiantes en el segundo examen están correlacionadas con las calificaciones del primero. Para facilitar los cálculos, se elige una muestra de ocho estudiantes. Sus calificaciones aparecen en la siguiente tabla. 2 3 4 5 6 7 8 Estudiante 1 Examen 1 60 75 70 72 54 83 80 65 Examen 2 60 100 80 68 73 97 85 90
a.
Construya un gráfico de dispersión para estos datos, utilizando la calificación del primer examen como la variable X. ¿Parece lineal la relación? Suponga que existe una relación lineal entre las calificaciones de los dos exámenes, calcule el valor r de Pearson.
b.
7.
Con el fin de estudiar la relación que existe entre la concentración de oxígeno (volumen por ciento) de la sangre arterial y de la sangre venosa, se hicieron determinaciones simultáneas en 30 individuos normales, con los siguientes resultados: Individuo Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
a. b. c.
Sangre Arterial (X) Venosa (Y) 18,2 20,5 20,9 18,5 21,9 18,4 17,4 22,3 20,4 18,2 19,3 20,3 18,3 20,3 20,3
11,4 14,0 15,1 12,0 14,6 12,0 11,3 15,3 11,9 12,7 12,7 12,8 12,2 14,8 13,4
Individuo Nº 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Sangre Arterial (X) Venosa (Y) 20,6 20,8 18,7 19,6 17,5 18,8 18,8 20,9 20,0 19,4 20,4 20,1 20,1 19,0 18,6
13,5 14,4 13,8 11,7 10,6 13,2 12,5 12,5 13,9 11,9 14,2 13,3 12,6 14,5 11,9
Para estudiar la correlación que pueda existir entre las dos variables, analice el gráfico de dispersión. ¿Cuál es la correlación entre las dos variables? Interprete su valor. Si todos los puntos observados coincidieran en una línea recta: ¿Cuál sería el grado de correlación de ambas concentraciones de oxígeno en tal caso? ¿Qué significación práctica tendría ese hecho? ¿Significaría esto que la concentración de oxígeno en ambos tipos de sangre es la misma? Salidas SPSS: Estadísticos descriptivos
Sangre Arterial
N 30
Mínimo 17,40
Máximo 22,30
Media 19,6167
Desv. típ. 1,22758
Sangre Venosa
30
10,60
15,30
13,0233
1,23419
ANÁLISIS DE REGRESIÓN
PÁGINA 2 DE 25
EJERCICIOS PROPUESTOS
Correlaciones
Sangre Arterial
Correlación de Pearson
Sangre Arterial 1
Sig. (bilateral) N Sangre Venosa
,000 30
Correlación de Pearson
,720**
Sig. (bilateral)
,000
N
Sangre Venosa ,720**
30
30 1 30
**. La correlación es significativa al nivel 0,01 (bilateral).
8.
a. b. c. 9.
El crecimiento de los niños desde la infancia a la adolescencia generalmente sigue un patrón lineal. Se calculó una recta de regresión mediante el método de mínimos cuadrados con datos de alturas de niñas norteamericanas de 4 a 9 años y el resultado fue: Intercepto a=80 y pendiente b=6. La variable dependiente Y es la altura en centímetros y X es la edad en años. Interprete los valores estimados del intercepto y de la pendiente. ¿Cuál será la altura predicha de una niña de 8 años? ¿Cuál será la altura predicha de una mujer de 25 años? Comente el resultado. En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la revista Field Crops Research, los datos usados en la investigación son: 92 92 96 100 102 102 106 106 121 143 Duración Rendimiento 1,7 2,3 1,9 2,0 1,5 1,7 1,6 1,8 1,0 0,3 Con X=La duración de la cosecha de porotos de soya en días, Y=Rendimiento de la cosecha en toneladas por hectárea. Se tiene la siguiente salida de SPSS:
ANÁLISIS DE REGRESIÓN
PÁGINA 3 DE 25
EJERCICIOS PROPUESTOS
Estadísticos descriptivos
DURACION
N 10
Mínimo 92,00
Máximo 143,00
Media 106,0000
Desv. típ. 15,47040
RENDIMIENTO
10
,30
2,30
1,5800
,56332
Correlaciones DURACION
Correlación de Pearson
DURACION 1
RENDIMIENTO -,940**
Sig. (bilateral) RENDIMIENTO
,000
Correlación de Pearson
-,940**
Sig. (bilateral)
1
,000
**. La correlación es significativa al nivel 0,01 (bilateral).
Coeficientesa Coeficientes no estandarizados Modelo 1
(Constante)
B 5,207
Error típ. ,471
t 11,047
Sig. ,000
DURACION
-,034
,004
-7,768
,000
a. Variable dependiente: RENDIMIENTO
2,5
2,0
O T1,5 N E I M I D N E R1,0
0,5
0,0 90
100
110
120
130
140
150
DURACION
ANÁLISIS DE REGRESIÓN
PÁGINA 4 DE 25
EJERCICIOS PROPUESTOS
0,3
0,2
l a 0,1 u d i s e R d 0,0 e z i d r a d n-0,1 a t s n U -0,2
-0,3
-0,4 90
100
110
120
130
140
150
DURACION
a. b. c. d. 10.
Estime la recta de regresión mediante el método de mínimos cuadrados. Interprete los estimadores en el contexto de la pregunta. ¿Existe una relación lineal entre la duración y el rendimiento de la cosecha? Verifique los supuestos. Estime el rendimiento si la duración de la cosecha fue de 104 días. Un Psicólogo ha construido un cuestionario para medir depresión. Para comparar los datos del cuestionario con los datos de los expertos, 12 individuos con "perturbaciones emocionales" completan el cuestionario. Los individuos son además calificados de manera independiente por dos siquiatras expertos, de acuerdo con el grado de depresión determinado por cada uno como resultado de entrevistas detalladas. Los valores mayores indican a una mayor depresión. Individuo
a.
Cuestionario
Siquiatra A
Siquiatra B
1 48 12 9 2 37 11 12 3 30 4 5 4 45 7 8 5 31 10 11 6 24 8 7 7 28 3 4 8 18 1 1 9 35 9 6 10 15 2 2 11 42 6 10 12 22 5 3 Use las salidas de SPSS adjuntas, comente los gráficos de dispersión y conteste: ¿Cuál es la correlación entre los datos de los dos siquiatras?
ANÁLISIS DE REGRESIÓN
PÁGINA 5 DE 25
EJERCICIOS PROPUESTOS
b. c.
¿Cuál es la correlación entre las calificaciones cuestionario y los datos de cada siquiatra? Informe de su análisis al Psicólogo. Gráficos de dispersión para depresión
Cuestionario
Siquiatra A
Siquiatra B
Correlaciones Cuestionario
Correlación de Pearson Sig. (bilateral) N
Siquiatra A
Siquiatra A .697*
.
.012
Siquiatra B .750** .005
12
12
12
Correlación de Pearson
.697*
1
.846**
Sig. (bilateral)
.012
.
.001
12
12
12 1
N Siquiatra B
Cuestionario 1
Correlación de Pearson
.750**
.846**
Sig. (bilateral)
.005
.001
.
12
12
12
N
*. La correlación es significante al nivel 0,05 (bilateral). **. La correlación es significativa al nivel 0,01 (bilateral).
11.
El Centro de Alumnos de la Escuela de Psicología de la Universidad de Talca, manifiestan su preocupación al momento de egresar de los estudios en las posibilidades de las ofertas laborales. Después de varias discusiones, se pidió realizar un estudio estadístico para determinar si las notas con que egresan los alumnos puede explicar el número de ofertas laborales que ellos reciben después de titularse. Para ello, se recopiló la información de 13 alumnos recién titulados, obteniéndose los siguientes datos: Estudiante Nota Ofertas
ANÁLISIS DE REGRESIÓN
1 2 3 4 5 6 7 8 9 10 11 12 13 6,1 5,3 4,6 4,2 6,4 5,7 5,4 4,8 6,5 6,2 4,4 5,0 5,3 4 3 1 0 5 4 2 2 6 4 1 2 3
PÁGINA 6 DE 25
EJERCICIOS PROPUESTOS
a. b. c. d. e. f.
A partir de las salidas de SPSS adjuntas: Obtenga el coeficiente de correlación entre ambas variables. Interprete el resultado. Encuentre la recta de regresión de mínimos cuadrados. Interprete los valores estimados del intercepto y la pendiente de la recta de regresión. Calcule el residuo para la primera observación (x=6,1; y=4). Bosqueje el gráfico de residuos que usted esperaría encontrar si este análisis de regresión lineal cumple el supuesto de linealidad (no es necesario hacer los cálculos). Si un estudiante egresa con una nota 5,9, ¿Cuántas ofertas laborales esperaría recibir? Correlaciones Nota de egreso Nota de egreso
Correlación de Pearson
Ofertas de trabajo .962**
1
Sig. (bilateral)
.000
N Ofertas de trabajo
13
13
Correlación de Pearson
.962**
1
Sig. (bilateral)
.000
N
13
13
**. La correlación es significativa al nivel 0,01 (bilateral).
ANOVAb
Modelo 1
Regresión Residual Total
Suma de cuadrados 33.037
1
Media cuadrática 33.037
2.656
11
.241
35.692
12
gl
F 136.842
Sig. .000 a
a. Variables predictoras: (Constante), Nota b. Variable dependiente: Ofertas
ANÁLISIS DE REGRESIÓN
PÁGINA 7 DE 25
EJERCICIOS PROPUESTOS
Coeficientesa Coeficientes estandarizad os
Coeficientes no estandarizados Modelo 1
(Constante)
B -8.799
Error típ. 1.005
2.166
.185
Nota
Beta .962
t -8.757
Sig. .000
11.698
.000
a. Variable dependiente: Ofertas
12.
Un Investigador cree que la inteligencia de los niños, medida a través del coeficiente intelectual (CI en puntos), depende del número de hermanos. Toma una muestra aleatoria de 15 niños y ajusta una regresión lineal simple. Los resultados aparecen en la salida adjunta: CI 110 115 120 118 110 108 105 104 98 99 98 100 90 93 90 Hermanos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6 Estadísticos descriptivos
CI
N 15
Mínimo 90,00
Máximo 120,00
Media 103,8667
Desv. típ. 9,59067
HERMANOS
15
,00
6,00
2,9333
1,83095
Correlaciones CI CI
Correlación de Pearson
HERMANOS -,904**
1
Sig. (bilateral) HERMANOS
,000
Correlación de Pearson
-,904**
Sig. (bilateral)
1
,000
**. La correlación es significativa al nivel 0,01 (bilateral).
Coeficientesa Coeficientes no estandarizados Modelo 1
(Constante)
B 117,750
Error típ. 2,132
t 55,227
Sig. ,000
-4,733
,622
-7,604
,000
HERMANOS a. Variable dependiente: CI
ANÁLISIS DE REGRESIÓN
PÁGINA 8 DE 25
EJERCICIOS PROPUESTOS
120
110
I C
100
90 0
1
2
3
4
5
6
4
5
6
HERMANOS
10
5
l a u d i s e R d e z i d 0 r a d n a t s n U -5
-10 0
1
2
3
HERMANOS
a. b. c. d. e. f.
Encuentre e interprete el coeficiente de correlación r. Encuentre e interprete el coeficiente de determinación r2. En este problema, ¿cuál de los dos coeficientes encontrados en (a) y (b) usaría? Dé la ecuación de la recta de regresión. Interprete los estimadores en el contexto de la pregunta. ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%. Verifique los supuestos de regresión.
ANÁLISIS DE REGRESIÓN
PÁGINA 9 DE 25
EJERCICIOS PROPUESTOS
13.
Se desea saber si existe alguna relación entre la ingestión y la absorción de grasas en lactantes desnutridos. Se realizan 20 determinaciones de ingestión y absorción cuyos resultados se muestran en la tabla que sigue: INGESTIÓN Y ABSORCIÓN DE GRASAS EN 20 LACTANTES DESNUTRIDOS: Caso Nº
Ingestión (X) 1,4 1,6 2,1 1,7 1,8 2,6 1,5 2,5 2,7 1,8
1 2 3 4 5 6 7 8 9 10
Absorción (Y) 0,7 1,2 1,6 1,1 1,3 2,0 1,2 1,5 2,4 1,5
Caso Nº 11 12 13 14 15 16 17 18 19 20
Ingestión (X) 2,0 1,4 1,9 1,8 1,9 1,6 1,9 2,1 1,6 1,6
Absorción (Y) 1,4 1,1 1,5 1,3 1,5 1,4 1,7 1,7 1,3 1,1
Estadísticos descriptivos N INGESTION
20
Mínimo 1,4
ABSORCION
20
,7
Máximo 2,7
Media 1,875
Desv. típ. ,3740
2,4
1,425
,3611
Correlaciones
INGESTION
INGESTION 1
Correlación de Pearson
ABSORCION ,866**
Sig. (bilateral) ABSORCION
,000
Correlación de Pearson
,866**
Sig. (bilateral)
,000
1
**. La correlación es significativa al nivel 0,01 (bilateral).
Coeficientesa Coeficientes no estandarizados Modelo 1
(Constante)
B -,143
Error típ. ,217
t -,659
Sig. ,518
INGESTION
,836
,114
7,353
,000
a. Variable dependiente: ABSORCION
ANÁLISIS DE REGRESIÓN
PÁGINA 10 DE 25
EJERCICIOS PROPUESTOS
2,5
2,0
N O I C R O 1,5 S B A
1,0
0,5 1,2
1,4
1,6
1,8
2,0
2,2
2,4
2,2
2,4
2,6
2,8
INGESTION
0,4
0,2
l a u d i s e R0,0 d e z i d r a d n a-0,2 t s n U
-0,4
-0,6 1,2
1,4
1,6
1,8
2,0
2,6
2,8
INGESTION
a. b. c. d.
Estime a y b mediante el método de mínimos cuadrados. Interprete los coeficientes de regresión. ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%. Encuentre e interprete el coeficiente de determinación r2. Verifique los supuestos de la regresión.
ANÁLISIS DE REGRESIÓN
PÁGINA 11 DE 25
EJERCICIOS PROPUESTOS
14.
El Centro de Alumnos de la Escuela de Psicología de la Universidad de Talca, manifiestan su preocupación al momento de egresar de los estudios en las posibilidades de las ofertas laborales. Después de varias discusiones, se pidió realizar un estudio estadístico para determinar si las notas con que egresan los alumnos puede explicar el número de ofertas laborales que ellos reciben después de titularse. Para ello, se recopiló la información de 13 alumnos recién titulados, obteniéndose los siguientes datos: Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 Nota 6,1 5,3 4,6 4,2 6,4 5,7 5,4 4,8 6,5 6,2 4,4 5,0 5,3 Ofertas 4 3 1 0 5 4 2 2 6 4 1 2 3
a. b. c. d. e. f. g. h.
A partir de las salidas de SPSS adjuntas: Obtenga el coeficiente de correlación entre ambas variables. Interprete el resultado. Encuentre la recta de regresión de mínimos cuadrados. Interprete los valores estimados del intercepto y la pendiente de la recta de regresión. ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%. Encuentre e interprete el coeficiente de determinación r2. Calcule el residuo para la primera observación (x=6,1; y=4). Bosqueje el gráfico de residuos que usted esperaría encontrar si este análisis de regresión lineal cumple el supuesto de linealidad (no es necesario hacer los cálculos). Si un estudiante egresa con una nota 5,9, ¿Cuántas ofertas laborales esperaría recibir?
Correlaciones
Nota de egreso
Correlación de Pearson
Nota de egreso 1
Sig. (bilateral) N Ofertas de trabajo
.000 13
Correlación de Pearson
.962**
Sig. (bilateral)
.000
N
Ofertas de trabajo .962**
13
13 1 13
**. La correlación es significativa al nivel 0,01 (bilateral).
ANÁLISIS DE REGRESIÓN
PÁGINA 12 DE 25
EJERCICIOS PROPUESTOS
ANOVAb
Modelo 1
Regresión
Suma de cuadrados 33.037
Residual Total
1
Media cuadrática 33.037
2.656
11
.241
35.692
12
gl
F 136.842
Sig. .000 a
a. Variables predictoras: (Constante), Nota b. Variable dependiente: Ofertas
Coeficientesa Coeficientes estandarizad os
Coeficientes no estandarizados Modelo 1
(Constante)
B -8.799
Error típ. 1.005
2.166
.185
Nota
Beta .962
t -8.757
Sig. .000
11.698
.000
a. Variable dependiente: Ofertas
15.
“PÉRDIDA DE LA MEMORIA”. Después de los 50 años de edad, algunas personas comienzan a tener dificultad para recordar fechas, nombres y otros datos. En algunos casos, haciendo un esfuerzo mental es posible recordar esa información, pero en otros el olvido es permanente. En un grupo de 20 sujetos, se les pidió que escribieran en una hoja el nombre de 15 familiares ó de amistades, y luego realizaran el ejercicio de recordar el nombre de las personas que había registrado en el papel. Considerando las siguientes salidas del SPSS: Correlaciones
Edad en años
Correlación de Pearson
Edad en años 1
Sig. (bilateral)
.000
N Cantidad de nombres que recuerda
Cantidad de nombres que recuerda -.988**
Correlación de Pearson
24
24
-.988**
1
Sig. (bilateral)
.000
N
24
24
**. La correlación es significativa al nivel 0,01 (bilateral).
Coeficientesa
Coeficientes no estandarizados Modelo 1
(Constante) Edad en años
B 32.794
Error típ. .850
-.370
.012
Coeficientes estandarizad os Beta -.988
t 38.587
Sig. .000
-30.023
.000
a. Variable dependiente: Cantidad de nombres que recuerda
ANÁLISIS DE REGRESIÓN
PÁGINA 13 DE 25
EJERCICIOS PROPUESTOS
a. b. c. d. e. f. g. h.
Comente el Diagrama de Dispersión en conjunto con el coeficiente de correlación. Determine el modelo de regresión lineal, en que la cantidad de nombres que recuerde el sujeto dependa de su edad. Interprete ambos coeficientes del modelo de regresión lineal obtenidos en (b). Si una persona tiene 61 años de edad, ¿Cuántas palabras estimamos que va a recordar? ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%. Encuentre e interprete el coeficiente de determinación r2. Realice el análisis del supuesto de la linealidad del modelo ajustado. Comente. Si se tuviera una nueva observación de una persona de 80 años de edad que recuerda 9 nombres, ¿qué efecto tendría este nuevo dato sobre la pendiente que se determinó en (b), aumentaría, se mantendría ó disminuiría? Justifique.
ANÁLISIS DE REGRESIÓN
PÁGINA 14 DE 25
EJERCICIOS PROPUESTOS
16.
En un estudio diseñado para analizar los efectos de añadir avena a la dieta estadounidense tradicional, se dividieron aleatoriamente los individuos en dos grupos diferentes. Dos veces al día, el primer grupo sustituyó con avena otros alimentos que contenían carbohidratos. Los miembros del segundo grupo no hicieron cambios en su dieta. Un resultado interesante es el nivel de colesterol en la sangre de cada individuo ocho semanas después de que comenzó el estudio. Las variables explicativas que podrían afectar esta respuesta incluyen el tipo de dieta, el grado de colesterol en la sangre al inicio del estudio, el índice de masa corporal y el sexo. Los coeficientes calculados y los errores estándares del modelo de regresión múltiple que contiene estas cuatro variables explicativas aparecen a continuación: Variable
Dietas Colesterol inicio Índice de masa corporal Sexo a.
b. c. d.
17.
a.
Coeficiente
Error estándar
-11,25 0,85 0,23 -3,02
4,33 0,07 0,65 4,42
t
Valor_p
0,0126
View more...
Comments