Ejercicios Regresion y Correlacion Lineal
Short Description
Download Ejercicios Regresion y Correlacion Lineal...
Description
EJERCICIOS REGRESION Y CORRELACION LINEAL 1. El número de españoles (en millones) ocupados en la agricultura, para los años que se indican, era: Año
1980 1982 1984 1986 1988 1990 1992 1994
Ocupados 2,1
2,04 1,96 1,74 1,69 1,49 1,25 1,16
a) ¿Explicar su evolución mediante una recta de regresión?
b) ¿Cuál es el porcentaje de correlación? El porcentaje de correlación es -0.986
Análisis de regresión: OCUPADOS vs. AÑO La ecuación de regresión es OCUPADOS = 143 - 0.0714 AÑO
Predictor Constante AÑO
Coef 143.489 -0.071369
S = 0.0629452
SE Coef 9.650 0.004856
T 14.87 -14.70
R-cuad. = 97.3%
P 0.000 0.000
R-cuad.(ajustado) = 96.8%
Análisis de varianza Fuente Regresión Error residual Total
GL 1 6 7
SC 0.85571 0.02377 0.87949
CM 0.85571 0.00396
F 215.97
P 0.000
Correlaciones: AÑO, OCUPADOS Correlación de Pearson de AÑO y OCUPADOS = -0.986 Valor P = 0.000
2. Asocia las rectas de regresión y = de puntos siguientes:
–x
+16, y = 2x – 12, y = 0,5x + 5 a las nubes
y = –x +16 --- = - 8 + 16 = 8 y = -16 + 16 = 0 y = 2x – 12 --- = 16 – 12 = 4 y = 32 – 12 = 20 y = 0,5x + 5 --- = 4 + 5 = 9 y 8 + 5 = 13
Esta recta en la nube c Esta recta en la nube b Esta recta en la nube a
3. Asigna los coeficientes de correlación lineal r = 0,4, r = –0,85 y r = 0,7, a las nubes del problema anterior. 4. a) Calcula la recta de regresión de Y sobre X en la distribución: X
10 7
5
3
0
Y
2
6
8
10
4
b) ¿Cuál es el valor que correspondería según dicha recta a X = 7? Y=4.304
Análisis de regresión: y vs. x La ecuación de regresión es y = 10.1 - 0.828 x
Predictor Constante x
Coef 10.1379 -0.82759
S = 0.303239
SE Coef 0.2409 0.03982
T 42.09 -20.78
R-cuad. = 99.3%
P 0.000 0.000
R-cuad.(ajustado) = 99.1%
Análisis de varianza Fuente Regresión Error residual Total
GL 1 3 4
SC 39.724 0.276 40.000
CM 39.724 0.092
F 432.00
P 0.000
5. El número de bacterias por unidad de volumen, presentes en un cultivo después de un cierto número de horas, viene expresado en la siguiente tabla: X: Nº de horas
0
1
2
3
4
5
Y: Nº de bacterias
12 19 23 34 56 62
Calcula: a) Las medias y desviaciones típicas de las variables, número de horas y número de bacterias. La media de las horas es de 2.5 y la desviación típica es de 1.7 La media de las bacterias es de 34.3 y la desviación típica es de 18.69 b) La covarianza de la variable bidimensional. Es de 31 c) El coeficiente de correlación e interpretación. Es de 0,97 d) La recta de regresión de Y sobre X. La ecuación es Y= 7.762 + 10.63 X
Análisis de regresión: bacterias vs. horas La ecuación de regresión es bacterias = 7.762 + 10.63 horas
S = 5.48678
R-cuad. = 94.3%
R-cuad.(ajustado) = 92.8%
Análisis de varianza Fuente Regresión Error Total
GL 1 4 5
SC 1976.91 120.42 2097.33
CM 1976.91 30.10
F 65.67
P 0.001
6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las horas de estudio dedicadas a su preparación y las horas que vieron la televisión los días previos al examen. Nota (Y)
5
6
7
3
5
8
Horas de estudio (X1)
7
10 9
4
8
10 5
14
Horas de TV (X2)
7
6
11 9
3
5
2
4 9
9
a) Representa gráficamente las ecuaciones de regresión correspondientes a notaestudio y nota-TV Nota Estudio Nota TV
Análisis de regresión: notay vs. estudiox1 La ecuación de regresión es notay = 0.7961 + 0.6064 estudiox1
S = 0.727679
R-cuad. = 89.0%
R-cuad.(ajustado) = 87.2%
Análisis de varianza Fuente Regresión Error Total
GL 1 6 7
SC 25.6979 3.1771 28.8750
CM 25.6979 0.5295
F 48.53
P 0.000
Análisis de regresión: notay vs. tvX2 La ecuación de regresión es notay = 9.460 - 0.5515 tvX2
S = 1.16868
R-cuad. = 71.6%
R-cuad.(ajustado) = 66.9%
Análisis de varianza Fuente Regresión Error Total
GL 1 6 7
SC 20.6801 8.1949 28.8750
CM 20.6801 1.3658
F 15.14
P 0.008
b) ¿En qué caso la correlación es más fuerte? En el de notas - estudio
7. Con los mismos datos, estima para un alumno que sacó un 2 en el examen:
Análisis de regresión: tvX2 vs. notay La ecuación de regresión es tvX2 = 14.13 - 1.299 notay S = 1.79345
R-cuad. = 71.6%
R-cuad.(ajustado) = 66.9%
Análisis de varianza Fuente Regresión Error Total
GL 1 6 7
SC 48.7013 19.2987 68.0000
CM 48.7013 3.2165
F 15.14
a) Las horas que estudió. 2.689 hrs b) Las horas que vio la TV. 11.532 hrs
P 0.008
EJERCICIOS DE ANOVA 8. Realizar el Análisis de Varianza (ANOVA) de las siguientes 3 tablas por separado: a) Calcular Fo vs F tablas y realizar el contraste de las Hipótesis. b) Describe una conclusión. alumnos
respuesta
materia
respuesta
Modelo
respuesta
Carlos
3.1
Estadística
3.1
Nuevo
3.1
Carlos
7.5
Estadística
7.5
Anterior
7.5
Carlos
2.5
Matemáticas
2.5
Nuevo
2.5
Carlos
5.1
Matemáticas
5.1
Anterior
5.1
Lucas
3.4
Estadística
3.4
Nuevo
3.4
Lucas
7.8
Estadística
7.8
Anterior
7.8
Lucas
2.7
Matemáticas
2.7
Nuevo
2.7
Lucas
5.5
Matemáticas
5.5
Anterior
5.5
Manuel
3.3
Estadística
3.3
Nuevo
3.3
Manuel
6.9
Estadística
6.9
Anterior
6.9
Manuel
2.5
Matemáticas
2.5
Nuevo
2.5
Manuel
5.4
Matemáticas
5.4
Anterior
5.4
Luis
3.6
Estadística
3.6
Nuevo
3.6
Luis
7.8
Estadística
7.8
Anterior
7.8
Luis
2.4
Matemáticas
2.4
Nuevo
2.4
Luis
4.8
Matemáticas
4.8
Anterior
4.8
Pablo
3.8
Estadística
3.8
Nuevo
3.8
Pablo
8.1
Estadística
8.1
Anterior
8.1
Pablo
2.8
Matemáticas
2.8
Nuevo
2.8
Pablo
5.3
Matemáticas
5.3
Anterior
5.3
En la tabla de alumnos – respuesta Se acepta F0 = 0.03 porque es menor que F = 3.056 de tablas Se aceptan porque no están siendo afectadas las respuestas por los factores Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se acepta pues P valua = 0.998 En la tabla de materia – respuesta Se acepta F0 = 3.82 porque es menor que F = 4.414 de tablas Se aceptan porque no están siendo muy afectadas las respuestas por los factores solo un poco el de matemáticas Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se acepta pues P valua = 0.066 En la tabla de modelo – respuesta Se rechaza F0 = 58.84 porque es mayor que F = 4.414 de tablas Se rechaza porque están siendo muy afectadas las respuestas por el factor
“nuevo”
Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se rechaza pues P valua = 0.000
ANOVA unidireccional: respuesta vs. alumnos Fuente alumnos Error Total
GL 4 15 19
S = 2.240
Nivel Carlos Lucas Luis Manuel Pablo
SC 0.67 75.26 75.93
CM 0.17 5.02
F 0.03
R-cuad. = 0.88%
N 4 4 4 4 4
Media 4.550 4.850 4.650 4.525 5.000
P 0.998
R-cuad.(ajustado) = 0.00% ICs de 95% individuales para la media basados en Desv.Est. agrupada ------+---------+---------+---------+--(---------------*---------------) (---------------*---------------) (---------------*---------------) (---------------*---------------) (---------------*---------------) ------+---------+---------+---------+--3.0 4.5 6.0 7.5
Desv.Est. 2.259 2.299 2.317 2.001 2.308
Desv.Est. agrupada = 2.240
ANOVA unidireccional: respuesta vs. materia Fuente materia Error Total
GL 1 18 19
S = 1.865
SC 13.28 62.64 75.93
CM 13.28 3.48
F 3.82
R-cuad. = 17.50%
Nivel Estadística Matemáticas
N 10 10
Media 5.530 3.900
P 0.066
R-cuad.(ajustado) = 12.91%
Desv.Est. 2.231 1.408
ICs de 95% individuales para la media basados en Desv.Est. agrupada --------+---------+---------+---------+(---------*---------) (----------*---------) --------+---------+---------+---------+3.6 4.8 6.0 7.2
Desv.Est. agrupada = 1.865
ANOVA unidireccional: respuesta vs. modelo Fuente modelo Error Total
GL 1 18 19
SC 58.140 17.785 75.925
S = 0.9940
Nivel Anterior Nuevo
N 10 10
CM 58.140 0.988
F 58.84
R-cuad. = 76.58%
Media 6.4200 3.0100
Desv.Est. 1.3139 0.4999
Desv.Est. agrupada = 0.9940
P 0.000
R-cuad.(ajustado) = 75.27%
ICs de 95% individuales para la media basados en Desv.Est. agrupada +---------+---------+---------+--------(----*-----) (----*-----) +---------+---------+---------+--------2.4 3.6 4.8 6.0
View more...
Comments