Ejercicios Regresion y Correlacion Lineal

Share Embed Donate


Short Description

Download Ejercicios Regresion y Correlacion Lineal...

Description

EJERCICIOS REGRESION Y CORRELACION LINEAL 1. El número de españoles (en millones) ocupados en la agricultura, para los años que se indican, era:  Año

1980 1982 1984 1986 1988 1990 1992 1994

Ocupados 2,1

2,04 1,96 1,74 1,69 1,49 1,25 1,16

a) ¿Explicar su evolución mediante una recta de regresión?

b) ¿Cuál es el porcentaje de correlación? El porcentaje de correlación es -0.986

Análisis de regresión: OCUPADOS vs. AÑO La ecuación de regresión es OCUPADOS = 143 - 0.0714 AÑO

Predictor Constante AÑO

Coef 143.489 -0.071369

S = 0.0629452

SE Coef 9.650 0.004856

T 14.87 -14.70

R-cuad. = 97.3%

P 0.000 0.000

R-cuad.(ajustado) = 96.8%

Análisis de varianza Fuente Regresión Error residual Total

GL 1 6 7

SC 0.85571 0.02377 0.87949

CM 0.85571 0.00396

F 215.97

P 0.000

Correlaciones: AÑO, OCUPADOS Correlación de Pearson de AÑO y OCUPADOS = -0.986 Valor P = 0.000

2. Asocia las rectas de regresión y = de puntos siguientes:

 –x

+16, y = 2x  – 12, y = 0,5x + 5 a las nubes

y =  –x +16 --- = - 8 + 16 = 8 y = -16 + 16 = 0 y = 2x  – 12 --- = 16  – 12 = 4 y = 32  – 12 = 20 y = 0,5x + 5 --- = 4 + 5 = 9 y 8 + 5 = 13

Esta recta en la nube c  Esta recta en la nube b  Esta recta en la nube a



3. Asigna los coeficientes de correlación lineal r = 0,4, r =  –0,85 y r = 0,7, a las nubes del problema anterior. 4. a) Calcula la recta de regresión de Y sobre X en la distribución: X

10 7

5

3

0

Y

2

6

8

10

4

b) ¿Cuál es el valor que correspondería según dicha recta a X = 7? Y=4.304

Análisis de regresión: y vs. x La ecuación de regresión es y = 10.1 - 0.828 x

Predictor Constante x

Coef 10.1379 -0.82759

S = 0.303239

SE Coef 0.2409 0.03982

T 42.09 -20.78

R-cuad. = 99.3%

P 0.000 0.000

R-cuad.(ajustado) = 99.1%

Análisis de varianza Fuente Regresión Error residual Total

GL 1 3 4

SC 39.724 0.276 40.000

CM 39.724 0.092

F 432.00

P 0.000

5. El número de bacterias por unidad de volumen, presentes en un cultivo después de un cierto número de horas, viene expresado en la siguiente tabla: X: Nº de horas

0

1

2

3

4

5

Y: Nº de bacterias

12 19 23 34 56 62

Calcula: a) Las medias y desviaciones típicas de las variables, número de horas y número de bacterias. La media de las horas es de 2.5 y la desviación típica es de 1.7 La media de las bacterias es de 34.3 y la desviación típica es de 18.69 b) La covarianza de la variable bidimensional. Es de 31 c) El coeficiente de correlación e interpretación. Es de 0,97 d) La recta de regresión de Y sobre X. La ecuación es Y= 7.762 + 10.63 X

Análisis de regresión: bacterias vs. horas La ecuación de regresión es bacterias = 7.762 + 10.63 horas

S = 5.48678

R-cuad. = 94.3%

R-cuad.(ajustado) = 92.8%

Análisis de varianza Fuente Regresión Error Total

GL 1 4 5

SC 1976.91 120.42 2097.33

CM 1976.91 30.10

F 65.67

P 0.001

6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las horas de estudio dedicadas a su preparación y las horas que vieron la televisión los días previos al examen. Nota (Y)

5

6

7

3

5

8

Horas de estudio (X1)

7

10 9

4

8

10 5

14

Horas de TV (X2)

7

6

11 9

3

5

2

4 9

9

a) Representa gráficamente las ecuaciones de regresión correspondientes a notaestudio y nota-TV Nota Estudio Nota TV

Análisis de regresión: notay vs. estudiox1 La ecuación de regresión es notay = 0.7961 + 0.6064 estudiox1

S = 0.727679

R-cuad. = 89.0%

R-cuad.(ajustado) = 87.2%

Análisis de varianza Fuente Regresión Error Total

GL 1 6 7

SC 25.6979 3.1771 28.8750

CM 25.6979 0.5295

F 48.53

P 0.000

Análisis de regresión: notay vs. tvX2 La ecuación de regresión es notay = 9.460 - 0.5515 tvX2

S = 1.16868

R-cuad. = 71.6%

R-cuad.(ajustado) = 66.9%

Análisis de varianza Fuente Regresión Error Total

GL 1 6 7

SC 20.6801 8.1949 28.8750

CM 20.6801 1.3658

F 15.14

P 0.008

b) ¿En qué caso la correlación es más fuerte? En el de notas - estudio

7. Con los mismos datos, estima para un alumno que sacó un 2 en el examen:

Análisis de regresión: tvX2 vs. notay La ecuación de regresión es tvX2 = 14.13 - 1.299 notay S = 1.79345

R-cuad. = 71.6%

R-cuad.(ajustado) = 66.9%

Análisis de varianza Fuente Regresión Error Total

GL 1 6 7

SC 48.7013 19.2987 68.0000

CM 48.7013 3.2165

F 15.14

a) Las horas que estudió. 2.689 hrs b) Las horas que vio la TV. 11.532 hrs

P 0.008

EJERCICIOS DE ANOVA 8. Realizar el Análisis de Varianza (ANOVA) de las siguientes 3 tablas por  separado: a) Calcular Fo vs F tablas y realizar el contraste de las Hipótesis. b) Describe una conclusión. alumnos

respuesta

materia

respuesta

Modelo

respuesta

Carlos

3.1

Estadística

3.1

Nuevo

3.1

Carlos

7.5

Estadística

7.5

Anterior

7.5

Carlos

2.5

Matemáticas

2.5

Nuevo

2.5

Carlos

5.1

Matemáticas

5.1

Anterior

5.1

Lucas

3.4

Estadística

3.4

Nuevo

3.4

Lucas

7.8

Estadística

7.8

Anterior

7.8

Lucas

2.7

Matemáticas

2.7

Nuevo

2.7

Lucas

5.5

Matemáticas

5.5

Anterior

5.5

Manuel

3.3

Estadística

3.3

Nuevo

3.3

Manuel

6.9

Estadística

6.9

Anterior

6.9

Manuel

2.5

Matemáticas

2.5

Nuevo

2.5

Manuel

5.4

Matemáticas

5.4

Anterior

5.4

Luis

3.6

Estadística

3.6

Nuevo

3.6

Luis

7.8

Estadística

7.8

Anterior

7.8

Luis

2.4

Matemáticas

2.4

Nuevo

2.4

Luis

4.8

Matemáticas

4.8

Anterior

4.8

Pablo

3.8

Estadística

3.8

Nuevo

3.8

Pablo

8.1

Estadística

8.1

Anterior

8.1

Pablo

2.8

Matemáticas

2.8

Nuevo

2.8

Pablo

5.3

Matemáticas

5.3

Anterior

5.3

En la tabla de alumnos  – respuesta Se acepta F0 = 0.03 porque es menor que F = 3.056 de tablas Se aceptan porque no están siendo afectadas las respuestas por los factores Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se acepta pues P valua = 0.998 En la tabla de materia  – respuesta Se acepta F0 = 3.82 porque es menor que F = 4.414 de tablas Se aceptan porque no están siendo muy afectadas las respuestas por los factores solo un poco el de matemáticas Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se acepta pues P valua = 0.066 En la tabla de modelo  – respuesta Se rechaza F0 = 58.84 porque es mayor que F = 4.414 de tablas Se rechaza porque están siendo muy afectadas las respuestas por el factor   



 



 

“nuevo” 

Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se rechaza pues P valua = 0.000

ANOVA unidireccional: respuesta vs. alumnos Fuente alumnos Error Total

GL 4 15 19

S = 2.240

Nivel Carlos Lucas Luis Manuel Pablo

SC 0.67 75.26 75.93

CM 0.17 5.02

F 0.03

R-cuad. = 0.88%

N 4 4 4 4 4

Media 4.550 4.850 4.650 4.525 5.000

P 0.998

R-cuad.(ajustado) = 0.00% ICs de 95% individuales para la media basados en Desv.Est. agrupada ------+---------+---------+---------+--(---------------*---------------) (---------------*---------------) (---------------*---------------) (---------------*---------------) (---------------*---------------) ------+---------+---------+---------+--3.0 4.5 6.0 7.5

Desv.Est. 2.259 2.299 2.317 2.001 2.308

Desv.Est. agrupada = 2.240

ANOVA unidireccional: respuesta vs. materia Fuente materia Error Total

GL 1 18 19

S = 1.865

SC 13.28 62.64 75.93

CM 13.28 3.48

F 3.82

R-cuad. = 17.50%

Nivel Estadística Matemáticas

N 10 10

Media 5.530 3.900

P 0.066

R-cuad.(ajustado) = 12.91%

Desv.Est. 2.231 1.408

ICs de 95% individuales para la media basados en Desv.Est. agrupada --------+---------+---------+---------+(---------*---------) (----------*---------) --------+---------+---------+---------+3.6 4.8 6.0 7.2

Desv.Est. agrupada = 1.865

ANOVA unidireccional: respuesta vs. modelo Fuente modelo Error Total

GL 1 18 19

SC 58.140 17.785 75.925

S = 0.9940

Nivel Anterior Nuevo

N 10 10

CM 58.140 0.988

F 58.84

R-cuad. = 76.58%

Media 6.4200 3.0100

Desv.Est. 1.3139 0.4999

Desv.Est. agrupada = 0.9940

P 0.000

R-cuad.(ajustado) = 75.27%

ICs de 95% individuales para la media basados en Desv.Est. agrupada +---------+---------+---------+--------(----*-----) (----*-----) +---------+---------+---------+--------2.4 3.6 4.8 6.0

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF