Paso4 TrabajoColaborativo 100105 131

Share Embed Donate


Short Description

Trabajo Fase 4 Estadística Descriptiva Regresión y Correlación Lineal...

Description

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

Curso Estadística Descriptiva

Trabajo Colaborativo  Unidad 2 Paso 4 Descripción de la Información Regresión y Correlación Lineal –

Tutor Heley Estefany Cepeda

Estudiantes Isabel Ramos Laura Yesenia Morales Gabriel Hernando Jaimes

Grupo: 100105_131

Campus Virtual UNAD

 Noviembre 2017



Introducción

La estadística descriptiva es una parte de la estadística que estudia fenómenos mediante la recolección, organización en tablas y la interpretación de datos. La interpretación de los datos se puede realizar mediante gráficos estadísticos o cálculo de parámetros estadísticos, en el presente trabajo analizaremos la información mediante los gráficos estadísticos. Uno de los gráficos más importantes para analizar fenómenos es la regresión y la correlación lineal simple, que nos permite conocer la relación entre 2 variables, podemos observar cómo se comporta una variable y debida al comportamiento de una variable x. En este trabajo se desarrolla el laboratorio de regresión y correlación lineal y se analiza la base de datos del DANE sobre desempleo en Colombia que recoge 20 variables entre los años 2001 y 2017.

Justificación

Cuando realizamos un estudio estadístico lo hacemos para obtener conclusiones sobre una problemática que afecta a una población, en este caso la problemática es el desempleo en Colombia, y los gráficos estadísticos son herramientas que nos permiten analizar una gran cantidad de datos y hallar relaciones entre diferentes variables. Por este motivo en el presente trabajo se analizaran analiz aran diferentes variables que inciden en el desempleo en Colombia mediante los diagramas de dispersión y hallaremos el modelo matemáticos que predice el comportamiento de las variables estudiadas en la problemática del desempleo en Colombia.

Objetivos General:

Determinar la relación entre 2 o más variables de la problemática a partir de la correlación y la regresión lineal simple. Específicos: -Desarrollar el laboratorio de regresión y correlación

-Identificar variables cuantitativas que puedan estar correlacionadas y probar estadísticamente dicha relación. -Encontrar el modelo matemático que permite predecir el efecto de una variable sobre otra y comprobar su confiabilidad.

Desarrollo Laboratorio Regresión y Correlación Lineal  Isabel Ramos

2.1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X (sal) 1,6 2,3 3,3 4,2 4,6 5,0

Y (Tensión) 98 102 109 113 115 120

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables Asociación 140 y = 6,1062x + 88,128 R² = 0,987

120 100    n 80    o    i    s    n    e 60    T

40 20 0 0

1

2

3

4

5

6

Consumo de Sal

RTA: El tipo de asociación del diagrama de dispersión es LINEAL, entre más consumo de sal mayor tensión arterial tendrán. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable?

El modelo matemático es: y = 6,1062x + 88,128 R² = 0,987 Se pude decir que el grado de confiabilidad es alto ya que el valor de R es cercano a 1. c. Determine el grado de relación de las dos variables. R² = 0,987 R= √0.987

R= 0.9934 Correlación excelente. d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial esperada? Para calcular la tensión arterial esperada, debemos reemplazar el valor de x en la ecuación. y = 6,1062(4.8) + 88,128 y= 117.43 Por lo tanto la tensión arterial esperada para una dosis de sal de 4.8 administrada será de 117.43. 2.2 En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio ( medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación: X Y

12 23 45 30

35 27

42 25

53 23

65 21

70 20

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

La variable dependiente y es el tiempo para tallar la pieza y la variable independiente x es el número de días. 50

   A    Z    E    I 45    P    A40    N    U    R 35    A    L    L 30    A    T    A25    R    A    P 20    O    D    I 15    D    E    M10    O    P    M 5    E    I    T 0    Y

y = -0,3566x + 42,569 R² = 0,7963

0

10

20

30

40

50

60

70

80

X NUMERO DE DIAS

El tipo de relación es inversa ya que indica que entre más días de trabajo, menos tiempo usan par tallar una pieza. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? y = -0,3566x + 42,569 R² = 0,7963 Puede ser confiable porque tiene un porcentaje de 79.96% c. Determine el grado de correlación de las dos variables. R² = 0,7963 R= √0.7963

R= 0.8923 Por lo tanto existe una correlación aceptable. d. Que tiempo deberá tardarse un empleado cuando lleven 80 días? y = -0,3566x + 42,569 y = -0,3566(80) + 42,569 y= 14.041 Por lo tanto un empleado que lleve 80 días debe tardarse 14 minutos tallando una pieza.

2.3 Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación se presentan los resultados: Estatu 12 ra 0 (cm) Peso ( 24 kg)

124

107

118

112

110

115

104

110

116

23

19

24

21

19

22

16

20

23

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables 30 y = 0,386x - 22,751 R² = 0,8329

25 20    G    K    n    e 15    o    s    e    P

10 5 0 100

105

110

115

120

125

Estatura en CM

Variable independiente X la estatura y dependiente Y el peso. El tipo de relación entre las variables es directa ya que la línea de tendencia indica que a mayor estatura mayo peso. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? y = 0,386x - 22,751 R² = 0,8329 Si es confiable, la confiabilidad de los datos de del 83.29%

c. Determine el grado de correlación de las dos variables. R² = 0,8329 R= √0.8329

R= 0.9126 Por lo tanto existe una correlación excelente. d. Cuál es el peso que debería tener un estudiante que mida 120 cm? y = 0,386x - 22,751 y = 0,386(120) - 22,751 Y= 23,569 Por lo tanto un estudiante que tenga un estatura de 120 cm debera pesar 24 kg aproximadamente. Laura Yesenia Morales Actividades a desarrollar

Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X (sal) Y (Tensión) 1,6 98 2,3 102 3,3 109 4,2 113 4,6 115 5,0 120 a.

Realice el diagrama de dispersión y determine el tipo de asociación entre las variables

Asociación Consumo de Sal y Tensión Arterial 140    L 120    A    I    R 100    E    T    R 80    A    N 60     Ó    I    S 40    N    E    T 20

y = 6,1062x + 88,128 R² = 0,987

0 0

1

2

3

4

5

6

DOSIS DE SAL

Teniendo en cuenta el diagrama de dispersión y la línea de tendencia obtenida, es posible concluir que el tipo de asociación entre las variables es directa puesto que la tensión arterial es directamente proporcional a la dosis de sal suministrada, es decir, si la dosis de sal aumenta, la tensión arterial aumenta a su vez. b.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?

La regresión lineal es un método que se emplea para pronosticar o predecir el valor de una variable dependiente (Tensión Arterial) en función de los valores suministrados por una variable independiente (Dosis de Sal), se habla así de una regresión de y en función de x. Mediante el método de los mínimos cuadrados es posible determinar la ecuación de la recta estimada; por lo tanto, El modelo matemático que permite predecir el efecto de una variable sobre la otra es: =+  = 6,1062 + 88,128   =      = ó  Para determinar la confiabilidad de la ecuación obtenida es necesario hallar el Coeficiente de Determinación ( ) El cual se trata de determinar las variaciones de la variable dependiente.  = 0.987   ó 98,7%   Teniendo en cuenta el coeficiente de determinación y multiplicando por el 100% es posible afirmar que la ecuación de la recta es altamente confiable en un 98,7%. c.

Determine el grado de relación de las dos variables.

Para determinar el coeficiente de relación de dos variables en la práctica es más frecuente usar, el coeficiente de correlación Lineal (r) o Coeficiente de Pearson.  =    El coeficiente de Correlación Lineal oscila entre +1 y -1, permitiendo confirmar el grado de relación entre las variables estudiadas.  = √ 0.987  = 0.9934   ó Teniendo en cuenta el resultado de coeficiente de correlación es posible afirmar hay una excelente correlación entre la dosis de sal y la tensión arterial donde la tensión arterial es directamente proporcional a la dosis de sal suministrada. d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial esperada? La tensión arterial esperada se calcula utilizando la ecuación lineal obtenida, al remplazar la dosis de sal de 4,8 en la ecuación.  = 6,1062 + 88,128  = 6,1062(4,8) + 88,128  = 117,43776 Al dar solución al planteamiento matemático se determina que 117 es la tensión arterial esperada para una dosis de sal de 4,8. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio (medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación: X Y a.

12 23 45 30

35 27

42 25

53 23

65 21

70 20

Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables

Teniendo cuenta el análisis se desea realizar hace referencia a la adaptación y mejoramiento en el proceso de producción de los operarios, utilizando dos variables, Tiempo Medio que se utiliza en realizar una pieza y Número de días desde que empezó dicho proceso de fabricación.

Se espera que con el transcurso de los días el tiempo medio de realización de una pieza sea menor, en tanto, realizando un análisis de los resultados suministrados de puede afirmar que las variables son: X = Número de días desde que empezó la fabricación. Y = Tiempo medio utilizado en la fabricación de una pieza. A su vez, la relación entre ellas es inversamente proporcional puesto que, al aumentar los días desde el inicio de la producción, los operarios adquieren mayor destreza y adaptación, por lo cual el tiempo medio utilizado en una pieza va disminuyendo significativamente.

Mejoramiento del Proceso de Producción a travez de los días 50

45

45

    ]    s 40    o    t    u 35    n    i    M30     [    o    i     d 25    e    M20    o    p 15    m    e 10    i    T

y = -0,3566x + 42,569 R² = 0,7963

30

27

25

23

21

20

5 0 0

10

20

30

40

50

60

70

Días Transcurridos [Días]

b.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?

=+

 = −0,3566 + 42,569   =   í (í)

 =   ()

  = 0,7963   ó 79,6%  

80

Teniendo en cuenta el coeficiente de determinación y multiplicando por el 100% es posible afirmar que la ecuación de la recta es considerablemente confiable con un 79,6%. c.

Determine el grado de correlación de las dos variables.

Teniendo en cuenta que el tiempo medio es inversamente proporcional a los días transcurridos. El coeficiente de correlación es negativo.  =    = −0,7963  = −0,8923   ó Teniendo en cuenta el resultado de coeficiente de correlación es posible afirmar hay una correlación aceptable e inversa entre los días transcurridos desde el inicio de la producción y el tiempo medio de fabricación de una pieza. d. Que tiempo deberá tardarse un empleado cuando lleven 80 días?  = −0,3566 + 42,569  = −0,3566(80) + 42,569  = 14,04  Un empleado debe tardarse aproximadamente 14,04 minutos en realizar una pieza artesanal en el día 80 de producción. Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación, se presentan los resultados: Estatura 120 124 107 118 112 110 115 104 110 116 (cm) Peso 24 23 19 24 21 19 22 16 20 23 (kg) a.

Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Teniendo en cuenta el análisis de la información administrada, es posible afirmar, la variable independiente es la Estatura [cm] y la variable dependiente es el peso [kg].

30 25 21 19

20 16

    ]    g     k     [ 15    o    s    e    P

22

23

24

24

23

20 y = 0,386x - 22,751 R² = 0,8329

19

10 5 0 100

105

110

115

120

Estatura [cm]

A su vez, la relación entre las variables es directa, es decir, si la estatura de los niños aumenta su peso también aumenta. b.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?

 = 0,3786 − 22,751   =  []  =  []   = 0,8329   ó 83,29%   Teniendo en cuenta el coeficiente de determinación y multiplicando por el 100% es posible afirmar que la ecuación de la recta es considerablemente confiable con un 83,29%. c.

Determine el grado de correlación de las dos variables.

Teniendo en cuenta que el peso es directamente proporcional a la estatura. El coeficiente de correlación.  =    = 0,8329  = 0,944   ó Teniendo en cuenta el resultado de coeficiente de correlación, es posible afirmar que hay una excelente correlación directa entre la estatura y el peso de los niños.

125

d.

¿Cuál es el peso que debería tener un estudiante que mida 120 cm?

 = 0,3786 − 22,751  = 0,3786(120) − 22,751  = 22,681 [] Un estudiante con 120 cm de estatura debe pesar aproximadamente 22,681 kg. Gabriel Jaimes 91517225 Laboratorio Regresión y Correlación Lineal

2.1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X (sal) 1,6 2,3 3,3 4,2 4,6 5,0

Y (Tensión) 98 102 109 113 115 120

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables DIAGRAMA DE DISPERSION 140 120    L    A    I 100    R    E    T 80    R    A    N    O 60    I    S    N    E 40    T

y = 6,1062x + 88,128 R² = 0,987

20 0 0

1

2

3 CONSUMO DE SAL

4

5

6

El tipo de asociación es lineal positiva o directa, la tensión arterial aumenta a medida que aumenta el consumo de sal. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo matemático que predice la relación entre el consumo de sal y la tensión arterial es:  = 6,1062 + 88,128 Siendo  el consumo de sal y  la tensión arterial. El coeficiente de determinación nos india la proporción de la variación de la variable y que es explicada por la variable x, cuanto mayor sea la proporción el coeficiente será más cercano 1, para nuestro ejemplo tenemos  = 0,987 que nos dice que el modelo matemático es muy confiable. c. Determine el grado de relación de las dos variables. El grado de relación es  = √  .  = √ 0.987  = 0.993 El grado de relación es entre la dosis de sal y la tensión arterial es muy alta. d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial esperada? Utilizamos la función de la recta de regresión para hallar la tensión esperada.  = 6,1062(4,8) + 88,128  = 117,44 Se espera una tensión arterial de 117 cuando el consumo de sal es 4,8. 2.2 En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio ( medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación: X 12 23 35 42 53 65

70

Y

45 30

27

25

23

21

20

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables. Para analizar la adaptación de los operarios al nuevo proceso las variables son las siguientes:  =    ó    = ú  í      DIAGRAMA DE DISPERSION 50 45    N 40    O    I    C    A35    C    I    R30    B    A25    F    E    D20    O    P 15    M    E    I 10    T

y = -0,3566x + 42,569 R² = 0,7963

5 0 0

10

20

30

40

50

60

70

80

DIAS DESDE EL INICIO DEL PROCESO

El tipo de asociación es lineal negativa o inversa. A medida que aumenta el número de días de implementación del proceso los trabajadores requieren menos tiempo para la fabricación de las piezas. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo matemático es igual a:  = −0,3566 + 42,569 Siendo  =   í    .  =    ó () El modelo tiene un 79.63% de exactitud, podemos concluir que es confiable. c. Determine el grado de correlación de las dos variables. Hallamos el coeficiente de correlación:  = −0,7963

 = −0,8924 La relación de las variables es negativa y tienen una correlación alta. d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 80 días? Utilizamos la función de la recta de regresión lineal para hallar el tiempo de fabricación cuando lleven 80 días.  = −0,3566(80) + 42,569  = 14,04 . El tiempo que tardara un empleado en fabricar una pieza cuando lleve 80 días será de 14,04 minutos. 2.3 Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación se presentan los resultados: Estatura 120 124 107 118 112 110 115 104 110 116 (cm) Peso ( 24 23 19 24 21 19 22 16 20 23 kg) a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables Para determinar el modelo matemático entre la relación entre el peso y la estatura de los estudiantes las variables son las siguientes:  =  ()  =  () DIAGRAMA DE DISPERSION 30 25 20    G    K    O15    S    E    P

y = 0,386x - 22,751 R² = 0,8329

10 5 0 100

10 5

110

1 15

ESTATURA CM

12 0

1 25

El tipo de asociación es lineal positiva o directa, a medida que aumenta la estatura también aumenta el peso de los estudiantes. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo matemático es igual a:  = 0,386 − 22,751  =        =       El modelo tiene un coeficiente de determinación o exactitud de 83.29%, lo que nos india que el modelo es confiable. c. Determine el grado de correlación de las dos variables. El grado de correlación es igual a:  = √ 0.8329  = 0.9126 La correlación es positiva y las variables tienen una alta correlación. d. ¿Cuál es el peso que debería tener un estudiante que mida 120 cm? Utilizamos la función de la recta de regresión lineal para hallar el peso que debería tener un estudiante de 120cm.

 = 0.386(120) − 22.751  = 23.569  Por lo tanto se espera que un estudiante que mida 120 cm tenga un peso de aproxidamente 24 kg.  Análisis Regresión Y Correlación Lineal Simple Desempleo en Colombia.  Isabel Ramos

Variables a trabajar: Variable Independiente: año Variable Dependiente: tasa de desempleo A partir de la base de datos suministrada, cada estudiante debe: -Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas. Año

Tasa de desempleo (%)

2.001

16,69

2.001

17,31

2.001

15,71

2.001

14,59

2.001

14,23

2.001

15,23

2.001

15,02

2.001

14,71

2.001

14,28

2.001

14,59

2.001

13,55

2.001

13,84

2.002

17,87

2.002

15,85

2.002

14,95

2.002

16,14

2.002

14,43

2.002

16,25

2.002

15,41

2.002

15,78

2.002

14,56

2.002

14,81

2.002

14,71

2.002

15,77

2.003

16,12

2.003

16,28

2.003

12,98

2.003

14,80

2.003

12,89

2.003

14,14

2.003

14,44

2.003

14,43

2.003

14,26

2.003

13,70

2.003

12,91

2.003

12,19

2.004

17,00

2.004

15,69

2.004

13,62

2.004

14,68

2.004

13,75

2.004

14,00

2.004

12,94

Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables.

2.004

13,09

2.004

12,51

2.004

12,59

2.004

11,78

2.004

12,07

2.005

13,22

2.005

14,23

2.005

12,95

2.005

12,06

2.005

12,31

2.005

11,52

2.005

12,00

2.005

11,75

2.005

11,17

2.005

9,96

2.005

10,21

2.005

10,33

2.006

13,41

2.006

13,00

2.006

11,34

2.006

12,01

2.006

11,88

2.006

10,61

2.006

12,39

2.006

12,79

2.006

12,89

2.006

11,35

2.006

10,94

2.006

11,78

2.007

13,90

2.007

12,83

2.007

11,93

2.007

10,90

2.007

11,53

2.007

11,16

2.007

11,16

2.007

10,73

2.007

10,84

2.007

10,05

2.007

9,42

2.007

9,89

2.008

13,08

2.008

11,99

2.008

11,22

2.008

11,13

2.008

10,84

2.008

11,17

2.008

12,06

2.008

11,22

2.008

10,95

2.008

10,12

2.008

10,80

2.008

10,61

2.009

14,25

2.009

12,49

2.009

11,99

2.009

12,14

2.009

11,66

2.009

11,34

2.009

12,63

2.009

11,74

2.009

12,16

2.009

11,55

2.009

11,08

2.009

11,31

2.010

14,62

2.010

12,59

2.010

11,81

2.010

12,24

2.010

12,04

2.010

11,64

2.010

12,68

2.010

11,16

2.010

10,57

2.010

10,15

2.010

10,79

2.010

11,12

2.011

13,56

2.011

12,86

2.011

10,87

2.011

11,19

2.011

11,24

2.011

10,91

2.011

11,54

2.011

10,08

2.011

9,74

2.011

9,00

2.011

9,22

2.011

9,82

2.012

12,48

2.012

11,87

2.012

10,36

2.012

10,86

2.012

10,71

2.012

10,03

2.012

10,86

2.012

9,75

2.012

9,94

2.012

8,85

2.012

9,25

2.012

9,55

2.013

12,07

2.013

11,79

2.013

10,21

2.013

10,17

2.013

9,42

2.013

9,24

2.013

9,88

2.013

9,27

2.013

8,98

2.013

7,79

2.013

8,48

2.013

8,44

2.014

11,10

2.014

10,68

2.014

9,73

2.014

8,97

2.014

8,80

2.014

9,19

2.014

9,29

2.014

8,90

2.014

8,35

2.014

7,86

2.014

7,71

2.014

8,72

2.015

10,79

2.015

9,86

2.015

8,86

2.015

9,50

2.015

8,93

2.015

8,25

2.015

8,84

2.015

9,09

2.015

8,98

2.015

8,19

2.015

7,27

2.015

8,59

2.016

11,91

2.016

10,00

2.016

10,14

2.016

9,02

2.016

8,85

2.016

8,88

2.016

9,85

2.016

8,99

2.016

8,51

2.016

8,29

2.016

7,51

2.016

8,74

2.017

11,73

2.017

10,50

2.017

9,70 20,00 18,00 16,00

   %    n 14,00    e    o    e 12,00     l    p    m 10,00    e    s    e     d 8,00    e     d    a    s 6,00    a    T

y = -0,3925x + 800,08 R² = 0,67

4,00 2,00 0,00  2.000

2.002

2.004

2.006

2.008

2.010

2.012

2.014

2.016

2.018

Año

Indica que este tipo de relación es directa, entre más años menos es el aumento en la tasa de desempleo. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable?

y = -0,3925x + 800,08 R² = 0,67 No es tan confiable, tiene apenas un porcentaje de 67% de confiabilidad. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. - Relacionar la información obtenida con el problema. R² = 0,67 R= √0.67

R= 0.8185 Por lo tanto existe una correlación aceptable. La relación obtenida en el problema es que a mayor cantidad de años o sea en la actualidad desde el 2001 el porcentaje de tasa de empleo a disminuido por lo que es algo positivo para el país, es decir existen ahora menos personas sin empleo. Estos valores se analizaron desde el 2001 hasta el año 2017, haciendo un control del mismo y verificando cual es el problema existente, esta información es útil para el paisa ya que permite verificar si estamos mejorando o no en la tasa de desempleo. Laura Yesenia Morales Regresión y Correlación lineal Simple

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas. Tasa de empleo (%)

Tasa de desempleo (%)

52,19

17,87

52,72

15,85

53,01

16,69

52,55

14,95

52,71

17,31

52,53

16,14

53,02

15,71

53,02

14,43

51,45

14,59

51,33

16,25

51,23

14,23

52,79

15,41

51,76

15,23

51,60

15,78

52,10

15,02

52,18

14,56

52,94

14,71

53,87

14,81

53,88

14,28

53,67

14,71

53,81

14,59

52,24

15,77

55,93

13,55

51,95

16,12

55,23

13,84

52,57

16,28

54,47

12,98

50,87

12,79

53,35

14,80

49,99

12,89

54,89

12,89

51,20

11,35

52,53

14,14

50,82

10,94

52,97

14,44

50,88

11,78

54,14

14,43

48,97

13,90

54,28

14,26

51,21

12,83

55,50

13,70

50,43

11,93

55,58

12,91

52,30

10,90

55,23

12,19

51,08

11,53

52,13

17,00

51,53

11,16

52,53

15,69

51,34

11,16

53,71

13,62

51,26

10,73

52,69

14,68

52,07

10,84

53,12

13,75

54,56

10,05

51,59

14,00

54,06

9,42

53,52

12,94

52,43

9,89

52,77

13,09

50,13

13,08

53,06

12,51

51,90

11,99

53,80

12,59

53,00

11,22

54,40

11,78

52,93

11,13

53,56

12,07

52,74

10,84

52,39

13,22

50,78

11,17

51,69

14,23

51,61

12,06

52,20

12,95

51,48

11,22

52,84

12,06

52,11

10,95

52,85

12,31

52,72

10,12

52,52

11,52

51,33

10,80

54,05

12,00

52,22

10,61

53,06

11,75

50,33

14,25

53,68

11,17

52,20

12,49

55,42

9,96

53,38

11,99

54,69

10,21

54,09

12,14

55,16

10,33

54,40

11,66

52,05

13,41

54,20

11,34

52,56

13,00

53,88

12,63

53,96

11,34

53,34

11,74

52,06

12,01

53,31

12,16

52,67

11,88

56,55

11,55

54,23

10,61

55,92

11,08

52,86

12,39

55,50

11,31

53,02

14,62

57,84

9,24

54,59

12,59

57,81

9,88

54,26

11,81

58,59

9,27

55,40

12,24

58,01

8,98

54,89

12,04

60,92

7,79

55,15

11,64

58,84

8,48

54,63

12,68

59,06

8,44

55,55

11,16

56,56

11,10

56,65

10,57

56,29

10,68

57,37

10,15

56,72

9,73

56,82

10,79

58,12

8,97

55,93

11,12

58,32

8,80

54,07

13,56

58,35

9,19

54,42

12,86

57,64

9,29

55,81

10,87

58,97

8,90

55,75

11,19

59,16

8,35

56,39

11,24

61,27

7,86

56,05

10,91

60,33

7,71

56,00

11,54

58,88

8,72

56,43

10,08

56,94

10,79

57,66

9,74

57,39

9,86

60,87

9,00

58,23

8,86

59,49

9,22

59,27

9,50

58,52

9,82

58,81

8,93

55,95

12,48

59,10

8,25

56,73

11,87

58,35

8,84

57,52

10,36

58,86

9,09

57,48

10,86

58,71

8,98

58,26

10,71

61,41

8,19

58,79

10,03

60,88

7,27

57,22

10,86

59,52

8,59

58,14

9,75

56,86

11,91

57,27

9,94

57,93

10,00

59,94

8,85

56,88

10,14

58,36

9,25

58,76

9,02

58,41

9,55

58,22

8,85

56,16

12,07

58,82

8,88

56,20

11,79

57,30

9,85

56,47

10,21

58,79

8,99

57,00

10,17

58,71

8,51

58,73

9,42

60,77

8,29

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables. 20,00 18,00 16,00     ]    %14,00     [    o    e     l    p 12,00    m    e    s 10,00    e    D    e 8,00     d    a    s    a 6,00    T

y = -0,5818x + 43,639 R² = 0,5483

4,00 2,00 0,00 0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

Tasa de Empleo [%]

Teniendo en cuenta el diagrama de dispersión y la línea de tendencia obtenidas, es posible concluir que el tipo de asociación entre las variables inversa puesto que la tasa de empleo es inversamente proporcional a la tasa de desempleo, es decir, si la tasa de empleo aumenta, la tasa de desempleo disminuye. - Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? La regresión lineal es un método que se emplea para pronosticar o predecir el valor de una variable dependiente (Tensión Arterial) en función de los valores suministrados por una variable independiente (Dosis de Sal), se habla así de una regresión de y en función de x. Mediante el método de los mínimos cuadrados es posible determinar la ecuación de la recta estimada; por lo tanto, El modelo matemático que permite predecir el efecto de una variable sobre la otra es: =+

 = −0,5818 + 43,639   =    [%]

 =   [%]

 = −0,9425 + 65,971   =    

 = ó 

Para determinar la confiabilidad de la ecuación obtenida es necesario hallar el Coeficiente de Determinación ( ) El cual se trata de determinar las variaciones de la variable dependiente.  = 0.5483   ó 54,83%   Teniendo en cuenta el coeficiente de determinación y multiplicando por el 100% es posible afirmar que la ecuación de la recta es regularmente confiable en un 54,83%. - Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. Para determinar el coeficiente de relación de dos variables en la práctica es más frecuente usar, el coeficiente de correlación Lineal (r) o Coeficiente de Pearson.  =    El coeficiente de Correlación Lineal oscila entre +1 y -1, permitiendo confirmar el grado de relación entre las variables estudiadas.  = √ 0.5483  = 0.7404   ó Teniendo en cuenta el resultado de coeficiente de correlación es posible afirmar hay una recular correlación e inversa entre la tasa de empleo y la tasa de desempleo donde el desempleo es inversamente proporcional al empleo. Gabriel Jaimes 91517225

A partir de la base de datos suministrada, cada estudiante debe: -Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas. Para el análisis de la información se estudiaran las siguientes variables -Cantidad de empresas: Variable independiente -Personas con empleo: Variable dependiente Cantidad Empresas

Personas Con Empleo

214.672

22.111.213,61

224.127

22.860.973,82

216.331

20.984.121,51

217.033

22.137.372,22

234.202

23.185.955,41

199.574

20.356.518,27

232.293

22.764.686,89

217.903

21.790.274,54

216.385

21.638.475,65

215.610

21.129.809,62

228.405

23.068.951,68

213.948

21.180.834,26

225.758

22.575.783,04

212.868

21.499.666,90

196.252

20.213.966,08

199.868

20.386.581,99

232.909

23.057.956,75

204.533

20.453.331,46

220.862

22.086.249,58

234.325

22.963.871,30

222.428

22.465.189,70

226.574

23.110.510,11

228.287

22.372.124,92

215.648

21.564.798,78

218.648

22.083.413,10

230.150

23.705.484,14

225.610

22.561.027,66

234.592

22.990.016,77 233.734

22.905.884,86

220.034

21.563.364,83

221.898

21.967.931,60

226.331

22.633.063,55

223.660

22.142.301,22

236.898

22.979.080,18

226.308

22.857.080,05

233.199

23.086.735,58

230.340

23.725.032,49

233.764

23.376.411,33

216.157

20.967.253,03

217.061

21.923.195,65

244.041

23.671.992,45

229.027

22.215.633,63

226.067

22.832.778,47

212.606

21.473.211,26

209.476

20.528.654,48

217.611

22.413.939,11

231.862

23.186.196,00

209.652

21.594.189,71

233.162

22.849.902,53

243.809

23.893.307,61

210.057

21.635.866,31

217.541

22.189.228,75

227.630

22.307.726,60

230.971

22.404.194,33

230.039

22.313.794,53

241.811

23.939.286,52

210.743

20.652.822,76

219.474

22.386.301,11

231.307

23.362.050,42

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables. DIAGRAMA DE DISPERSION  35.000.000,00  30.000.000,00

   O    E    L    P  25.000.000,00    M    E    N 20.000.000,00    O    C    S  15.000.000,00    A    N    O 10.000.000,00    S    R    E    P

y = 96,27x + 892744 R² = 0,969

 5.000.000,00  -

50 . 00 0 100 .0 0 01 5 0 . 0 0 02 0 0 . 0 0 02 5 0 . 0 0 03 0 0 . 0 0 03 5 0 . 0 0 0 CANTIDAD DE EMPRESAS

El tipo de asociación es positiva o directa, el número de personas con empleo aumenta a medida que aumenta el número de empresas.

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo matemático que relaciona las dos variables es:  = 96,27 + 892744 Siendo:  = ú    =      El modelo tiene un coeficiente de determinación de 0,969, con lo cual concluimos que es muy confiable. - Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. El porcentaje de relación de explicación del modelo es del 96.9% (alto) y el grado de relación de las dos variables es igual a:  = √ 0.969  = 0.9843 El grado relación del número de empresas y la cantidad de personas con empleo es muy alta. - Relacionar la información obtenida con el problema. Con la información analizada podemos determinar que al aumentar el número de empresas aumenta el número de personas con empleo y con esto se disminuye el desempleo en Colombia. Una política que incentive la creación de empresas en Colombia garantiza que la tasa de desempleo disminuya.

Conclusiones -Con la regresión lineal podemos relacionar una variable (conocida como variable

dependiente) con una o más variables independientes por medio de una ecuación lineal. -En la regresión lineal simple una sola variable independiente explica el comportamiento de la variable independiente. -El coeficiente de correlación indica el nivel de asociación entre la variable dependiente e independiente en el modelo matemático de la regresión lineal, puede ser negativa o positiva y un valor cercano a 1 indica si efectivamente el modelo corresponde a una línea recta. -Cuando analizamos las variables de cantidad de empresas y la variable personas con empleo podemos determinar que al aumentar el número de empresas aumenta el número de personas con empleo y con esto se disminuye el desempleo en Colombia. Una política que incentive la creación de empresas en Colombia garantiza que la tasa de desempleo disminuya. - Cuando analizamos las variable tasa de desempleo contra tiempo podemos concluir que a mayor cantidad de años o sea en la actualidad desde el 2001 el porcentaje de tasa de empleo a disminuido por lo que es algo positivo para el país, es decir existen ahora menos personas sin empleo. Estos valores se analizaron desde el 2001 hasta el año 2017, haciendo un control del mismo y verificando cual es el problema existente, esta información es útil para el paisa ya que permite verificar si estamos mejorando o no en la tasa de desempleo.

Referencias Bibliográficas

Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto Politécnico Nacional. Recuperado de: http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&do cID=10436604&tm=1489456194304 Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F., MX: Instituto Politécnico Nacional, (2010). ProQuest ebrary. Recuperado de: http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&do cID=10365616&tm=1489456296586 Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística 1. Distrito Federal, MÉXICO: Grupo Editorial Patria. Recuperado de :http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&d ocID=11230886&tm=1489456400673

Anexo Universidad Nacional Abierta y a Distancia

Vicerrectoría Académica y de Investigación Guía para el uso de Recursos Educativos 1. Descripción general del curso Escuela o Unidad Académica Nivel de formación Campo de Formación Nombre del curso Código del curso Tipo de curso Número de créditos

Escuela de Ciencias Básicas, Tecnología e Ingeniería Profesional Formación interdisciplinar básica común Estadística Descriptiva 100105 Teórico Habilitable Si x No 2

2. Descripción de la actividad Tipo de Simula Laborato Recurs dor rio o virtual remoto Tipo de actividad:

Recurs o web

Recurso Otr x multimedia o

Individual x Colaborativa

Momento de la evaluación:

Inicial

Peso evaluativo de la actividad : 35 Fecha de inicio de la actividad: 02/11/2017 Temáticas que aborda el recurso:

Cuál

Número de 4 semanas

Intermedia, x Final unidad: Entorno donde se hace uso del recurso: Entorno de aprendizaje práctico. Fecha de cierre de la actividad: 28/11/2017 

Medidas Bivariantes Diagramas de dispersión Actividades a desarrollar

1. Este ejercicio práctico, pretende hacer la transferencia del conocimiento adquirido a partir de la elaboración del laboratorio de Regresión y Correlación Lineal , el cual se realizará utilizando el software gratuito INFOSTAT, que podrá descargar ingresando a Laboratorios Estadística Descriptiva: Infostat, Tutoriales, ( Entorno de aprendizaje práctico).

Los ejercicios prácticos también los podrán desarrollar utilizando la herramienta EXCEL, la cual aparece instalada por defecto en el Office de su computador. 2. En el entorno de aprendizaje Colaborativo Paso 4– Descripción de la Información, cada estudiante deberá enviar la solución de los tres ejercicios que aparecen a continuación: 2.1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les  administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X (sal) 1,6 2,3 3,3 4,2 4,6 5,0

Y (Tensión) 98 102 109 113 115 120

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? c. Determine el grado de relación de las dos variables. d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial esperada?

2.2 En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio ( medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación:

X Y

12 23 45 30

35 27

42 25

53 23

65 21

70 20

a. Identifique la variable dependiente (y) y la variable independiente (x),realice el diagrama de dispersión y determine el tipo de asociación entre las variables b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? c. Determine el grado de correlación de las dos variables. d. Que tiempo deberá tardarse un empleado cuando lleven 80 días? 2.3 Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación se presentan los resultados: Estatu 12 ra cm) 0 Peso ( 24 kg)

124

107

118

112

110

115

104

110

116

23

19

24

21

19

22

16

20

23

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? c. Determine el grado de correlación de las dos variables. d. Cuál es el peso que debería tener un estudiante que mida 120 cm?

Entorno para su desarrollo: Productos a entregar por el estudiante:

Entorno de aprendizaje colaborativo Archivo en Word o Excel. Nombre del estudiante_ laboratorio Regresión y Correlación lineal.

Tipo de Individual producto: Individual:

Archivo en Word o Excel.

x Colaborativ o

No se entrega ningún producto

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF