Paso4 TrabajoColaborativo 100105 131
Short Description
Trabajo Fase 4 Estadística Descriptiva Regresión y Correlación Lineal...
Description
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
Curso Estadística Descriptiva
Trabajo Colaborativo Unidad 2 Paso 4 Descripción de la Información Regresión y Correlación Lineal –
Tutor Heley Estefany Cepeda
Estudiantes Isabel Ramos Laura Yesenia Morales Gabriel Hernando Jaimes
Grupo: 100105_131
Campus Virtual UNAD
Noviembre 2017
–
Introducción
La estadística descriptiva es una parte de la estadística que estudia fenómenos mediante la recolección, organización en tablas y la interpretación de datos. La interpretación de los datos se puede realizar mediante gráficos estadísticos o cálculo de parámetros estadísticos, en el presente trabajo analizaremos la información mediante los gráficos estadísticos. Uno de los gráficos más importantes para analizar fenómenos es la regresión y la correlación lineal simple, que nos permite conocer la relación entre 2 variables, podemos observar cómo se comporta una variable y debida al comportamiento de una variable x. En este trabajo se desarrolla el laboratorio de regresión y correlación lineal y se analiza la base de datos del DANE sobre desempleo en Colombia que recoge 20 variables entre los años 2001 y 2017.
Justificación
Cuando realizamos un estudio estadístico lo hacemos para obtener conclusiones sobre una problemática que afecta a una población, en este caso la problemática es el desempleo en Colombia, y los gráficos estadísticos son herramientas que nos permiten analizar una gran cantidad de datos y hallar relaciones entre diferentes variables. Por este motivo en el presente trabajo se analizaran analiz aran diferentes variables que inciden en el desempleo en Colombia mediante los diagramas de dispersión y hallaremos el modelo matemáticos que predice el comportamiento de las variables estudiadas en la problemática del desempleo en Colombia.
Objetivos General:
Determinar la relación entre 2 o más variables de la problemática a partir de la correlación y la regresión lineal simple. Específicos: -Desarrollar el laboratorio de regresión y correlación
-Identificar variables cuantitativas que puedan estar correlacionadas y probar estadísticamente dicha relación. -Encontrar el modelo matemático que permite predecir el efecto de una variable sobre otra y comprobar su confiabilidad.
Desarrollo Laboratorio Regresión y Correlación Lineal Isabel Ramos
2.1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X (sal) 1,6 2,3 3,3 4,2 4,6 5,0
Y (Tensión) 98 102 109 113 115 120
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables Asociación 140 y = 6,1062x + 88,128 R² = 0,987
120 100 n 80 o i s n e 60 T
40 20 0 0
1
2
3
4
5
6
Consumo de Sal
RTA: El tipo de asociación del diagrama de dispersión es LINEAL, entre más consumo de sal mayor tensión arterial tendrán. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable?
El modelo matemático es: y = 6,1062x + 88,128 R² = 0,987 Se pude decir que el grado de confiabilidad es alto ya que el valor de R es cercano a 1. c. Determine el grado de relación de las dos variables. R² = 0,987 R= √0.987
R= 0.9934 Correlación excelente. d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial esperada? Para calcular la tensión arterial esperada, debemos reemplazar el valor de x en la ecuación. y = 6,1062(4.8) + 88,128 y= 117.43 Por lo tanto la tensión arterial esperada para una dosis de sal de 4.8 administrada será de 117.43. 2.2 En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio ( medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación: X Y
12 23 45 30
35 27
42 25
53 23
65 21
70 20
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
La variable dependiente y es el tiempo para tallar la pieza y la variable independiente x es el número de días. 50
A Z E I 45 P A40 N U R 35 A L L 30 A T A25 R A P 20 O D I 15 D E M10 O P M 5 E I T 0 Y
y = -0,3566x + 42,569 R² = 0,7963
0
10
20
30
40
50
60
70
80
X NUMERO DE DIAS
El tipo de relación es inversa ya que indica que entre más días de trabajo, menos tiempo usan par tallar una pieza. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? y = -0,3566x + 42,569 R² = 0,7963 Puede ser confiable porque tiene un porcentaje de 79.96% c. Determine el grado de correlación de las dos variables. R² = 0,7963 R= √0.7963
R= 0.8923 Por lo tanto existe una correlación aceptable. d. Que tiempo deberá tardarse un empleado cuando lleven 80 días? y = -0,3566x + 42,569 y = -0,3566(80) + 42,569 y= 14.041 Por lo tanto un empleado que lleve 80 días debe tardarse 14 minutos tallando una pieza.
2.3 Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación se presentan los resultados: Estatu 12 ra 0 (cm) Peso ( 24 kg)
124
107
118
112
110
115
104
110
116
23
19
24
21
19
22
16
20
23
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables 30 y = 0,386x - 22,751 R² = 0,8329
25 20 G K n e 15 o s e P
10 5 0 100
105
110
115
120
125
Estatura en CM
Variable independiente X la estatura y dependiente Y el peso. El tipo de relación entre las variables es directa ya que la línea de tendencia indica que a mayor estatura mayo peso. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? y = 0,386x - 22,751 R² = 0,8329 Si es confiable, la confiabilidad de los datos de del 83.29%
c. Determine el grado de correlación de las dos variables. R² = 0,8329 R= √0.8329
R= 0.9126 Por lo tanto existe una correlación excelente. d. Cuál es el peso que debería tener un estudiante que mida 120 cm? y = 0,386x - 22,751 y = 0,386(120) - 22,751 Y= 23,569 Por lo tanto un estudiante que tenga un estatura de 120 cm debera pesar 24 kg aproximadamente. Laura Yesenia Morales Actividades a desarrollar
Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X (sal) Y (Tensión) 1,6 98 2,3 102 3,3 109 4,2 113 4,6 115 5,0 120 a.
Realice el diagrama de dispersión y determine el tipo de asociación entre las variables
Asociación Consumo de Sal y Tensión Arterial 140 L 120 A I R 100 E T R 80 A N 60 Ó I S 40 N E T 20
y = 6,1062x + 88,128 R² = 0,987
0 0
1
2
3
4
5
6
DOSIS DE SAL
Teniendo en cuenta el diagrama de dispersión y la línea de tendencia obtenida, es posible concluir que el tipo de asociación entre las variables es directa puesto que la tensión arterial es directamente proporcional a la dosis de sal suministrada, es decir, si la dosis de sal aumenta, la tensión arterial aumenta a su vez. b.
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?
La regresión lineal es un método que se emplea para pronosticar o predecir el valor de una variable dependiente (Tensión Arterial) en función de los valores suministrados por una variable independiente (Dosis de Sal), se habla así de una regresión de y en función de x. Mediante el método de los mínimos cuadrados es posible determinar la ecuación de la recta estimada; por lo tanto, El modelo matemático que permite predecir el efecto de una variable sobre la otra es: =+ = 6,1062 + 88,128 = = ó Para determinar la confiabilidad de la ecuación obtenida es necesario hallar el Coeficiente de Determinación ( ) El cual se trata de determinar las variaciones de la variable dependiente. = 0.987 ó 98,7% Teniendo en cuenta el coeficiente de determinación y multiplicando por el 100% es posible afirmar que la ecuación de la recta es altamente confiable en un 98,7%. c.
Determine el grado de relación de las dos variables.
Para determinar el coeficiente de relación de dos variables en la práctica es más frecuente usar, el coeficiente de correlación Lineal (r) o Coeficiente de Pearson. = El coeficiente de Correlación Lineal oscila entre +1 y -1, permitiendo confirmar el grado de relación entre las variables estudiadas. = √ 0.987 = 0.9934 ó Teniendo en cuenta el resultado de coeficiente de correlación es posible afirmar hay una excelente correlación entre la dosis de sal y la tensión arterial donde la tensión arterial es directamente proporcional a la dosis de sal suministrada. d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial esperada? La tensión arterial esperada se calcula utilizando la ecuación lineal obtenida, al remplazar la dosis de sal de 4,8 en la ecuación. = 6,1062 + 88,128 = 6,1062(4,8) + 88,128 = 117,43776 Al dar solución al planteamiento matemático se determina que 117 es la tensión arterial esperada para una dosis de sal de 4,8. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio (medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación: X Y a.
12 23 45 30
35 27
42 25
53 23
65 21
70 20
Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables
Teniendo cuenta el análisis se desea realizar hace referencia a la adaptación y mejoramiento en el proceso de producción de los operarios, utilizando dos variables, Tiempo Medio que se utiliza en realizar una pieza y Número de días desde que empezó dicho proceso de fabricación.
Se espera que con el transcurso de los días el tiempo medio de realización de una pieza sea menor, en tanto, realizando un análisis de los resultados suministrados de puede afirmar que las variables son: X = Número de días desde que empezó la fabricación. Y = Tiempo medio utilizado en la fabricación de una pieza. A su vez, la relación entre ellas es inversamente proporcional puesto que, al aumentar los días desde el inicio de la producción, los operarios adquieren mayor destreza y adaptación, por lo cual el tiempo medio utilizado en una pieza va disminuyendo significativamente.
Mejoramiento del Proceso de Producción a travez de los días 50
45
45
] s 40 o t u 35 n i M30 [ o i d 25 e M20 o p 15 m e 10 i T
y = -0,3566x + 42,569 R² = 0,7963
30
27
25
23
21
20
5 0 0
10
20
30
40
50
60
70
Días Transcurridos [Días]
b.
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?
=+
= −0,3566 + 42,569 = í (í)
= ()
= 0,7963 ó 79,6%
80
Teniendo en cuenta el coeficiente de determinación y multiplicando por el 100% es posible afirmar que la ecuación de la recta es considerablemente confiable con un 79,6%. c.
Determine el grado de correlación de las dos variables.
Teniendo en cuenta que el tiempo medio es inversamente proporcional a los días transcurridos. El coeficiente de correlación es negativo. = = −0,7963 = −0,8923 ó Teniendo en cuenta el resultado de coeficiente de correlación es posible afirmar hay una correlación aceptable e inversa entre los días transcurridos desde el inicio de la producción y el tiempo medio de fabricación de una pieza. d. Que tiempo deberá tardarse un empleado cuando lleven 80 días? = −0,3566 + 42,569 = −0,3566(80) + 42,569 = 14,04 Un empleado debe tardarse aproximadamente 14,04 minutos en realizar una pieza artesanal en el día 80 de producción. Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación, se presentan los resultados: Estatura 120 124 107 118 112 110 115 104 110 116 (cm) Peso 24 23 19 24 21 19 22 16 20 23 (kg) a.
Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
Teniendo en cuenta el análisis de la información administrada, es posible afirmar, la variable independiente es la Estatura [cm] y la variable dependiente es el peso [kg].
30 25 21 19
20 16
] g k [ 15 o s e P
22
23
24
24
23
20 y = 0,386x - 22,751 R² = 0,8329
19
10 5 0 100
105
110
115
120
Estatura [cm]
A su vez, la relación entre las variables es directa, es decir, si la estatura de los niños aumenta su peso también aumenta. b.
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?
= 0,3786 − 22,751 = [] = [] = 0,8329 ó 83,29% Teniendo en cuenta el coeficiente de determinación y multiplicando por el 100% es posible afirmar que la ecuación de la recta es considerablemente confiable con un 83,29%. c.
Determine el grado de correlación de las dos variables.
Teniendo en cuenta que el peso es directamente proporcional a la estatura. El coeficiente de correlación. = = 0,8329 = 0,944 ó Teniendo en cuenta el resultado de coeficiente de correlación, es posible afirmar que hay una excelente correlación directa entre la estatura y el peso de los niños.
125
d.
¿Cuál es el peso que debería tener un estudiante que mida 120 cm?
= 0,3786 − 22,751 = 0,3786(120) − 22,751 = 22,681 [] Un estudiante con 120 cm de estatura debe pesar aproximadamente 22,681 kg. Gabriel Jaimes 91517225 Laboratorio Regresión y Correlación Lineal
2.1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X (sal) 1,6 2,3 3,3 4,2 4,6 5,0
Y (Tensión) 98 102 109 113 115 120
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables DIAGRAMA DE DISPERSION 140 120 L A I 100 R E T 80 R A N O 60 I S N E 40 T
y = 6,1062x + 88,128 R² = 0,987
20 0 0
1
2
3 CONSUMO DE SAL
4
5
6
El tipo de asociación es lineal positiva o directa, la tensión arterial aumenta a medida que aumenta el consumo de sal. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo matemático que predice la relación entre el consumo de sal y la tensión arterial es: = 6,1062 + 88,128 Siendo el consumo de sal y la tensión arterial. El coeficiente de determinación nos india la proporción de la variación de la variable y que es explicada por la variable x, cuanto mayor sea la proporción el coeficiente será más cercano 1, para nuestro ejemplo tenemos = 0,987 que nos dice que el modelo matemático es muy confiable. c. Determine el grado de relación de las dos variables. El grado de relación es = √ . = √ 0.987 = 0.993 El grado de relación es entre la dosis de sal y la tensión arterial es muy alta. d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial esperada? Utilizamos la función de la recta de regresión para hallar la tensión esperada. = 6,1062(4,8) + 88,128 = 117,44 Se espera una tensión arterial de 117 cuando el consumo de sal es 4,8. 2.2 En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio ( medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación: X 12 23 35 42 53 65
70
Y
45 30
27
25
23
21
20
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables. Para analizar la adaptación de los operarios al nuevo proceso las variables son las siguientes: = ó = ú í DIAGRAMA DE DISPERSION 50 45 N 40 O I C A35 C I R30 B A25 F E D20 O P 15 M E I 10 T
y = -0,3566x + 42,569 R² = 0,7963
5 0 0
10
20
30
40
50
60
70
80
DIAS DESDE EL INICIO DEL PROCESO
El tipo de asociación es lineal negativa o inversa. A medida que aumenta el número de días de implementación del proceso los trabajadores requieren menos tiempo para la fabricación de las piezas. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo matemático es igual a: = −0,3566 + 42,569 Siendo = í . = ó () El modelo tiene un 79.63% de exactitud, podemos concluir que es confiable. c. Determine el grado de correlación de las dos variables. Hallamos el coeficiente de correlación: = −0,7963
= −0,8924 La relación de las variables es negativa y tienen una correlación alta. d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 80 días? Utilizamos la función de la recta de regresión lineal para hallar el tiempo de fabricación cuando lleven 80 días. = −0,3566(80) + 42,569 = 14,04 . El tiempo que tardara un empleado en fabricar una pieza cuando lleve 80 días será de 14,04 minutos. 2.3 Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación se presentan los resultados: Estatura 120 124 107 118 112 110 115 104 110 116 (cm) Peso ( 24 23 19 24 21 19 22 16 20 23 kg) a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables Para determinar el modelo matemático entre la relación entre el peso y la estatura de los estudiantes las variables son las siguientes: = () = () DIAGRAMA DE DISPERSION 30 25 20 G K O15 S E P
y = 0,386x - 22,751 R² = 0,8329
10 5 0 100
10 5
110
1 15
ESTATURA CM
12 0
1 25
El tipo de asociación es lineal positiva o directa, a medida que aumenta la estatura también aumenta el peso de los estudiantes. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo matemático es igual a: = 0,386 − 22,751 = = El modelo tiene un coeficiente de determinación o exactitud de 83.29%, lo que nos india que el modelo es confiable. c. Determine el grado de correlación de las dos variables. El grado de correlación es igual a: = √ 0.8329 = 0.9126 La correlación es positiva y las variables tienen una alta correlación. d. ¿Cuál es el peso que debería tener un estudiante que mida 120 cm? Utilizamos la función de la recta de regresión lineal para hallar el peso que debería tener un estudiante de 120cm.
= 0.386(120) − 22.751 = 23.569 Por lo tanto se espera que un estudiante que mida 120 cm tenga un peso de aproxidamente 24 kg. Análisis Regresión Y Correlación Lineal Simple Desempleo en Colombia. Isabel Ramos
Variables a trabajar: Variable Independiente: año Variable Dependiente: tasa de desempleo A partir de la base de datos suministrada, cada estudiante debe: -Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas. Año
Tasa de desempleo (%)
2.001
16,69
2.001
17,31
2.001
15,71
2.001
14,59
2.001
14,23
2.001
15,23
2.001
15,02
2.001
14,71
2.001
14,28
2.001
14,59
2.001
13,55
2.001
13,84
2.002
17,87
2.002
15,85
2.002
14,95
2.002
16,14
2.002
14,43
2.002
16,25
2.002
15,41
2.002
15,78
2.002
14,56
2.002
14,81
2.002
14,71
2.002
15,77
2.003
16,12
2.003
16,28
2.003
12,98
2.003
14,80
2.003
12,89
2.003
14,14
2.003
14,44
2.003
14,43
2.003
14,26
2.003
13,70
2.003
12,91
2.003
12,19
2.004
17,00
2.004
15,69
2.004
13,62
2.004
14,68
2.004
13,75
2.004
14,00
2.004
12,94
Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables.
2.004
13,09
2.004
12,51
2.004
12,59
2.004
11,78
2.004
12,07
2.005
13,22
2.005
14,23
2.005
12,95
2.005
12,06
2.005
12,31
2.005
11,52
2.005
12,00
2.005
11,75
2.005
11,17
2.005
9,96
2.005
10,21
2.005
10,33
2.006
13,41
2.006
13,00
2.006
11,34
2.006
12,01
2.006
11,88
2.006
10,61
2.006
12,39
2.006
12,79
2.006
12,89
2.006
11,35
2.006
10,94
2.006
11,78
2.007
13,90
2.007
12,83
2.007
11,93
2.007
10,90
2.007
11,53
2.007
11,16
2.007
11,16
2.007
10,73
2.007
10,84
2.007
10,05
2.007
9,42
2.007
9,89
2.008
13,08
2.008
11,99
2.008
11,22
2.008
11,13
2.008
10,84
2.008
11,17
2.008
12,06
2.008
11,22
2.008
10,95
2.008
10,12
2.008
10,80
2.008
10,61
2.009
14,25
2.009
12,49
2.009
11,99
2.009
12,14
2.009
11,66
2.009
11,34
2.009
12,63
2.009
11,74
2.009
12,16
2.009
11,55
2.009
11,08
2.009
11,31
2.010
14,62
2.010
12,59
2.010
11,81
2.010
12,24
2.010
12,04
2.010
11,64
2.010
12,68
2.010
11,16
2.010
10,57
2.010
10,15
2.010
10,79
2.010
11,12
2.011
13,56
2.011
12,86
2.011
10,87
2.011
11,19
2.011
11,24
2.011
10,91
2.011
11,54
2.011
10,08
2.011
9,74
2.011
9,00
2.011
9,22
2.011
9,82
2.012
12,48
2.012
11,87
2.012
10,36
2.012
10,86
2.012
10,71
2.012
10,03
2.012
10,86
2.012
9,75
2.012
9,94
2.012
8,85
2.012
9,25
2.012
9,55
2.013
12,07
2.013
11,79
2.013
10,21
2.013
10,17
2.013
9,42
2.013
9,24
2.013
9,88
2.013
9,27
2.013
8,98
2.013
7,79
2.013
8,48
2.013
8,44
2.014
11,10
2.014
10,68
2.014
9,73
2.014
8,97
2.014
8,80
2.014
9,19
2.014
9,29
2.014
8,90
2.014
8,35
2.014
7,86
2.014
7,71
2.014
8,72
2.015
10,79
2.015
9,86
2.015
8,86
2.015
9,50
2.015
8,93
2.015
8,25
2.015
8,84
2.015
9,09
2.015
8,98
2.015
8,19
2.015
7,27
2.015
8,59
2.016
11,91
2.016
10,00
2.016
10,14
2.016
9,02
2.016
8,85
2.016
8,88
2.016
9,85
2.016
8,99
2.016
8,51
2.016
8,29
2.016
7,51
2.016
8,74
2.017
11,73
2.017
10,50
2.017
9,70 20,00 18,00 16,00
% n 14,00 e o e 12,00 l p m 10,00 e s e d 8,00 e d a s 6,00 a T
y = -0,3925x + 800,08 R² = 0,67
4,00 2,00 0,00 2.000
2.002
2.004
2.006
2.008
2.010
2.012
2.014
2.016
2.018
Año
Indica que este tipo de relación es directa, entre más años menos es el aumento en la tasa de desempleo. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable?
y = -0,3925x + 800,08 R² = 0,67 No es tan confiable, tiene apenas un porcentaje de 67% de confiabilidad. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. - Relacionar la información obtenida con el problema. R² = 0,67 R= √0.67
R= 0.8185 Por lo tanto existe una correlación aceptable. La relación obtenida en el problema es que a mayor cantidad de años o sea en la actualidad desde el 2001 el porcentaje de tasa de empleo a disminuido por lo que es algo positivo para el país, es decir existen ahora menos personas sin empleo. Estos valores se analizaron desde el 2001 hasta el año 2017, haciendo un control del mismo y verificando cual es el problema existente, esta información es útil para el paisa ya que permite verificar si estamos mejorando o no en la tasa de desempleo. Laura Yesenia Morales Regresión y Correlación lineal Simple
-Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas. Tasa de empleo (%)
Tasa de desempleo (%)
52,19
17,87
52,72
15,85
53,01
16,69
52,55
14,95
52,71
17,31
52,53
16,14
53,02
15,71
53,02
14,43
51,45
14,59
51,33
16,25
51,23
14,23
52,79
15,41
51,76
15,23
51,60
15,78
52,10
15,02
52,18
14,56
52,94
14,71
53,87
14,81
53,88
14,28
53,67
14,71
53,81
14,59
52,24
15,77
55,93
13,55
51,95
16,12
55,23
13,84
52,57
16,28
54,47
12,98
50,87
12,79
53,35
14,80
49,99
12,89
54,89
12,89
51,20
11,35
52,53
14,14
50,82
10,94
52,97
14,44
50,88
11,78
54,14
14,43
48,97
13,90
54,28
14,26
51,21
12,83
55,50
13,70
50,43
11,93
55,58
12,91
52,30
10,90
55,23
12,19
51,08
11,53
52,13
17,00
51,53
11,16
52,53
15,69
51,34
11,16
53,71
13,62
51,26
10,73
52,69
14,68
52,07
10,84
53,12
13,75
54,56
10,05
51,59
14,00
54,06
9,42
53,52
12,94
52,43
9,89
52,77
13,09
50,13
13,08
53,06
12,51
51,90
11,99
53,80
12,59
53,00
11,22
54,40
11,78
52,93
11,13
53,56
12,07
52,74
10,84
52,39
13,22
50,78
11,17
51,69
14,23
51,61
12,06
52,20
12,95
51,48
11,22
52,84
12,06
52,11
10,95
52,85
12,31
52,72
10,12
52,52
11,52
51,33
10,80
54,05
12,00
52,22
10,61
53,06
11,75
50,33
14,25
53,68
11,17
52,20
12,49
55,42
9,96
53,38
11,99
54,69
10,21
54,09
12,14
55,16
10,33
54,40
11,66
52,05
13,41
54,20
11,34
52,56
13,00
53,88
12,63
53,96
11,34
53,34
11,74
52,06
12,01
53,31
12,16
52,67
11,88
56,55
11,55
54,23
10,61
55,92
11,08
52,86
12,39
55,50
11,31
53,02
14,62
57,84
9,24
54,59
12,59
57,81
9,88
54,26
11,81
58,59
9,27
55,40
12,24
58,01
8,98
54,89
12,04
60,92
7,79
55,15
11,64
58,84
8,48
54,63
12,68
59,06
8,44
55,55
11,16
56,56
11,10
56,65
10,57
56,29
10,68
57,37
10,15
56,72
9,73
56,82
10,79
58,12
8,97
55,93
11,12
58,32
8,80
54,07
13,56
58,35
9,19
54,42
12,86
57,64
9,29
55,81
10,87
58,97
8,90
55,75
11,19
59,16
8,35
56,39
11,24
61,27
7,86
56,05
10,91
60,33
7,71
56,00
11,54
58,88
8,72
56,43
10,08
56,94
10,79
57,66
9,74
57,39
9,86
60,87
9,00
58,23
8,86
59,49
9,22
59,27
9,50
58,52
9,82
58,81
8,93
55,95
12,48
59,10
8,25
56,73
11,87
58,35
8,84
57,52
10,36
58,86
9,09
57,48
10,86
58,71
8,98
58,26
10,71
61,41
8,19
58,79
10,03
60,88
7,27
57,22
10,86
59,52
8,59
58,14
9,75
56,86
11,91
57,27
9,94
57,93
10,00
59,94
8,85
56,88
10,14
58,36
9,25
58,76
9,02
58,41
9,55
58,22
8,85
56,16
12,07
58,82
8,88
56,20
11,79
57,30
9,85
56,47
10,21
58,79
8,99
57,00
10,17
58,71
8,51
58,73
9,42
60,77
8,29
- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables. 20,00 18,00 16,00 ] %14,00 [ o e l p 12,00 m e s 10,00 e D e 8,00 d a s a 6,00 T
y = -0,5818x + 43,639 R² = 0,5483
4,00 2,00 0,00 0,00
10,00
20,00
30,00
40,00
50,00
60,00
70,00
Tasa de Empleo [%]
Teniendo en cuenta el diagrama de dispersión y la línea de tendencia obtenidas, es posible concluir que el tipo de asociación entre las variables inversa puesto que la tasa de empleo es inversamente proporcional a la tasa de desempleo, es decir, si la tasa de empleo aumenta, la tasa de desempleo disminuye. - Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? La regresión lineal es un método que se emplea para pronosticar o predecir el valor de una variable dependiente (Tensión Arterial) en función de los valores suministrados por una variable independiente (Dosis de Sal), se habla así de una regresión de y en función de x. Mediante el método de los mínimos cuadrados es posible determinar la ecuación de la recta estimada; por lo tanto, El modelo matemático que permite predecir el efecto de una variable sobre la otra es: =+
= −0,5818 + 43,639 = [%]
= [%]
= −0,9425 + 65,971 =
= ó
Para determinar la confiabilidad de la ecuación obtenida es necesario hallar el Coeficiente de Determinación ( ) El cual se trata de determinar las variaciones de la variable dependiente. = 0.5483 ó 54,83% Teniendo en cuenta el coeficiente de determinación y multiplicando por el 100% es posible afirmar que la ecuación de la recta es regularmente confiable en un 54,83%. - Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. Para determinar el coeficiente de relación de dos variables en la práctica es más frecuente usar, el coeficiente de correlación Lineal (r) o Coeficiente de Pearson. = El coeficiente de Correlación Lineal oscila entre +1 y -1, permitiendo confirmar el grado de relación entre las variables estudiadas. = √ 0.5483 = 0.7404 ó Teniendo en cuenta el resultado de coeficiente de correlación es posible afirmar hay una recular correlación e inversa entre la tasa de empleo y la tasa de desempleo donde el desempleo es inversamente proporcional al empleo. Gabriel Jaimes 91517225
A partir de la base de datos suministrada, cada estudiante debe: -Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas. Para el análisis de la información se estudiaran las siguientes variables -Cantidad de empresas: Variable independiente -Personas con empleo: Variable dependiente Cantidad Empresas
Personas Con Empleo
214.672
22.111.213,61
224.127
22.860.973,82
216.331
20.984.121,51
217.033
22.137.372,22
234.202
23.185.955,41
199.574
20.356.518,27
232.293
22.764.686,89
217.903
21.790.274,54
216.385
21.638.475,65
215.610
21.129.809,62
228.405
23.068.951,68
213.948
21.180.834,26
225.758
22.575.783,04
212.868
21.499.666,90
196.252
20.213.966,08
199.868
20.386.581,99
232.909
23.057.956,75
204.533
20.453.331,46
220.862
22.086.249,58
234.325
22.963.871,30
222.428
22.465.189,70
226.574
23.110.510,11
228.287
22.372.124,92
215.648
21.564.798,78
218.648
22.083.413,10
230.150
23.705.484,14
225.610
22.561.027,66
234.592
22.990.016,77 233.734
22.905.884,86
220.034
21.563.364,83
221.898
21.967.931,60
226.331
22.633.063,55
223.660
22.142.301,22
236.898
22.979.080,18
226.308
22.857.080,05
233.199
23.086.735,58
230.340
23.725.032,49
233.764
23.376.411,33
216.157
20.967.253,03
217.061
21.923.195,65
244.041
23.671.992,45
229.027
22.215.633,63
226.067
22.832.778,47
212.606
21.473.211,26
209.476
20.528.654,48
217.611
22.413.939,11
231.862
23.186.196,00
209.652
21.594.189,71
233.162
22.849.902,53
243.809
23.893.307,61
210.057
21.635.866,31
217.541
22.189.228,75
227.630
22.307.726,60
230.971
22.404.194,33
230.039
22.313.794,53
241.811
23.939.286,52
210.743
20.652.822,76
219.474
22.386.301,11
231.307
23.362.050,42
- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables. DIAGRAMA DE DISPERSION 35.000.000,00 30.000.000,00
O E L P 25.000.000,00 M E N 20.000.000,00 O C S 15.000.000,00 A N O 10.000.000,00 S R E P
y = 96,27x + 892744 R² = 0,969
5.000.000,00 -
50 . 00 0 100 .0 0 01 5 0 . 0 0 02 0 0 . 0 0 02 5 0 . 0 0 03 0 0 . 0 0 03 5 0 . 0 0 0 CANTIDAD DE EMPRESAS
El tipo de asociación es positiva o directa, el número de personas con empleo aumenta a medida que aumenta el número de empresas.
- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo matemático que relaciona las dos variables es: = 96,27 + 892744 Siendo: = ú = El modelo tiene un coeficiente de determinación de 0,969, con lo cual concluimos que es muy confiable. - Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. El porcentaje de relación de explicación del modelo es del 96.9% (alto) y el grado de relación de las dos variables es igual a: = √ 0.969 = 0.9843 El grado relación del número de empresas y la cantidad de personas con empleo es muy alta. - Relacionar la información obtenida con el problema. Con la información analizada podemos determinar que al aumentar el número de empresas aumenta el número de personas con empleo y con esto se disminuye el desempleo en Colombia. Una política que incentive la creación de empresas en Colombia garantiza que la tasa de desempleo disminuya.
Conclusiones -Con la regresión lineal podemos relacionar una variable (conocida como variable
dependiente) con una o más variables independientes por medio de una ecuación lineal. -En la regresión lineal simple una sola variable independiente explica el comportamiento de la variable independiente. -El coeficiente de correlación indica el nivel de asociación entre la variable dependiente e independiente en el modelo matemático de la regresión lineal, puede ser negativa o positiva y un valor cercano a 1 indica si efectivamente el modelo corresponde a una línea recta. -Cuando analizamos las variables de cantidad de empresas y la variable personas con empleo podemos determinar que al aumentar el número de empresas aumenta el número de personas con empleo y con esto se disminuye el desempleo en Colombia. Una política que incentive la creación de empresas en Colombia garantiza que la tasa de desempleo disminuya. - Cuando analizamos las variable tasa de desempleo contra tiempo podemos concluir que a mayor cantidad de años o sea en la actualidad desde el 2001 el porcentaje de tasa de empleo a disminuido por lo que es algo positivo para el país, es decir existen ahora menos personas sin empleo. Estos valores se analizaron desde el 2001 hasta el año 2017, haciendo un control del mismo y verificando cual es el problema existente, esta información es útil para el paisa ya que permite verificar si estamos mejorando o no en la tasa de desempleo.
Referencias Bibliográficas
Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto Politécnico Nacional. Recuperado de: http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&do cID=10436604&tm=1489456194304 Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F., MX: Instituto Politécnico Nacional, (2010). ProQuest ebrary. Recuperado de: http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&do cID=10365616&tm=1489456296586 Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística 1. Distrito Federal, MÉXICO: Grupo Editorial Patria. Recuperado de :http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&d ocID=11230886&tm=1489456400673
Anexo Universidad Nacional Abierta y a Distancia
Vicerrectoría Académica y de Investigación Guía para el uso de Recursos Educativos 1. Descripción general del curso Escuela o Unidad Académica Nivel de formación Campo de Formación Nombre del curso Código del curso Tipo de curso Número de créditos
Escuela de Ciencias Básicas, Tecnología e Ingeniería Profesional Formación interdisciplinar básica común Estadística Descriptiva 100105 Teórico Habilitable Si x No 2
2. Descripción de la actividad Tipo de Simula Laborato Recurs dor rio o virtual remoto Tipo de actividad:
Recurs o web
Recurso Otr x multimedia o
Individual x Colaborativa
Momento de la evaluación:
Inicial
Peso evaluativo de la actividad : 35 Fecha de inicio de la actividad: 02/11/2017 Temáticas que aborda el recurso:
Cuál
Número de 4 semanas
Intermedia, x Final unidad: Entorno donde se hace uso del recurso: Entorno de aprendizaje práctico. Fecha de cierre de la actividad: 28/11/2017
Medidas Bivariantes Diagramas de dispersión Actividades a desarrollar
1. Este ejercicio práctico, pretende hacer la transferencia del conocimiento adquirido a partir de la elaboración del laboratorio de Regresión y Correlación Lineal , el cual se realizará utilizando el software gratuito INFOSTAT, que podrá descargar ingresando a Laboratorios Estadística Descriptiva: Infostat, Tutoriales, ( Entorno de aprendizaje práctico).
Los ejercicios prácticos también los podrán desarrollar utilizando la herramienta EXCEL, la cual aparece instalada por defecto en el Office de su computador. 2. En el entorno de aprendizaje Colaborativo Paso 4– Descripción de la Información, cada estudiante deberá enviar la solución de los tres ejercicios que aparecen a continuación: 2.1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X (sal) 1,6 2,3 3,3 4,2 4,6 5,0
Y (Tensión) 98 102 109 113 115 120
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? c. Determine el grado de relación de las dos variables. d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial esperada?
2.2 En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio ( medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación:
X Y
12 23 45 30
35 27
42 25
53 23
65 21
70 20
a. Identifique la variable dependiente (y) y la variable independiente (x),realice el diagrama de dispersión y determine el tipo de asociación entre las variables b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? c. Determine el grado de correlación de las dos variables. d. Que tiempo deberá tardarse un empleado cuando lleven 80 días? 2.3 Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación se presentan los resultados: Estatu 12 ra cm) 0 Peso ( 24 kg)
124
107
118
112
110
115
104
110
116
23
19
24
21
19
22
16
20
23
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? c. Determine el grado de correlación de las dos variables. d. Cuál es el peso que debería tener un estudiante que mida 120 cm?
Entorno para su desarrollo: Productos a entregar por el estudiante:
Entorno de aprendizaje colaborativo Archivo en Word o Excel. Nombre del estudiante_ laboratorio Regresión y Correlación lineal.
Tipo de Individual producto: Individual:
Archivo en Word o Excel.
x Colaborativ o
No se entrega ningún producto
View more...
Comments