Sesion 07 - Correlacion y Regresion - 10.08
July 6, 2022 | Author: Anonymous | Category: N/A
Short Description
Download Sesion 07 - Correlacion y Regresion - 10.08...
Description
ANALISIS DE CORRELACIÓN CAPACIDADES:
Analiza el coefciente de correlación de Pearson para dos variables cuantavas y los coefcientes para el modelo de regresión lineal simple. TEMÁTICA:
Aplicaciones
con
el
diagrama
de
dispersión. Coefciente de correlación lineal de Pearson.
Modelo de regresión lineal simple (Uso de EXCEL).
Inorme Estadísco: Análisis (discusión).
Diagramas de dispersión o nube de puntos Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión. O bservar datos del cuadro anterior Altura en cm. 161
100 Peso en Kg. 90 50
187
76
197
85
179
65
171
66
169
60
166
54
176
84
163
68
...
...
80
Pesa 85 kg. (187,76)
Pesa 76 kg.
70 60 50
Pesa 50 kg.
(161,50)
Mide 161 cm.
40 30 140
150
160
170
180
. m c
m c 7 9
7 8 1 e d i M
1 e d i M
190
200
Peso (Kg.)
Relación entre las variables (X)anterior. y peso (Y) de los 30 individuos vistos en el altura ejemplo Altura en cm.
Peso 100 en Kg.
161
50
187
76
197
85
179
65
90 80
t a n e u m a a a u r t t l A
70
n t a e u m a a s o P e
60 171 169
66 60
166
54
176
84
163
68
...
...
50 40 30 140
150
160
170
180
Altura (cm) 190 200
DIAGRAMA DE DISPERSION O NUBE DE PUNTOS Grafco que muestra la
Y
Y
•
lineal relación entre doslineal variables numéricas
•
•
•
Y
hps://phet.colorado.ed u/sims/html/least-squar es-regression/latest/leas t-squares-regression_es. html
(b) Lineal inversa
(a) Lineal directa
•
•
(c) Curvilínea directa Y
•
•
•
•
Y •
•
•
•
•
X
•
• • •
•
•
•
•
•
•
•
(d) Curvilínea inversa
•
•
• •
•
•
X
•
Y
•
• • • • •
•
X
•
•
•
X
•
•
•
• • • • • • • • • •
•
•
X
(e) Lineal inversa con más dispersión
•
•
•
•
•
•
•
• •
•• • ••
X
(d) Ninguna relación
COEFICIENTE DE CORRELACIÓN ( )
• La correlación se esma mediante el coefciente
de correlación de Pearson (r), y es ulizado cuando ambas variables son cuantavas siguiendo una distribución normal. • Para cada coefciente obtenido se puede realizar el siguiente el contraste de hipótesis para determinar si el coefciente es igual a cero: • H0: = 0 •
H1: 0
COEFICIENTE DE CORRELACIÓN DE PEARSON (r) Mide la uerza y dirección de una relación lineal entre 2 variables cuantavas siguiendo cuantavas siguiendo una distribución normal. • Se puede realizar el siguiente el contraste de hipótesis para determinar si el coefciente es igual a cer cero: o: H0: = 0 vs H1: 0 •
Variables
r
Cuantavas ∗
Cov( x, y )
x
X
∑
y
√
Siguen Distribución
[(
∗
Y
∑
−
Normal
∑ − ∑ ∑ ∗
( ∑ ) XY
) ] [( ∗
∗
∑
X2
−
( ∑ )) Y2
)]
Correlación Lineal - Tendencias Tendencias
-1
Muy Alta --
-0.8
erfecta --
Alta --
Moderada --
-0.6
-0.4
Baja --
Muy baja --
-0.2
0
Muy baja +
ula
0.2
Baja +
Moderada +
0.4
0.6
Alta +
El valor R oscila entre [-1; 1]. Cuanto más cerca esté R de -1 o +1 mejor será el grado de relación lineal.
0.8
Muy Alta +
1
Perfecta +
Correlación Lineal - Tendencias Tendencias
• Antes de Calcular un coefciente de correlación, se debe inspeccionar los datos
para detectar valores apicos (que pueden producir resultados erróneos) • Dos variables pueden estar perectamente relacionadas pero si la relación no es lineal, el Coefciente de correlación de Pearson no será un estadísco adecuado para medir su relación
Ejemplo 1: Edad
N° días de ausencia
25
20
50
5
35 20
10 20
45
8
50
2
30 40
15 12
62
1
40
8
El jee de personal de una empresa cree que existe una relación entre la ausencia al trabajo y la edad del empleado. Tomó en cuenta la edad de 10 trabajadores y contabilizó los días de ausencia en un año: -
a i c n e s u a
Trace el diagrama de dispersión. Determine el grado de relación lineal entre estas 2 variables.
d e s a í d ° N
Edad
Coefciente de Correlación de Pearson «R» Ejemplo 1: -
Edad
∑
∑ = ∑ = ∑ =
Paraa calcular el valor d Par de e R: N° días de ausencia
XY
X
2
2
Y
25
20
500
625
400
50
5
250
2500
25
35
10
350
12 1225
100
20
20
400
400
400
45
8
360
2025
64
50 30
2 15
100 450
2500 900
4 225
40
12
480
16 1600
144
62
1
62
3844
1
40
8
320
1600
64
397
101
3272
17219
1427
∑
=
=
√ [
=
=
∑
( ) ∗ ( ) − ( ) ∗ ( ) (
∗
) − ( )
]
∗
[ ∗ ( ) − ( ) ]
=− , Existe una relación inversa y muy alta entre la Edad del trabajador (X) y el N° de días de ausencia al trabajo (Y).
Ejemplo 2: (en Excel) Considere un estudio donde se mide el DAP: Diámetro a la Altura del Pecho (X) en cenmetros y la Altura (Y) en metros. Se considera una muestra de 10 árboles, los datos son:
Calcule e interprete interprete la correlación.
DAP
A lt u r a
15.6
17.4
14.8
18.4
15.5
16.5
12.5
15.2
14.2
19.9
15.7
22.1
12.3 14.2
14.8 17.3
8.8
10.3
11.9
14.6
Aplicación de la correlación correlación
hps://www.xatakaciencia.com/sabias-que/no-simple-que-ano-humano-eq uivalga-a-siete-perrunos-este-estudio
La ciencia consiguió establecer la verdadera equivalencia entre años humanos y caninos. Aunque pueden haber dierencias entre razas (en este caso se usaron perros labradores), los de perros exhiben una "todos trayectoria desarrollo, fsiológica y patológica similar". Esta es la órmula: Edad humana= 16*ln(edad canina)+31
REGRESION LINEAL Y=a+bx 1. 2. 3. 4.
Co Comp mprrend ndeer e inter erpr preetar lo loss términos de variable dependiente e independiente Ca Callcu cullar la rect ctaa de regr gres esiión lineal Ca Callcu cullar e iin nterp rprretar el ajus ajustte de los datos al modelo. Realizar prediccio ciones o pronoscos
Dinámica • ¿Se podrá determinar la estatura de una persona si se
conoce la medida de la extensión de su brazo?. • ¿Exisrá la relación entre dichas variables? Alumno
Extensión de brazos en cm.
Estatura en cm.
1 2 3 4 5 6 7 8 9
72 69 70 71 70 75 70 68 65
172 161 180 175 169 172 162 163 150
10
68
166
A parr de los datos observados • ¿Qué análisis descripvo se puede realizar? • ¿Qué po de variable tenemos en el estudio? • Existe una relación entre las dos variables? • Como se puede caracterizar esa relación?
Simulación de correlación correlación y regr regresión esión
hps://phet.colorado.edu/sims/html/least hps://phet.colorado.edu/sims/html/least-squares-regression/lates -squares-regression/latest/least-squares-r t/least-squares-regression_es_PE.html egression_es_PE.html
Solución en Excel
Solución en Excel Para calcular el coefciente de Correlación de Pearson. En excel: excel: =COEF.DE.CORREL(matriz1,matriz2)
REGRESION LINEAL Caracteriza la relación entre una var var.. dependiente dependiente (Y) (Y) y una variable independiente independiente (X). Es decir, estudia cómo los cambios en una variable X afecta a una variable dependiente dependient e Y.
El propósito de la regresión lineal , es modelar la dependencia de la variable Y en función de la variable X a través de la ecuación de una recta.
Variable dependiente
Variable independiente
+ e Intercepto
Pendiente
Y
b = pendiente
a
X
MODELO DE REGRESIÓN LINEAL SIMPLE La relación entre 2 variables numéricas puede ser representada mediante la línea de mejor ajuste a los datos llamada recta de regresión (lineal) que nos Se busca encontrar una función de X muy simple (lineal) permita aproximar Y mediante la siguiente formula: Y
+ e
s e t n i e d n e p e D
X Independientes Explicavas
Y e rara vez coincidirán por muy bueno que sea el modelo de regresión. A la candad e = Y - se le denomina residuo o residuo o error residual. residual.
MODELO DE REGRESIÓN LINEAL SIMPLE Extensión Estatura de brazos. en cm. 72 cm 172 69 cm 161 70 180 71 175 70 169 75 172 70 162 68 163 65 150 68 166
Diagrama de Dispersión 185 180 175 170 ) m c ( a r u t a t s E
165 160 155 150
Y = 8.9623 + 2.264x R2 = 0.4985
145 140
La recta de regresión nos describe cómo varía la media de una variable (dependiente) en función de la otra (independiente)
135 64
66
68
70
72
Extensión de los brazos (cm)
74
76
Recta de Regresión Para estimar la recta de regresión se aplica el método de mínimos cuadrados. Esta línea cuadrados. es la que hace mínima la suma de los cuadrados de 2 2 los residuos ∑e = ∑(Y real – Y est) .
a Y bX
b
Cov Co v( x, y) Var ( x)
( Xi X )(Yi Y ) XY n X Y 2 2 2 ( Xi X ) X n X
yn y3
u3
ui
yi y1
Intercepto a
Pendiente
yˆ i
yn 1
= +
yi
y2
x1
x2
x3
xi
xn 1
xn
El método de Mínimos Cuadrados Alumno Extensión de Estatura (n) brazos cm (X) cm. (Y)
X2
Y2
XY
1 2 3 4 5
72 69 70 71 70
172 161 180 175 169
5184 4761 4900 5041 4900
29584 25921 32400 30625 28561
12384 11109 12600 12425 11830
6 7 8 9 10
7 75 0 68 65 68
1 17 62 2 163 150 166
5 46 92 05 0 4624 4225 4624
2 29 65 28 44 4 26569 22500 27556
1 12 19 30 40 0 11084 9750 11288
a Y b X a 167 (2.264) * 69.8 a 8.9623
La ecuación de la recta es SUMA
698
1670
PROMEDIO
69.8
167
48784 279544 116710
XY n X Y 116710 (10) * 69.8 *16 167 7 14 144 4 b 2
X n X
2
2
48784 (10) * (69.8 )
63.6
264 4 2.26
El Coefciente correlación de Pearson (r) Extensión de
Alumno (n)
brazos cm. (X)
Estatura cm. (Y)
1 2 3 4 5 6
72 69 70 71 70 75
172 161 180 175 169 172
7 8 9 10
70 68 65 68
162 163 150 166
=COEF.DE.CORREL(Matriz1, Matriz2) =COEF.DE.CORREL(B4:B13,C4:C13) r = 0.70606
Que tan bueno es el modelo? 2
0≤
r = Proporción la variación en laindependiente variable y, quex.es explicada por lade variación en latotal variable
IMPORTANTE • Si bien hay relación entre R2 y r, cada uno tiene una finalidad diferente: • El coef. de correlación lineal (r) mide el grado de relación entre dos variables • El coef. de determinación (R2) Nos indica que porcentaje de los datos es explicado por el modelo. Cuanto más cerca a uno, las variables tendrán mayor correlación.
2
r
Var.Explic ada Var.Total
Y
14
Variación no
12
(Y 'Y ) 2 (Y Y ) 2
2
r
* *
Variación Total
10 8 6
Explicada
Y’
Variación Explicada
4
2
r
a Y b XY nY 2
Y
2
nY 2
2
Y
0 0
1
2
3
4
5
Coeficiente de determinación (r 2 ) V. total Y
Y’
9
9.0
5
V. Explicada
V. No explicada
2 (Y- ത )
(Y’- )2
(Y-Y’)2
9
0
0.0
0.0
4.8
9
16
0.2
0.04
7
6.9
9
4
0.1
0.01
14
13.2
9
25
0.8
0.64
10
11.1
9
1
-1.1
1.21
∑= 46
∑= 44.10
∑= 1.90
ത
Variación Total = Variación Explicada + Variación No Explicada 46 46 = 44.10 + 1.90
2
r 2 Var . Explicada (Y ' Y ) 2 0.96 Var .Total (Y Y )
96% de la variación de la altura (Y) esta explicada por la variación de la edad de las plantas (X).
En un estudio de la relación entre la publicidad por radio y las ventas EJEMPLO:
de un producto, durante 10 semanas se han recopilado, los tiempos de duración en minutos de la publicidad por semana (X), y el número de artículos vendidos (Y). Semana
1
2
3
4
5
6
7
8
9
10
Publicidad en minutos X
20
30
30
40
50
60
60
60
70
80
Ventas Y
50
73
69
87
108
128
135
132
148
170
-
Determine el promedio de Publicidad (x) y Ventas (Y) Determine el grado de relación Obtenga la ecuación de regresión. Interprete el valor de 90 la pendiente. Si la publicidad es de min, ¿cuánto será el número de arculos vendidos?
Solución
X
Y
XY
X2
Y2
20 30 30 40 50 60 60 60 70 80
50 73 69 87 108 128 135 132 148 170
1000 2190 2070 3480 5400 7680 8100 7920 10360 13600
400 900 900 1600 2500 3600 3600 3600 4900 6400
2500 5329 4761 7569 11664 16384 18225 17424 21904 28900
1100
61800
28400
134660
500
X i
Y i X i Y i
X
X X i / n ,
i
2
Y i
Y Y i / n
2
Reemplazando en las formula de los coeficientes c oeficientes de regresión, …Solución se tiene lo siguiente:
1
SC xy
SC x
Xi Yi
( Xi)( Yi n
β1
2
2
Xi _
0
( Xi) n
)
61800
500 x 1100
10
2
28400 (500) 10
2
2
_
y b x
110
2 (50)
10
Por lo tanto la recta de regresión Y = 0+ 1(X), estará determinada de la siguiente manera Y = 10+ 2x. Interpretación B0: El Número real de ar artículos tículos vendidos es de 10 unidades. unidades. B1: El número promedio de artículos vendidos aumenta en 2 unidades a medida que aumenta cada minuto de duración, de la publicidad en la semana.
Regresión Regresión Lineal Simple Ejemplo: -
Tomando los datos del ejemplo de la ausencia al trabajo y la edad del empleado :
-
-
-
Obtenga la ecuación de regresión. Interprete el valor de la pendiente. Si un trabajador ene 38 años, ¿cuántos días se espera que alte al año?
Edad
N° días de ausencia
XY
X
2
2
Y
25
20
500
625
400
50 35
5 10
250 350
2500 12 1225
25 100
20
20
400
400
400
45
8
360
2025
64
50
2
100
2500
4
30
15
450
900
225
40
12
480
16 1600
144
62
1
62
3844
1
40
8
320
1600
64
397
101
3272
17219
1427
Regresión Regresión Lineal Simple -
Ejemplo: Par Para a calcular el valor de los Coefcientes de la Ecuación:
Las sumatorias:
∑ = ∑ = ∑ = = = ∑ ∑
Pendiente: ∗
=
=
−
Intercepto Intercepto en el origen:
∗
=
− ( ∑ ∑ ∑ ∑ ∑ ) ∗
=
(
) − ( ) ∗ ( ) ∗ ( ) − ( )
∗
=− ,
=
∑
− ∗
∑
( ( ) )
− ( − , ) ∗
= ,
Regresión Lineal Simple Regresión
-
Ejemplo:
La Ecuación:
= , − ,
- Interpretación de la Pendiente: =− ,
Por cada cada año adicional en la Edad del empleado (X), el n° de días de ausencia (Y) disminuye en 0,5059.
- Si un trabajador ene 38 años, ¿cuántos días se espera que alte al año?
= , − , ∗ ( )= , Si un trabajador ene 38 años registre, aproximadamente, 11(X=38), altas. se espera que durante el año
Excel) Ejemplo: (en Excel) Considerando los datos del d el problema anterior anterior,, encuentre la ecuación de regresión entre el DAP y la altura. Datos→Análisis de Datos→Regresión (acvar Nivel de Confanza) →Aceptar
Ejemplo: (en Excel)
= − ( − ) − − −
Interpretación de = ,
=− , + ,
Por cada cenmetro adicional en el DAP (X), la Altura del árbol (Y) aumentará aumentará en 1,281028 metros.
Ejercicio 1 (Resuelto Excel) •
•
Una empresa dedicada a la producción de cierto artículo perecible ZZ desea evaluar la relación existente entre la distancia recorrida para transportar su producto a los diferentes puntos de comercialización y las mermas producidas por dicho transporte. Con este fi, se lleva a cabo un estudio en el que se observan, entre otras variables: v ariables: Y= porcentaje de carga útil final (luego del transporte) X= Distancia recorrida (decenas de kilómetros) Y se encuentra en una muestra aleatoria de 12 viajes o recorridos los siguientes resultados:
Carga Úl (y) Distancia Recorrida (x) •
91 33
95 12
93 18
98 3
97 4
97 8
88 66
94 5
89 37
90 29
Con la finalidad de establecer medidas preventivas, ¿Cuál ¿C uál será el porcentaje de carga útil para un futuro transporte t ransporte de 250 km.?
92 15
95 10
Análisis de regresión simpl simplee Resumen Estadíscas de la regresión
Coefcientee de ccor Coefcient orrela relacción mú múlple lple Coefc Co efcien ientte de de dete terrmi min nación ión R R^^2 R^2 ajustado Error pi co
0.88 .883 0.78 .780 0.758 1.627
Obse rvaci one s
12
AN LISI LISISS DE VARIANZA
gl
Promedio
Valor
Suma de
de los
crítco
cuadrados
cuadrados
R e g re s i ó n
1
93.789
93.789
Re s i d u o s Total
10 11
26.461 120.250
2. 646
Coe oeff Error pico Estad adíís scco t Prob obab ab
Inte rce pci ón Distanci a Re corri da ( x)
96.41 -0.16
0.71 0.03
136.09 -5.95
0.00 0.00
F
de F
35.445
0.000
Inferior
Superior
Inferior
Superior
95% 95%
95% 95%
95.0%
95.0%
94.83 -0.22
97.99 -0.10
94.83 -0.22
97.99 -0.10
Análisis de regresión sim simple ple
Distancia Recorrida (x) (x) Curva de regresión ajustada
100
95
90 ) y ( l Ú a g r a C
Carga Úl (y) Pronósco Carga Úl (y) 85
80
75 0
10
20
30
40
Distancia Recorrida (x)
50
60
70
Error Estándar y Error de Estimación Cuando se realiza una predicción, es importante determinar el error estándar, el cual se representa por Sy.x y mide la dispersión de los datos observados con respecto a la línea de regresión.
Sy. x
y
2
B0 y B1 xy
n2
Error de predicción
Sy. x
134660 10(1100 ) 2(61800) 2.74 10 2
El error de estimación, que esta representado:
e=y–y
RESUMEN DE FÓRMULAS Coefciente de
=
Ecuación de la recta de regresión regres ión lineal
Coefciente s de regresión
∗
∗
∑ − ∑ ∑ ∗
∗
∗
− ( ) − ( ) ) ] ∑ ∑ ∑ ∑ [ ] [ √
correlación Coefciente de determinación
∑ + ∑ − ¯ = ∑ − ¯
= ¿¿¿
∑ =+ . ( , ) = ( ) ´ ´ = ∑ − ´ ∑ −
=
a Y bX
´ )( − ´ ) ) ∑ ( − ´
∑ (
)
Reexión del tema • Para que sirve la regresión lineal • Cual es el procedimiento procedimiento para obtener la ecuación • • • •
de regresión Interpretar la pendiente y el intercepto (bo y b1) Paraa que sirve Par sir ve el coefciente de correlación (r) Paraa que sirve Par sir ve el coefciente de determinación (r2) Indique algunos ejemplos en la aplicación del modelo de regresión.
Muchas Gracias
Ejercicio: A continuaci continuación ón tenemos las estaturas en centímetros (muestra x) y el peso en kilogramos (y) de niños de 6 años. Niño Estatura (cm) x (cm) x
1
2
3
4
5
6
7
8
9
10
121 123 108 118 111 109 114 103 110 115
Peso (kg) y 25
22
19
24
19
18
20
15
20
21
EJEMPLO En un estudio2:de la relación entre la publicidad por radio y las ventas de un producto, durante 10 semanas se han recopilado, los tiempos de duración en minutos de la publicidad por semana (X), y el número de artículos vendidos (Y).
-
Semana
1
2
3
4
5
6
7
8
9
10
Publicidad en minutos X
20
30
30
40
50
60
60
60
70
80
Ventas Y
50
73
69
87
108
128
135
132
148
170
Trace el diagrama de dispersión. Determine el grado de relación lineal entre estas 2 variables. Hallar la recta de regresión lineal
Ejercicios para desarrollar 1.
Los dat datos os de la pr produc oducció ción nd dee tr trig igo o een n ttone onelad ladas as ((X) X) y eell p pre recio cio del kilo kilo de harina en soles (Y) en la década de los 80 en Lima ueron: Producción trigo(Y) (X) Precio de la de harina
30 28 32 25 25 25 35 40 25 30 27 40 42 40 22 50 24 45 30 25
Ajusta la recta de regresión por el método de mínimos cuadrados.
1.
Pregunta de examen!!
Los ga gast stos os sem semanal anales es de pub public licida idad d y las ve vent ntas as de una emp empre resa sa en dólares, para una muestra de 10 semanas son:
Gastos sem 41 54 63 54 x public Ventas 1250 1380 1425 1425 seman
48
46
62
61
64
71
1450
1300
1400
1510
1575
1650
a) Estable Establezc zcaa la recta recta de regresió regresión n que permita permita predec predecir ir las ventas ventas semanale semanaless b) c) d) e)
en unción deado los de gastos denpublicidad Calcular Calcu lar el el grado gr relació relación entre entre las 2 variab variables les Inte Interp rpre retta la la pen pendi dien ente te Pronos Pronosca ca las vent ventas as para para gastos gastos semanales semanales de de 50 y 60 dólar dólares es Cuales Cuales son los error errores es de esmaci esmación ón cuando cuando predic predicee las ventas ventas semanale semanaless para gastos de publicidad de 61, 62 y 63 dólares respecvamente
Ejercicios para desarrollar En un estudio, por medio de detectores radioacvos, de la capacidad corporal para absorber hierro y plomo, parciparon diez sujetos. sujetos. A cada uno se le da una dosis oral idénca de hierro (sulat (sulato o erroso) y de plomo (cloruro de plomo-203). Después de doce días se mide la candad de cada componente retenida en el sistema corporal y, a parr de éstas, se determinan los porcentajes absorbidos por el cuerpo. Los datos obtenidos ueron:
Hierro (%) X
17 22 35 43 80 85 85 91 92 96 100
Plomo (%) Y
8 17 18 25 58 59 41 30 43 58
a) Dibuja la nube de puntos. Basándose en ella, ¿se puede esperar que el coefciente de correlación esté próximo a 1, -1 ó 0?. b) Halla e interpreta el coefciente de determinación. c) Esma la recta de regresión y ulízala para predecir el porcentaje de hierro absorbido por un individuo cuyo sistema corporal absorbe el 15% del plomo ingerido.
Las califcaciones de un examen y el numero de horas de estudio para el examen, de una muestra de 12 estudiantes, se presenta en el siguiente cuadro: Tiempo de 3 estudio Califcación 9
a) b) c) d)
3
3
4
4
5
5
5
6
6
7
8
12
11
12
15
14
16
15
18
16
15
17
Hall Hallar ar la recta ecta de regr regres esió ión n Inte Interp rpre reta ta la pend pendie ient ntee Esma Esmarr la califc califcaci ación ón cuand cuando o el empo empo de de estudi estudio o es 10 Esma Esmarr el empo empo de de estudi estudio o cuand cuando o la calif califcac cación ión es 8
En la siguiente tabla , donde : Y = Peso, x= Altura a) Re Reali alice ce un d diag iagra rama ma de dis disper persió sión n e in indiq dique ue ¿Sugiere la gráfca una asociación lineal? b) c) d) e) )
Re Reali alice ce llaa eecua cuació ción n de re regre gresió sión n In Inte terpr rpret etee la pen pendie dient nte, e, reali realice ce un pr pronó onós sco co Calcul Calculee e in interp terpret retee el coef coefcien ciente te d dee correl correlación ación Calcul Calculee e in interp terpret retee el coef coefcien ciente te d dee determi determinación nación Cal Calcul cular ar e int interp erpre retar tar el err error or es están tándar dar de esmación
La materia prima que se usa en la elaboración de una fbra sintéca se almacena en un local que no ene control de humedad. Las mediciones de la humedad relava en el local y del contenido contenido de humedad de una muestra de la materia prima (ambos en porcentajes) durante 12 días, dieron los siguientes resultados. a)
Reali Realice ce un diagr diagrama ama de dispe dispers rsión ión e indi indique que ¿Sugie ¿Sugiere re la gráfca una asociación lineal?
b) c) d) e) )
Reali ealice ce la ecua ecuaci ción ón de regr egresió esión n Inte Interp rprret etee la pen pendi dien ente te,, rea realilice ce un un pron pronós ósc co o Calcul Calculee e in inte terp rpre rete te el coef coefci cien ente te de corr correla elació ción n Calcul Calculee e in inte terp rpre rete te el coef coefci cien ente te de dete determi rminac nación ión Calc Calcul ular ar e int inter erpr pret etar ar el el erro errorr es está tánd ndar ar d dee esm esmac ació ión n
Humedad (X)
42 35 50 43 48 62 31 36 44 39 55 48
Contenido de humedad (Y)
12 8 14 9 11 16 7 9 12 10 13 11
El siguiente conjunto de datos se ha tomado sobre grupos de trabajadoras de. Cada grupo está ormado por trabajadores de la misma proesión, en cada uno de los veincuatro grupos muestreados se han observado dos variables: el índice de estandarizado estandariz ado de consumo de cigarrillos (x) y el índice de muertes por cáncer de pulmón (Y) variable dependiente. Se desea estudiar la relación relación entre estas dos variables.
1. 2. 3. 4. 5. 6.
Realice un diagrama diagrama de dispersión dispersión e indique ¿Sugiere la gráfca gráfca una una asociación asociación lineal? Reali Realice ce la ecuaci ecuación ón de re regr gresi esión ón Interpr Interprete ete la pendie pendient nte, e, realic realicee un pronós pronósco co Calcule Calcule e interpr interprete ete el el coefcie coefciente nte de corre correlaci lación ón Calcule Calcule e interpr interprete ete el el coefcie coefciente nte de deter determina minación ción Calcular Calcular e interp interpre retar tar el el error error estánd estándar ar de esm esmación ación
El director de una escuela está inter interesado esado en relacionar dos variables en los estudiantes y ha tomado como inormación los resultados resultados de la prueba de habilidad h abilidad y del puntaje obtenido en el examen de admisión, los cuales se muestran a connuación a) Realice Realice un diagr diagrama ama de de disper dispersión sión e inter interpre prete te llos os resultados b) Realice Realice la la ecuación ecuación de regre regresión sión e inter interpre prete te la pendien pendiente. te. c) Calcule Calcule e inter interpre prete te el el error error estándar estándar de esma esmación ción d) Calcule Calcule e inter interpre prete te el coef coefcien ciente te de d dete etermi rminació nación n e) Si el punt puntaje aje de la prueb pruebaa de habilid habilidad ad es de de 50 punt puntos, os, cual es el pronósco en el examen de admisión
Prueba de Habilidad Examen de mental X admisión Y 5 15 10 19 15 25 20 23 25 30 32 35 40
29 32 34 39 42 46 50
Una cadena de rest restaurante aurantess de comida rápida decide llevar a cabo un experimento experiment o para medir la inuencia sobre las ventas del gasto en publicidad. En 8 regiones del país, se realizaron dierentes variaciones relavas en el gasto en publicidad, comparado con el año anterior anterior,, y se observaron las variaciones en los niveles de ventas resultante resultantes. s. La tabla adjunta muestra los resultados.
a) b) c) d) e)
Realice Realice un diagr diagrama ama de disper dispersión sión e inter interpre prete te los resul resultado tadoss Realice Realice la ecuaci ecuación ón de regres regresión ión e interpr interprete ete la la pendi pendient ente. e. Calcule Calcule e interp interpret retee el err error or estánd estándar ar de esmació esmación n Calcule Calcule e inter interpre prete te el coef coefcien ciente te de d dete etermin rminación ación Realice Realice un pron pronósc ósco o si el gasto gasto de publicid publicidad ad increme increment ntaa en un 5% y en 15%
Una compañía de seguros considera que el número de vehículos (y) que circulan por una determinada autopista a más de 120 km/h , puede ponerse en unción del número de accidentes (x) que ocurren oc urren en ella. Durante Durante 7 días obtuvo los siguiente siguientess resultados:
a) b) c) d) e)
Accidentes xi
5
7
5
3
2 1 9
Vehículos yi
15 18 13 11 10 8 20
Realice Realice un diagr diagrama ama de disper dispersión sión e inter interpre prete te los result resultados ados Realice Realice la ecuaci ecuación ón de regr regresión esión e inter interpre prete te la pendien pendiente. te. Calcule Calcule e inter interpre prete te el el error error estándar estándar de esmaci esmación ón Calcule Calcule e inter interpre prete te el coefc coefcien iente te de deter determina minación ción Realice Realice un un pronós pronósco co si la candad candad de de acciden accidentes tes es es de 4 y 6
En la tabla siguiente se indica la edad y la conducta agresiva (medida en una escala de cero a 10) de 10 niños. Edad Conducta agresiva
6 9
6 6.7 6 7
7 8
7.4 7.9 7 4
8 2
8. 2 8. 5 8. 9 3 3 1
a) Obtener Obtener la la recta recta de regresión regresión de de la conduct conductaa agresiva agresiva en unció unción n de la edad. edad. b) Grafc Grafcar ar la nube nube de de puntos puntos y la la recta recta de de regre regresión sión.. c) A parr parr de dicha dicha recta recta,, obtener obtener el el valor valor de la condu conducta cta agres agresiva iva que que correspondería a un niño de 7.2 años. d) Calcular Calcular el error error estánda estándarr de de esma esmación ción.. e) Calcular Calcular e inter interpre pretar tar el coef coefcien ciente te de deter determina minación ción..
Una empresa transportadora considera que existe una relación directa entre los gastos publicitarios y el numero de pasajeros que escogen viajar. Para determinar si esta relación existe, y si es así cual podría ser la naturaleza exacta, los datos son: a) Calc Calcule ule e interpre interprete te la ecuaci ecuación ón d dee la rect rectaa de regresión regresión b) Que le di dice ce este este model modelo o sob sobre re la rela relación ción entre entre lo loss gasto gastoss publicitarios y el número de pasajeros c) En es esta ta ap aplic licaci ación ón el pr propó opósit sito o de publi publicid cidad ad es esm esmar ar los pasajeros. Esme los pasajeros para una publicidad de $20.
Un banco en Atlanta que se especializa en créditos para vivienda intenta inten ta analizar el mercado de fnca raíz, midiendo el poder explica explicavo voenque las tasas de interés enen sobre número dede casas vendidas el área. Se compilaron los datos paraelun periodo 10 meses, así:
Relación entre variables Ordinales • Coefciente de correlación de rangos de
Spearman (ρ). -1 ≤ ρ ≤ 1
= −
∑
− Donde di = Xi - Yi
View more...
Comments