Regresión y Correlación Lineal Simple y Múltiple
September 22, 2022 | Author: Anonymous | Category: N/A
Short Description
Download Regresión y Correlación Lineal Simple y Múltiple...
Description
ACREDITADA POR ACCREDITATION COUNCIL FOR BUSINESS SCHOOLS AND PROGRAMS (A CBSP), EUROPEAN COUNCIL FOR BUSINESS EDUCATION (ECBE) Y AXENCIA PARA A CALIDADE DO SISTEMA UNIVERSITARIO DE GALICIA (ACSUG)
FACULTAD DE CIENCIAS CONTABLES, CONTABL ES, ECONÓMICAS ECONÓMICAS Y FINANCIERAS FINANCIERAS
ESCUELA ESCUE LA DE CONTABIL CONTABILIDAD IDAD Y FINANZAS
REGRESIÓ REGRE SIÓN N Y CORRELACIÓN L LINEAL INEAL SIMP SIMPLE LE Y MÚLTIPLE CURSO: MODELOS CUANTITATIVOS Y DE OPTIMIZ OPTIMIZACIÓN ACIÓN PRESENTADO POR APOLAYA APOL AYA
FLORES, JENNYFER
COLLANA
PARED PAREDES ES ,
ZAA
BRISA
CAÑARI, ZADITH DOY DOYLA LA
TINEO CHIHUA, CHIHUA, DHAFNE ANTUANE A NTUANE DOCENTE: DR. WILDER FLORES DIAZ
L IMA, PERÚ 2019 - II
1
ÍNDICE Introducción ……………………………………………………… ………………………………………………………... ...
4
CAPÍTULO I OBJETI OBJE TIVO VO DE LA INVE INVEST STIG IGACI ACI N 1.1
Objetivo general …………………………………………………. ………………………………………………….
5
1.2
Objetivos específicos ……………………………………………. …………………………………………….
6
CAPÍTULO II MAR ARC CO TE RICO 2.1
Regresión lineal simple ……………………………………… ……………………………………….. ..
7
2.1.1 Diagrama de dispersión………………… dispersión………………………………... ……………...
8
2.1.2 Metodo de minimos cuadrados para una linea de regresion simple
2.2
2.1.3 Error estándar de estimación …………………………. ………………………….
8
Correlación lineal Simple……………………… Simple………………………………………. ……………….
9
2
CAPÍTULO III TRABA ABAJO JO PR PR CTICO 3.1
Problemas desarrollas de regresión lineal ……………………. …………………….
14
Conclusiones……………………………………………... Conclusiones……………………………………………...
46
Apéndice ……………………………………………… ……………………………………………………. …….
47
Bibliografía ……...……………………… ……...………………………………………... ………………...
51
3
INTRODUCCIÓN
El objetivo de la regresión lineal simple es estimar el valor de una variable llamada variable dependiente, conociendo el valor de una variable asociada llamada variable independiente. La regresión lineal tiene una fuerte importancia como por ejemplo en las líneas de tendencia, medicina y también en la informática. El presente trabajo de investigación expone el tema de manera explícita informando los diferentes tipos de regresión lineal, con diversos ejemplos del tema con sus respectivas soluciones. Durante el trabajo de investigación se tuvo dificultades por parte de los integrantes del grupo, ya que no sabíamos cómo utilizar correctamente los programas asignados para el buen desarrollo de los temas propuestos, pero con esfuerzo y dedicación el presente trabajo se llevó a cabo de una manera eficaz. A continuación, se invita a revisar los ejercicios realizados con los programas estadísticos de SPSS y MINITAB.
LOS INTEGRANTES INTEGRANTES
4
CAPÍTULO I OBJETIVO OBJ ETIVOS S DE LA INVES INVESTIGACIÓN TIGACIÓN
1. OBJETIVOS GENERAL GENERALES ES
1. Analizar e en n qué consiste la regresión lineal
2. OBJETIVOS ESPECÍFICOS
● Investigar sobre regresión lineal simple.
● Dar a conocer el diagrama de dispersión.
cuadrados rados pa para ra una línea de regresión. ● Analizar el método de mínimos cuad ● Saber estimar el valo valorr promedio de Y para un un valor valor de X.
● Saber predecir futuros de la variable respuesta.
5
confianza y resolver contrast contrastes es sobre ● Saber construir intervalos de confianza dichos parámetros.
6
CAPÍTULO II REGRESIÓN REGRE SIÓN LINEAL SIMPLE En este capítulo definiremos que es la regresión lineal simple, mediante ejemplos de variables de dispersión lineal que ayudan a desarrollar técnicas estadísticas para su comprensión.
2.1. 2.1. Re Regresi gresión ón lineal l ineal sim simple ple La Regresión y la correlación son dos técnicas estadísticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relación Funcional entre dos o más variables, donde una variable depende de la otra variable.
Según Bravo (2013) ‘‘Un modelo de regresión se usa para modelar la relación de una variable dependiente y numérica con x variables independientes x1, x2, . . . , xn’’. xn’’.
En la regresión lineal simple se tiene una ´ única variable independiente
x para
modelar la variable dependiente y . Se asume la siguiente relación lineal entre la variables: Yi = β0 + β1xi + Ei. Ei.
La regresión lineal permite determinar el grado de estimación de las series entre” x” y “y”, es decir la “x” está siendo representado como una variable independiente, mientras mientra s que la “y” es una variable dependiente, está a su vez está basado en un estudio no aleatoria,cuando una variable es independiente, este ejerce influencia sobre otra variable dependiente.
7
2.1. 2.1.1 1 Diagrama Diagrama de dis dispersió persió n
Es una gráfica en la que se traza cada uno de los puntos que representan un par de valores observados para las variables independientes y dependientes.
Según Chambers (1983).‘‘El diagrama de dispersión es la herramienta gráfica más usada, sencilla y potente para analizar la relación que puede existir entre dos variables….’’ variables….’’
Es decir nos sugiere la manera en que se relacionan las dos variables.Nos da una buena visión de conjunto de la relación entre las dos variables, y nos ayuda a la interpretación de los coeficientes del modelo de regresión.
En la actualidad existen tres gráficos de regresión, esto depende mucho del resultado del problema obtenido, como podemos observar en la imagen anterior, los tipos de rectas de regresión pueden ser positivas o negativas.
8
2.1. 2.1.2. 2. Mé Métod todo o de mínimo mínimoss cu cuadrados adrados p para ara una línea de regresión s imp imple. le. Este método se utiliza comúnmente para analizar una serie de datos que se obtengan de algún estudio, con el fin de expresar su comportamiento de manera lineal y así minimizar los errores de la data tomada.
Yi= B0 + B1Xi +Ei
Yi = Valor de la variable dependiente en el i- ésimo ensayo. B0= Primer parámetro, que indica el valor de la Y para X=0. B1=Segundo parámetro, que indica la pendiente de la recta. Xi= Valor de la variable independiente en el i -ésimo ensayo. Ei= Error aleatorio de muestreo en el i- ésimo ensayo.
Los valores de b0 y b1, que satisfacen e este ste criterio crit erio son:
b1= ΣXY - n X Y
De ese modo a través de ejemplos gráficos de dispersión donde la variable “x” es representada por la altura y la variable “y” estima el peso, a medida que los puntos indicados demuestran las medidas correspondientes de cada individuo.
9
Figura 1: Gráfica de dispersión de peso (x) y estatura (y).
2.1. 2. 1.3. 3. Error estándar est ándar de esti esti mació mación: n:
El error estándar o también llamada error típico, es el valor que cuantifica cuando se separan la medida de la población, es un error en la cual se comete a la medida de tomar un valor estándar. Es por ello que:
Baron y Telles (s.f).sostiene que: El error estándar depende del parámetro que estemos calculando y de la distribución de la variable. Es una medida de variabilidad del estimador. Su cálculo exacto es salvo excepciones y sin hacer simplificaciones, excesivamente complicados (...) o que la muestra es lo suficientemente grande para considerar algunas aproximaciones adecuadas (...) un ejemplo muy común, consiste en elegir niveles de confianzas del 95%...(p.13-14)
10
Asimismo, se puede decir que es un error estándar cuando las muestras son excesivamente grande a medida que no se puede hallar una cálculo determinado, por ende considerando ese factor nosotros debemos solucionar el problema con las fórmulas y las tablas.
O directamente:
2.2 CORRELA CORRELACIÓN CIÓN LINEAL SIMPLE: SIMPLE:
La correlación lineal de pearson es una medida que permite cuantificar el grado de relación conjunta entre dos variables, es por ello que: Laguna(2014) sostiene que: “La finalidad de la correlación es examinar la dirección y la fuerza de la asociación entre dos variables cuantitativas. Así conoceremos la intensidad de la relación entre ellas y si, al aumentar el valor de una variable, aumenta o disminuye el valor de la otra variable…” (p.2) (p.2)
De ese modo la correlación permite indicar la dirección respectiva de las variables asociada a la cantidad de factores que estén representadas mediante una gráfica.
11
La correlación se estudia para determinar en qué medida una ecuación lineal o de otro tipo describe o explica de una forma adecuada la relación entre variables. El análisis de correlación intenta medir la fuerza de las relaciones entre dos variables por medio de un solo número llamado coeficiente de correlación lineal.
El coeficiente de correlación lineal de Pearson (se denota r ó ρ) es una medida de asociación lineal entre dos variables aleatorias X e Y:
r= Se verifica que –1 que –1 ≤ r ≤ 1 y podemos decir que: que: existe iste una relación line lineal al negativa perfecta entr entre e X e Y. ● Si r = -1, ex existe iste una relación line lineal al positiva perfecta e entre ntre X e Y. ● Si r = 1, ex ● Si r = 0, no existe ninguna relación lineal entre X e Y (X e Y son independientes).
12
CAPÍTULO III TRABAJO TRABA JO PRÁCT PRÁCTICO ICO Mediante este capítulo practicaremos la solución de los ejercicios de regresion r egresion y correlacion lineal simple,a su vez se desarrollara con el programa minitab que facilita el desarrollo estadístico para una mejor interpretación.
3. 3.1 1P Problemas roblemas desarrolladas de regresion y corr correla elacion cion lineal simple: simpl e: A continuacion se desarrollaran 20 problemas sobre la regresion regresion y correlacion lineal simple.
EJERCICIO 1 Un psicólogo escolar toma una muestra aleatoria de 7 alumnos de un colegio y les pasa una prueba de extroversión (X). A continuación, observa cuántos mensajes SMS (Y) envía a cada alumno durante el recreo:
13
14
DESARROLLO EN MINITAB
EJERCICIO 2 Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos. 1. Hallar la ecuación ecuación de la recta de regresió regresión n de la edad sobre el peso. 2. ¿Cuál sería el peso aproximado de de un niño niño de seis años?
xi
yi
xi²
yi²
xi · yi
2
14
4
196
28
3
20
9
400
60
5
32
25
1 024
160
15
7
42
49
1 764
294
8
44
64
1 936
352
25
152
151
5 320
894
DESARROLLO EN MINITAB
16
EJERCICIO 3
X
Y
X2
Y2
X.Y
4
12
16
144
48
7
15
49
225
105
17
TOTAL
6
12
36
144
72
9
16
81
256
144
2
13
4
169
26
28
68
186
938
395
≈ 10.877
≈ 0.486
10.877 + 0.486 . x DESARROLLO EN MINITAB
18
GRÁFICO DE DISPERSIÓN
EJERCICIO 4 Consideremos el siguiente experimento controlado y aleatorizado para estudiar el efecto de una nueva droga sobre la frecuencia cardiaca de ratas sanas. Cinco ratas
19
fueron asignadas aleatoriamente a una de cinco dosis y se registró la máxima disminución observada en la frecuencia cardiaca en una hora. Los datos obtenidos son:
La relación respuesta-dosis es aparentemente lineal. Parece razonable propone:
Podríamos intentar ajustar una recta “a ojo”. Propuestas: yi = 5.5 + 3.5 * xi yi = 0.5 + 7.0 * xi
Para decidir cuál de las dos rectas ajusta mejor estos datos consideraremos una medida de cuán lejos está cada dato de la recta propuesta
20
⇒
RESIDUO.
La mejor recta sería aquella que minimice la suma de las distancias al cuadrado de los puntos a la recta, es decir deberíamos encontrar β o ˆ y 1 βˆ tales que para
cualquier elección de bo y b1 que hagamos.
EJERCICIO 5 Los datos de la producción de trigo en toneladas (X) y el precio del kilo de harina en pesetas (Y) en la década de los 80 en España fueron.
21
DESARROLLO EN MINITAB
22
GRÁFICA DE DISPERSIÓ DISPERSIÓN N
EJERCICIO 6 Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:
23
Nº de Clientes (X)
Distancia (Y)
8
15
7
19
6
25
4
23
2
34
1
40
1. Calcular el coeficiente de correlación lineal. lineal. 2. Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar? esperar? 3. Si desea recibir a 5 clientes, ¿a qué distancia del núcleo de población debe situarse? situarse?
xi
yi
xi · ·y yi
xi²
yi²
8
15
120
64
225
7
19
133
49
361
6
25
150
36
625
24
4
23
92
16
529
2
34
68
4
1 156
1
40
40
1
1 600
28
156
603
170
4 496
Correlación Correla ción nega negativa tiva muy fuerte
25
DESARROLLO EN MINITAB
GRÁFICO DE DISPERSIÓN
EJERCICIO 7: El gerente de ventas de una cadena de tiendas ti endas obtuvo información de los pedidos de internet y del número de ventas realizadas por esa modalidad. Como parte de su presentación en la próxima reunión de vendedores al gerente le gustaría dar información específica sobre la relación entre el número de pedidos y el número de ventas realizadas.
26
27
28
DESARROLLO EN MINITAB
GRÁFICA DE DISPERSIÓN
29
EJERCICIO 8: Un grupo de estudiantes quiere determinar si la creación de una empresa de alquiler de contenedores para el transporte de mercancías entre colombia y Ecuador, se obtiene los siguientes datos.
30
31
PROBLEMA 9
32
33
PROBLEMA 10
Los datos de la tabla siguiente relaciona la solubilidad del nitrato de sodio Y (NaNO3) con la temperatura del agua T (en ºC). A la temperatura indicada T , Y partes de nitrato de sodio se disuelven en 100 partes de agua obteniendo
Para estimar la solubilidad del nitrato de sodio se sugiere un modelo lineal de la forma Y= mT +b
34
a. Usando el método de mínimos cuadrados obtenga los estimadores de los parámetros. b. ¿Qué puede decir de la calidad del ajuste obtenido? c. ¿Cree Ud. que a mayor temperatura existe mayor solubilidad del nitrato de sodio? d. Determine el error estándar de estimación con el modelo ajustado y obtenga un intervalo de longitud dos errores estándar de estimación, centrado en la estimación de la solubilidad del nitrato de sodio cuando la temperatura es de 25°C.
35
36
EJERCICIO 11 Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:
Matemáticas
2
3
4
4
5
6
6
7
7
8
10
10
Física
1
3
2
4
4
4
6
4
6
7
9
10
37
Hallar las rectas de regresión y representarlas.
xi
yi
xi i
xi2
yi2
2
1
2
4
1
3
3
9
9
9
4
2
8
16
4
4
4
16
16
16
5
4
20
25
16
6
4
24
36
16
6
6
36
36
36
7
4
28
49
16
7
6
42
49
36
8
7
56
64
49
10
9
90
100
81
10
10
100
100
100
72
60
431
504
380
1 Hallamos las dias aritméticas.
38
2 Calculamos lavarianza.
3 Calculamos lasඡrianzas.
4ºRecta de regresión de Y sobre X.
4ºRecta de regresión de X sobre Y.
39
DESARROLLO EN MINITAB
40
EJERCICIO 12
41
42
43
EJERCICIO 13
44
EJERCICIO 14
45
EJERCICIO 15
46
47
EJERCICIO 16 Coca Cola Cola desea e experim xperimentar entar la relación llineal ineal sim simple ple entre la experiencia de sus vendedores vendedor es e en na años ños y las uni dades ve vendid ndidas as e en n mil miles, es, de sus prod ucto uctoss para lo cual se eligieron eligi eron 5 vendedores al az azar ar tal com como o se muestr muestra ae en n la tabla siguiente:
Vendedor Ve ndedor
Experiencia
Ca Carlos rlos
Jua Juan n
Ma Manuel nuel
Julio
Pe Pedro dro
3
1
2
5
4
9
5
7
14
10
(años)
Ventas (Miles (M iles de d e unidades) unid ades)
Hallar: A. La gráfica de dispersión, determinar si es apropiado un aná análisi lisiss de regresión regre sión lineal.
48
B. La ecuación ecuación de regresión, regresión, in interpretar terpretar sus coeficientes. c oeficientes. C. Prede Predecir cir para experienci experiencia a de 3,5 3,5 años y 4,5 años respecti r espectivamente, vamente, así como para p ara 8 años. D. Existen relación entre las varia v ariables bles , experiencia y vventas? entas? Probar con α = 5%.
E. Ha Hallar llar el grado de relación entre experienci experiencia a y ventas de sus vendedores.
SOLUCIÓN B) Ecuación de regresión regresió n lineal: Y = b o + b 1X
X
Y
XY
X2
Y2
3
9
27
9
81
1
5
5
1
25
4
10
40
16
100
5
14
70
25
196
49
2
7
14
5
49
15
45
156
55
451
B) La ecuación ecuación de regresión, interpretar sus coeficientes.
Entonces la
ecuación ecua ción de
regresión
lineall será: linea
Y = b o + b 1X -> Y = 2,7 + 2,1X Interpretación: b o =2,7: Sin experiencia (X = 0), las ventas serán de 2,7 mil unidades. b 1 = 2,1 2,1:: Por cada c ada a año ño de d e experiencia (X) adicional, adici onal, las ventas vent as se incrementan en 2,1 mil unidades. C) PREDICCIONES
50
Si X = 3,5 años: año s: Y = 2,7 + 2,1 (3.5) = 10.05 Si X = 4,5 años: año s: Y = 2.7 + 2.1 2.1 (4,5) = 12.15 Si X = 8 años: No se puede hallar porque sobrepasa el rango del 1 – 5 años D) RELACIÓN ENTRE LAS VARIABLES: PRUEBA DE HIPOTISIS CON T STUDENT Ho: no exist existe e relación entre ent re las Variables ventas vent as y EXPER EXPERIE IENC NCIA IA H1:: exist H1 existe e re relación lación entre la lass variables ventas y pub publici licidad dad Tcal =
Cà Càlcu lculo lo del error estándar (Syx) (Syx)
Tcritico = (gl; α) (n – 2; 5%) (5 – 2; 0,05) Tabla T: (3; 0,05) = ± 3,182
51
Interpretación: Interpretaci ón: Como T calculado calc ulado (8,4) (8,4) e ess mayor m ayor q que ue T crítico crític o (3, (3,18 182) 2) cae en la zona de rechazo.
Por tanto existe exist e relación entre ventas y
experiencia.
E) Grado de R Relación elación : ccoefic oeficiente iente de correlación correlaci ón (r)
CONCLUSIONES ● La regresión regresión lineal simple consiste en estimar las variables de x e y para para determinar los factores dependientes e independientes , para su representación gráfica. ● Las técnicas de regresión y correlación cuantifican la asociación estadística entre dos o más variables.
regresión n lineal simple expres expresa a la relación e entre ntre una variable dependiente dependiente ● La regresió Y y una variable independiente X, en términos de la pendiente y la intersección de la línea que mejor se ajuste a las variables.
expresa presa el grado o la cercanía de la relac relación ión entre las ● La correlación simple ex dos variables en términos de un coeficiente de correlación que proporciona una medida indirecta de la variabilidad de los puntos alrededor de la mejor línea de
52
ajuste- Ni la regresión ni la correlación dan pruebas de relaciones causa – – efecto.
APÉNDICE A PÉNDICE
53
GRÁFICO GRÁFIC O 1:Regresión 1:Regresión lin linea eal,l, pru prueba eba de hipotesi hip otesiss y T de student. stu dent. s.slideshare.net/je net/jeison isonvillarrealj/ villarrealj/28 28-e -ejercicios jercicios Recup Re cuperado erado de ::((https://e htt ps://es.slideshare.
54
GRAFICO 2:Regresión lineal simple(2010).Estadistica II.Recuperado de : http://halweb.uc3m.es/esp/Personal/personas/aarribas/esp/docs/estII/te ma4esp(2).pdf
55
BIBLIOGRAFÍA
● Bravo,F(2013).Regresión
lineal.Recuperado
De:https://felipebravom.com/teaching/regresion.pdf
Castro, stro, Anto Antonio(s.f).Interpretación nio(s.f).Interpretación de los diagramas de disp dispersión ersión por ● Estepa Ca los estudiantes de bachillerato.Investigación didáctica.Recuperado de: https://www.raco.cat/index.php/Ensenanza/article/down https://www.raco.cat/index.php/ Ensenanza/article/download/118098/297 load/118098/297686 686
Clara(2014). 4). Correlacion y Regre Regresion sion lineal.Instituto Argon Argones es de ● Laguna, Clara(201 ciencia en la salud.Recuperado de: http://www.ics-aragon.com/cursos/saludpublica/2014/pdf/M2T04.pdf ● Peña,
D.
“Regresión
y
análisis
de
experimentos”
https://www.bioestadistica.uma.es/baron/apuntes/ficheros/cap02.pdf
56
(2005)
1.
57
View more...
Comments