Modelos Empíricos Muchos problemas en la ingeniería involucran las relaciones entre dos o más variables Por ejemplo: temperatura y dureza El análisis de regresión es una técnica estadística muy útil para este tipo de problemas. Se puede hacer un modelo para predecir la dureza del material a cierta temperatura
1
17/06/2010
Modelos Empíricos
Diagrama de dispersión
2
17/06/2010
Observaciones No hay una curva simple que una todos los puntos Existe una tendencia muy fuerte a que todos los puntos se encuentran dispersos aleatoriamente alrededor de una línea recta
Regresión Lineal Simple Es razonable asumir que el valor esperado de Y está relacionado a x por: Donde la pendiente y la intersección con el eje Y se conocen como COEFICIENTES DE REGRESIÓN Debido a que estamos hablando de una aproximación, se le añade un término de error
3
17/06/2010
Regresión Lineal Simple Donde є se le conoce como término aleatorio de error A la ecuación anterior le llamamos
modelo
de regresión lineal simple debido a que sólo tiene una variable independiente o
regresor
Importancia de la Varianza La varianza determina la variabilidad en las observaciones Entonces si σ2 es pequeña los valores de las observaciones de Y caerán muy cerca de la línea, en cambio si σ2 es grande los valores de las observaciones de Y se desviarán mucho de la línea. Debido a que σ2 es constante, la variabilidad en Y para cualquier valor de x es el mismo
4
17/06/2010
Importancia de la Varianza
Regresión Lineal Simple Suponemos que tenemos n pares de observaciones Utilizaremos un criterio para la estimación de los coeficientes de regresión llamado el método de los mínimos cuadrados
5
17/06/2010
Regresión Lineal Simple Generalizando tenemos:
La suma de los cuadrados de las desviaciones de las observaciones es:
Regresión Lineal Simple Los estimadores mínimos cuadrados de y de , o dichos de otra manera y deben satisfacer:
Simplificando tenemos:
6
17/06/2010
Definición Los estimadores de mínimos cuadrados en la intercepción y en la pendiente en un modelo de regresión lineal simple son:
Observaciones La regresión lineal estimada por lo tanto es: Para cada par de observaciones se debe satisfacer la siguiente relación Donde es llamado residual y describe el error en ese punto
7
17/06/2010
Observaciones Es conveniente dar símbolos especiales al numerador y al denominador de la definición anterior
Ejemplo
8
17/06/2010
Ejemplo
Ejemplo
9
17/06/2010
Estimación de σ2 Tenemos aún otro parámetro desconocido en nuestro modelo de regresión, σ 2 la varianza del término de error aleatorio є Para esto definimos La suma de cuadrados de los residuales, mejor conocida como error de suma de cuadrados
Estimación de σ2 Tenemos ahora que un estimador puntual de la varianza es igual a:
Donde SSE también puede ser presentado así:
10
17/06/2010
Errores estándar En la regresión lineal simple el error estándar estimado de la pendiente y de la intersección son:
Pruebas de hipótesis en regresión lineal simple Una parte importante para lograr un modelo adecuado de regresión lineal es evaluar hipótesis acerca de los parámetros de este mismo modelo y de esta manera construir intervalos de confianza
11
17/06/2010
Usando las pruebas-t Supongamos que deseamos evaluar la hipótesis de que la pendiente es igual a una constante, por decir, Las apropiadas hipótesis serían: Nuestro valor T es el siguiente, con distribución t y n-2 grados de libertad
Usando las pruebas-t Podemos rechazar
cuando:
Ahora para evaluar la intercepción
Se rechaza con la misma condición
12
17/06/2010
Casos especiales Si aceptamos la hipótesis
Si Rechazamos la hipótesis
Ejemplo Continuando con el ejemplo anterior, evaluemos las siguientes hipótesis Usaremos α = 0.01 Tenemos lo siguiente
Debido a que
la hipótesis se rechaza
13
17/06/2010
Análisis de la Varianza El método de análisis de la varianza mide la significancia de la regresión El método particiona la variabilidad total de la respuesta variable en componentes significativos como la base para la prueba La igualdad para el análisis de la varianza es:
Análisis de la Varianza Simbólicamente la ecuación puede escribirse así: Donde: Es la suma total corregida de los cuadrados (k=n-1) Es el error de suma de los cuadrados (k=n-2) Es la suma de regresión de los cuadrados (k=1)
14
17/06/2010
Análisis de la Varianza Para rechazar o aceptar utilizaremos ahora la distribución F
Rechazaremos H0 si MSR y MSE son los cuadrados significativos
Ejemplo Utilizaremos el mismo ejemplo anterior,
Se cumple se rechaza
por lo tanto la hipótesis
15
17/06/2010
Intervalos de confianza
Ejemplo Encontrar intervalo de confianza del 95% sobre la pendiente usando los datos anteriores
16
17/06/2010
Ajuste de la recta de regresión
•
•
Debido a que para nuestro análisis requerimos varias suposiciones, es necesario verificar que nuestros resultados sean adecuados Para esto utilizamos: Análisis de residuales Coeficiente de determinación
Análisis de residuales Sabemos que un residual es: Se podría utilizar un histograma de frecuencia de residuales, pero es mejor utilizar una gráfica de probabilidad normal
17
17/06/2010
Gráfica de PROBABILIDAD NORMAL 176, 191, 214, 220, 205, 192, 201, 190, 183, 185
Gráfica de PROBABILIDAD NORMAL
18
17/06/2010
Coeficiente de determinación R 2 Se determina así:
Es utilizado para juzgar que tan adecuado fue el modelo de regresión El valor va de 0 a 1
Thank you for interesting in our services. We are a non-profit group that run this website to share documents. We need your help to maintenance this website.