MINITAB AVANZADO Contenido PDF
August 31, 2022 | Author: Anonymous | Category: N/A
Short Description
Download MINITAB AVANZADO Contenido PDF...
Description
MINITAB AVANZADO
Contenido Parte A: 1. Configuraci Configuración ón p personaliza ersonalizada da de de Minitab 2. Gráficas especiales 3. Manipulac Manipulación ión de datos 4. Cálculos y pa patrones trones de datos en columnas 5. Distribucione Distribuciones s de probabilidad 6. Estadística inferencial – inferencial – Pruebas de hipótesis 2
Contenido Parte B: 7. Tamaño de muestra y potencia 8. Análisis exploratorio exploratori o de datos 9. Estadística Estadística no paramétrica 10. Tablas y pruebas no paramétricas 11. Regresión lineal y cuadrática 12. Regresión múltiple
3
Contenido Parte C: 13. Series de tiempo 14. Diseño de experimentos experimento s factoriales factoria les 15. Estudios de R&R – Concordanci Concordancia a por atributos 16. Capacidad de procesos por atributos 17. Capacidad de procesos 18. Cartas de control control ponderadas ponderadas en el tiemp tiempo o 4
Contenido Parte A: 1. Configuraci Configuración ón p personaliza ersonalizada da de de Minitab 2. Gráficas especiales 3. Manipulac Manipulación ión de datos 4. Cálculos y pa patrones trones de datos en columnas
5. Distribucione Distribuciones s de probabilidad 6. Estadística inferencial – inferencial – Pruebas de hipótesis 5
Configuración personalizada personalizada del Minitab
• Barras de tareas • Personalización • Opciones • Perfiles • Seguridad de archivos
7
Barras de tareas: Tools > toolbars toolbars
8
Barras de tareas: Tools > toolbars toolbars > Standard Standard
Ayuda Editar el último diálogo Ctrl-E Comando anterior Alt-F2 Comando siguiente F2
Cancelar Buscar siguiente
Buscar Ctrl-F 9
Tools > toolbars toolbars > Project Project Manager Manager
Mostrar
Mostrar Infor-
Mostrar reporte
Project Mgr.
Borrar gráficas
folder de sesión Mostrar folders de hojas Ctrl-Alt-D y Gráficas Ctrl-Alt-G
Mación Ctrl-Alt-I Mostrar historial Ctrl-Alt-H
Ctrl-Alt-R
Ctrl-I
Mostrar documentos Relacionados Datos Ctrl-Alt-L
Mostrar hoja de Datos Ctrl-D
Mostrar diseño Ctrl-Alt-E
Mostrar sesión Ctrl-M
10
Tools > toolbars toolbars > Worksh Worksheet eet
Asignar Fórmula a columna
Insertar celda renglón y columna
Mover columna
Mostrar Filas de Datos de Puntos Selec. Con Brush
Borrar
11
Tools > toolb toolbar arss > Gr Graph edi editin ting g
Selección Brush Borrar selección
12
Tool oolss > tool toolba bars rs > Grap Graph h an anno nota tati tion on to tool ol
Selección
Insertar rectángulo círculo, línea, punto
Insertar dibujo de línea o superficie
Insertar Texto
13
toolbar arss > 3-D 3-D Gr Graph to tools ols Tools > toolb
Rotación inversa y
Rotación inversa y
Rotación inversa y
Rotación inversa y normal ligera en los
normal en el eje X
normal en el eje Y
normal en el eje Z
ejes ejes X, Y y Z
Zoom +y-
Regreso a parámetros inciales
14
Tools > toolbars toolbars > Factorial Factorial designs designs
Crear diseño factorial Definir diseño factorial Seleccion ar Diseño óptimo
Analizar Diseño factorial
Optimizador
Analizar variabilidad Preproceso de respuestas para análisis de variabilidad
Gráficas factoriales
Modificar y mostrar diseño
Gráficas de contornos overlaid
Gráficas de contorno y superi sup erific fice e de respuesta 15
Tools > toolbar toolbarss > Resp Response onse surf surface ace desi designs gns
Crear diseño
Analizar
Optimi-
Modificar
de superficie de respuesta
Diseño de Superficie de respuesta
zador
y mostrar diseño
Definir diseño de superficie de respuesta
Seleccionar Diseño óptimo
Gráficas de contornos overlaid
Gráficas de contorno y super sup erifi ifice ce de respuesta
16
toolbars > Mixture Mixture designs Tools > toolbars
Crear diseño factorial Definir diseño factorial Seleccion ar Diseño óptimo
Analizar Diseño factorial Gráficas factoriales Gráfica Del diseño Simplex
Gráficas de trazo de respuesta
Optimizador
Modificar y mostrar diseño
Gráficas de contornos overlaid
Gráficas de contorno y superi sup erific fice e de respuesta 17
Tools > toolba toolbars rs > Taguc Taguchi hi des designs igns
Crear diseño de Taguchi
Analizar Diseño de Taguchi
Definir diseño de Taguchi
Modificar y mostrar diseño
Predecir resultado
18
Tools > Customize Para personalizar las opciones de menú, seleccionar y arrastrar el comando específico, a una barra de menú existente
Tools > Options
Para personalizar las opciones por Default, de cada una de las opciones y menús de Minitab
Tools > Profiles
Para personalizar las opciones y menús de Minitab, definidos para un perfil específico
Seguridad para archivos Permite asig a sign nar passwords pass words en archivos archivos de proy proyectos. ectos. para protegerlos p rotegerlos de uso no autorizado. autorizado.
Secu rity Tools > File Security File > Save Project P roject As > Security
Password to open proj Password project ect fil file e (Hasta (H asta 15 caracteres)
Clave para abrir un archivo de proyecto
Password Passw ord to modi modify fy project fil file e Clave para modificar modifi car archivo archivo de proyect proyect Permite su acceso de solo so lo lectura lectura Read Only NOTA: Si el password se olvida o pierde, no hay forma de recuperarlo
Gráficas especiales • Gráfic Gráficas as de dispersión de dos variables • Gráfic Gráficas as matriciales de dispersión
• Gráfic Gráficas as tridimensionales • Gráficas de contornos
• Gráfic Gráficas as de superficies de respuest respuesta a
24
Gráficas Gráfi cas de dispersión de dos va variables riables Gráfica de Gráfica d e dispersión simple File > Open Worksheet > Pulse.mtw Graph > Scatterplot > Simple
o Copiar Copi ar los datos datos de Archiv de Archivos os Datos Módul Módulo o
Indicar en Y variable Weig W eight ht y en X variable Height La gráfica de dispersión d ispersión simple se muestra muestra a continuación: continuación: Scatterplot of Weight vs Heigh Heightt 220 200 180
t h 160 g i e W 140
120 100 60
62
64
66
68 Height
70
72
74
76
25
Gráfica Gráfi ca de d dispersión ispersión Simple con una va variable riable categórica:
P ulse.mtw se.mtw File > Open Worksheet > Pul Graph > Scatterplot > Simple Indica ndicarr en Y variable Weight y en X variable Height Heig ht Se puede agregar otra variable para estratificar haciendo doble click en los puntos y seleccionando la pestaña Groups e indicando indic ando la vvariable ariable categórica Sex. Scatterplot of Weight vs Height 220
Sex
1 2
200 180 t h 160 g i e W 140 120 100 60
62
64
66
68 Height
70
72
74
76
26
Para cambiar cambi ar el titipo po se sí símbolo mbolo por categoría para impresión i mpresión en blan blanco co y negro: negro: Click sobre cualquie cualquiera ra de los puntos, puntos, para seleccionarl selecci onarlos os todos Click sobre los puntos puntos de un una a cierta ci erta categoría Doble click para que aparezca el cuadro de diálogo que permita cambiar color, símbolo y tamaño para los puntos de ese grupo.
27
Para marcar más de un punto a la vez se utili utiliza za Brush Editor tor > Brush, Brush, se pueden Con el gráfico seleccionado con un click, seleccionar Edi seleccionar los puntos uno a uno o con un cuadro seleccionar varios a la vez,. manteniendo mant eniendo presi presionado onado el botón izquierdo del de l ratón mient mientras ras se selecci seleccionan onan.. Otra forma de activar acti var Bru Brush sh es con la barra d de e herramientas Graph Editi Editing ng llllamada amada
desde: Tools > Tool Bars > Graph Editing
28
Con Brush activado y con la ventana de gráfica activa, en el Menu Editor seleccionar Set ID Variables indicar Pulse 1, Pulse 2, Ran, Smokes, Activity Activ ity seleccionar Include (row numbers) Se muestra la siguiente si guiente información: información:
29
Para poner la Act la Activ ividad idad a cada pun punto to se usa: Graph > Scatter p plot: lot: With Groups Labels > Data Labels > seleccionar Use Labels from Colu Co lumn mn Activity
30
Para hacer un Zoom de una zona del diagrama hay que cambiar los valores mínimo y Range poner los adecuados. máximo de los ejes, selecci seleccionar onar cada un uno o y en Scale Range Eje X Eje Y
Minimum Minimum
100 61
Maximum Maximum
1 20 64
31
Para identificar las coordenadas de los puntos
de la gráfica seleccionar la gráfica Editor > Crosshair El cursor se convierte en una cruz que se puede colocar en el punto punto para ver las coordenadas
32
Gráficas Gráf icas de dispersión B Bivari ivariantes antes con páneles: Se utiliza el archivo REHEAT.MTW de REHEAT.MTW de Minitab localizado en DATA . File > Open Worksheet > Reheat.Mtw Graph > Scatter plot: With Connect Line para unir unir los puntos puntos Y variab variable le Quality X variables Time Multiple ltiple graphs > By Variables Vari ables > En En By By variab variables les in separate panel pa nels s Temp Mu
33
Para modificar modifi car la apariencia de la gráfica, seleccionarla y : Editor > Panel > Options Seleccionar Don´t Don´t alternate alternate panels pa nels Seleccionar Group information information:: Both variable nam names es and a nd levels levels Scatterplot of Quality vs Time Temp = 350
Temp = 375
Temp = 400
Temp = 425
Temp = 450
Temp = 475
8 6 4 2
y t i l a u Q
0 8 6 4 2 0 25
30
35
25
30
35
25
30
35
Time
34
Graficas bivariantes con distribuciones de frecuencia adicionales: Reheat.Mtw Reheat.Mtw File > Open Worksheet> Reheat.Mtw
Graph > Marginal Variables Varia bles Y = PVPPlotX = Pot(CV) Se tienen 3 posibilidades después de indicar la variable Y y X como antes:
Marginal P lot of Height vs Weight
t h g i e H
75
75
70
t 70 h g i e H
65
65
100
150
200
Marginal Plot of Height vs Weight
75
70
65
100
150
Weight
100
150
Weight
Weight
t h g i e H
Marginal P lot of Height vs Weight
200
200
35
Matrices de Graficas bivariantes simples: Pulse.Mtw Simple File > Open Worksheet Worksheet > Pulse.Mtw Graph > Matrix Matrix Plot > Si Simple mple Se tienen varias varias posibilidades posi bilidades después después de indicar i ndicar las variables: variables:
Matriz de "todas" por "todas" Matriz " todas" las variables var iables seleccionadas
Permite seleccionar toda la matriz o solo la parte inf i nferior erior o superior de la misma
36
Matri Mat rix x Plot of Pulse1 Pulse1,, Pulse2, Pulse2, Heigh Height, t, Weight Weight 50
100 100
150 150
100 100
150 150
200 100 100
75
Pulse1
50
15 150 0
10 100 0
Pulse2
50 75 70 Height 65
20 200 0 15 150 0
Weight
10 100 0 50
75
100 100
65
70
75
37
Matrices de Grafi Graficas cas bivari bivariantes antes por grupos: Pulse.Mtw Pulse.Mtw Por grupos File > Open Worksheet > Pulse.Mtw Graph > Matrix Plot > With groups Graph variab variables les > Pulse 1 Pulse 2 Height Weight Categorical variables for subgroups Sex OK Matrix Plot of Pulse1, Pulse2, Height, Weigh Weightt 50
100
150
100
150
200 100
75
Pulse1
Sex 1 2
50
150
100
Pulse2
50 75 70 Height 65
200 150
Weight
100 50
75
100
65
70
75
38
Matrices de Graficas bivariantes varias X vs varias Y: Pulse.Mtw Por grupos File > Open Worksheet > Pul P ulse.Mtw se.Mtw Graph > Matrix Plot > Each Y vs Each X > With Smoother Y variables > Pulse 1 Pulse 2 X Variables Variables Height Weight OK
Matrix Plot of Pulse1, Pulse2 Puls e2 vs Height, Weigh Weightt 100
125
150
175
200 100
1 e s l u P
75
50 150
125 2 e s 100 l u P
75 50 60
64
68 Height
72
76 Weight
39
Gráficas de dispersión tridim tridimensionales: ensionales: Coches.Mtw Grafica bivariada en tres dimensiones
Graph > 3D Scatter Plot Se utiliza utili za de nuevo nuevo el archivo arc hivo COCHES.MTW anexo
3D 3DScatterplot Scatterplot of PVP vsPot. t.(CV) (CV) vsCil Cil.( .(cc) cc)
45000000
30000000
15000000
Indicar las variables para el eje Z, Y y X
450 0
300 0
2000
150 4000
Cil.(cc)
000
Pot.(CV)
0
40
Con la herramienta Tools > Tool Bars > 3D Graph tools se tools se puede modificar la gráfica:
Girar gráfi ca Sobre la gráfica de 3 dimensiones d imensiones se pueden usar también las opciones Brush, modificar ejes, puntos, etc. haciendo doble click sobre ellos.
Zoom
Posi ción ini cial
En algunos casos se desea tener los líneas lí neas verticales para los puntos, puntos, esto se hace en e n el menu menu de: Graph > 3D Scatter Plot Data View Seleccionar en Data Display Di splay Projected lines
41
Grafica Grafi ca bivariada en tres dimensiones estratificada estratificada por po r una variable categórica Graph > 3D Scatter Plot
3DScatterplot ofPVPvs Pot. t.(CV (CV)vs Cil.(cc) Num.Cil. 2 4 5 6 8 12
45000000
Indicar las variables Z, Y y X así como la variable (s) categórica categóric a (s)
30000000
PVP 15000000 450 0
300 0
150 2000
Cil.(cc)
6000
Pot.(CV)
0
42
ContourPlo lotofC3vs sC C2,C1
Curvas de nivel (Contour Pl Plots) ots)
5.0 -0.4
-0.4 -0.4
Graph > Contour Plot Columnas de datos para Z, Y y X de Mesh
-0.8
2.5
2 C 0.0
0.4
0.4
0.8
-0.8
0.8
-2.5
0.0 -0.4
-0.4
-0.8 -0.8
-5.0 -5.0
-2.5
-0.8
0.0 C1
2.5
5.0
43
Superficie mallada (Wireframe) (Wireframe) o sup superificie erificie con textura (surface)
Graph > 3D Scatter Plot Generar datos para la superficie por medio de una función ya establecida con: Calc > Make Mesh Data
Columnas donde se guardan los datos generados
Datos para un sombrero vaquero
Obtener la gráfica con: Graph > 3D Surface Plot 44
Obtener la gráfi Obtener gráfica ca c con: on: Graph > 3D Sur S urface face Plot Colu Col umn mnas as d de e da dato tos s pa para ra Z, Y y X de M Mesh esh
Se ttien ienen en dos opcio opcion nes, mallada o superficie
Surface Plot of C3 vs C2, C1
1
C3
0
5 -1
0 -5
0 C1
5
C2
-5
45
Extraer subconjuntos de datos da tos de hojas de trabajo (Worksheets)
Data ta > Subset worksheet worksheet Da
48
La secci s ección ón de la hoja hoja de trabajo resu resultan ltante te es:
49
Dividir hojas de trabajo (Worksheets) Data > Split worksheet Spli t worksheet
50
Reunir hojas de trabajo (Worksheets)
Data > Merge worksheet
OK
51
Copias diversas Data > Copy OK
52
Apilar Apil ar columnas Data ta > Stack colum column ns Da OK
C olumnas resultan resultantes tes
53
Desapilar columnas Data > Unstack columns OK
Columnas resultantes
54
Transponer columnas Transpo Tran spone ne columnas columnas a renglones Por ejemplo, e jemplo, se tienen datos de estudiantes estudiantes arreglados a rreglados e en n colu column mnas as pero se quiere quiere rearreglarlos rearreglarlos por tipo de ejer ejercicio cicio:: Task
Lyn
Bi l l
Sam
Mari e
Pushups
50
69
70
57
Pul l ups
66
85
81
76
Si tups
73
88
95
79
Fi File le > Open Worksheet > Exercise.Mtw Data > Transpose columns En Transpo Transpose se the following columns columns Lyn Bill B ill Sam Marie seleccionar After After last colu column mn in use En Store Transpose Transpose seleccionar En Create variable names using columns, columns, anotar Task OK 55
Los resul resultados tados se muestran a contin continuación: uación: Labe l s
P us h up s
P ul l up s
Si tups
Lyn
50
66
73
Bi l l
69
85
88
Sam
70
81
95
Mari e
57
76
79 56
Ordenar datos por una más columnas co lumnas
En los siguientes datos de ventas, se desea un listado por agencia: Inde x
Quarte r
Ye ar
Sal e s
A dv e rti s
Capi tal
AdAge ncy
1
1
1991
94
17
8 Ome ga
2
2
1991
99
10
6 Ome ga
3
3
1991
98
9
12 Al pha
4
4
1991
92
22
16 Al pha
5
1
1992
106
24
29 Al pha
6
2
1992
116
18
32 Al pha
7
3
1992
113
13
33 Ome ga
8
4
1992
108
14
36 Ome ga
File > Open Worksheet > Market.Mtw Data > Sort En Sort column column(s), (s), seleccionar Sales Advertis AdAgency En la primera By column column se seleccionar leccionar AdAgency En la segun seg unda da By column column selecci seleccionar onar Advertis y seleccionar Descending En Store sorted data data seleccionar se leccionar Colu Co lumns(s) mns(s) of cur c urrent rent worksheet seleccionar C8 C9 C10 OK 57
Los result resultados ados son los los sig s igu uien ie ntes:
Sal e s
A dve rti s
A dAge ncy
106
24 A l pha
92
22 A l pha
116
18 A l pha
98
9 A l ph a
94
17 Ome ga
108
14 Ome ga
113
13 Ome ga
99
10 Ome ga 58
Borrado de datos d atos de renglones y columnas Data > Delete D elete Rows
OK Data > Erase variables
OK
59
Uso de tablas de conversión Se desea codificar los nombres de estados a sus números de ID Tabla de conversión
STID
State
StNam
StCod
MT
AL
1
CO
AK
2
CO
AZ
3
OR
AR
4
WA
CA
5
La Tabla resultante resultante es la si siguiente: guiente:
CA WA
CO CT
6 7
File > Open Worksheet > States. Mtw Crear una columna columna nuev nueva a STID para los códi c ódigos gos Data > Code > Use conversion Table En Input column, seleccionar State En Output En Output column, seleccionar STID Column of Original Values, seleccionar StNam En Column En En Co En Colum lumn n of New Values, seleccionar StCod StCod OK
State MT
StNam AL
StCod
CO
AK
2
6
CO
AZ
3
6
OR
AR
4
3 37 7
WA
CA
5
47
CA
CO
6
5
WA
CT
7
4 47 7
CO
DE
8
6
1
STID
2 26 6
60
Cambio de tipo de variabl variables es Tabla resultan re sultante te
Data > Change data type
C 1-T
C 2-D
Fe chas Ene - 10
Date s Ene - 2010
Fe b- 10
Fe b- 2010
Mar-10
Mar- 2010
Abr-10
Abr- 2010
May-10
May- 2010
Jun- 10
Jun- 2010
Se desea de sea ca cambiar mbiar da datos tos de fecha en tex texto to a datos e en n for formato mato de fecha Fechas
Ene-1-10 Feb-1-10 Mar-1-10 Abr-1 Abr-1-10 -10 May-1-10 Jun-1-10
Instrucciones de Minitab: Data > Change data type > Text Text to Date/T Da te/Time ime En Change text column, seleccionar Fechas En Store En Store D Date ate / Time columns columns in, i n, seleccionar Dates Format of text colu columns mns (e.g. (e.g. mm-dd-yy), mm-yy En Format En OK NOTA: mmm da el nombre del mes
61
Extracción Extracci ón d de e datos de fechas
Data > Extract Extract from Date / Time
Tabla resultante C2-D FechaNum
Dates Enee-2 2010
201001
Feb eb-2 -20 010
201002
Mar-2 -20 010
201003
Abrr-2 Ab -20 010
201004
Mayy-2 2010
201005
Jun-20 -2010
201006
62
Concatenar columnas Se usa para combinar columnas de texto en una columna más amplia Por ejemplo, e jemplo, los nombres y apellidos de estudi estudiant antes, es, estan en 2 co colu lumn mnas: as: Apel elli lid do
Nombre
Al l e n
Jo
Charl e s
Dave
Pe rki ns
Max
Ri chards
Bob
Ste phe ns
Mary
Fil File e > Open worksheet w orksheet > S STU TUDE DENT NTS.MTW S.MTW Data > Concatenate En Concatenate Co ncatenate text columns, columns, First Last s, poner Students En Store Result Resu lts OK
Tabla resultante Students
Jo Allen Dave Charles Max Perkins Perki ns Bob Richards Mary Stephens Stephe ns 63
Despiegue de contantes y matrices
Data > Display data Muestra datos seleccionados Muestra selecci onados de constantes constantes y matrice matricess almancenadas almancenadas dado que no se mostraron en la ventana de sesión. Las constantes son números o textos definidos, para uso en fórmulas y cálculos. Todas las constantes se identifican con un nombre que inicia con K (K1, (K 1, K2, K2 , etc.). Minitab Minitab tiene tres constantes constantes reservadas: K998 = * K999 = 2.718 (e ) K1000 = 3.4142 (Pi) También se pueden asignar asi gnar otros nombres a las constantes. constantes.
64
Las matrices son bloques rectangulares de números sobre los que se realizan realiz an operaciones operaci ones matemáticas. Porr ejemplo una matriz 3 x 4 (filas x columnas) Po columnas) es:
Las matrices tienen una identificación que inicia con M (M1, M2, etc.) También se pueden asignar otros nombres a las matrcies. Instru nstrucci cciones ones de Minitab: Minitab : Data > Display Data En Co Colu lumn mns, s, constants, constants, and matrices matrice s to dis d isplay, play, las que se quieren mostrar OK
65
Cálculo y patrones de datos en columnas Calculadora aritmética aritmética de d e columnas columnas
La calculadora se utiliza para realizar operaciones aritméticas, comparaciones, operaciones lógicas y operaciones entre columnas. Se puede realizar la operaciòn inmediata, o asignarla como fórmula a una columna o constante. Las expresiones no pueden contener matrices. C1-C4 C1-C 4 no es un un rango rango de valores, se interpreta como C1 C1 menos menos C4. C4. Ejemplo:
File > Open worksheet > PULSE.Mtw Calc > Calculator Store results in variable, Pulse Diff
En Expresion, poner Pulse2 - Pulse 1 En OK 68
Los resultados son:
Pul se 1
Pulse 2
Pul se Diff
64
88
24
58
70
12
62
76
14
66
78
12
64
80
16
69
Asignación de un una a constante Se desea des ea asi a signar gnar el v valor alor 1.25 en u un na con co nstante stante Calc > Calculator Store result resu lts s in variable, K1 En Expresion, poner 1.25 En OK
70
Cálculos con datos de fechas
Restar dos columnas de fechas
Fecha Hoy - Fecha Anterior
Restar 30 días a la fecha de hoy y guardar el resultado numérico
TODAY() - 30
Restar 30 días a la fecha de hoy DATE(TODAY() DAT E(TODAY() - 30) y guardar el resultadocomo fecha Extraer la fecha de una columna de Fecha Fecha /T Tie iempo mpo
DATE(fecha)
03") Guardar un indicador (verdadero Fecha = WHEN("3/15/ WHEN ("3/15/03") falso) en un una a ccolum olumn na, ccon on base en la fecha y tiempo de una columna column ad de e fe fecha cha
(1= verdadero, 0=falso) 71
Guardar un indicad Guardar indicador or (verdadero Tiempo >= TIME TIME ("7: ("7:30") 30") AND falso) en e n una una columna, columna, con co n base Tiempo TODAY()TODAY ()-30 30 Guardar un indicad Guardar indicador or (verdadero Fecha contr con tratada falso) en e n una una columna, columna, con co n base en comparación de datos de fechas fechas Guardar un indicad Guardar indicador or (verdadero Fecha con contr tratada atada >DATE("3/15/03")-30 >DAT E("3/15/03")-30 falso) en e n una una columna, columna, con co n base en comparación de datos de fechas fechas
72
Expresiones generales Calcular una expresión matemática Coeficien Coefici ente te de variación
STDEV(C1)/MEAN(C10)*100
Área del círcu círculo lo
K1000*C1**2
Grados centígrados
5/9*(Farenheit - 32)
Guardar texto en columna
"Verde"
Guardar un indicador de verdadero o falso en e n col. (1= verdadero, 0=falso)
C1 C2 (C1=16)
73
Estadísticas Estadísti cas de fila y c columna olumna Determina las estadísticas de filas y columnas con las pantallas sig.: Calc > Column stati s tatistics stics
Calc > Row stati statistics stics
74
Estandarizar valores de variable va riable Se utiliza para determianr los valores Z correspondientes a valores X almacenados en una una colum c olumna: na: Calc > Standaridi Standaridiz ze
75
Patrones de datos en columnas Facilita el llenado de una columna con números que siguen un patrón tales como 1 al 100, o 5 subconj subconju untos de 1, 2 y 3. Se pueden obten obtener er patrones con nú números meros igual i gualmen mente te esp espaci aciados ados o con espaciamient espaciami entos os di diferen ferentes tes como 10, 20, 50….
pa tterned Calc > Make patt erned data
76
Por ejemplo: Da ta > Simple Calc > Make Patterned Data Simple set of numbers Store patterned data, poner ID En From firs value, poner 1, en To last value, poner 100 En OK Tabla resultante: result ante:
ID 1 2 3 4 5
77
Otros ejemplos:
78
Otros ejemplos:
79
Arbitrary set of numbers
Text Values
80
Simpe set of Date/Ti Date/Time me values values Ar Arbit bitrary rary set of Date/Ti Date/Time me values values
81
Variables Variabl es indicadoras parea la regresión Convierte datos categóricos en variables indicadoras para uso en regresión Ejemplo: AL realizar realizar un an análisis álisis de regresión regresión de llos os dat datos os de ven entas, tas, se qu quiere iere in inclu cluir ir la estación estaci ón del año, qu que e es variable categóri categórica, ca, primavera, verano, verano, otoño e invierno invierno (datos en archiv archivo o SEAS SE ASONALSALE ONALSALES.MTW). S.MTW). Season
Daily Sales
Spri ng
3.75
Spri ng
3.89
Spri ng
4.78
Spri ng
3.82
Spri ng
3.63
Etcétera…
82
Instrucciones de Minitab: Open worksheet File > Open w orksheet > > SEASONALSALES:MTW Calc > Make Indicator variables for, Season Store indicator variables in columns, Spring Summer Summ er Fall Winter OK
83
Los datos resultantes son:
Season
Da Daily Sales
Fall
Spring
Summer Winter
Spri ng
3.75
0
1
0
0
Spri ng
3.89
0
1
0
0
Spri ng
4.78
0
1
0
0
Spri ng
3.82
0
1
0
0
Spri ng
3.63
0
1
0
0
Etc…
Se pu p uede ahora realizar la la regresió regres ión n con: Instru strucci cciones ones d de e Minitab: Stat > Regresión > Regression En Response, poner Daily Sales Summ er Fall Fall Winter Winter En Predictors, Spring Summer OK
84
Los resultados resultados se muestran muestran a cont c ontinu inuaci ación: ón:
The regression equation is Daily Sales = 0.687 + 0.634 Fall + 3.13 Spring + 4.03 Summer Predictor
Coef
SE Coef
T
P
Constant
0.6870
0.1987
3.46
0.001
Fall
0.6340
0.2811
2.26
0.030
Spring
3.1290
0.2811
11.13
0.000
Summer
4.0310
0.2811
14.34
0.000
S = 0.628497
R-Sq = 88.8%
R-Sq(adj) = 87.8%
85
Interpretación:
Los coeficientes para Fall, Spring y Summer son significativos. Las vent entas as de de S Spring pring sonm may mayores ores en $3.13 que las de Wi Win nter $0), en general se pueden observar las diferencias de los coeficientes de las estaci es taciones ones para comparar compa rar su sus s efectos en llas as ven ventas. tas. Normal Probability Plot (response is Daily Sales) 99
95 90 80 t n e c r e P
70 60 50 40 30 20 10 5
1
-1.5
-1.0
-0.5
0.0 Residual
0.5
1.0
1.5
Los residuos res iduos muestran norm normalidad, alidad, por p or lo que el modelo es válido
86
Distribución normal o de Gauss
Estadístico Z
Inferencia estadística de los parámetros:
m= media Cuando n >= 30 y/o
es conocida (de
datos históricos) m =proporción Cuando n >= 30
Estadístico t
Inferencia estadística del parámetro: m= media Cuando n < 30 y desconocida (sin historial del proceso o prov.)
89
Estadístico
2
Inferencia estadística del parámetro: = desviación estándar Comprobar normalidad del proceso
Estadístico F
Inferencia estadística del parámetro: 12/ 22 relación de varianzas Revisar normalidad de muestras
90
Generación de números aleatorios para simulación simulación Permite generar números aleatorios a partir de diferentes distribuciones con base en sus parámetros específico específicos: s: Calc > Random data
91
Ejemplo para la distribución normal: Calc > Random data > Normal La tabla resultante es:
Datos
113.307163 103.446686 100.30218 118.253584
105.06341
Etcetera
92
Distribuciones de probabilidad Permite calcular calcular llas as densidade densidades s de probabilidad, p robabilidad, probab probabilidades ilidades acumulativ acumu lativas as y probabi probabilidad lidades es a acumu cumulativ lativas as inv inversas ersas para una un a serie seri e de d distrib istribuciones uciones disc discretas retas y contin continuas: uas: Calc Ca lc > Probabili Prob ability ty distributions distributions
93
Ejemplo para la distri distribución bución normal: Calc > Probability distributions > Normal
Los resultados son:
Cumulative
Normal
Distribution
with
mean
x
P( X Probability Distribution Plot. Plot . Seleccionar View Probability Probability,, click OK OK.. Normal.. De la Distribution, Distribution, Seleccionar Normal En Mean, Mean, poner 1211 . En Standard deviation deviation,, poner 320 . By,, seleccionar X Value Value.. Click en Shaded area. area . En Define Shaded Area By Click Right Tail Right Tail.. En X value value,, poner 1738 . Distribution Plot Click OK en OK en cada cuadro de diálogo Normal, Mean=1211, StDev=320 0.0014 0.0012 0.0010 y t i s n e
0.0008
D 0.0006
0.0004 0.0002 0.0498 0.0000
1211
1738
X
97
O para un 10% del área: area.. En Define Shaded Area By, By, seleccionar Probab., Right Tail, 0.10 5 Click en Shaded area
Distribution Plot Normal, Mea n=1211, StDev=320
0.0014 0.0012 0.0010
10
y 0.0008 t i s n e D 0.0006
0.0004 0.0002
0.1
0.0000
1211
1621
X
El valor de 1738 si entra en la zona.
98
Solo como demostración para el caso de dos colas: By, sel. Probab., Proba b., Bot Both h Ta Tails, ils, 0.10 0.10.. 5 Click en Shaded area. area . En Define Shaded Area By, Distribution Plot Normal, Mean=1211, StDev=320 0.0014 0.0012 0.0010 y t 0.0008 i s n e D 0.0006
0.0004 0.0002 0.05 0.0000
0.05 685
1211 X
1737
99
Prueba de normali normalidad dad Es una prueba de hipótesis de una población para determinar si la muestra se extrae de una población normal, que es la hipótesis nula. La hipótesis alterna es que no es normal.
Se puede hacer por diversos métodos:
1. Método gráfico Se trata de probar la flamabilidad de una fibra y ver si sigue una distribución normal, además se quiere observar su valor en el percentll 87avo.
1 2 3 4 5 6
File > Open worksheet worksheet FLAMERTD.MTW. Probab ility Graph > Probabili ty Plot. Seleccionar Single, Single, click OK OK.. variables,seleccionar ,seleccionar Fabric . En Graph variables Click Scale Scale,, y click el Percentile Lines . Lines . OK en cada cuadro de diálogo. En Show percentile lines at Y values, values , teclear 87 . Click OK
100
Probability Plot of Fabric Normal - 95% CI 99
95 90
87
Mean StDev N AD P-Value
3.573 0.5700 15 0.31 0.310 0 0.517
80 70
t n e cr e P
60 50 40 30 20 10 5
5 1 2 . 4
1
2
3
4 Fabric
5
6
Los puntos no salen del intervalo de confianza del 95% y el P value es menor de 0.05 por tanto los datos de la muestra siguen una distribución normal. El IC del 87% se encuentra entre los valores 3.84295 y 4.58790 101
6. Estadística inferencial Pruebas de hipótesis
104
Estadística inferencial • Introducción
• Intervalos de confianza • Pruebas de hipótesis de una población • Pruebas de hipótesis de dos poblaciones Análisis de vari varianza anza de un una a vía ((ANOV ANOVA A One way) way) • Análisis • Anális Análisis is de varianz varianza a de dos vías (ANOV (ANOVA A two wa ways) ys)
• Análisis de medias (ANOM) ANOV VA bal balanc anceado eado • ANO 105
IC = Est Estadís adístico tico ++- err error or mu muestr estral al
Intervalo de confianza (95%) , rango de valores para estimar los parámetros , , 2,
Población, total de productos y servicios (N)
Muestra (n)
Inferencia estadística de los parámetros: m= media s= desviación estándar 2 = varianza =proporción
Estadísticos X, s, p
106
Distribución normal o de Gauss
Estadístico Z
Inferencia estadística de los parámetros:
m= media Cuando n >= 30 y/o datos históricos) m =proporción Cuando n >= 30
es conocida (de
Estadístico t
Inferencia estadística del parámetro: m= media Cuando n < 30 y desconocida (sin historial del proceso o prov.)
107
Estadístico
2
Inferencia estadística del parámetro: = desviación estándar Comprobar normalidad del proceso
Estadístico F
Inferencia estadística del parámetro: 12/ 22 relación de varianzas Revisar normalidad de muestras
108
IC = Est Estadís adístico tico ++- err error or mu muestr estral al
Intervalo de confianza (95%) , rango de valores para estimar los parámetros , , 2,
Población, total de productos y servicios (N) Estadísticos utilizados: Z o t
m = media, =proporción
Muestra (n)
s= desviación estándar, 12/
2
22 Rel. de varianzas
Estadísticos X, s, p
109
Intervalos de confianza para la media Determinar el intervalo de confianza para la media poblacional , con los datos tomados del índice de calidad del vino, con los datos en el archivo Wine.Mtw. Desv. Estándar = 2.04 Se utiliza el estadístico Z por ser n > 30
File le > Open worskeet > Wine.Mtw Wine.Mtw Fi Stat > Basi B asic c statistics statisti cs > 1-Sample-Z 1-S ample-Z (Test (Test and confidence in i nterv terval) al) Samples in columns seleccionar columna columna Quality Estándar deviatio deviation n 2.04 Options Co Conf nfid idence ence lev level el 95% OK Individual Individu al Value Plot of Quality Graphs seleccionar Individual value plot OK OK (with 95% Z-confidence interval for the Mean, and StDev = 2.04)
_ X
Intervalo donde se encuentra La media poblacional
7
8
9
10
11
12 Quality
13
14
15
16
110
Se obtienen los resultados siguientes: One-Sample Z: Quality The assumed standard deviation = 2.04 Variable Quality
N
Mean
StDev
SE Mean
38
12.437
2.045
0.331
95% CI (11.788, 13.085)
Conclusión: para un 95% de nivel de confianza, con los datos obtenidos de la muestra mues tra del ínid ínidice ice de c calidad alidad de dell vino (Quality), el intervalo qu que ec contiene ontiene al ííndice ndice promedio de calida c alidad d para toda la producc producción ión de vino es: (11.788 (11. 788 a 13.085) La gráfica de puntos que muestra la distribución de los valores del índice de calidad y el Intervalo de confianza correspondiente, para un nivel de confianza del 95% es: Individual Value Plot of Quality (with 95% Z-confidence interval f or the Mean, and S tDev = 2.04)
_ X
7
8
9
10
11
12 Quality
13
14
15
16
111
Prueba de hipótesis • Una prueba de hipótesis es una afirmación sobre el valor que se estima tiene un parámetro poblacional , , 2, • Si la afirmación contiene el signo igual (=, >=, 100 Ho: m Basic statistics > 1-sample t
113
One-Sam OneSample ple Z Los resultados se muestran a continuación TOne-Sample est of m mu u = 100T vs > 100 The assumed standardcannot deviationbe = 5 made with summarized data. * NOTE * Graphs Test of mu = 100 vs not = 100 N
95% Lower Mean StDev
SE Mean
N 20
95% CI
Mean SE Mean Z P (107.66, 112.34) 110.00 5.00Bound 1.12 20 110.00 1.12 108.16 8.94 0.000
T
P
8.94
0.000
Conclusión: El
intervalo de confianza donde se encuentra el promedio de las ventas con base en una muestra tomada es (107.66 a 112.34) para un 95% de nivel de confianza.
El Int Interv ervalo alo de c conf onfianz ianza a de (107.66, 112.34) no contiene a la medi media a de la hipótesis (100) y P value es menor a 0.05, se rechaza Ho y se acepta Ha, ya subió el promedio de ventas.
114
Cuando se conoce la desviaci desviación ón estándar y la muestra n es mayor a 30. Para el caso de los datos de dell arch archivo ivo Wine.Mtw se trata de probar la afirmación afirmaci ón de que que el aroma es mayor o igual a 4, a un 95% de nivel de confianza. Establecimiento de hipótesis Ha: m= 4 En Minitab:
Stat > Basic B asic statistics > 1-Sample-Z (Test (Test and confidence interval) interval) Samples in columns seleccionar columna columna Aroma Standard deviation deviatio n 4.847 Pe rform hy Perform hypothesi pothesis s test Hy Hypothesi pothesized zed mean 4 Options ns Co Confidence nfidence level 95% 95% Alternative Alternative Less Than Than OK Optio Graphs seleccionar Individual value plot OK OK
115
116
Los result resultados ados se muestran a co cont ntinuación: inuación: One-Sample Z: Aroma Test of mu = 4 vs < 4 The assumed standard deviation = 4.847
95% Upper
Variable Aroma
N
Mean
StDev
SE Mean
Bound
Z
P
38
4.847
1.082
0.786
6.141
1.08
0.859
Conclusión: El int i ntervalo ervalo de confianz confianza a donde se encu encuentr entra a el prome promedio dio de A Aroma roma con base en un una a muestra tomada es (…., 6.14 6.141) 1) pa para ra un 95% de nivel de confianz confianza. a.
El Interv Intervalo alo de confianz confianza a de (….., 6.141) SI contiene a la medi media a de la hipótesi hipótesis s (4) y P value value es mayor a 0.05, NO se rechaza Ho, el Aroma ti tiene ene un promedi promedio o >= 4. Individual Value Plot of Aroma
(with Ho and 95% Z-confidence interval for the Mean, and StDev = 4.847)
_ X Ho
3
4
5
6
7
8
Aroma
117
Prueba de hipótesis para una proporción Ejemplo: Un producto tiene accesori accesorios os que se pi piensa ensa nadie usa, se hace un una a encuesta a 200 usuarios y 17 si usan los accesorios.
¿Para un 95% de confianza confianza se confirma la sospecha de q que ue men menos os del 1 10% 0% de usuarios usu arios usan estos acceso accesorios? rios? Establecer hipótesis: Ho: Proporción >= 0.10
Ha: Proporci Proporción ón < 0.10
Instrucciones de Minitab Stat > Basic Statistics > 1 - Proportion Options Confidence level 95% Test Proportion 0.1 Alter Altern nat ativ ive e Less Than nterval val based on normal normal distribution di stribution seleccionar Use Use test and iinter OK
118
Se obtuvieron los resultados siguientes:
Test and CI for One Proportion Test of p = 0.1 vs p < 0.1 Sample 1
Upper
Exact
X
N
Sample p
Bound
P-Value
17
200
0.085000
0.124771
0.285
No se rechaza Ho ya que la Proporción del 10% de la hipótesis se encuentra en el intervalo de confianza y el P value es mayor a 0.05, no se acepta la hipótesis alterna. Es válido decir que sólo el 10% de usuarios utilizan los accesorios
119
Comparación de dos medias - Muestras independientes Ho: Media A (m A)- Media B (mB) = 0 Ha: Media A (m A)- Media B (mB) 0 Ejemplo: 10 pieles pi eles son curt curtida idass usan usando do el método A y 10 usan usando do el método B B,, las resistencias a la tracción son las siguientes: Mét étodo odo A Mét étodo odo B 24.3 24.4 25.6 21.5 26.7 25.1 22.7 22.8 24.8 25.2 23.8 23.5 25.9 22.2 26.4 23.5 25.8 23.3 25.4 24.7
¿Se puede decir que los dos métodos producen resistencias a la tracción diferentes? Usar un nivel de confianza del 95%. En Minitab: Se colocan coloc an los vvalores alores en dos column columnas as di diferen ferentes tes C1 y C2 corresp. A Metodos A y B 120
P aso as o 1. S e real realiza iza un aná anállis is de compara comparación ción de varianzas varianzas poblacional oblacionales es : Ho: Vari Varianz anza a A = Varia Varianz nza aB Ha: Vari Varianz anza a A Vari Varianz anza aB
Vari ances Stat > Basic Statistics > 2 Varian ces Samples in different columns First Método A Second Método B Options Confidence level 95% OK
121
Los resultados son los siguientes: Test for Equal Variances: Método A, Método B 95% Bonferroni confidence intervals for standard deviations F-Test (normal distribution) Test statistic = 1.01, p-value = 0.991
Como el P value es mayor a 0.05 no se rechaza la Hipótesis nula de igualdad de varianz ari anzas, as, por po r tanto se asume que son iiguales. guales. Esta inf. se usará a continuaci continuación: ón:
122
P as o 2. S e realiza realiza un anál anális is de compa comparación ración de med medias ias poblac poblacion ional ales es Establecer hipótesis H: Media A - Media B = 0
Ha: Media A - Media B
0
Instrucciones de Minitab: Stat > Basic Statistics > 2 - Sample t Samples in i n different column columns s Fi rst Método A Second Método B seleccionar Assume Assume equal variances Options Confidence level 95% Test differen di fference ce 0.0 0.0 Altern Alternativ ative e Not equal OK OK
123
La gráfica de d e caja parece iindicar ndicar diferencia entre las las media medias s de las mu muestras estras Boxplot of Método A, Método B 27
26
25
at
a 24 D
23
22
21 Método A
Método B
124
Se obtienen llos os siguientes resul resultados: tados: Two-sample T for Método A vs Método B N Mean StDev SE Mean Método A 10 25.14 1.24 0.39 Método B
10
23.62
1.24
0.39
Difference = mu (Método A) - mu (Método B) Estimate for difference: 1.52000 95% CI for difference: (0.355, 2.685) T-Test of difference = 0 (vs not =): T-Value = 2.74 P-Value = 0.013
DF = 18
Conclusiones: Como el cero no se encuentra en el intervalo de confianza de la diferencia de las dos medias y el valor P value es menor a 0.05 se rechaza la hipótesis nula de igual i gualdad dad de medias y se acepta Ha afirmando afirmando que las medias son diferentes diferentes
125
Muestras pareadas - Prueba si las diferencias entre sujetos son iguales. Ho: Media de diferencias = 0
Ha: Media de diferencias
Se utilizan cuando cuando se trata de co comparar mparar el efecto de dos tratamientos a los mismos mi smos sujetos u objetos, por ejemplo el peso de individuos antes y después de una rutina. También se aplica aplic a cuando cuan cuando do antes de comparar se hacen parejas de sujetos por ejemplo para comparar los promedios promedi os de alumos de dos universidades universidades,, primero se forman parejas (dos ingenieros, dos administradores, dos do s arquitectos, etc.) Ejemplo: Se hacen dos tratamientos superficiales para pa ra lentes lentes A y B, se seleccio seleccionan nan 10 personas pe rsonas a las que se les instala un uno o de esos lentes en cual cualquier quier lado al a l azar. Después de un periodo se mide mi de el deterio deterioro ro (rayas, desgaste, etc.) de cada lente: lente:
A un un 95% de nivel de con confian fianz za ¿Se puede afirmar que los 2 tratamien tratamientos tos producen diferent diferente e de deterioro terioro en los lentes? Se colocan los datos en las columnas C1 y C2 para los Lentes A y B.
126
Persona 1 2 3 4 5 6
Lente A 6.7 5.0 3.6 6.2 5.9 4.0
Lente B 6.9 5.8 4.1 7.0 7.0 4.6
7 8 9 10
5.2 4.5 4.4 4.1
5.5 5.0 4.3 4.8
En Minitab colocar los datos de Lent Le ntes es en dos colu co lumn mnas as Establecer hipótesis Ho: Diferen Di ferencia cia de medias media s = 0
Ha: Diferencia Di ferencia de medias
0
Instrucciones de Minitab Stat > Basic Statistics > Paired t Samples in i n different column columns s Fi rst Lente A Second Lente B plo t Graphs Individual value plot Options Confidence level 95% Test mean 0.0 mean 0.0 Altern Alternativ ative e Not equal OK OK
127
Resultados Paired T-Test and CI: Lente A, Lente B Paired T for Lente A - Lente B N Mean StDev Lente A 10 4.96000 1.02978 Lente B 10 5.50000 1.13039 Difference 10 -0.540000 0.343835
SE Mean 0.32564 0.35746 0.108730
95% CI for mean difference: (-0.785964, -0.294036) T-Test of mean difference = 0 (vs not = 0): T-Value = -4.97 P-Value = 0.001
Como el cero no se encuent encuentra ra en el intervalo intervalo de confianza confianza de la diferen difere ncia de las do dos s medi medias as y el valor valor P value value es men menor or a 0.05 se rechaza rechaza la hipótesis hipótesi s nula nula de igualdad i gualdad de med media ias s y se acepta ace pta la alterna alterna afirmando afi rmando que los tratamient tratamientos os dan da n deterioros diferent di ferentes. es.
128
Individual Ind ividual Value Pl ot of Differ ences
(with Ho and 95% t-confidence interval for the mean)
_ X Ho
-1.2
-1.0
-0.8
-0.6
-0.4
-0.2
Differences
0.0
Como el valor de Ho no se encuentra en el intervalo de confianza de la diferencia de las dos medias, se rechaza Ho y se acepta Ha indicando que el deterioro es diferentes en los dos métodos.
129
Comparación de dos proporciones Ejemplo: En una encuesta encuesta a 300 clientes cli entes de la zona A, 33 estan descontentos En otra zona B se encuestaron a 250 clientes y 22 se mostraron desconten desc ontentos. tos. A un 95% de nivel nivel de confianz confianza a o 5% de nivel nivel de sigfinicancia, sigfinicancia, ¿Hay diferencia en las proporciones propo rciones de clientes descontentos en las las dos zon zonas? as? Establecer hipótesis: Ho: Proporción A = Proporción B
Ha: Proporción A Proporción B
Instru nstrucciones cciones de Minitab (datos resumidos): re sumidos): Stat > Basic Statistics > 2 - Proportion P roportions s Options Confidence level 95% Options 95% Altern Alternative ative Not equal, Test Difference = Difference = 0 Seleccionar Use Use Pooled estimate p for test
OK
130
Los resul resultados tados so son n los siguientes: Test and CI for Two Proportions Sample 1
X 33
N 300
Sample p 0.110000
2
22
250
0.088000
Difference = p (1) - p (2) Estimate for difference: 95% CI for difference:
0.022
(-0.0278678, 0.0718678)
Test for difference = 0 (vs not = 0):
Z = 0.86
P-Value = 0.392
Como el cero SI se encuentra en el intervalo de confianza de la diferencia de d e las 2 proporcio proporciones nes y el v valor alor P valu alue e es may mayor or a 0.05 no se rechaza rechaza la hipótesis nu nula la de iigualdad gualdad de prop proporciones orciones o sea que no h hay ay raz razón ón para deci decirr que las proporci proporciones ones son diferent diferentes. es.
131
Análisis de varianza (ANOVA) El Análisis de V Varianz arianza a es una pru prueba eba d de e hipótesi hipótesis s que trat trata a de p probar robar la igualdad de varias medias al mismo tiempo: H 0
1
2
3
....
k
H 1 : Al menos
dos s medias so do sonn diferentes
.
Requiere que las poblacio p oblaciones nes sean norm normales ales y con varianza varianza si similar. milar. ANOVA de una vía con datos de tratamientos en diferentes columnas: Ejemplo: Los técnicos de un una a fábrica fábri ca de papel hacen un ex experimento perimento de un factor para ver que varied variedad ad de árbol produce menos fen fenoles oles en los desechos de pa pasta sta de papel. Se colectan los siguientes datos en porcentajes: A un un 95% de nivel de con confian fianz za, ¿hay algu algun na v variedad ariedad que que produ produz zca m más ás ffenol enoles es qu que e ot otra? ra? Se colocan los datos en tres colum columnas nas distintas:
132
Instru nstrucci cciones ones de Minitab: Stat > ANOVA > One Way (Unstacked) Responses in separate columns A columns A B C Confidence Level 95 Tukey's, 's, family error rate: 5 rate: 5 Comparisons Tukey Graph Graphs: s: Residual plots Box plot of data Norm Normal al plot of residuals OK
133
Los resultados resultados se muestran a continuació continuación: n: One-way ANOVA: A, B, C
Como el valor P value value es menor a 0.05 existe una diferencia significativa signific ativa entre entre algunas algunas medias medi as
Source DF Factor 2 Error 12 Total 14 S = 0.2309 Level A B C
N 4 5 6
SS MS 0.9000 0.4500 0.6400 0.0533 1.5400 R-Sq = 58.44%
Mean 1.9000 1.3000 1.4000
StDev 0.1414 0.2121 0.2828
F 8.44
P 0.005
R-Sq(adj) = 51.52%
Individual 95% CIs For Mean Based on produce más fenoles fenoles que B,C Pooled St A produce ----+---------+---------+ ----+---------+---------+---------+-----------+-----(-------*--------) (-------*--------) (------*-------) (------*-------) (------*------) (------*------) ----+---------+---------+---------+----1.20 1.50 1.80 2.10
Las medias B y C son similares
Pooled StDev = 0.2309
D esviación estándar poblacional
La media de A es diferente a B y C
134
Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons Individual confidence level = 97.94% A subtracted from:
Como el cero ce ro no está en el intervalo interv alo de la di diferen ferencia cia B B-A -A o C-A, A es diferente de B y C
B
Lower -1.0130
Center -0.6000
Upper -0.1870
-----+---------+---------+---------+ -----+---------+---------+---------+------(---------*---------)
C
-0.8974
-0.5000
-0.1026
(---------*--------) (---------*--------) -----+---------+---------+---------+----0.80 -0.40 -0.00 0.40
B subtracted from: Lower Center C
-0.2728
0.1000
Upper
-----+---------+---------+-------------+---------+---------+---------+---+----
0.4728
(---------*--------) (---------*--------) -----+---------+---------+---------+----0.80 -0.40 -0.00 0.40
El intervalo intervalo de la d diferencia iferencia C-B C -B si incluye incluye el cero por tanto B no es diferen di ferentes tes de C
135
Los resultados gráficos son los siguientes: Boxplot of A, B, C 2.2
2.0
1.8 a t a D
1.6
1.4
1.2
1.0 A
B
C
Se observ ob serva a que la m medi edia a de A es diferen di ferente te a las medias de B y C (si se s e superpone superpo ne B y C tienen ti enen elementos elementos comunes comunes y son iguales) Los árboles á rboles B y C produ prod ucen menos menos cantidad de fenoles. 136
Los resultados gráficos son los siguientes: Normall Pr obab Norma obability ility Plot (responses are A, B, C) 99
95 90 80 70 t n 60 e c 50 r e 40 P 30 20 10 5
1
-0.50
-0.25
0.00 Residual
0.25
0.50
Los residuos o errores se apegan a la recta normal, por tanto el modelo ANOVA es un modelo adecuado para los datos 137
ANOVA de una vía ccon on datos d dee tratamientos en una sola columna Los datos del ejemplo anterior se arreglan en dos columnas column as como se mu muestran estran a continu continuaci ación: ón:
A
B
C
1.9
1.6
1.3
1.8 2.1 1.8
1.1 1.3 1.4 1.1
1.6 1.8 1.1 1.5 1.1
Fenoles
Árbol
1.9 1.8 2.1
A A A
1.8 1.6 1.1 1.3 1.4 1.1 1.3 1.6 1.8 1.1 1.5
A B B B B B C C C C C
1.1
C 138
Instru nstruccio cciones nes de Minitab: Stat > ANOVA > One Way Response Fenoles Factor Árb Factor Árbol ol Confidence Level 9 Level 95 5 Comparisons Tukey's, Comparisons Tukey's, family error rate: 5 rate: 5 Graphs: s: Residual Residual plots Box plot of data Norm Normal al plot of residuals Graph OK
Los resultados que se obtienen son iguales a los ejemplo anterior.
139
Ejercicios: Las calificaciones de un curso de liderazgo para 18 participantes de tres diferentes departamentos fueron las mostradas en la tabla siguiente. Probar a un 95% de nivel de confianza o 5% de nivel de significancia si el aprovechamiento fue similar en los tres departamentos o en su caso cuál fue el peor. DEPARTAMENTO
Arreglados en dos columnas quedan como:
De Dept pto_ o_A A
Dept pto_ o_B B
Dept pto_ o_C C
8 7
7 8
5 6
7 Dep Depto_ to_A A
8
7
6
8 Dep Depto_ to_A A
6
7
7
6 Dep Depto_ to_A A
7
6
7
7 Dep Depto_ to_A A
8
8
6
8 Dep Depto_ to_A A
Calificaciones Depto
8 Dep Depto_ to_A A
7 Dep Depto_ to_B B 8 Dep Depto_ to_B B 7 Dep Depto_ to_B B 7 Dep Depto_ to_B B 6 Dep Depto_ to_B B 8 Dep Depto_ to_B B 5 Dep Depto_ to_C C 6 Dep Depto_ to_C C 6 Dep Depto_ to_C C 7 Dep Depto_ to_C C 7 Dep Depto_ to_C C 6 Dep Depto_ to_C C
140
a) Con datos en tres columnas
Instru nstruccio cciones nes de Minitab: Mi nitab: Stat > ANOVA > One Way (Unstacked) Responses in separate sepa rate colu co lumn mnss Depto _ A Depto Depto_B _B Depto_ Depto_C C Confidence Level 95 Comparis ons Tukey's, Comparisons Tukey's, family error rate: 5 rate: 5 Graphs: Residual plots Box plot of data Normal plot of residuals OK Como el valor P de
es
que 0.05, se concluye concluye que
El peor aprovechamiento aprovechamiento lo tuvo tuvo el departamento De las gráficas de diferencias de Tukey, las medias de los procesos que son diferentes son (dado que el cero no se encuentra en el intervalo de confianza de la diferencia de medias – Pairwise comparisons): comparisons):
b) Otra opción con datos en una sola columna
Instru nstruccio cciones nes de Minitab: Mi nitab: A NOVA > One Way Stat > ANOVA Response Calificación Factor Depto Confidence Level Level 9 95 5 Comparisons ons Tukey's, Tukey's, family error rate: 5 rate: 5 Comparis
Graphs: Residual plots Box plot of data Normal plot of residuals OK Identificar la media que es diferente a las demás (donde el cero no pertenezca al intervalo 141
b) Otra opción con datos en una sola columna
Con Mini Minitab: tab: Stat > ANOVA One way Response Calificaciones Factor Depto Comparisons: Tukey’s, family error rate 5
Graphs: Box polot of data Graphs: OK ESTADÍSTICAS ESTADÍST ICAS > ANOVA AN OVA UN FACTOR RESPUESTA CALIF CALIF FACTOR DEPTO. COMPARACIONES: TUKEY, TASA DE ERROR DE LA FAMILIA 5 GRÁFICAS: DIAGRAMA DE CAJA DE DATOS OK Identifi carr la media que es diferente Identifica di ferente a las demás (donde el cero no ppertenezca ertenezca al al iintervalo ntervalo de confianza de la l a diferencia de medias entre cada dos tr trata atamientos mientos Depto).
142
Análisis de varianza varianz a de d dos os vías (ANOVA (ANOVA T wo way) Prueba la igualdad de medias medi as poblaci poblacional onales es cuan cuando do la clasifi clasificación cación de tratamientos es por variables o factores, las las celdas deben estar balan balanceadas ceadas con el mismo número de observaciones y los factores deben ser fijos. Para mostrar las medias en las celdas y sus desviaciones estándar utilizar la opción Cross Tabulati Tabulation on and Chi C hi Square. Si se desea que ciertos factores sean aleat aleatorios, orios, usar ANOVA balanceado o el Modelo lineal general general si desea comparar medias usan usando do co comparaciones mparaciones mú múltiples. ltiples.
Por ejemplo:
Se estu e studia dia el plancton plancton en dos lagos. lago s. Se preparan prep aran doce tanques en el laboratorio, seiss con agua de cada sei c ada uno de los lagos, lago s, se agre agrega ga uno de tres nutrientes nutrientes en cada tanque tanque y al mes se cuenta cuenta el plancton en cada unid unidad ad d de e volu volumen men de ag agua. ua. Se ut utiliza iliza el ANOVA de d dos os vías vías para pa ra este experiment experi mento. o. 143
Instrucciones nstrucciones de Minitab: Open pen worksheet worksheet > EXH_AOV.MTW. 1 File > O Zooplank to ton Supplement
34 43 57 40 85 68 67 53 41 24 42 52
2 3 4 5
1 1 1 1 2 2 2 2 3 3 3 3
Lak e
Rose Rose Dennison Dennison Rose Rose Dennison Dennison Rose Rose Dennison Dennison
Stat > ANOVA > Two-Way. En Response, seleccion selecci onar ar Zooplankton . En Row factor , seleccionar seleccionar Supplement . Seleccionar Seleccionar Display means. En Column factor , seleccion selecci onar ar Lake . Sel. Display means. Click OK. 144
Los resultados se muestr muestran an a continuación: Two-way ANOVA: Zooplankton versus Supplement, Lake Source Supplement
DF 2
SS 1918.50
MS 959.250
F 9.25
P 0.015
Lake
1
21.33
21.333
0.21
0.666
Interaction Error
2 6
561.17 622.00
280.583 103.667
2.71
0.145
11
3123.00
Total S = 10.18
R-Sq = 80.08%
R-Sq(adj) = 63.49%
Individual 95% CIs For Mean Based on
Pooled StDev
Supplement
Mean
1
43.50
2 3
68.25 39.75
--+---------+--+---------+---------+-------------+---------+---------+------(-------*----(-------*-------) --) (--------*----(--------*-------) --) (--------*---(--------*-------) ---) --+---------+---------+---------+-------
30
45
60
75
Interpretación: De la tabla de ANOVA se s e ve que no no hay una in i nteracción teracci ón signific significativa ativa entr entre e Supplement*Lake y tampoco Lake es significativo. 145
Individual 95% CIs For Mean Based on
Pooled StDev
Supplement
Mean
1
43.50
2 3
68.25 39.75
--+---------+---------+---------+-------+---------+---------+---------+------(-------*-------) (--------*-------)
(--------*-------)
--+---------+---------+---------+-------
30
45
60
75
Individual 95% CIs For Mean Based on
Pooled StDev
Lake
Mean
Dennison
51.8333
Rose
49.1667
-----+---------+---------+---------+-------+---------+---------+---------+---(----------------*----------------) (----------------*----------------) (----------------*----------------) (----------------*----------------) -----+---------+---------+---------+----
42.0
48.0
54.0
60.0
Hay evidencia significativa que Supplement afecta al crecimiento para un alfa de 0.05. De gráfica de medias pparece arece que Supplem Supplement ent 2 es mejor para crecimient crecimie ntoo del plancton plancton.. Para examinar comparaciones múltiples de medias, utilizar el modelo lineal general. 146
Análisis de medias Sirve para realizar un un análisis análisis de medias medi as (ANOM (A NOM)) para datos normales, binomiales o de Poisso P oissonn y opcional opci onalmen mente te imprime una tabla resumen para datos normales o binomiales.
Por ejemplo para datos normales: Se ev e valúa alúa el efecto de tres tiempos de d e nivel niveles es de proceso y tres niveles niveles de resistencia en la densidad. Se analizan las medias y un diseño de dos vías para identificar int i nteracciones eracciones o efectos principales si significativos. gnificativos.
147
Instrucciones nstrucciones de d e Minitab: worksh eet EXH_AOV.MT 1 File > Open worksheet E XH_AOV.MTW. W. D ensi ty
M i nutes
S trength
7 8 10 7 1 4 3 2 6 7 8
10 10 10 10 15 15 15 15 15 15 15
3 3 3 3 1 1 1 1 2 2 2
Etcétera…
3 En Response, seleccionar Density . 4 Seleccionar Normal. 5 En Factor 1, seleccionar Minutes . En Factor 2, seleccionar selecci onar Strength. Strength. Click Clic k OK. 148
Los resultados se muestran a continuación: Two-Way Normal ANOM for Density Alpha = 0.05
Interaction Intera ction Effect Effect s 2
t c e f f E
1.578 0
0
-2 Strength Minutes
-1.578 1 10
2
3
1 15
2
3
Main Ef fect s f o r Min ut es
n a e M 6
2
3
Main Effect s fo r S t ren gt h 7.145
7
1 18
6.222
8 n a 6 e M 4
7.145 6.222 5.300
5.300 2
5 10
15 Minutes
18
1
2 Strength
3
149
Interpretación: Se muestra la gráfica de interacción y de efectos principales para 2 factores. La gráfica ANOM tiene una línea central y límites de decisión, si un punto cae fuera de estos e stos límites límites es evidente qu que e es diferente de la gra gran nm medi edia. a. Si la interacción fu fuera era significati si gnificativ va, y ya a no se consideran los efectos principales por separado, dado que unos dependen de otros. En este caso no es significativo.
El punto que representa la media del nivel 3 del factor Minutes se muestra con un asterisco en rojo, indicando que hay evidencia al nivel de alfa = 0.05 de que que difiera difie ra significati significativ vamente amente de la la media general. general. En el caso de Strenght, hay evidencia de que los efectos principales para los niveles 1 y 3 se encuentren fuera de los límites de decisión y son diferentes de la media general. Los pun puntos tos que es están tán fuera fuera se pueden inv investi estigar. gar. 150
Ejemplos Ejempl os con datos binomiales
Se cuenta cuenta el número úmero d de e soldaduara soldaduara rechazadas en muestras muestras d de e tamaño 80 para identifi identificar car que proporci proporciones ones están fu fuera era de la línea línea con otras muestras. muestras. Como las muestras tienen 2 resultados, resultados, la proporci proporción ón de éxitos es constante constante y son independie independien ntes se usa el análisi análisiss de medias para datos bin bi nomiales. 1 File > Open worksheet EXH_AOV.MTW. eldRejects
3 6 8 14 6 1 8 1 8 10 1
151
2 3 4
Stat > ANOVA > Analysis Analysis o off Means Means.. En Response Response,, seleccionar WeldRejects . en Sample size size.. Click OK. Seleccionar Binomial y poner 80 en One-Way One-W ay Binomial Binomial ANOM ffor or WeldRejects Alpha = 0.05 0.20
0.1547
0.15
n o i t r o p o r P
0.10 0.075 0.05
0.00
0
1
2
3
4
5
6 Sample
7
8
9
10
11
152
Intrepretación: La gráfica g ráfica muestra la proporción proporció n de defectos para p ara cada cad a muestra, muestra, la lín línea central cent ral como la proporción proporci ón promedio, y los límites límites superior e in i nferior.
En este caso la muestra muestra 4 sale sa le de los límites límites de decisión deci sión y es anormal. anormal.
153
Ejemplo con datos de Poisson Una Un a fábri fábrica ca d de e jugu juguetes, etes, quiere monitorear el nú número mero de defectos de carros ca rros de jugu juguete. ete. Se toman 20 muestr muestras as de carros y se crea una una carta de medias para examinar el n núm úmero ero de defectos en cada mu muestra. estra. 1 File > Open work worksheet sheet TOY TOYS.MTW. S.MTW. Defects
Defects
9 11 2 5 15 13 8 7 5 2
4 4 2 5 5 2 3 2 1 6 154
2 3 4
Stat > ANOVA > Analysis of Means. En Response, seleccion selecci onar ar Defects Seleccionar Poisson . Click OK. One-Way Poisson ANOM for Defects Alpha = 0.05
16
12.49
12 s t c e f e D
8 5.55 4
0
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 Sample
155
Interpretación: La gráfic g ráficaa muestra el número número de defectos defectos en cada cada muestra, la línea línea central es el promedio promedi o de defectos, y los límites límites de deci d ecisión sión superior e in i nferior.
En este caso, el número número de ddefectos efectos de los carros cinco y seis son anormales ya que caen fuera de los límites de decisión.
156
ANOVA Balancea Ba lanceado do Se usa pa para ra realizar anál análisi isiss univariado univariado de varianza varianza pa para ra cada una de las variables ddee resp respuuesta. El diseño debe ser balanceado, con las mismas observaciones por celda. Los factores pueden ser cruz cruzado adoss o anidados, anidad os, fijos o aleatorios. aleatorio s. Se pueden incluirir hasta 50 variables inclu aria bles de respuesta con hasta 31 factores simultan simultaneos. eos. Los factores son so n predi predictores ctores (independie (independienntes) que se seleccionan a que que varien sistemáticamente durante un experimento para determinar su efecto en llaa variable ddee resp respuuesta (variable de dependiente). pendiente).
157
Por ejemplo, ejemplo, si si se quiere evaluar el acabado superficial de partes metálicas producidas por varias máquinas y se miden por varios operadores. Tanto Tan to "Máquin "Máq uina" a" como ""Operador" Operador" son factores en este experimento. Los factores pueden ser cruzados o anidados, dependiendo de cómo se colecten los datos. Factores cruzados:
Do s factores son Dos s on cru cruzzado adoss cuando cada nivel nivel de un factor ocurr ocurree en combinación con cada nivel del otro factor. Por ejemplo, los m mismos ismos tres operadores operado res evalúan evalúan el acabado superficial superficia l de las 2 máquinas.
158
Modelo:
En la caja de Model solo se especifican las X's no la Y. La opción Make Patterned data, single set of numbers puede ay a yudar a cargar carga r los números números de d e niveles de un factor.
L as as r e las para expresar modelos son: 1 * indica indi ca un un término de interacc interacció ión, n, por ej ejemplo emplo A*B. A*B .
Por ejemplo: Dos factores cru cruz zados: A B A*B
159
Por ejemplo para un diseño cruzado de tres vías con niveles a, b y c de factores A, B, C, con n observaciones por celda, se tiene: F3 (Reset (Reset def.). 1 Calc>Make Patterned Data > Simple set of numbers, F3 i n. Poner 1 en From first value, value, Poner Poner A en Store patterned patterned data in niveles de A en To last value. Poner el producto bcn e en n List the whole sequence sequence.. Clik OK 2 Calc>Make Patterned Data > Simple set of numbers, F3 F3 (Reset (Reset defaul defaults). ts). Poner Poner B en Store patterned patterned data in i n. Poner 1 en From first value, value, niveles de B en To last value.
Niveles de A en List each value. value. Poner cn e en n List the whole sequence. sequence. Click OK 3 Calc>Make Patterned Data > Simple set of numbers, F3 F3 (Reset (Reset defaul defaults). ts). in.. Poner 1 en From first value, value, Poner C en Store patterned patterned data in niveles de C en To last value. value.. Poner el tamaño de muestra n Producto ab en List each value en List th the e whole sequence. sequence. Clik Clik OK 160
Ejemplo de ANOVA con dos factores cruz Ejemplo cruzados ados Se quiere probar probar cuanto toma usar un unaa ca calcu lculadora ladora nu nueva eva y uuna na antigua. Seis ingenieros Seis ingenie ros trabajan en ambos un prob problema lema estadíst estadístic icoo y un unoo de ingeniería usando cada modelo de calculadora y se toma el tiempo en minutos que toma resolver el problema. Los in i ngenieros se consideran como bloques del di diseño seño experimental experimental.. Hay dos factores: Tipo de pproblema roblema y Modelo de calcual calcualadora, adora, cada uno con dos niuveles. Como cada nivel del factor ocurre en combinación con cada nivel del otro factor, los factores son cruzados.
161
1 File > Open worksheet EXH_AOV.MTW. SolveT Solv eTime ime Engine Engineer er Pr Prob obTy Type pe Calcula Calculattor Engine Engineer er Pr Prob obTy Type pe Calcula Calculattor 3.1 Jones Stat New Dixon Stat New 7.5 Jones Stat Old Dixon Stat Old 2.5 Jones Eng New Dixon Eng New 5.1 Jones Eng Old Dixon Eng Old 3.8 Williams Stat New Erickson Stat New 8.1 Williams Stat Old Erickson Stat Old
2.8 5.3 3 7.6 2 4.9
Williams Williams Adams Adams Adams Adams
Eng Eng Stat Stat Eng Eng
New Old New Old New Old
Erickson Erickson Maynes Maynes Maynes Maynes
Eng Eng Stat Stat Eng Eng
New Old New Old New Old
162
2 3
Stat > ANOVA > Balanced ANOVA. ANOVA. seleccio nar SolveTime . En Responses, Responses , seleccion
4 5 6
En Model, Model, seleccion seleccio nar Engineer ProbType | Calculator . Calculator . Factors s, seleccion seleccio nar Engineer Engineer .. En Random Factor Click Results Results.. En Display means correspon corresponding ding to the terms poner ProbType Calculator . Click OK en cada cuadro de diálogo.
7
163
Los resultados se muestran a continuación: ANOVA: SolveTime vs Engineer, ProbType, Calculator Factor Type Levels Values Engineer random 6 Adams, Dixon, Erickson, Jones, Maynes, Williams
ProbType Calculator
fixed fixed
2 2
Eng, Stat New, Old
Analysis of Variance for SolveTime Source DF SS MS F Engineer 5 1.053 0.211 3.13 ProbType 1 16.667 16.667 247.52 Calculator 1 72.107 72.107 1070.89 ProbType*Calculator 1 3.682 3.682 54.68 Error 15 1.010 0.067 Total 23 94.518 S = 0.259487 R-Sq = 98.93% R-Sq(adj) = 98.36%
P 0.039 0.000 0.000 0.000
164
Means ProbType Eng Stat
N 12 12
Calculator New Old
SolveTime 3.8250 5.4917
N 12 12
SolveTime 2.9250 6.3917
ProbType Eng Eng Stat
Calculator New Old New
N
SolveTime 6 2.4833 6 5.1667 6 3.3667
Stat
Old
6
7.6167 165
Interpretación:
Se muestran muestran los los factores con c on su tipo (fijos o aleatorios), aleatori os), número de niveles y valores. Después se muestra la tabla de ANOVA, A NOVA, indicando indic ando uunna in i nteracción teracció n significativ significati va entr entree tipo de problema p roblema y calcul calculadora. adora. También ambi én se muestran muestran las las medias medi as de d e todos los factores y sus sus combinaciones como efectos principales. Donnde se pu Do puede ede observ obse rvar ar que el tiempo tiempo se reduce al cambiar de la calculadora antigua a la nueva.
166
Contenido Parte B: 7. Tamaño de muestra y potencia 8. Análisis exploratorio exploratori o de datos 9. Estadística Estadística no paramétrica 10. Tablas y pruebas no paramétricas 11. Regresión lineal y cuadrática 12. Regresión múltiple 168
7. Tamaño Tamaño de mu muestra estra y potencia
169
Tamaño de muestra y potencia
• Introducción • Prueba de una y dos medias • Prueba de una y dos proporciones ANOV VA de una vía • Prueba de ANO
• Diseño de experimentos de dos niveles
170
T amaño de muestra y potencia potencia Potencia: Es la capaci Potencia: Es ca pacidad dad d de e un una a prueba para d detectar etectar u una na diferen diferencia cia c cuan uando do cuando realmente existe. Hipótesis Hipótes is N ula D es ic ici ó n
V er dader a
No rechaz rec haza a D es es i c i ó n c o rre c ta p=1-a Rechazar E rro r ti p o I p=a
F als a
E rrrro r ti p o II p=b D e s i c i ó n c o rre c ta p=1- b Potencia
La poten po tencia cia d de e la pru prueba eba e es s la probabilida probabilidad d de de rechaz rec hazar ar correctament correctamente e la hipótesis nula nula siendo si endo que en realidad es falsa. El análisis de potencia puede a ayu yudar dar a c cont ontestar estar pregun preguntas tas como: * ¿C uán uántas tas muestras muestras se deben ttomar omar para el an análisis? álisis? * ¿E s suficient suficiente ee ell tamaño tamaño d de e muestra? * ¿Qué tan grande grande e es s la di diferen ferencia cia que la prueba puede detectar? * ¿S on realmen realmente te val valioso iosos s los result resultados ados de la pru prueba? eba? 171
Para estimar la potencia, Minitab requiere de dos de los siguientes parámetros: * Tamaños de muestra muestra * Diferencias - un corrimiento significativo de la media que se desea detectar * Valores de potencia potencia - La probabilidad deseada de rechazar rechazar Ho cuando cuando es fals
Caso 1. Prueba t de una media poblacional
Ejemplo: Se tiene una una poblaci población ón normal normal con media media de 365 y llíímites de especificaci especi ficación ón de 360 y 370. Si la media medi a se desplaz de splazaa 2.5 gramos por arriba de la media, media , el núm número ero de defectos sería sería in i naceptable, la desviaci desviación ón están estándar dar histórica es de 2.403:
172
Caso 1. Prueba t de una media poblaci poblacional onal Ejemplo: Se tiene una una poblaci población ón n normal ormal con m media edia de 365 y lí límites mites de especi especificaci ficación ón de 360 y 370. Si la media se desplaz d esplaza a 2.5 gramos por arriba de la media, el nú número mero de defectos sería sería in i naceptable, la desviación estándar histórica histórica es de 2.403: Si ze > 1 - Sample t Stat > Power and Sample Size Completar el diálogo como sigue: si gue:
173
Los resultados se muestran a continuación:
Power and Sample Size 1-Sample t Test Testing mean = null (versus not = null) Calculating power for mean = null + difference Alpha = 0.05
Assumed standard deviation = 2.403
Se tiene un 53.76% de Potencia para detectar una un a diferencia di ferencia de 2.5 2 .5 si se usan 6 muestras muestras O sea que hay una una probabilid probab ilidad ad del 46.24% que no se rechaze Ho y se concluya que no hay diferencia significa s ignificativa. tiva.
Sample
Difference 2.5
Size 6
Power 0.537662
CORRIDA DE 2.5 GRS. EN PROMEDIO
0.18 0.16
Ha: Corrida 367.5
Ho: LIE 360
Meta 365
Variable
LIE 370
Original Corrida
1.0
0.14 0.12 a t a D Y
0.8
0.10 0.6
0.08 0.06 0.04
r e w o P
0.4
Power Curve for 1-Sample Z Test Sample Size 2 4 6 8 10 12 A ssumptions A lpha 0.05 S tD ev 2. 403 A lternative Not =
0.2
0.02 0.00 355
360
365
370
0.0
375
-3
-2
C1
-1
0 Difference
1
2
3
174
¿Cuántas muestras se requieren para tener un ¿Cuántas un 80% de probabi p robabilidad lidad de d e detectar el corrimiento, y para 85%, 90% y 95%? Stat > Power and Sample Size > 1 - Sample t
Se cambia este parámetro
Los resultados se muestran a continuación: Difference 2.5 2.5 2.5 2.5
Sample Size 10 11 12 15
Target Power 0.80 0.85 0.90 0.95
Actual Power 0.832695 0.873928 0.905836 0.962487
Si la potencia es demasiado alta por decir 99% se pueden detectar diferencias que realmente no son significativas. 175
Caso 2. Prueba t de comparación de dos medias poblacionales Ejemplo: La potencia potencia de un una a prueba depende de la di diferen ferencia cia qu que e se quiera detectar respecto a la desviación estándar estándar,, para un una a si sigma gma poner 1 en diferencia y desv desviaci iación ón estándar, con valores deseados de Potencia de 0.8 y 0.9. Stat > Power and Sample Si Siz ze > 2 - Sample t Power and Sample
2-Sample t Test
Testing mean 1 = mean 2 (versus not =) Calculating power for mean 1 = mean 2 + difference Alpha = 0.05
Assumed standard deviation = 1
Difference
Sample
Target
Size
Power
Actual Power
1
17
0.8
0.807037
1
23
0.9
0.912498
Se requieren tamaños de muestra de entre 17 y 23 176
Caso 3. Prueba de 1 proporción Para estimar la poten po tencia, cia, Minitab requiere de dos de los siguientes siguientes parámetros: * Tamaños de muestra * La proporción p roporción - una una proporción que que se desea detectar d etectar con alta alta probabilida probabilidad d * Valores de potencia potencia - Probabilidad Probabi lidad deseada dese ada de rechazar rechazar H Ho o cuan cuando do es falsa Suponiendo que se desea detectar una proporción de 0.04 con el 0.8 y 0.9 de niveles de Potencia:
Proporción que se desea detectar con alta probabilidad (0.80, 0.90) Es la proporción de la Hipótesis nula Test for One Proportion Testing proportion = 0.02 (versus > 0.02) Alpha = 0.05 Alternative Sample Target Proportion Size Power Actual Power 0.04 391 0.8 0.800388 0.04 580 0.9 0.900226 177
Caso 3. Prueba de 1 proporción Para estimar la poten potencia, cia, Minitab requiere de dos de los si siguien guientes tes parámetros: * Tamaños de muestra * La proporción - u una na proporción qu que e se desea detectar con al alta ta probabilidad probabi lidad * Valores de poten potencia cia - P robabilidad desead deseada a de rechaz rechazar ar Ho cuan cuando do es e s falsa Suponiendo que q ue se desea dese a de detectar tectar una una proporci proporción ón de 0.04 con co n el 0.8 y 0.9 de nivel iveles es de Potencia:
Proporción que se desea detectar con alta alta probabilidad (0. (0.80, 80, 0.90) Es la proporció prop orción n de lla a Hipótesis Hipó tesis nula nula
178
Los resultados se muestran a continuación: Test for One Proportion Testing proportion = 0.02 (versus > 0.02) Alpha = 0.05 Alternative
Sample
Target
Proportion
Size
Power
Actual Power
0.04
391
0.8
0.800388
0.04
580
0.9
0.900226
179
La Poten Po tencia cia de pru p rueba eba si se util tiliz iza a un tamaño tamaño de d e muestra muestra de 500: Samp le Siz Stat > Power and Sampl S ize e > 2 - Proportions Proportions Sample Sa mple sizes sizes = 500 Alternative A lternative values of o f p 0.04 Hypothetized p: 0.02 p: 0.02 Options: Greater Than
Po 1.0
0.8
Significance Level = 0.05 r e
Los Lo s resultados resultados se muestr m uestran an a cont co ntinu inuaci ación: ón: Test for One Proportion Testing proportion = 0.02 (versus > 0.02)
w o P
0.6
0.4
0.2
Alpha = 0.05 Alternative
Sample
Proportion
Size
Power
500
0.865861
0.04
0.0 0.0
0.2
Po r ttant Por anto o con co n un tamaño de muestra de 5 500, 00, la potencia d de e la prueb prueba a para detect de tectar ar un un corrimient corrimiento o de 2% a 4% es e s del 86.6% 180
Caso 4. Prueba de 2 proporci proporciones ones Para estimar estimar la poten potencia, cia, Mi Min nitab requiere de dos de los si sigu guientes ientes parámet parámetros: ros: * Tamaños de mu muestra estra * La proporción proporci ón 1 - un una a proporci proporción ón qu que e se desea detectar con alta probabili probabilidad dad * Valores de poten potencia cia - Probabilidad Probabi lidad d deseada eseada de rech rechaz azar ar Ho cuan cuando do es falsa o una proporción 2 - contra la que se prueba la igualdad de prop. Ejemplo: Suponiendo que se desea detectar una proporción de 0.04 con el 0.8 y 0.9 de niveles de Potencia:
OPTIONS
Proporción que se desea detectar con alta alta probabili probabilidad dad (0.80, 0.90)
GRAPHS 181
Power and Sample Size Test for Two Proportions
Testing proportion 1 = proportion 2 (versus not =) Calculating power for proportion 2 = 0.05 Alpha = 0.05 Proportion 1 0.04 0.04
Sample Size 6745 9030
Target Power 0.8 0.9
Actual Power 0.800005 0.900030
The sample size is for each group.
182
Ejemplo: En política política se desea d esea saber si s i hay diferencia diferencia entre entre las proporciones de hombres y mujeres mujeres qu q ue apoyen a poyen una una reforma fiscal. fis cal. Encuestas anterio ant eriores res muestran que que el 30% 30 % (p=0.3) de los votantes votantes apoyan ap oyan la reforma. Se encuestan a 1000 personas de cada género, ¿cuál es la potencia para detectar detectar un una diferencia di ferencia ent e ntre re hombres y mujeres mujeres que soporten sopo rten la reforma en 5% o más? más? Stat > Power an and d Sample S ample Size > 2 - Proportion P roportions s Sample siz si zes, 1000 Proportio n 1 valu values es 0.25 0.35 Prop ortion Proportion 2, ingresar 0.30 OK
183
Los resultado resultados s se se muestran a cont continu inuaci ación: ón: Power and Sample Size Test for Two Proportions Testing proportion 1=proportion 1=proportion 2 (vs not =) Calculating power for proportion 2 = 0.3
Alpha = 0.05
Sample
Proportion 1
Size
Power
0.25
1000
0.707060
0.35
1000
0.665570
184
Power Curve for Test for Two Proportions 1.0
Sample Size 1000
0.8
r e w o P
A ssumptions A lpha 0.05 Propo Proporrtio tio n 2 0.3 0.3 A lternativ e Not =
0.6
0.4
0.2
0.0 0.0
0.2
0.4 0.6 Proportion 1
0.8
1.0
185
Caso 5. ANOVA ANOVA de una vía Sirve para determinar el tamaño de muestra necesario para detectar diferencia máxima máx ima en medias media s de niveles niveles de un factor, factor, con base en tamaño tamaño de muestra muestra y potencia potencia de la pru p rueba eba deseada. d eseada. Ejemplo: Se trata de determinar si o no 4 trat tratamie amient ntos os afectan el rendi rendimiento miento de un producto, para lo cual se utilizan utilizan 5 observaciones ob servaciones por po r tratamie tratamient nto. o. Se sabe s abe que la media del grupo de cont c ontrol rol es de 8 y se trata de e encon ncontrar trar diferencia significativa de +4. De investigaciones previas se determino una desviación estándar de 1.64.
186
Instrucciones de and Minitab: Sample 1. 1. Stat > Power S ample Size > One way ANOVA 2. Number Numbe r of levels levels, 4 3. Sample sizes, sizes, 5 4. En Values of the maximum diff difference erence between betw een means, means , 4 deviati viation on,, 1.64 5. En Estándar de OK Los resu res ultados son los sig siguient uientes: es: Power and Sample Size One-way ANOVA Alpha = 0.05 SS
Sample
Means
Assumed std. Dev. = 1.64
8
No. Levels = 4
Maximum
Size
Power
Difference
5
0.826860
4
The sample size is for each level.
187
Power Curve for One-w O ne-way ay ANOVA 1.0
Sample Size 5
0.8
A ssumptions A lpha 0.05 S tD ev 1.64 # Lev els 4
0.6 r e w o P
0.4
0.2
0.0 0
1
2
3 4 5 Maximum Di Maximum Diffe ffere rence nce
6
7
8
Interpretación: Si se asi asignan gnan 5 obse observ rvaci aciones ones para cada tratamien tratamiento, to, se tiene u una na poten potencia cia del 83% de detectar d etectar u un na di diferen ferencia cia de 4 un unida idades des o más ent entre re las medias media s de los tratam tratamientos. ientos. Tam Tambié bién n se mu muestra estra la curv curva a OC de la potencia. 188
Caso 6. 6 . Diseños de experimentos de dos niveles Si rve Sirv e para de determin terminar ar el n nú úmero de réplic réplicas as necesario para detectar de tectar el efecto especí es pecífico fico en el n nivel ivel de potencia espec especííficado ficado,, con base e en n el número nú mero de pun puntos tos centrales y efec efecto to mínimo mínimo.. Ejemplo: Se quiere determinar el "mejor" aju ajuste ste de 4 variab ariables les de entrada (factores) para mejorar la trasnparencia trasnparencia de un una a pa parte rte plástica. S Se e ha determinado qu q ue el diseño dis eño adecuado es un ffactoria actoriall fr fracci accional onal (1/2) con 8 corridas experim. y 3 puntos puntos central centrales. es. S Se e iin nten tenta ta detec detectar tar efectos de magnitu magnitud d 5 o más. más . Experimentación previa previa sugiere que la desviación desviaci ón estándar estándar es de 4 4.5. .5.
189
Instruccio nstrucciones nes de Minitab: Mi nitab: Factorial Design Design 1. 1. Stat > Power and Sample Size > 2 level Factorial 2. Number o f factors factors, 4 3. Number of corner p points oints,, 8 4. En Replicates, Replicates , 1 2 3 4 Effects,, 5 5. En Effects 6. En Number of center points per block, block , 3 deviation on,, 4.5 7. 7. En Standard deviati OK Los resultados se muestran a continuación: Power and Sample Size 2-Level Factorial Design Alpha = 0.05 Assumed standard deviation = 4.5 Factors: 4 Base Design: 4, 8 Blocks: none Including a term for center points in model. Center Points 3 3 3 3
Effect 5 5 5 5
Reps 1 2 3 4
Total Runs 11 19 27 35
Power 0.157738 0.518929 0.730495 0.856508 190
Power Curve for 2-Level Factorial Design 1.0
Reps, Ctr Pts Per Blk 1, 3 2, 3 3, 3 4, 3
0.8
r e w o P
A ssumptions A lpha 0.05 S tD ev 4.5 # F actors 4 # C orner P ts 8 # B lock s none # T erm s O m miitte d 0
0.6
0.4
Term Included In Model C en enter P oints
0.2
0.0 -5.0
-2.5
Interpretación:
0.0 Effect
2.5
5.0
Y es
Si hay un una réplica de dell diseño, solo se tien tiene e el 16% de posi posibili bilidad dad de d detectar etectar diferencias de 5. Con C on 4 réplicas réplicas del d el diseño (1/2) ffraccional raccional para 35 corridas (32 puntos puntos vér vértice tice y 3 pun puntos tos centr centrales) ales) se tiene el 86% de posibi po sibilidad lidad de encontrar efectos importantes. La curva curva muestra las combinacio combinaciones nes de pa parámetros rámetros y la la po poten tencia cia de la pru prueba. eba. 191
8. Análisis exploratorio de datos (EDA)
192
Análisis exploratorio de datos (EDA)
• Introducción • Prueba de una muestra por Poisson • Prueba de dos muestras por Poisson Poisson • Análisis de medianas de dos vías
• Regresión resistente • Suav Suavizam izamient iento o resi resiste stente nte • Prueba de normalidad con gráfica de desviaciones
193
Introducción (EDA) A) se utilizan • Los métodos de análisis de datos exploratorio (ED para explorar los datos antes de utilizar otros métodos más tradicionales, o para examinar los residuales de un modelo.
• Permiten identificar observaciones anormales (Outliers) y violaciones a los supuestos tradicionales tales como no linealidad o varianza no constante.
194
Prueba de una muestra por Poisson Calcula el intervalo de confianza de la tasa de ocurrencia y el número medio de ocurencias de eventos en una muestra en un proceso de Poisson, y prueba la hipótesis de que la tasa de ocu o curren rrencias cias es iigual gual a un un vvalor alor especi especificado. ficado.
Un proceso de Poisson describe el número de ocurrencias de un evento en un cierto periodoo de tiempo como área, vvolu period olumen men,, etc. Por ejemplo: El nú número de llam llamadas adas telef telefónicas ónicas diari diarias as a uunn cent centro ro de serv servici icioo a cl clientes ientes El núm número ero de defectos defecto s en un tramo de alambre
195
Por ejem ejemplo: plo: La A de cada receptores de durante TV cuenta número unidades con pantallas defectivas queempresa se producen trimestre loselúltimos 10de años. Los directiv di rectivos os establecen que que 20 defectivos por cu cuatrimestre atrimestre es el máximo máximo aceptable, y quieren determinar si la producción actual cumple este requerimiento. 1 2 3 4
File > Open Open the worksheet TVDEFECT.MTW. Stat > Basic Statistics > 1-Sample Poisson Rate . En Samples in columns, Seleccionar 'Defective A '. Seleccionar Perform hypothesis test. En Hypothesized rate, poner 20 .
selecci onar less than. 5 Click Options. En Alternative, seleccionar 6 Click OK en cada cuadro de diálogo
196
Defec efecttive ive A Def Defect ectiv ive e B 18
20
18
35
21
19
14
30
Resultados:
19
26
14
22
Et c .
Et c .
Test and CI for One-Sample Poisson Rate: Defective A Test of rate = 20 vs rate < 20
Total
Variable Defective A
Rate of
95% Upper
Exact
Occurrences
N
Occurrence
Bound
P-Value
713
40
17.8250
18.9628
0.001
Length of observation = 1.
Como P valu value e es men menor or a 0.05, se rechaza Ho y se acepta Ha donde la tasa de defectos es men menor or a 20 197
Prueba de dos muestras por Poisson Se puede probar si la empresa A tiene un una tasa mayor de defectos q qu ue la empresa B. La empresa A mide cada cad a tres meses su sus s defectos y la empresa B cada seis se is meses. Se trata de probar cual empresa empresa ti tiene ene la menor menor tasa de d e defectos de fectos mensual mensual.. 1 Fi File le > Open th the e worksheet TVDEFECT.MTW. 2 Stat > Basic Statistics > 2-Sample Poisson Rate. Rate . 3 Samples in different columns, columns, Seleccionar Selecci onar 'Defective A '. 4 First 'Defective A' 'Defective B'ength" 5 Second Second Options. . En "L "Leng th" of obs. o bs. [time, [time, items, items, area, vol. etc], etc], ner '3 6 Click Options 7 Confidence level 95.0 Test difference 0 Alternative Not equal 8 Seleccionar Use pooled estimate of rate to test a zero difference 9 Click OK en cada cuadro de diálogo OK en
6 '
198
Los resul resultados tados s se e muestran a contin continuación: uación: Test and CI for Two-Sample Poisson Rates: Defective A, Defective B
Total Variable
"Length" of
Rate of
Mean
Occurrences
N
Observation
Occurrence
Occurrence
Defective A
713
40
3
5.94167
17.825
Defective B
515
20
6
4.29167
25.750
Difference = rate(Defective A) - rate(Defective B) Estimate for difference: 1.65 95% CI for difference: (1.07764, 2.22236) Test for difference = 0 (vs not = 0): Z = 5.50 P-Value = 0.000 Exact Test: P-Value = 0.000
Co mo el v Como valor alor P val value ue es menor a 0.05 se ace acepta pta la h hipó ipótesis tesis a alt lterna erna que qu e AyB s son on di differen erentt donde B tiene lla a meno tasa de ocur ocurren rencia cia Difference = mu (Defective A) - mu (Defective B) Estimate for difference: -7.925 95% CI for difference: (-10.5053, -5.34474) Test for difference = 0 (vs not = 0): Z = -6.40 P-Value = 0.000 Exact Test: P-Value = 0.000 199
Prueba de bondad de ajust ajuste e (Chi cuadrada) Permite comparar compa rar los valores valores observados de la distribución con los valores valores esperados espe rados de la misma di distribución stribución y prueba la hipótesis ipó tesis nul ula a de que los valores valores soi soin n similares: * Prueba que ttan an bien ajust ajusta a una una di distribución stribución tteórica eórica a un conjunto de datos * Prueba si un modelo estadí estadístico stico ajusta a a llos os datos. Por ejemplo la regresión regresió n Logistics Logisti cs usa una una prueba de bondad de aju ajuste ste con Chi cuadrada para probar si modela de manera adecuada los datos NOTA: Si las frecuencias NOTA: frecuencias esperadas esperada s en alguna alguna celda c elda so son n menores menores a 5, los resultados pueden no ser válidos.
200
Por ejempl ejemplo: o: Ho: Los datos d atos si siguen guen u una na distrib distribución ución Mu Multinomial ltinomial Ha: Los datos no siguen lla a di distribución stribución Mul Multinomial tinomial La filiación política de ciera ciudad es: Republicanos 52%, Demócratas 40% e independientes independientes 8%. Se quiere probar si esta filiación política es similar a la de otra población. Para lo cual u utilizan tilizan u una na mu muestra estra de 200 p personas ersonas (datos en POLL.M Polit Po litic ica al PartCou PartCount ntss
Pr Prop opor orti tion onss
Re publ i can
121
0.52
De mocrati c
75
0.4
4
0.08
Othe rs
Instr nstrucciones ucciones d de e Minitab: 1 File > Open Worksheet > POLL.MTW. Square are Goodness of o f Fit (1 (1 var.) 2 Sel. Stat > Tables > Chi Squ 3 En Observed counts counts,, poner Counts . 4 En Category names names,, poner Political Party 5 Seleccionar Specific proportions proportions,, poner Proportions cuadro de diálogo Click OK en cada cuadro 201
Los resultados se muestran a continuación: Chi-Square Goodness-of-Fit Goodness-of-Fit Test for Obs. Counts in Counts Using category names in Political Party
Test
Category
Contribution
Observed
Proportion
Expected
to Chi-Sq
Republican
121
0.52
104
2.77885
Democratic
75
0.40
80
0.31250
4
0.08
16
9.00000
Others N
DF
Chi-Sq
200
2
12.0913
P-Value 0.002
Interpretación: Como el valor P de la prueba es menor a un alfa de 0.05, se rechaza la hipótesis nula y se concluye que la filiación política no es la misma en las las ciudades co comparadas mparadas 202
Chart of Observed and Expected Values Expected Observed
120
100
80 e u l a V
60
40
Chart of Contribution to the Chi-Square Value by Category 20
0 Category
9 8 Republican
Democratic
Others
7 e u l a 6 V d e 5 t u b i r 4 t n o C 3
2 1 0 Others
Republican Category
Democratic
203
Análisis nálisis de medianas med ianas de d dos os vías Es similar al análisis de varianza de dos vías (ANOVA two way), pero no e es s más robusta en cuanto cuanto a puntos puntos aberrantes a berrantes (Outliers) (Outliers) Ejemplo: Se trata de probar tres tipos tip os de remaches, remaches, en los los que se aplicó aplic ó la fuerza fu erza por el frente frente y por detrás, y se mide mid e el impacto, i mpacto, para pa ra determinar si hay diferencias en los tres tipos de remaches.
204
Inst nstrucciones rucciones de d e Minitab: Mi nitab: Paso: Realizar el análisi análisis s de medianas Open pen worksheet w orksheet > EXH_STAT.MTW. 1 File > O 2 Seleccionar Stat > EDA > Median Polish. 3 En Response, poner Impact . factor or , HelmetType . En Column factor , poner Location 4 En Row fact 5 En Common effect, poner CommonEffect . En Row eff effects ects, poner RowEffect. En E n Column eff effects, ects, po poner ner ColumnEffect. ColumnEffect. 6 Check Residuals. Click OK. Paso 2. Mostrar los resultados 1 Seleccionar Data > Display Data. 2 En Columns, cons constants, tants, and matrices matrices to display d isplay, poner Com Comm m onEffect, onE ffect, RowEffect, RowEffect, y ColumnEffect. OK. K. Click O
205
Los resultados resultados se mu muestran estran a co con ntinu tinuaci ación: ón:
CommonEffect Row RowEffect
44.5000 ColumEffect
1
0
-1
2 3
23 -3
1
Interpretación: El efecto general general de impacto i mpacto es 44.5.
Los efectos de fila son 0, 23 y -3 respecto al valor común que correspon correspo nden al remach remache e 1, 2 y 3 respec respectivamen tivamente. te. Se observa o bserva que el remache 2 titiene ene u un n mayor mayor impac impacto. to.
Los efectos de colum column na d de e -1 y 1 iin ndi dican can que hu hubo un una a pequeña reducción de impacto ligera respecto al valor común en el frente y un poco mayor para la parte de atrás 206
Con Co n los los residuos resi duos se pu p ueden ident id entifcar ifcar Outliers. Outliers. 1
Seleccionar Data > Display Data.
2 En Columns, constants, and matr matrices ices to display, poner RESI1. Click OK. OK. RESI1 3.5 -0.5 3.5
0.5 -5.5 -4.5
1.5 -1.5
2.5
0.5 -1.5 -0.5
Celda 1,1
207
Regresión resistente Es similar s imilar al análisi análisis s de regresió reg resión n lineal lineal excepto excepto que es más robu rob usta ante puntos aberrantes (Outliers). Se sugiere utilizarla al principio para observar si hay relación lineal. Stat > EDA > Resistant line Resistan t line
208
Suavizamiento resistente Suaviza una serie ordenada de datos colectados durante el tiempo para remover fluctuaciones aleatorias y descubrir tanto las tendencias como los puntos aberrantes (Outliers). Ofrece Ofr ece varios métodos Stat > EDA > Resistant Smoothing
209
Prueba de nor normal malidad idad con grá gráfi fica ca de desviaciones El rotograma es e s un histograma is tograma suspendido con u un na distribució di stribución n normal norm al que lo ajusta. ajusta. Muestra Muestra las desviaci d esviaciones ones a partir pa rtir del ajuste aju ste de la dis d istribució tribución n normal, normal, como lo hace hace p por or percen perce ntiles protege contra puntos aberrantes (Outliers) y cuentas anormales de eventos. eventos. Ejemplo:
Se utiliza un un rotograma rotograma para pa ra determinar si o no las mediciones medic iones de peso de 92 9 2 estu es tudi diant antes es siguen si guen una una distribución di stribución normal. normal. Instrucciones de Minitab Open pen worksheet w orksheet > PULSE.MTW. 1 File > O 2 Seleccionar Stat > EDA > Rootogram 3 En Variable, Variable, poner Weight . OK. K. Click O Click
Weight 140 14 0
14 145 5 160 160 19 190 0 155 15 5
Etcétera 210
Los resultados resultados se mu muestran estran a con continu tinuaci ación ón
211
Interpretación: La gráfica mu muestra estra resid residu uales dobles para iin ndic dicar ar que tan tanto to los datos se separan de la distrib distribu ución norm normal, al, Se observa una concentración ligera de signso negativos en el
lado in i nferio feriorr y una mayor concen concentració tración n de s sig ign nos p posi ositivos tivos en la parte central y superio superior. r. Sin embargo en ambos casos permanecen dentro del intervalo de confianza, indicando que los pesos son normales.
212
9. Estadística no paramétrica
213
Estadística no paramétrica
Introducción
• Prueba de signos de la mediana • Prueba de una mediana de Wilconox • Prueba de rangos de dos muestra de Mann Whitney • Prueba de igualdad igualdad de medianas de Krus Kruskal kal Wallis • Prueba de igualdad de medianas de Mood • Experi Experiment mentos os aleato aleatoriza rizados dos bloqueados bloqueados de Friedman
• Prueba de rachas 214
ESTADÍSTICA NO PARAMÉTRICA Acciones a ttomar omar sobre los datos normal ormales es antes antes de opt optar ar por est estas as pruebas: pruebas: Revise y asegúrese de que los datos no siguen una distribución normal. • Desarroll Desa rrollar ar un una a Prueba de normalidad normalidad . Para la prueba de Bartlet (P valu value e Open worksheet > Exh_Stat.Mtw Exh_Stat.Mtw Stat > Nonparametrics > 1-Sample Sign. En Variables Variables,, seleccion selecci onar ar PriceIndex Confidence interv i nterval al level 90 median an y poner 115 en el cuadro Seleccionar Test medi En Al En Alte tern rnat ativ ive e, Seleccion Seleccionar ar greater than than.. Click OK. Los resultados son los siguientes: Sign Test for Median: PriceIndex Sign test of median = 115.0 versus > 115.0 N Below Equal Above P PriceIndex 29 12 0 17 0.2291
Inte terp rpre reta tación ción de resu resultltad ados os::
Median 144.0
Como Com oe ell vsuficiente al alor or P de de lla ap pru rueb eba ae ess > >0. 0.1 1n no hay ay evidencia para rechazar Ho yolah mediana no es mayor a 115. 218
Prueba de una mediana de Wilconox Ho: mediana = mediana hipotetizada versus versus
Ha: mediana ≠ mediana mediana hipotetizada hipotetizada
Se registran regi stran llos os resultados de exam examenes enes en ciencias para 9 estu estudia diant ntes. es. Se quiere probar si hay suf sufici icient ente e evidencia de que la mediana sea men menor or a 77 con alfa = 0.05. Nivel de confianza = 1 - alfa = 95% File > Open worksheet > Exh_Stat.Mtw Stat > Nonparametrics > 1-Sample Wilconox En Variables Variables,, seleccionar Achievement Confidence interval level 95 Seleccionar Test Test median y poner 77 en el cuadro En Alt En Alter ern nat ativ ive e, Seleccionar less Th Than an.. Click OK. Los resultados son los siguientes: siguientes: Wilcoxon Signed Rank Tes Te st: Achieveme Achievement nt Test of median = 77.00 versus median < 77.00
Achievement
N 9
N for Test 8
Interp terpre reta tación ción de resu resultltado ados: s:
Wilcoxon Statistic 19.5
P 0.610
Estimated Median 77.50
Como Como e ell val valor or P d de e la la p pru rueba eba es >0.05 0.05 no h hay ay evidencia suficiente para rechazar Ho y la mediana no es estadísticamentemenor a 77.
219
Prueba de rangos r angos de dos muestras muestras de Mann M ann Whit Whitney ney H0: h1 = h2 versus versus
H1: h1 ≠ h2 , donde h es mediana de la población.
Se asume que las mu muestras estras provienen de dos poblaci poblaciones ones con la misma forma y v varianz arianza a Ejemplo: Se compara la presión diastólica de dos muestras extraidas de dos poblaciones Se quiere quie re probar a un 5% de nivel de significa significancia ncia si hay diferen di ferencia cia ent entre re las media medianas. nas. Nivel de confianza = 1 - alfa = 90% File > Open worksheet > Exh_Stat.Mtw Stat > Nonparametrics > Mann-Whitney En First Sample, Sample, sleccionar DBP1. En Second Sample Sample,, seleccionar seleccionar DBP DBP2. 2. Click OK. OK. level el 95 y en en Alter Altern nativ ative e, Seleccionar Not equal. equal. Click OK OK.. En Confidence lev
220
Los resultados resultados son los si siguien guientes: tes: Mann-Whitney Test and CI: DBP1, DBP2 N
Median
DBP1
8
69.50
DBP2
9
78.00
Point estimate for ETA1-ETA2 is -7.50 95.1 Percent CI for ETA1-ETA2 is (-18.00,4.00) W = 60.0 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.2685 The test is significant at 0.2679 (adjusted for ties)
Inter erpr pret etac ación ión de rres esu ultad ados os::
Com Como o el val alor or P de lla a pr pru ueba eba es >0. 0.05 05 n no o hay hay evidencia suficiente para rechazar Ho y las medianas no son diferentes estadísticamente.
221
Prueba de igualdad de medianas de Kru Kruskal skal Walli Wallis s H0: Las medianas poblacionales son todas iguales vs
H1: Al menos hay un una a diferente
Esta es e s una generalización generalización de la prueba de Mann Whitney Whitney Ejemplo: Se quiere probar si el efecto de tres tratamientos diferentes influyen influyen en el crecimiento de bacterias a un 5% de nivel de significancia Nivel de confianza = 1 - alfa = 90% File > Open worksheet > Exh_Stat.Mtw Stat > Nonparametrics > Kruskal-Wall Kruskal-Wallis. is. En Response, Response, seleccionar Growth . En Factor , seleccionar Treatment . Click OK OK.. Los resultados son los siguient sig uientes: es: Kruskal-Wallis Test: Growth versus Treatment Kruskal-Wallis Test on Growth Treatment
N
Median
Ave Rank
Z
1
5
13.20
7.7
-0.45
2 3
5 6
12.90 15.60
4.3 12.7
-2.38 2.71
Overall
16
8.5
H = 8.63
DF = 2
P = 0.013
H = 8.64
DF = 2
P = 0.013
Interpretación Interpretación de resultados: Como el valor P de la prueba es < 0.05 hay evidencia suficiente para rechazar Ho y las medianas son diferentes estadísticamente. La mediana 3 difiere menos de la mediana general Las medianas 1 y 2 tienen una mayor diferencia respecto a la mediana general.
(adjusted for ties)
222
Prueba de igualdad igualdad de medianas de Mood M ood Prueba similar simi lar a la an anterior: terior: H0: h1 = h2 = h3, versus H1: no todas las h's son so n iguales con h's medianas poblacionales . de OT OTIIS para los tres nivel niveles es e educacionales. ducacionales. Ejemplo: Se mide mid e la habilidad intelect intelectual ual de 179 estudiant estudiantes es en base al di dibuj bujo o de fi figuras guras después se aplica una pru prueba eba OTI OTIS S y se quiere p probar robar si a un al alfa fa de 5% hay diferencia significativa signific ativa en entre tre el n nivel ivel de educación 0 - Preprofesi Preprofesional onales es 1 -P -Profesionales rofesionales 2 - Preparatoria File > Open worksheet > Cartoon.Mtw
Nivel de confianza = 1 - alfa = 90%
Stat Nonparametrics Nonparametrics Mood s Median Medi an Test Test En Response, Response, seleccion seleccio nar OTIS OTIS.. En Factor , seleccion seleccio nar ED ED.. Click OK OK..
223
Los resultados son los siguient sig uientes: es: Mood Median Test: Otis versus ED
Interpretación de resultados: Como el v valor alor P es menor a 0.05 indica que las medianas no son
Mood median test for Otis Chi-Square = 49.08 DF = 2
iguales
P = 0.000
Individual 95.0% CIs
ED
N
Median
Q3-Q1
0
47
9
97.5
17.3
1
29
24
106.0
21.5
2
15
55
116.5
16.3
----+---------+---------+---------+-(-----*-----) (------*------) (----*----) ----+---------+---------+---------+--
96.0
104.0
112.0
120.0
224
Exp. aleatorizado bloqueado (equivale a ANOVA 2 vías) Prueba de Friedman Ho: Los efectos de todos tod os los tratamientos son cero H1: Los efectos de los tratamientos difieren de cero Ejemplo: Se quiere probar un tratamiento de drogas sobre la actividad enzimatica. Se prueba p rueba con tres tratamientos en an animales imales de diferentes granjas. Enzym nzymeA eAcctiv ivit it
Ther herapy
Litte itterr
0.15
1
1
0.26
1
2
0.23
1
3
0.99
1
4
0.55
2
1
0.26
2
2
-0.22
2
3
0.99
2
4
0.55
3
1
0.66
3
2
0.77
3
3
0.99
3
4
225
Instrucciones de Minitab: File > Open worksheet > EXH_STAT.MTW Stat > Nonparametrics Nonparametrics > Fried Friedman. man. En Response Response,, seleccionar EnzymeActivity. En Treatment Treatment,, selecionar Therapy. En Blocks Blocks,, seleccionar Litter. Click OK. OK. Los resultados son los siguient sig uientes: es: Friedman Frie dman Test: Test: EnzymeAct EnzymeActivity ivity versus versus Therapy Therapy blocked blocked by Litte Litte S = 2.38
DF = 2
P = 0.305
S = 3.80
DF = 2
P = 0.150 (adjusted for ties)
Sum Su m
Therapy
N
Est Median
of Ranks
1 2
4 4
0.2450 0.3117
6.5 7.0
3
4
0.5783
10.5
Los valores P son mayores mayores a 0.10 por tanto no hay evidencia para decirr que el efecto de los deci tratamientos tratamient os sea diferente de cero
Grand median = 0.3783 226
Prueba de Rachas Prueba de Rachas paramétrica: Racha es un punt punto o o seri serie e consec consecutiva utiva de pun puntos tos que caen en un lado de la medi mediana. ana.
Se usa cuando se buscan evide evidencias ncias de cciertos iertos pa patron trones es no aleatorios e en n el proceso, proces o, indicando que la variación variaci ón es anormal form formando ando grupos, osci oscilaciones, laciones, mezclas mezclas y que que se de deben ben tomar acciones correc correctivas. tivas. Si la muestra muestra es de uno determina la línea línea central como la media mediana na y si la muestra es de subgrupos une las medias de los subgrupos con una línea. Las hipotesis de esta prueba son: H0: Las rachas son aleatorias H1: Las rachas siguen si guen un un patrón no no aleatorio a leatorio
227
Por ejemplo con el archivo RADON.MTW de este módulo se tiene:
File le > Open Worksheet > Radon.mtw Fi Stat > Quality Tools > Run Chart En Si Single ngle column column, seleccionar selecci onar Membrane . size,, poner 2 . Click OK. OK. En Subgroup size Run Chart of Membrane 45 40 e n a r 35 b m e 30 M 25 20 1
2
Number of runs about median: Expect cte ed nu num mber of ru runs ns: Longest run about median: Approx Appr ox P-V P-Val alue ue for Clusterin tering: g: Approx Appr ox P-V P-Val alue ue for Mixture xtures: s:
3
4 3 6.00000 5 0.022 .02209 0.97791
5 6 Sample
7
8
Number Number of runs up or down: Ex Expe pect cte ed num number o off ru runs ns: Longest run up or down: Approx Appro xP P-Va -Value for Trends: Approx Appro xP P-Va -Value for Os Oscil cilllati ation: on:
5 6.33333 3 0.13 0.13455 0.86545
9
10
Interpretación de resultados Interpretación Como el P value de Clustering es menor a 0.05 indica que el patrón no es aleatorio y se deben investigar las posibles causas. 228
Prueba de rachas no paramétrica
rachas son aleatori aleatorias as H0: Las rachas
H1: Las rachas rachas siguen un patrón no aleatorio
Un entrevistador entrevistador e encu ncuesta esta a 30 per personas sonas al azar y les hace un una a pregunta con 4 posi posibles bles
respuestas (0, 1, 2 y 3). Se quiere probar si hay una respuesta aleatoria en el orden de las respuestas o que no h haya aya sesgo en el entrevistado. Usar el archivo File > Open Worksheet > EXH_STAT.MTW. Stat > Non Nonparametric parametricss > Runs Runs Test. En Variables, Variables, seleccionar Response . Click OK OK.. Los resultados son los siguientes: Runs Test: Response Runs test for Response Runs above and below K = 1.23333 The observed number of runs = 8 The expected number of runs = 14.9333 11 observations above K, 19 below P-value = 0.005
Interpretación de resultados: Interpretación Como P value es menor a 0.05 se tiene evidencia de que el comportamiento de las respuestas no es aleatorio y debe investigarse la causa. 229
10. Tablas y pruebas no paramétricas
230
Tablas y pruebas no paramétricas
• Contador de eventos • Estadístic Estadística a descriptiva de tablas • Tabulación cruzada y Chi cuadrada • Análisis Chi cuadrada con tabulación cruzada • Tablas de contingencia
231
Contador de eventos Se usa para mostrar cuenta, cuenta acumulada, porcentajes, y porcentajes acumulados para cada variable especificada Suponiendo que se está estudiando la influencia de la actividad de paciente en el desempeño de una droga nueva. Después de colectar los datos, se examina la distribución de la actividad del paciente. 1
File > Open worksheet EXH_TABL.MTW Activity Moderat e Moderate A lot Slight Moderate Slight A lot Moderate Moderate Etc.
2 3 4 5
Repetir c on GENDER y HEIGHT Los resultados son los siguientes: Tally for Discrete Variables: Activity Activity
Count
CumCnt
Percent
CumPct
A lot Moderate
21 61
21 82
23.08 67.03
23.08 90.11
Slight
9
91
9.89
100.00
N=
91
La actividad ligera tiene un 9.89%, la actividad moderada
Stat > Tables > Tally Individual Variables. Variables. un 67.03% y alta 23.08% Variables,, poner Act En Variables Activity ivity . En Display Display,, seleccionar Counts, Percents, Cumulative counts, counts, y Cumu Cumula lative tive percents Click OK
232
Estadística descriptiva de tablas Se usa para generar tablas conten conteniendo iendo frecuencias frecuencias estadí estadísticas sticas para variables categóricas categó ricas y estadí estadísticas sticas resumidas para p ara variables numéricas asociadas. Ejemplo: Se desea d esea resumir resumir las estadí estadísticas sticas ddee frecu frecuencias encias de datos de pul pulso so para las personas p ersonas en el estu estudio dio,, calasifica calasificadas das por gé génnero y nnivel ivel de actividad (datos en el archivo EXT-TABL.MTW)
233
Gender
Activit y
Smokes
Heigh t
Weig ht
P ulse
Male Male Male
Moderate Moderate A lot
No No Yes
66 72 73.5
140 145 160
64 58 62
Male Male
Slight Moderate
Yes No
73 69
190 155
66 64
Etcétera…
Instru strucci cciones ones de Minitab: Minitab : 1 File Open > Workshe Worksheet et > EXH_TABL.MTW. Statistics. 2 Seleccionar Stat > Tables > Descriptive De scriptive Statistics 3 En For rows, poner Gender . En For columns, poner Smokes . Percentss. 4 Sel. Categorical variables, check Counts and Row Percent 5 Sel. Associated variables, poner Pulse . Sel. Display Means Click OK en cada cuadro de diálogo 234
Los resul resultados tados se muestran a continu continuaci ación: ón: Tabulated Rows:
statistics:
Gender
Gender,
Columns:
Smokes
No
Yes
All
Female
74.59
84.50
76.86
27 77.14
8 22.86
35 100.00
Male
70.00
72.42
70.82
37
19
56
66.07
33.93
100.00
All
71.94
76.00
73.14
64
27
91
70.33
29.67
100.00
Cell
Contents:
Pulse
Smokes
:
Mean Count %
of
Row 235
Interpretación: Se muestra la tabla resumen tanto de la variable categórica y la variable asociada. Minitab muestra muestra el e l valor valor medio medi o del del pulso, pulso, el el contado contadorr y los porcentajes porcent ajes de fila fi la clasificados clasificado s por gén g énero ero y estado de fumar fumar
De los 56 hombres, 19 son fu fumadores, madores, su pulso pulso medio es 72.42 72 .42 y su porcentaje porcent aje correspondiente correspondiente de fila es de 33.93%
236
Ejemplo: Se desea resumir los pesos y estaturas de las personas en el estudi calsificados calsifica dos por p or género género y nivel nivel de actividad. Instru strucci cciones ones de de Minitab: 1 File Open > Workshee Worksheett > EXH_TABL.MTW. Desc riptive ve Stati S tatistics stics.. 2 Seleccionar Stat > Tables > Descripti 3 En For rows, rows, pon poner Gender Gender .. En For columns, columns, poner Activity poner Activity .. Heigh gh y W Weight eight 4 Sel. Associated variables, variables, poner Hei 5 En Display, Display, seleccion selecci onar ar Means, Std. Dev., Dev ., y N Missing Clickk OK en cada cuadro de diálogo Clic diá logo 237
Los resultados resultados se mu muestran estran a co con ntinu tinuaci ación: ón: Tabulated statistics: Gender, Activity Rows: Gender Columns: Activity Female
A lot 64.60 121.0 2.074 21.02 0 0 5
Moderate 65.62 124.5 2.735 12.78 0 0 26
Slight 65.00 123.0 2.160 7.70 0 0 4
All 65.40 123.8 2.563 13.37 0 0 35
14.29
74.29
11.43
100.00
Male
71.12 155.5
70.43 158.1
72.40 170.0
70.80 158.4
2.649 13.21 0 0 16 28.57
2.521 20.58 0 0 35 62.50
2.510 19.69 0 0 5 8.93
2.579 18.77 0 0 56 100.00 238
All
69.57
68.38
69.11
68.73
147.3
143.8
149.1
145.1
3.773
3.532
4.485
3.679
21.12
24.27
28.80
23.87
0
0
0
0
0
0
0
0
21
61
9
91
23.08
67.03
9.89
100.00
Cell Contents:
Height
:
Mean
Weight
:
Mean
Height
:
Standard deviation
Weight
:
Standard deviation
Height
:
Missing
Weight
:
Missing
Count
% of Row
Interpretación: Minitab muestra la media, medi a, des desv viac iación ión estándar, y tamañ tamaño od de e muestra para Height Hei ght y Weig Weigh ht, clasific clasificados ados por Gender y Activity Activity..
El hombre con actividad moderada tiene peso medio de 158.1 lbs. con desv. desv. Est. De 20.58 lbs. Es Estos tos val valores ores so son n con base en 35 observaciones. Al A l final se muestran llas as estadí estadística sticas s totales. 239
T abulaci abulación ón cruzada y Chi cuadrada Se usa pa para ra generar tablas de frecuencia frecuencia y porcentajes. T Tambi ambién én se puede realizar rea lizar u un na prueba C Ch hi cuadrada y selecci seleccionar onar el Layou Layoutt de la tabla.
240
241
242
243
Ejemplo: Serí Se ría a co conv nvenient eniente e clasi clasificar ficar las p personas ersonas de dell estu estudi dio o po porr género, si fuman o no y peso como la variable as asoci ociada ada.. Presentar esta informaciòn informaci òn en u una na tabla d de e tres ví vías. as.
Instrucciones de Minitab: File e Open Open > Worksheet > EXH_TABL.MTW. 1 Fil Tab ulation on and Chi Squar Squ ar 2 Seleccionar Stat > Tables > Cross Tabulati 3 En For rows, rows, poner Gender Gender .. En For columns, columns, poner Activity poner Activity .. En For Layers, Layers, poner Smokes. 4 En Display, Display, seleccionar Counts Click OK en cada cuadro de diálogo di álogo
244
Los resul resultados tados se muestran a continu continuaci ación: ón: Tabulated statistics: Gender, Activity, Smokes Results for Smokes = No
Rows: Gender
Columns: Activity
A lot
Moderate
Slight
All
4
20
3
27
Male
12
22
3
37
All
16
42
6
64
Female
Cell Contents:
Count
Results for Smokes = Yes
Rows: Gender
Columns: Activity
A lot
Moderate
Slight
All
Female
1
6
1
8
Male
4
13
2
19
All
5
19
3
27
Cell Contents:
Count 245
Interpretación: Minitab crea una tabla de dos vías para cada nivel de la variable por capas, capa s, Smoke. La variable ddee fifila la es Gender y la vvariab ariable le de
colum column n a es Acti Activ v ity. T Tambi ambién én se puede c cambi ambiar ar el La Lay y out de la tabla asign asi gnan ando do variables a trav través és de las filas, debajo de las columnas o por capas.
246
Ejemplo de cambio de Layout Layo ut de tabla Instrucciones de Minitab: 1 File Open > Worksh Worksheet eet > EXH_TABL.MTW. Tabu lation ion and Chi C hi Squar 2 Seleccionar Stat > Tables > Cross Tabulat 3 En For rows rows,, poner Gender Gender .. En For columns columns,, Activi Activity ty Smoke Sm oke 4 En Display Display,, seleccion seleccio nar Counts Click OK en cada cuadro cuadro de diálogo di álogo
247
Los resul resultados tados se muestran a cont continu inuaci ación: ón: Tabulated statistics: Gender, Activity, Smokes Rows: Gender
Columns: Activity / Smokes
A lot
Moderate
Slight
All
Female
No 4
Yes 1
No 20
Yes 6
No 3
Yes 1
All 35
Male
12
4
22
13
3
2
56
All
16
5
42
19
6
3
91
Cell Contents:
Count
Interpretación: La variable variab le de fila e es s Gender, lla a variable de colum column na superi superior or es Activity Activ ity y la inf inferior erior es Smo Smokes. kes. 248
Análisis nálisis Chi cuadrada cuadr ada con T abulación cruzada cruzad a Hay interés en determianr si hay asociación entre el Género y el nivel de ac activ tivid idad ad para las personas en el estudio. Hacer una una prueba pru eba Ch C hi Cu C uadrada. adrada . Instruccio nstrucciones nes de Minitab: Mi nitab: Worksheet eet > EXH_TABL.MTW. 1 File Open > Worksh 2 Seleccionar Stat > Tables > Cross Tabulation Tabulation and Chi Squar Squ ar 3 En For rows rows,, poner Gender Gender .. En For columns, columns, poner Activity poner Activity Display,, seleccionar selecci onar Counts 4 En Display 5 Sel. Chi Square > Chi > Chi Cuad. Anal A naly ysi sis, s, Exp. Cell Ce ll count counts, s, Std. Re Click OK en cada cuadro de diálogo
249
250
Cell Contents:
Count Expected count
Standardized residual
Pearson Chi-Square=2.487, DF=2, P-Value=0.288
Likelihood Ratio Chi-Square = 2.613, DF = 2, P-Value = 0.271 * NOTE * 1 cells with exp. counts less than 5
Interpretación: Las celdas en la tabla continen continenen en las frecu frecuencias encias,, las frecuen frecuenci cias as esperadas y llos os residuos estandariz estandarizados. ados. Como P value es mayor a 0.05, no hay evidencia de asociación entre Gender y Activity Activi ty . Como hay una frecuencia menor a 5, se
debe deb e tener precuaci precuación ón al in intepretar tepretar los resul resultados tados 251
T ablas de Contingencia Contingencia La Tabla de contingencia es una prueba de independencia entre variables. Ho: La variable de renglón es independiente de la variable de columna Las proporci proporciones ones en todas las columnas columnas de cada renglón son iguales iguales Ha: La variable de renglón tiene dependencia de la variable de columna Las proporci proporciones ones en las columnas columnas de cada renglón son diferentes diferentes Ejemplo: Se tiene interés de probar si la afiliación política depende del sexo y del partído polític político, o, para lo cual se encuestan a 100 personas. Dem emo ocrat rat Rep epu ublican
Hombres Mujeres
28 22
18 27
Other
4 1
Las instrucciones son las siguientes: File > Open worksheet Exh_Tabl.Mtw. Stat > Tables > Chi-Square Test (Tabla Test (Tabla en en Worksheet). En Columns Columns que que contiene la tabla, indicar Democrat, Republican y Other . Click OK. 252
Los resul res ultados tados son los si siguient guientes: es: Chi-Square Test: Democrat, Republican, Other Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts
Democrat
Republican
Other
Total
28
18
4
50
25.00
22.50
2.50
0.360
0.900
0.900
22
27
1
25.00
22.50
2.50
0.360
0.900
0.900
50
45
5
1
2
Total
NOTA: L NOTA: Las as frecuencias esperadas esperada s deb deberí erían an ser mayores a 5. 50
100
Chi-Sq = 4.320, DF = 2, P-Value = 0.115 2 cells with expected counts less than 5.
El valor P es mayor a 0.05 y no se rechaza Ho por tanto tanto el tip tipo o
de partido es independiente del sexo de los votantes.
253
Ejercicios: 1. Los errores present pres entados ados en tres tipos de s servicios ervicios c cuan uando do se pres prestan tan por tres regiones se muestran a continuación, continuación, probar con un una a tabla d de e co cont ntingencia ingencia s sii los errores dependen del tipo de se serv rvici icio o y regió región n para un 95% de niv nivel el de c conf onfianza. ianza.
Servicio
Region A Region B Region C
1 2 3
27 41 42
12 22 14
8 9 10
Ho: Los errores NO dependen en cada región del tipo de servicio. Ha: Los errores en cada región, dependen del tipo de servicio, Con Minitab: sq uare test (two way table in worksheet) Stat > Tables > Chi square Columns containing the table Region A Region B Region C OK 254
Probar ar a un una a alfa de 0.05 si los errores que se cometen al facturar facturar 2. Prob en di ferentes ramos son si mi lares. Ni vel de confi anza = 1 - alfa = 95 Orden Far Farma maci cia a Consumo Consumo Comput. Comput. Tel Telecom ecom.. Correcta 207 136 151 178 Incorrecta 3 4 9 12 Ho: El nú número de errores no depende dep ende del ramo indu i ndustrial strial Ha: El nú número de errores depende de pende de dell ramo industrial industrial Con Minitab:
Stat > Tables > Chi square test (two way table in worksheet) Columns containing the table Farmacia Consumo Comput. Telecom. OK
255
11. Regresión lineal y cuadrática
256
Regresión lineal y cuadrática
• Correlación y regresión lineal gráfica a • Regresión simple por medio de gráfic
• Regresión cuadrática cuadrática por medio de gráfica
257
Correlación y Regresión lineal y cuadrática simple Coeficiente de Correlación Establece si existe una relación entre las variables y responde a la pregunta, ”¿Qué tan evidente es esta relación?". La correlación es una prueba fácil y rápida para eliminar factores que no influyen en la predicción, para una respuesta dada. * Es una medida de de la fuerza fuerza de la relación lineal entre d dos os vvariables ariables x y y. * Es un número entre -1 y 1 * Un valor positivo indica que cuando una variable aumenta, la otra variable aumenta * Un valor negativo indica que cuando una variable aumenta, la otra disminuye * Si las dos variables no están relacionadas, el coeficiente de correlación tiende a 0.
258
Correlación Negativa Evidente
Correlación Positiva 25
Y
Evidente
25
20
20
15
15
10 5 0
Y
10 5
0
5
10
15
20
Sin Correlación
25
0
r= 1
X
0
25
5
10
r = -1
15
20
25
X
20 15 Y
Correlación Positiva
25
10
Correlación Negativa
5
r= 0
0 0
5
10
15
20
25
25
20
X
20
15 15 Y
10
Y
r = 0.8
5
r = -0.8
10 5
0 0
5
10
15
20
0
25
0
5
10
15
20
25
X X
259
Ejemplo: Se utiliza el archivo PULSE.MTW campos Peso (Weight) y Altura (Height) File > Open Worksheet > Pulse.Mtw o cop copiar iar lo los da dato toss d del el arch archii Antes d Antes de e ca calcula lcularr e ell coe coefficien iciente te d de e co corr rrela elación ción se su sugie giere re ha hacer cer un dia diagr gram ama a bivariante para identificar posibles valores anómalos, relaciones no lineales, etc.
Graph > Sc Scatterp atterplot: lot: Si Simple mple
Y = Wei Weight ght y X = Hei Height ght
Scatterplot of Weight vs Height 220 200 180
t
h 160 g i e
W 140 120 100 60
62
64
66
68 Height
70
72
74
76
260
Ahora se calcula c alcula el ccoef oeficiente iciente de Cor Correlación relación que mide el grado de relación relación que exi exist ste e entre dos variables, como sigue:
Stat > Basic Statistics > Correl Co rrelation ation Seleccionar en Variables Weight Height Display splay P values values Seleccionar Di Los resultados son los siguientes: Correlations: Weight, Height Pearson correlation of Weight and Height Coef Coeficiente iciente de ccorr orrelación elación P-Value = 0.000
Como el P value es menor a 0.05, la correlación si es significativa
261
Coeficiente de correlación Reglas empíricas Coeficiente de correlación
Relación
0.8 < r < 1.0
Fuerte, positiva
0.3 < r < 0.8
Débil, positiva
-0.3 < r < 0.3
No existe
-0.8 < r < -0.3 -1.0 < r < -0.8
Débil, negativa Fuerte, negativa
262
Análisis de Regresión El análisis de regresión es un método estandarizado estandarizad o para localizar localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción. Puede ser usado para analizar las relaciones entre: • Una Una sol sola a “X” “X” predictora y una sola “Y” • Múltiples predictores “X” y una sola “Y” • Varios predictores “X” entre sí 263
Modelo de regresión lineal simple Fitted Line Plot Resultados de prueba (%) = 31.21 + 0.6955 Tiempo de estudio (horas) S R- Sq R- Sq (ad j)
80
) 75 %(
4.47182 77.0% 74.2%
R^2 Coef. de determinación
a
b 70 e ur p
e 65 d s o
d 60 a tl u
esR 55 50 30
40 50 60 Tiempo de estudio (horas)
70
Mínimos cuadrados 264
Regresión s sim imple ple por medio de gr gráfi áfica: ca: File le > Open Worksheet > Pulse.Mtw Fi Stat > Regression > Fitted line Plot Seleccionar en Response (Y) Weight Weight y en Predictor (X) Height Regres sion on model Linear Type of Regressi Seleccionar modelo Type duals Standardized > Normal Plot y Resi Residuals duals vs vs fits fi ts Sel. en e n Graphs > Resi Residuals OK
Ecuación de Regresión
Fitted Line Plot Weight = - 204.7 + 5.092 Height 220
S Desv. Estandar de los residuos (valor real-estimado por la regresión)
200 180 t h 160 g i e W 140
S R-S q R-S q q((adj)
14.7920 61.6% 61.2%
120 100 60
62
64
66
68 Height
70
72
74
76
R-Sq Coeficient Coeficiente e de Determinación en porcentaje de variación explicada ex plicada por la ecuación de regresión
R-Sq (Adj) - Sólo para regresión múltiple 265
Regression Analysis: Weight versus Height The regression equation is Weight = - 204.7 + 5.092 Height S = 14.7920
R-Sq = 61.6%
R-Sq(adj) = 61.2%
Analysis of Variance Source
DF
SS
MS
F
1
31591.6
31591.6
144.38
Error
90
19692.2
218.8
Total
91
51283.9
Regression
P 0.00
El valor p menor a 0.05 indica que SI es significativa la Correlación de Y y X.
266
Análisis de los residuos
Versus Fits
Normal Probability Plot
(response is Weight)
(response is Weight)
4
99.9 99
3 la
95 u di
90
2 s e R
80 70 60 50 40 30 20
d
t n
1 e iz
e c r e
d r a
P
0 d n a
10 t S
5
-1
1
-2 0.1
100
110
120
130
140 150 Fitted Value
160
170
-4
180
Los re residuos m muuestran aleatoriedad
-3
-2
-1 0 1 Standardized Residual
2
3
4
Los re residuos si siguen una distribución normal
267
Regresión cuadrática cuadr ática por medio de gráfica: File > Open Worksheet > Exh_Reg.Mtw Stat > Regression > Fitted line Plot Seleccionar en Response (Y) EnergyConsumption EnergyConsumption y en Predictor (X) MachineSettin Seleccionar modelo modelo Type of Regression Model Quadratic Sel. en Graphs > Residuals Standardized > Normal Plot y Residuals vs fits OK Ecuación de Regresión
Fitted Line Plot EnergyConsumption = 128.8 - 13.11 MachineSetting EnergyConsumption + 0.3289 MachineSetting** MachineSetting**2 2 40
S R-Sq R- Sq Sq (a (ad j) j)
n 30 iot p m
u 20 s
6.00002 79.3% 73.4%
S Desv. Estandar de los residuos residuos (valor real-estimado por la regresión)
n o C rg
y E
n
e 10
R-Sq Coeficiente de Determinación en porcentaje de
variación explicada por la ecuación de regresión
0 10
15
20 MachineSetting
25
30
R-Sq (Adj) - Sólo para regresión múltiple
268
Resultados Polynomial Regression Analysis: EnergyConsumption versus Ma The regression equation is EnergyConsumption = 128.8-13.11 MachineSetting+0.3289 Machi S = 6.00002
R-Sq = 79.3%
R-Sq(adj) = 73.4%
Analysis of Variance Source
DF
SS
MS
F
P
Regression
2
963.81
481.904
13.39
0.004
Error
7
252.00
36.000
Total
9
1215.81
El valor p menor a 0.05 indica que SI es significativa la Correlación de Y y X.
Sequential Analysis of Variance Source Linear Quadratic
DF 1
SS 28.500
F 0.19
P 0.673
1
935.308
25.98
0.001
269
Análisis de los residuos Normal Norm al Proba Pr obabili bility ty Plot (response (res ponse is EnergyConsumption EnergyConsumption)) 99
95 90 80 70
n
t
60 50
Pe
40 30
cr
e
20 10
5
1
-3
-2
-1
0 1 Standardized Residual
2
3
Los residuos siguen una distribución normal 270
12. Regresión Múltiple
271
Regresión múltiple
• Introducción • Regresión múltiple • Regresión por pasos
• Regresión por mejores subconjuntos
272
Introducción
273
Regres Re gresión ión múltiple Genera una una ecu ecuaci ación ón que que des describ cribe e la relación relació n estad estadíístic stica a entr entre e uno uno o más predictores y la variable de respuesta y predice nuevas observaciones. Utiliza el método de mínimos cuadrados para derivar la ecuación que minimiza la suma de los residuos al cuadrado.
Los resultados resultados de la regresi regresión ón indican la dirección, direcci ón, ttamañ amaño, o, y significancia estadística de la relación entre los predictores y la respuesta. * El signo de cada coefici coeficient ente e indica la dirección de la la relació relación n. * Los coefici coeficient entes es representan el cambio pormedio en la respuesta respuesta para una unidad de cambio en el predictor, mientras se mantienen constant const antes es otros o tros predic predictores tores del modelo.
274
* El valor valor P de cad cada a coefi coeficiente ciente pru prueba eba la h hipó ipótesis tesis nu nula la de que el coeficient coefici ente e es igual a cero (si (sin n ef efecto). ecto). Por tant tanto, o, vvalores alores bajos de P sugieren que el predictor tiene un efecto significativo en el modelo. * La ecuación predice nuevas observaciones con base en valores específicos especí ficos de los predi predictores ctores
275
Regresión múltiple •
Cuando se usa más de una variable independiente para predecir los valores de una variable dependiente, el proceso se llama
análisis de regresión múltiple, incluye el uso de ecuaciones lineales.
Y u
b 0 b 1 X u1 b 2 X u 2
.......
b k X uk u
Se asume que los errores u tienen las características siguientes: •
Tienen media cero y varianza común
•
Son estadísticamente independientes.
•
Están distribuidos en forma normal.
2.
276
Tamaño de muestra •
Tomar 5 observaciones para cada una de las variables independientes, si esta razón es menor de5 a 1, se tiene el riesgo de “sobreajustar “sobreajustar ” el modelo
•
Un mejor nivel deseable es tomar 15 a 20 observaciones por cada variable independiente
277
Multicolinealidad
•
La multicolineali multicolinealidad dad implica implica una dependencia dependencia cercana cercana entre regresores (columnas de la matriz matriz X ), de tal forma que si hay una dependencia lineal exacta hará que la matriz X’X sea singular.
•
La presencia de dependencias cercanamente lineales impactan dramáticamente en la habilidad para estimar los coeficientes de regresión.
•
La varianza de los coeficientes de la regresión son inflados debido a la multicolinealidad. Es evidente por los valores diferentes de cero que no están en la diagonal principal de X’X. Que son correlaciones simples entre los regresores.
278
Multicolinealidad •
Una prueba fácil fácil de probar si hay multicolinea multicolinealidad lidad entre dos variables es que su coeficiente de correlación sea mayor a 0.7
•
Los elementos de la diagonal principal de la matriz X’X se denominan Factores de inflación de varianza (VIFs) y se usan como un diagnóstico importante de multicolinealidad. Para el componente j – j – és ésim imo o se tien tiene: e:
•
Si es mayor a 10 implica que se tienen serios problemas de multicolinealidad. 1 VIF VI F j 2 1 R j
279
Análisis de los residuos •
Los residuos graficados vs la Y estimada, pueden mostrar diferentes patrones indicando adecuación o no adecuación del modelo:
•
La gráfica de residuos residuos aleatorio aleatorios s cuya suma es cero (null plot) indica modelo adecuado
•
La gráfica de residuos mostrando una no linealidad curvilínea indica necesidad de transformar las variables
•
Si los residuos se van abriendo indica que la varianza muestra heteroestacidad y se requiere transformar transformar las variables. Se puede probar probar con la prueba prueba de Levene de homogeneid homogeneidad ad de varianzas
280
•
Escalamiento de residuos En algunos casos es difícil hacer comparaciones directas entre los coeficientes de la regresión debido a que la magnitud de bj bj refleja refleja las unidades de medición del regresor Xj. Xj. Por ejemplo:
Y ˆ
•
5 X 1 1000X 2
Para visualización deestandarizar residuos ante diferencias en losfacilitarla coeficientes, coeficientes, se sugiere o grandes estudentizar los residuos
281
Escalamiento de residuos • R es iduos es tanda ndari ri za zado dos s – Se obtienen dividiendo cada residuo entre la desviación estándar de los residuos
d i
ei MSE
,
– Después de la estandarización, los residuos tienen una media de 0 y desviación estándar de 1 – Con más de 50 datos siguen a la distribución t, de manera que si exceden a 1.96 (límite para alfa 0.05) indica significancia estadística y son “outliers “outliers””
282
Escalamiento de residuos • R es iduos es tude udent ntiza izado dos s – Son similares a los residuos donde se elimina una observación y se predice su valor, pero además se elimina la i-ésima observació observación n en el cálculo de la desviación desviación estándar estánd ar usada para estandariza estandarizarr la í-ésima observación observación – Puede identificar observaciones que tienen una gran influencia pero que no son detectadas por los residuos estandarizados r i
ei
MSE (1
hii )
,
283
Escalamiento de residuos •
El estadí estadísti stico co PRESS PRESS (Predi (Predicti ction on Error Error Sum Sum of Squar Squares) es) es es una medida similar a la R2 en la regresión. Difiere en que se estiman n1 modelos de regresión.
•
En cada modelo se omite una observación en la estimación del modelo de regresión y entonces se predice el valor de la observación omitida con el modelo estimado. El residuo iésimo será:
•
e Y Y ) El residuo residuo PRESS PRESS es la( i )suma ial cuadrado cua( idrado de de los residuos residuos individuales e indica una medida de la capacidad de predicción
N
PRESS PR ESS
i 1
2
e( i )
Y i Y ( i )
ˆ
ˆ
2 2
R Pr edicción
1
PRES PRE S S
S YY 284
Gráficas parciales de regresión •
Para mostrar el impacto de casos individuales es más efectiva la gráfica de regresión parcial. Un caso “outlier “outlier ” impacta en la pendiente de la ecuación de regresión (y su coeficiente).
•
Una comparación visual de la gráfica de regresión parcial con y sin la observación muestra la influencia de la observación
•
El coeficiente de correlación parcial es la correlación de la variable independiente Xi y la variable dependiente Yi cuando se han eliminado de ambos Xi y Yi
•
La correlación correlación semipar semiparcial cial refleja refleja la correlación correlación entre entre las variables independiente y dependiente removiendo el efecto Xi 285
Por ejemplo: Se inv i nvestig estiga a el efecto de los factores q que ue afectan a % de rotura rotura de pap papas as (v (varia ariable ble de respuesta) antes de su embarq embarque. ue. Los predi predictores ctores son el % de papa respec respecto to a otros ingredi ingredient entes es y la la temperatura de horneado en grados celsius. % de papas pap as rotas = 4.231 - 0.044(% papas) + 0.023 Temp Pre di dictor
Coe fi ficie nt nte
Constante % papas Temp
4.231 -0.044 0.023
P
0.322 0.001 0.02
R-Sq = 67.2%
286
Co mo el P valu Como value e de a ambos mbos predictores pred ictores es e s menor menor a 0.05, son sign sig nificativos, ific ativos, ex explican plican el 67.2% de la varia varian nza d del el % de papas rotas. * Por cada ca da grado g rado C de in i ncrement cremento o en la temperatura, temperatura, el % de papas rotas se espera se incremente en 0.023% * Para predecir el % de papas rotas con el 50% de papas y una temperatura temperatura de cocción cocci ón de 1 175 75 ºC, se calcu ca lcula la el val valor or esperado de 4.831% de papas pap as rotas.
287
Regresión múltiple
288
Ejemplo: Como parte p arte de un una a prueba de e ener nergí gía a térmica solar, so lar, se mide el el calor total en Fluxes en las las casas. casas . Se desea des ea examin examinar ar si este e ste calor puede puede predecirse predeci rse por la posició posi ción n de los pu pun ntos focales en el Este; Sur y Norte. HeatFlu x 271.8
East 33.53
So ut h 40.55
N ort h 16.66
264
36.5
36.19
16.46
238.8
34.66
37.31
17.66
230.7
33.13
32.52
17.5
251.6
35.75
33.71
16.4
257.9
34.46
34.14
16.28 Etc… Etc.. E tc..
289
Instrucciones nstrucciones de Minitab: 1 2 3 4 5 6 7
worksheet > EXH_REGR.MT File > Open worksheet > E XH_REGR.MTW. W. Seleccionar Stat > Regression > Regression. Regression . selecci onar HeatFlux . En Response, Response, seleccionar selecci onar East South North . EIn Predictors, Predictors, seleccionar Click Graphs. En Residu Residuals als for Plots, seleccionar Standardized. En Residual Plots, En Plots, seleccion selecci onar ar Individual Plots. Plots. Histogram of residuals residuals,, Normal rmal plot of residuals, residuals, y Residuals versus fits. fits. Click OK. No
8 Click Options. Options. En Display Display,, seleccionar PRESS y PRESS y predicted predicted R-square R-square.. Click OK en cada caja caja de diálogo. di álogo.
290
Los resultados resultados se muestran a continu continuaci ación: ón: Regression Analysis: HeatFlux versus East, South, North
The regression equation is HeatFlux = 389 + 2.12 East + 5.32 South - 24.1 North
Predictor Constant
Coef 389.17
SE Coef 66.09
T 5.89
P 0.000
2.125
1.214
1.75
0.092
South
5.3185
0.9629
5.52
0.000
North
-24.132
1.869
-12.92
0.000
East
S = 8.59782
R-Sq = 87.4%
R-Sq(adj) = 85.9%
291
PRESS = 3089.67
R-Sq(pred) = 78.96%
Analysis of Variance Source
DF
SS
MS
F
P
3
12833.9
4278.0
57.87
0.000
Residual Error
25
1848.1
73.9
Total
28
14681.9
Regression
Source
DF
Seq SS
East
1
153.8
South
1
349.5
North
1
12330.6
Unusual Observations Obs
East
HeatFlux
Fit
SE Fit
Residual
St Resid
4
33.1
230.70
210.20
5.03
20.50
2.94
22
37.8
254.50
237.16
4.24
17.34
2.32
R denotes an observation with a large standardized resi 292
Interpretación:
* El valor valor P d de e la ANOVA (0.00) indica que el modelo de regresión regresi ón es si signific gnificativo ativo a un n nivel ivel alfa de 0.05. 0 .05. Indica Indica que al menos un coe coefici ficiente ente es diferen di ferente te de cero. * Los valores P para los coefici c oeficient entes es estimados es timados de North y South South (P = 0.000 0.000)) indican indi can que tienen influ influencia encia si signific gnificativa ativa en el HeatFlux HeatFlux.. El P-valu P-value e de East Ea st de 0.092 indica qu q ue no es significativo si gnificativo a un nivel de significancia de 0.05. Además la la suma suma secu secuen encial cial de cuadrados cuadrados (sequen (sequential tial su sum m of squares) squares) indica que el predictor East, no explica una gran cantidad de varianza, Por lo que el modelo con c on solo North y South serìa serìa apropi ap ropiado ado.. * El valor de R-sq (adj) (a dj) de 85.9% 8 5.9% tomando en e n cuenta cuenta el núm número ero d de e predictores predic tores en el modelo, in indic dica a que el modelo ajusta ajusta bien bi en a los datos.
293
* El Predicted R-Sq de 78.96% es cercano al valor de R-Sq, el modelo no parece estar es tar sobreaju sobreajustado stado y tiene bu buena ena capacidad capacida d predictiv predi ctiva. a. * Las observ o bservaciones aciones 4 y 22 se identifican como anormales anormales dado que el valor val or estandari estandarizado zado de sus resi residuos duos es mayor a 2. Pueden ser Outlie Outliers. rs. Versus Order
Normal Probability Plot
(response is HeatFlux)
(response is HeatFlux) 99
2 l a
90
u id s e R t n d e e
50 c
iz r d e r
P
0 a d n a t S
10
-2 2
4
6
8
10
12 14 16 18 Observation Order
20
22
24
26
1
28
-3.0
-1.5
0.0 Standardized Residual
Versus Fits
Histogram
(response is HeatFlux)
(response is HeatFlux)
1.5
3.0
8
2 l a
6 u id s e y R c n d e e u
4
iz q d e r
r
0 a d
F
n a t S
2
-2
0 200
220
240 Fitted Value
260
280
-2
-1
0 1 Standardized Residual
2
3
294
Interpretación: * La gráfica de Histograma indica que pueden existir puntos aberrantes aberran tes en los los datos, da tos, indicado por las dos barras derechas. * La gráfica grá fica de probab p robabili ilidad dad normal muestra muestra un patrón aprox. lineal consistente con una distribución normal. Hay dos puntos que salen de la línea, línea, con Brushing Brushing se identifica i dentifican n como el 4 y 22. * La gráfica de residuos contra valores estimados, muestra que son más pequ peq ueños conforme se in i ncrementa el valor valor esti estimado mado de Y, lo que puede in i ndicar di car qu q ue los resiu resi udos no tienen un una varianza constante y tal vez sea necesaria una transf. de datos.
295
Regresión por pasos y mejores subconjunto su bconjuntoss
296
Regresión por pasos (Stepwise regression) Remueve y agrega Remueve agreg a variables al al m mode odelo lo de regresió reg resión n con el propósito propó sito de d e identifica i dentificarr un un subconju subconjunt nto o útil de predictores. predi ctores. Se tienen tres tres procedimient procedi mientos: os: * Regresión Regresi ón estándar por pasos, agrega y remueve remueve variables. aria bles. * Regresión hacia delante (forward regression), agrega variables * Regresión hacia atrás (backward regression), remueve variables Cuando se selecciona el método Cuando método p por or pasos (stepwise), (stepwise), se puede introducir introdu cir un conju conjunt nto o inicia i niciall de variables predictoras predi ctoras en e n la la caja ca ja Predictors Predictor s in initial m odel, estas serán removid remov idas as si s i sus s us valores valores p son mayores mayores al a l valor valor A Alp lpha ha to enter e nter . Si se quieren quie ren manten mantener er en el modelo a pesar pe sar de ssus us valores valores P incluirlas inclu irlas en e n la la caja Predictor Predictors s to include in every model. m odel. 297
Cuando se seleccion seleccio na el método de regresi regresión ón h haci acia a ade adelan lante, te, Alpha pha to enter. se puede introducir el valor de Al
Cuando se seleccion seleccio na el método de regresi regresión ón h haci acia a atrás, se puede introducir el valor de Al Alpha pha to remove.
Ejemplo: Un grupo de estudiantes registra su peso, estatura, género, preferencia por fumar, nivel de ejercicio y pulso en reposo. Algunos Algun os de ell ellos os corren dur durant ante eu un n minu minuto, to, desp despu ués de lo cual todos se toman el pulso por segunda vez. Se desea encontr encon trar ar los mejores predi predictores ctores para la 2 2a. a. tasa de pul pulso. so. Pulse1
Pulse2
Ran
Smokes
Sex
Height
Weight
Activity
64
88
1
2
1
66
140
2
58
70
1
2
1
72
145
2
62
76
1
1
1
73.5
160
3
66
78
1
1
1
73
190
1
64
80
1
2
1
69
155
2
298
Instr nstrucciones ucciones d de e Mi Minitab: nitab: 1 File > Open worksheet > PULSE.MTW. 2 Pulsar [CTRL] + [M] para acti activ var la Session window . 3 Sel. Editor > Enable C Commands ommands para que Minitab muestre comandos. 4 Seleccionar Stat > Regression > Stepwise Stepw ise.. seleccio nar Pulse2 . 5 En Response, Response, seleccion 6 En Predictors, Predictors , seleccion seleccio nar Pulse1 Ran Weight . 7 Click Options Options.. p auses,, anotar 2 . 8 In Number of steps between pauses 9 Click OK en cada caja caja de diálogo. 10 En la Se Sessi ssion on window, en el 1er. More More? ? prompt, poner Yes . More? ? prompt, poner No . 11 En E n lla aS Sessi ession on w window, indow, en el 2do. More
299
Los resultados resultados se muestran a continuaci continuación: ón: Stepwise Regression: Pulse2 versus Pulse1, Ran, Alpha-to-Enter: 0.15
Alpha-to-Remove: 0.15
Response is Pulse2 on 6 predictors, with N = 92 Step
1
2
Constant
10.28
44.48
Pulse1
0.957
0.912
T-Value
7.42
9.74
P-Value
0.000
0.000
Ran
-19.1
T-Value
-9.05
P-Value
0.000
S
13.5
9.82
R-Sq
37.97
67.71
R-Sq(adj)
37.28
66.98
Mallows Cp
103.2
13.5 300
More?
(Yes,
SUBC>
yes
No,
Step
Subcommand,
or
Help)
or
Help)
3
Constant
42.62
Pulse1
0.812
T-Value
8.88
P-Value
0.000
Ran
-20.1
T-Value
-10.09
P-Value
0.000
Sex
7.8
T-Value
3.74
P-Value
0.000
S
9.18
R-Sq
72.14
R-Sq(adj)
71.19
Mallows
Cp
More?
(Yes,
SUBC>
no
1.9 No,
Subcommand,
301
Interpretación: El ejemplo utiliza seis predictores. Se pidio que Minitab realice dos etapas en el m método étodo de regresión por pasos automático, muestre los resultados y permita intervenir. En la primera etapa del modelo, la vvariab ariable le Pulse 1 se introduce al modelo; en el paso 2, entra la variable Ran, no se removió ninguna variable. En cada paso Minitab indica la constante, Coeficientes
y el valor valor T para cad cada a mode modelo, lo, desviació desviación n están estándar dar y R-sq (adj). Al dar Y Yes es en la segun segunda da etapa, el procedimient procedimiento o agrega la variable Sex, como ya no hay más variables que entren o salgan, sa lgan, el procedi procedimiento miento pregun pregunta ta de nu nuevo, evo, al constestar con No, No, se d detiene. etiene. 302
Regresión por mejores subconjuntos (Best subsets) Este método de regresión reg resión identifica los mjeores modelos de regresión regresió n qu que e pueden ser formados co con n las las variables predictoras que se especifiquen. Minitab in i nicia ici a p por or analiz analizar ar los modelos mode los de un predictor, y después los de dos do s predictores, predi ctores, etc. Solo muestra muestra dos de los mejores modelos en cada caso.
303
Ejemplo: Como parte de una prueba de energía térmica solar, se mide el calor total en Fluxes en las casas. Se desea examinar si este calor puede puede predecirse predeci rse por las variables variables de posici p osición ón de los Norte rte ; la Insulation y la hora. puntos focales en el Este; Sur y No Time Tim e of tthe he day . Heat Flu x
East
So u th
271.8
33.53
40.55
264
36.5
36.19
238.8
34.66
37.31
230.7
33.13
32.52
251.6
35.75
33.71
257.9
34.46
34.14
304
Instrucciones nstrucciones de d e Minitab: 1 Fil Filee > Open worksheet w orksheet > > EXH_REGR.MTW. 2 Seleccionar Stat > Regression > Best Subsets 3 En Response Response,, seleccionar HeatFlux . redictorss, seleccionar Insulation - Time . 4 En Free PPredictor Click OK en cada caja de diálogo.
305
Los resultados se muestran a continuación: Best Subsets Regression: HeatFlux vs Insolation, East, ... Response
is
HeatFlux
I
n
s
o
l
a
t i
E a
o o u r
o
s
t
t
n
t
h
h
Mallows Vars
R-Sq
R-Sq(adj)
Cp
S
1
72.1
71.0
38.5
12.328
1
39.4
37.1
112.7
18.154
2
85.9
84.8
9.1
8.9321
2
82.0
80.6
17.8
10.076
3
87.4
85.9
7.6
8.5978
3
86.5
84.9
9.7
8.9110
X
4
89.1
87.3
5.8
8.1698
X
4
88.0
86.0
8.2
8.5550
X
5
89.9
87.7
6.0
8.0390
X
S N
X X X
X X
X X X
X
X
X
X
X
X
X
X
X
X 306
Interpretación de resultados: Interpretación Cada Ca da línea línea represe represent nta a un modelo diferent di ferente. e. Va Vars rs es el nú número mero de variables predi p redictoras ctoras en el m mode odelo, lo, R R-Sq -Sq (adj) está en %. El modelo con co n ttoda odass las variables titiene ene u un n vvalor alor de C Cp p de Mallow de 6.0 (debe (de be se serr aprox. igual ig ual al n núm úmero ero de p predi redictores ctores más la constante), tiene una R-Sq(adj) de 87.7% y el menor valor de desviación estándar S (8.0390). Compite con el modelo de cuatro predictores (sin el timepo) tiene un valor de Cp de 5.8, una S uin poco mayor (8.16) y la R-Sq (adj) es ligeramente más baja (87.3%). En el modelo de tres predictores se observa que el agregar la varia variable ble E East ast no ayu ayuda da a all aju ajuste ste del mod modelo. elo.
307
Ejemplo de datos de autos: Estadística Estadí stica de coches:
Stat > Regression > Regression Response Velo.max Response Velo.max Predictors Nu Num.Cil, m.Cil, C Cil.(cc), il.(cc), Pot.(CV) Graphs: Graph s: Fou Fourr in On One e Re Residu sidual als s vers versu us variab variable les s Pot.(CV) Options: Prediction intervals for new observations 4 1124 100
308
Se obtienen o btienen los siguientes resul resultados: tados: Regres Regr essi sion on Ana Analy lysi sis: s: Vel Velo. o.ma max x ve vers rsus us Num Num.C .Cil il., ., Cil Cil.( .(cc cc), ), Pot Pot.( .( The regression equation is Velo.max = 157 - 5.72 Num.Cil. - 0.00218 Cil.(cc) + 0.521 Pot. 244 cases used, 3 cases contain missing values Predictor Coef SE Coef T P Constant 157.178 2.562 61.34 0.000 Num. Nu m.Ci Cil. l. -5.7 -5.717 177 7 0.98 0.9893 93 -5. -5. Si Significati gnificativo vo (P valu alue e < 0.05) Cil. Ci l.(c (cc) c) -0.0 -0.002 0217 178 8 0.00 0.0016 1610 10 -1. -1. No sign sig nificativo ifi cativo (Pvalu (Pvalue e > 0.05) Pot. Po t.(C (CV) V) 0.52 0.5209 092 2 0.01 0.0192 927 7 27. 27. Si Significati gnificativo vo (P valu alue e < 0.05) S = 9.76245 R-Sq = 89.1% Analysis of Variance Source DF SS Regression 3 187887 Residual Error 240 22873 Total 243 210760 Source Num.Cil. Cil.(cc) Pot.(CV)
DF 1 1 1
Seq SS 98419 19841 69627
R-Sq(a MS 62629 95
Coef. De determinación F 657.14
P 0.000
R residuos con más de 2 sigmas X residuos resi duos mu muyy alejados del grupo normal 309
R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large influence. Predicted Values for New Observations Obs
Fit
SE Fit
1
183.951
1.161
95% CI
95% PI
(181.663, 186.239)
(164.584, 203.318)
Values of Predictors for New Observations Obs
Num.Cil.
Cil.(cc)
Pot.(CV)
1
4.00
1124
100
310
Los residuos resi duos muestran un un comportamiento normal por lo que el modelo es adecuado
Residuall Plots ffor Residua or Velo. Velo.m max Norm ormal Pro Proba babi bili lity ty Plo Plott of the t he Residu sidua als
Residua iduals Versus rsus the Fitte itted dV Va alue lues
99.9
t n e c r e P
99
20
90
l a 0 u d i s e R -20
50 10 1
-40
0.1
-40
-20
0 Residual
20
150
40
Histo tog gramof th the e Residuals
200
250 Fitt Fitted ed Value
300
Residuals Versus th the Order o off th the e Data
80 20 60 y c n e u 40 q e r F 20
l a 0 u d i s e R -20 -40
0 -40
-30
-20
-10 0 Residual
10
20
1 20 40 60 80 100 120 140 160 180 200 220 240
Observation Order
311
Resid idualls sVersu susPot.( .(CV)
El comportamiento de los residuos vs Potencia Potencia sugiere que es necesaria una transformación de variables por ejemplo sacarle raíz cuadrada.
(respo (responseis isVelo.m Velo.max) 30 20 10 l 0 a u d -10 i s e R
-20 -30 -40 -50 0
100
200
300
400
500
Pot.(CV)
312
Transforman Tran sformando do la variable Pot.(CV) por Pot2 = rai raizz cu cuadrada adrada de Pot.(CV) se tiene: Regression Analysis: Velo.max vs Num.Cil., Cil.(cc),Pot2
The regression equation is Velo.max = 73.5-1.42 Num.Cil.-0.00699 Cil.(cc)+ 12.8 Pot2 Predictor Constant Num.Cil. Cil.(cc) Pot2
Coef 73.502 -1.4201 -0.006988 12.8232
S = 7.03547
SE Coef 2.258 0.6770 0.001202 0.3177
R-Sq = 94.4%
T 32.56 -2.10 -5.82 40.36
R-Sq(a
P 0.000 0.037 0.000 Sig Significati nificativo vo 0.000
(P vvalu alue e < 0.05)
Mejora el ajuste
Predicted Values for New Observations Obs
Fit SE Fit
95% CI
95% PI
1 1342.286 29.024 (1285.111, 1399.461) (1283.455, 1401.117)XX
XX denotes a point that is an extreme outlier in the pred Values of Predictors for New Observations Obs Num.Cil. Cil.(cc) Pot2 1 4.00 1124 100
313
Residual Plots for Velo.m Velo.max ax Norm ormal Proba Probabi billity Pl Plot ot of the Re Resi sidua dualls 99.9
Re Resi sidua dualls Vers Versus us the Fitted Val Value uess 20
99
t n e c r e P
90
l 0 a u d i e s R -20
50
10 1
-40
0.1
-40
-20
0
20
150
200 200
250
300
Residual
Fitted Value
Hist oog gram o f t h hee Residuals
Residuals Versus t he he Order o f t he he Dat a 20
40 y c n 30 e u q e 20 r F 10
l 0 a u d i s e R -20
-40 0
-30.0 -22.5 -15.0 -7.5
0.0
7.5
15.0
1
20
40
60
80 100 120 140 160 180 200 220 240
Observation Order
Residual
314
Los residuos residuos vs Pot2 ya tienen u un n mejor comportamient comportamiento o más a aleatorio: leatorio: Residu Resi dual als s Versus Pot2 (response is is Velo.m Velo.max) 20 10 0
l a u di
s -10 R
e
-20 -30 -40
5.0
7.5
10.0
12.5
15.0
17.5
20.0
22.5
Pot2
315
Selección Selecci ón de la mejor ecuac ecuación: ión: Best Subsets Permite obtener un "buen modelo" e en n fu función nción de su sencillez o faci facilidad lidad de interpretación. Stat > Regression > Stepwise
Variables candidatas a entrar en el modelo Variables Vari ables forzadas a entrar en llos os modelos
316
Mínimo numero de variables en el modelo 1 Máximo número Máximo número de d e variables en el modelo todas Número de ecuaciones Número ec uaciones que aparec aparecen en con 1, 2, 3.... Variables regresoras
317
Los resul resultados tados son so n los siguientes: Best Subsets Regression: Velo.max vs Num.Cil., Cil.(cc), ... Response is Velo.max 244 cases used, 3 cases contain missing values N C P
u i o
m l t
. . .
C ( ( P
i c C o
Mallows
l c V t
Vars
R-Sq
R-Sq(adj)
C-p
S
. ) ) 2
1
92.5
92.5
109.0
8.0 Buen Buenos os
1
86.6
86.5
385.3
10.813
2
94.3
94.2
29.3
7.0 Incluye ncluye sólo
2
93.6
93.6
58.0
7.4544
X X
3
94.8
94.8
3.9
6.7261
X X X
3
94.4
94.3
26.5
4
94.9
94.8
5.0
modelos X
Ci Cil.(cc) l.(cc) y Pot2
7.0 Incluye ncluye Num.Ci Num.Cil,l, Cil.(Cc), Ci l.(Cc), Pot2 P ot2 6.7269
X X X X 318
Selección de la mejor m ejor ecuac ecuaciión: Stepwise Stepwise Se usa cuan cuando do e ell n núm úmero ero de varia ariables bles es mu muy y gran grande de ma may yor a 31, antes da los mismos resul res ultados tados q que ue el m método étodo anterior: Variable de d e respuest respuesta a
Variables candidatas a entrar en lós modelos
319
Cri terio para la entrada y salida Criterio de variables El método implica que las las variables puedan ir entrando o saliendo. sali endo. Inic Inicia iando ndo con ninguna. ninguna. Las variables van entrando pero ya no no salen sa len Las variables van saliendo a partirr de tomar todas parti toda s y no no vuelven vuelven a entrar Permite mostrar en cada paso las mejores opciones además de la seleccionada y el número de pasos entre entre pausas.
320
Los resultados resultados obtenidos son los sigu sig uientes: Stepwise Regression: Velo.max versus Num.Cil., Cil.(cc), Pot.(CV), Pot2 Alpha-to-Enter: 0.15
Alpha-to-Remove: 0.15
Response is Velo.max on 4 predictors, with N = 244
N(cases wit with hm miss iss ing ob observat servation ions) s) = 3 N(all cases ) = 247 Step Constant
1
2
78.97
71.48
Variables que entran en cada 43 paso y su calidad de ajuste
Pot2
10.41
12.69
17.41
T-Value
54.66
40.50
18.33
P-Value Cil.(cc)
0.000
0.000 -0.00845
0.000 -0.00722
T-Value
-8.58
-7.48
P-Value
0.000
0.000
Pot.(CV)
-0.206
T-Value
-5.23
P-Value
0.000
S
8.08
7.08
6.73
R-Sq
92.51
94.26
94.85
R-Sq(adj)
92.48
94.21
94 Modelo adecuado
Mallows C-p
109.0
29.3
3.9 321
Contenido Parte C: 13. Series de tiempo 14. Diseño de experimentos factoriales 15. Estudios de R&R – Concordanci Concordancia a por atributos 16. Capacidad de procesos por atributos 17. Capacidad de procesos 18. Cartas de control control ponderadas ponderadas en el tiempo 323
13. Series de tiempo
324
Series de tiempo
• Introducción • Método de Tendencia lineal y cuadrática • Método de Promedio móvil • Método de Suavización exponencial simple • Método de Suavización exponencial doble • Método de Winters
325
INTRODUCCIÓN
Los métodos de análisis de series de tiempo consideran el hecho que los datos tomados en diversos periodos de tiempo pueden tener algunas características de autocorrelación, tendencia o estacionalidad que se debe tomar en cuenta. Definición de serie de tiempo: Es una secuencia ordenada de valores de una variable en intervalos de tiempo periódicos y consecutivos. Aplicación: la aplicación de estos métodos tiene dos propósitos: comprender las fuerzas de influencia en los datos y descubrir la estructura que produjo los datos observados. Ajustar el modelo y proceder a realizar pronósticos, monitoreo, retroalimentación y control en avance.
Las aplicaciones incluyen pronósticos económicos, análisis de presupuesto, análisis del mercado, etc. 326
Tendencias:
los datos muestran unalos tendencia, se Como puedenelajustar los del datos con algún tipo deSicurva o recta y modelar residuales. propósito ajuste es simplemente remover la tendencia a largo plazo, una línea recta es ssuficiente. uficiente.
327
Estacionalidad: son
fluctuaciones periódicas, por ejemplo cuando hay picos de ventas en la navidad y después declinan. La serie de tiempo de ventas mostrarán un incremento durante septiembre a diciembre y una declinación durante enero y febrero.
328
INDICADORES DE MODELOS DE SERIES DE TIEMPO
Estos indicadores sirven para comparar la efectividad de diferentes modelos utilizados. Siempre se busca el valor menor en los indicadores MAPE, MAD y MSD ya que representa un mejor ajuste del modelo.
MAPE: Porcentaje
promedio absoluto de error, mide la exactitud de los valores estimados de la serie de tiempo. La exactitud se expresa como un porcentaje con yt igual al valor observado, yt es el valor estimado y n el número de ˆ
observaciones.
329
MAD: Desviación
media absoluta, mide la exactitud de los valores estimados de la serie de tiempo. Expresa la exactitud en las mismas unidades de los datos.
MSD:
Desviación cuadrática media, es más sensible a errores anormales de pronóstico que el MAD.
330
MÉTODOS DE PRONÓSTICO Los métodos de series de tiempo incluyen métodos de pronóstico y de suavizamiento simples, métodos de análisis de correlación y métodos de Box Jenkins ARIMA.
Métodos de pronóstico y suavizamiento simple: se basan en la idea de que hay patrones visibles en una gráfica de series de tiempo que pueden ser extrapolados al futuro. El método se selecciona dependiendo de si los patrones son estáticos (constantes en el tiempo) o dinámicos (cambian en el tiempo), la naturaleza de los componentes de tendencia y estacionalidad y que tan lejos se quiera pronosticar, son métodos generalmente fáciles y rápidos de aplicar.
331
Métodos de pronóstico ARIMA (Autoregressive Integrated Moving Average): Average): también usan patrones de datos, sin embargo puede que no sean fácilmente visibles en la serie de tiempo. El modelo usa funciones de diferencias, autocorrelación y autocorrelación parcial para ayudar a identificar un modelo aceptable. El modelo ARIMA representa una serie de pasos de filtraje hasta que solo queda ruido aleatorio. Es un proceso iterativo que consume tiempo de ejecución.
332
Por ejemplo: Se colectan datos de empleo en un sector de negocios durante 60 meses y se desea predecir la tasa de empleo para los siguientes 12 meses, EMPLOY.MTW. Trade 322 317 319 323 327
Food 53.5 53 53.2 52.5 53.4
Metals 44.2 44.3 44.4 43.4 42.8
Trade 351 354 355 357 362
Food 63.6 68.8 68.9 60.1 55.6
Metals 44.5 45 44.8 44.9 45.2
Etc.
Etc.
Etc.
Etc.
Etc.
Etc.
333
MÉTODO DE TENDENCIA LINEAL Las instrucciones de Minitab son las siguientes: 1 File > Open Worksheet > EMPLOY.MTW. 2 Ejecutar Stat > Time Series > Trend Analysis . 3 En Variable, poner Trade. 4 En Model Type, seleccionar Linear 5 Seleccionar Generate forecasts y poner 12 en Number of forecasts. 6 Seleccionar Storage . 7 Seleccionar Fits (Trend Line) , Residuals (detrended data), y Forecasts. Seleccionar OK en cada diálogo.
334
Trend Analysis Analysis Plot P lot for Trade Linear Trend Model Yt = 313.989 + 1.16485*t 400 390 380 370 e d 360 a r T
350 340
Variable Ac tual Fits Forecasts Ac cur acy Measures M A PE PE 1.8999 MA D 6.6177 MS SD D 67. 43 4325
Forecasts Period Forecast 61 385.045 62 386.209 63 387.374 64 388.539 65 389.704 66 390.869 67 68
392.034 393.199
69 70 71 72
330 320 310 1
7
14
21
28
35 42 Index
49
56
63
70
MAPE MAD MSD
394.363 395.528 396.693 397.858
1.8999 6.6177 67.4325 335
MODELO CUADRÁTICO 1 Open Worksheet W orksheet EMPLOY.MT EMPLOY.MTW. W. 2 Ejecutar Stat > Time Series > Trend Analysis. 3 En Variable, poner Trade. 4 En Model Type, seleccionar Quadratic. 5 Seleccionar Generate forecasts y poner 12 en Number of forecasts. 6 Seleccionar Storage . 7 Seleccionar Fits (Trend Line) , Residuals (detrended data), y Forecasts. Seleccionar OK en cada diálogo.
336
Trend Analysis Analysis Plot for Trade Tr ade Quadratic Trend Model Yt = 320.762 320.762 + 0.50937 0.509373*t 3*t + 0.0107456*t** 0.0107456*t** 2 410 400 390 380 e d
370
Variable Ac tual Fits Forecasts Ac cur acy Measures MAPE MAP E 1.70 .7076 M AD AD 5.9566 MS MSD D 59.13 .1305
Forecasts Period Forecast 61 391.818 62 393.649 63 395.502 64 397.376 65 399.271 66 401.188
a r T
360 350 340 330 320 1
7
14
21
28
35 42 Index
49
56
63
70
67 68 69 70 71 72
403.127 405.087 407.068 409.071 411.096 413.142
MAPE 1.7076 MAD 5.9566 MSD 59.1305 337
PROMEDIO MÓVIL
Suaviza los datos al promediar observaciones consecutivas en la serie Este método es adecuado cuando no hay componente de tendencia ni de tiempo. estacionalidad Se calcula el promedio móvil de la serie. Por ejemplo si se tienen los números 4, 5, 8, 9, 10 y se usa un promedio móvil de 3. Los primeros dos valores no existen. El tercer valor es el promedio de 4, 5, y 8; el cuarto valor es el promedio de 5, 8, y 9; el quinto valor es el promedio de 8, 9, y10
338
Ejemplo: Se desea predecir el empleo durante los próximos 6 meses en el segmento de metales con los datos de los últimos ú ltimos 60 meses. Se usa el método de promedio pr omedio
móvil si no se tienen patrones bien definidos de tendencia o estacionalidad en los datos. 1 File > Open worksheet EMPLOY.MTW. 2 Seleccionar Stat > Time Series > Moving Average Average.. length, poner 3. 3 En Variable, Variable, seleccionar Metals. En MA length, 4 Seleccionar Center the moving averages. averages. forecasts. Click 5 Seleccionar Generate forecasts, forecasts, y poner 6 en Number of forecasts. OK OK..
339
Moving Average Average Plot Pl ot for Metals
Forecasts
52
Variable
50
Ac tual Fits Forecasts 95.0% PI Moving Av era erage ge Le Lengt ngth h 3
48 s l a t 46 e M
Ac curacy MAPE MAD MS MSD D
Measures Measures 1.5 .55 5036 0.70292 0.76433
44
42
Period
Forecast
61
49.2
62
49.2
63
49.2
64
49.2
65
49.2
66
49.2
40 1
7
14
21
MAPE MAD MSD
28
35 Index
42
49
56
63
1.55036 0.70292 0.76433 340
MÉTODOS DE SUAVIZA SUAVIZACIÓN CIÓN EXPONENCIAL SIMPLE
Se aplica cuando solo si se tiene un comportamiento de la serie de tiempo sin tendencia o estacionalidad. El componente simple dinámico en un modelo de promedio móvil es el nivel. Peso especificado 1. Se usa el promedio de los primeros seis (o N si N Open worksheet EMPLOY.MTW. worksheet EMPLOY.MTW. Seleccionar Stat > Time Series > Single Exp Smoothing. Smoothing . Variable,, poner Metals. En Variable Seleccionar Generate forecasts, forecasts, y 6 en en Number of forecasts. forecasts. Click OK OK..
Los resultados se muestran a continuación: Single Exponential Smoothing for Metals Data
Metals
Length
60
Smoothing Constant Alpha
1.04170
342
Single Exponential Smoothing Plot for Metals 52
Variable Ac tual Fits Forecasts 95.0% PI
50
Smoothing C onsta onstant nt Alp ha 1.04170 1.04170
48
A ccur acy MAPE MAD MSD MSD
l s a t 46 e M
44
Measures 1.1 .11 164 648 8 0.5 .50 0427 0.4 .42 2956
Forecasts Period Forecast 61 48.0560 62 48.0560 63 64 65 66
48.0560 48.0560 48.0560 48.0560
42
40 1
7
MAPE MAD MSD
14
21
28
35 Index
42
49
56
63
1.11648 0.50427 0.42956 343
SUAVIZAMIENTO EXPONENCIAL EXPONENCIAL DOBLE (HOLT) Se aplica cuando en la serie de tiempo se presenta una tendencia ascendente o descendente pero sin estacionalidad.
Pesos especificados 1. Se hace una regresión lineal en los datos de la serie (Y) contra el tiempo (X). 2. La constante de esta regresión es el valor inicial estimado del componente de nivel, el coeficiente de la pendiente es el estimado inicial del componente de
tendencia. Pronósticos: el método de suavizamiento exponencial doble usa los componentes de nivel y de tendencia para generar los pronósticos.
344
Por ejemplo: File > Open worksheet EMPLOY.MTW. Seleccionar Stat > Time Series > Double Exp Smoothing. En Variable, poner Metals.
1 2 3
4 Seleccionar en Number of forecasts. Generate forecasts, y 6 en Click OK. OK. Los resultados se muestran a continuación:
Double Exponential Smoothing for Metals Data
Metals
Length
60
Smoothing Constants Alpha (level) Gamma (trend)
1.03840 0.02997 345
Double Exponential Smoothing Plot for Metals 54
Variable Ac tual Fits Forecasts 95.0% PI
52 50
Smoothing C onstants onstants Alp ha (level) 1.0 1.0384 3840 0 Gamma Gam ma (t (trend) rend) 0. 0.02 0299 997 7
s 48 l a t e M 46
Ac cur acy MAPE MAD MS MSD D
44 42 40 1
7
MAPE MAD
14
21
28
35 Index
1.19684 0.54058
42
49
56
63
Measures 1.1 .19 9684 0.5 .54 4058 0.4 .46 6794
Forecasts Period Forecast 61 48.0961 62 48.1357 63 48.1752 64 48.2147 65 66
48.2542 48.2937
MSD
0.46794 346
MÉTODO DE WINTERS Se aplica cuando en la serie de tiempo se presentan los patrones de tendencia y estacionalidad. Suaviza los datos por el método exponencial de Holt – Winters. Se recomienda este método cuando se tienen presentes los componentes de tendencia y estacionalidad ya sea en forma aditiva o multiplicativa.
El efecto multiplicativo se presenta cuando el patrón estacional en los datos depende del tamaño de los datos o sea cuando la magnitud del patrón estacional se incrementa conforme los valores aumentan y decrece de crece cuando los valores de los datos disminuyen. El efecto aditivo es mejor cuando el patrón estacional en los datos no depende del valor de los datos, o sea que el patrón estacional no cambia conforme la serie se incrementa o disminuye de valor. 347
El método de Winters calcula los estimados de de tres componentes: nivel, tendencia y estacionalidad. Calcula estimados dinámicos con ecuaciones para los tres componentes: nivel, tendencia y estacionalidad. Estas ecuaciones dan una mayor ponderación a observaciones recientes y menos peso a observaciones pasadas, las ponderaciones decrecen geométricamente a una tasa constante. La ponderación seleccionada para Nivel, tendencia y estacionalidad es de 0.2 si se quiere hacer una correspondencia con el modelo ARIMA u otros valores entre 0 y 1 para reducir los los errores de estimación.
348
Ejemplo de pronósticos utilizando el Método de Winters W inters Se desea predecir el empleo para los siguientes seis meses en la industria alimenticia usando datos colectados sobre los últimos 60 meses, usando el método de Winters con el modelo multiplicativo, dado que hay componente estacional y de tendencia aparente en los datos. Instrucciones de Minitab 1 File > File > Open Worksheet > EMPLOY.MTW. 2 Ejecutar Stat > Time Series > Winters' Method. Method . 3 En Variable, Variable, poner Food . In Seasonal length, length, 12 . Type,, seleccionar Multiplicative. Multiplicative. 4 En Model Type 5 Seleccionar Generate forecasts poner 6 en Number of forecasts. forecasts. Seleccionar OK. OK.
349
Winters' Method Plot for Food
Multiplicative Method 75
70
d o o F
65
60
55
Variable Ac tual Fits Forecasts 95.0% PI Smoothing C onstants onstants Alph a (level) (level) 0.2 Gam Gamma (tre (trend) nd) 0.2 Del Delta ta (sea (seassonal onal)) 0.2 Ac curacy Meas Measures ures MAPE 1.8 .88 8377 MAD 1.1 .12 2068 MS MSD D
2.8 .86 6696
Period Forecast 61 57.8102 62 57.3892 63 57.8332 64 57.9307 65 58.8311 66 62.7415
50 1
7
14
21
28
35
42
49
56
63
Index
Smoothi Smoo thing ng Con Consta stants nts Alpha (level) 0.2 Gamma (trend) 0.2 Delta (seasonal) 0.2
MAPE 1.88377 MAD 1.12068 MSD 2.86696 350
14. Diseños de experimentos
351
Diseño de experimentos
• Introducción • Diseños de experimentos 2K
• Diseños de experimentos factoriales completos
352
Introducción
353
Diseño de experimentos factoriales •
Es una prueba o serie de pruebas donde se inducen cambios deliberados en las variables de entrada de un proceso, para observar su influencia en la variable de salida o respuesta
Entradas
Salidas (Y)
Proceso
Entradas
Salidas (Y)
Diseño de Producto
354
y Número de niveles
•
En Dos Nivel Niveles es nos perm permite ite considerar únicamente los efectos lineares. 1
2 2 Niveles
y
•
En Tres Tres Niveles Niveles hay la necesidad necesidad de ejecutar másbuscar pruebas, sin embargo, nos permite la curvatura, es decir,, los efectos cuadráticos. decir 1
2
3
3 Niveles 355
Pas Pa sos de del DO DOE - genera neralles • Establecer objetivos
• Seleccionar variables del proceso • Seleccionar un diseño experimental • Ejecutar el diseño • Asegurar que los datos sean co consistentes nsistentes con con los supuestos • Analizar e interpretar interpretar los resulta resultados dos • Usar / presentar los resultados (pueden orientar a corridas futuras) 356
Pas Pa sos del del DOE DOE - deta detalllad lado • Proceso en control, evaluar capacidad • Deter Determina minarr CTQ objetivo objetivo a me mejorar jorar • Definir como medir la variable de respuesta • Determinar los factores de influencia • Determinar los niveles de experimentación
357
Pasos del DOE – DOE – detallado… detallado… • Seleccionar diseño experimental a utilizar • Verificar el error R&R del sistema de medición • Planear y asignar recursos a los experimentos experimentos • Realizar los experimentos • Medir las unidades experimentales
358
Pas Pa sos del del DOE DOE - deta detalllad lado • De resultados identificar factores significativos • Determinar la mejor combinación de niveles de factores para lograr los objetivos • Correr un experimento de confirmación • Establecer controles para mantener la solución • Re evaluar la capacidad del proceso 359
Tipos de Experimen Experimentos tos Tipos Comunes
Número Típico de
de Experimentos 1. Facto ctoria rial Compl mpleto
Objetivos
Factores Controlables
• Encontrar los niveles de
(todas las combinaciones de factores y niveles)
factor que proporcionan los mejores resultados. • Construir un modelo matemático (evalúa todas las interacciones).
4 o menos
• Encontrar los niveles de
2. Fracc racciional Fa Fact cto oria rial (subgrupo del número total de combinaciones)
factor que proporcionan los mejores resultados. • Construir un modelo matemático (evalúa todas las interacciones).
5 o más
3. Examen
• encntra Probar rmuchos factores para encntrar los po pocos cos vi vitales. tales.
7 o más
(no evalúa interacciones). 360
Tipos de Experimentos (continuación) Tipos Comunes de Experimentos 4. •
Diseñ eño o Central Compuesto o Box-Behnken
5.
Diseño R Ro obusto
Objetivos • •
•
•
6.
Diseñ eño o Robusto Dinámico de Taguchi (Función Ideal)
Número Típico de Factores Controlables
Optimizar Construir un modelo matemático cuando no haya efectos lineales (Superficie de respuesta).
Optimizar Para encontrar los niveles de factores a fin de reducir al mínimo la variación ante factores de ruido cambiantes. • •
•
Optimizar Optimizar la función de un producto o proceso de manufactura. Reducir al mínimo la sensibilidad al ruido y aumentar al máximo la sensibilidad a la señal de entrada.
3 o menos
5 o más
7 o más
361
Los Factores Pueden Afectar... 1. La Variación del Resultado Tiempo de Ciclo Largo
3. La Variación y el Promedio Temp Alta Temp Baja
Tiempo de Ciclo Corto
Dimensión de la Parte
2. El Resultado Promedio Presión de Sujeción Baja
Dimensión de la Parte
4. Ni la Variación ni el Promedio Presión de Sujeción Alta
Dimensión de la Parte
Ambos materiales materiales producen el mismo resultado
Dimensión de la Parte
362
Estrategia cuando el “ Val Valor or Me Meta ta es Me Mejor jor” Paso Pa so 1: Encu Encuent entra ra los los facto factores res que que afectan afec tan la variac variación. ión. Usa Usa estos factores facto res para para reducir reducir al mínimo mínimo la variación. Paso Pa so 2: 2: Encue Encuentr ntra a los los facto factores res que que desplazan el promedio (y no afect afe ctan an la varia variació ción). n). Usa Usa estos estos factores para ajustar la salida promedio con la meta deseada.
Meta
363
Estrategia cuando el Valor Mínim Mínimo o es M Mejor ejor” “ Tendencia de salida baja
0
• El objetivo en este caso es encontrar los factores que
afectan la sal afectan salida ida pro promed medio io (tiem (tiempo). po). Usa es estos tos fac factore toress para hacer que la tendencia del promedio sea baja. se reduce la variación en la salida salida al mínimo, • Cuando se también se mejora salida al los factores que contribuyen en granlamedida a detectar la variación.
364
Diseños de experimentos experimentos 2K
365
Diseños factoriales de dos niveles El número de combinaciones de prueba para un factorial completo con factores k, cada uno en dos niveles es:
n
k 2
Por lo tanto, a estos diseños se les conoce como diseños .
k 2
366
Diseño factorial completo 2K ALTO ALTO
Representación ció n Gr Gráfi áfica ca
B
B
ALTO BAJO
BAJO
C
A ALTO
BAJO
A
Factor
BAJO
BAJO
ALTO
Prueba A
Representación Tabular
1 2 3 4
A
B
+ +
+ +
1 2 3 4 5 6 7 8
+ + + +
B
C
+ + + +
+ + + + 367
Diseño factorial completo 2K Niveles Factores Velocidad (seg.)
Bajo 350
Alto 400
Tiempo
1min.
2min.
Todas las combinaci combinaciones ones Velocidad C or r ida 1: C or r ida 2: C or r ida 3: C or r ida 4:
350 350 400 400
Tiempo 1min. 2min. 1min. 2min.
368
Experim Exp eriment ento o facto factorial rial com complet pleto o – sin interacción
Un experimento factorial completo es un experimento donde se prueban todas todas las po posibles sibles combin combinaciones aciones de los niveles de todos todos los
factores. Factor A : -1
+1
+1
30
52
-1
20
40
Factor B :
Y = Respuesta B+1
Efecto del factor A = (52+40)/2 - (30+20)/2 = 21 Efecto del factor B = (3 (30+52)/2 0+52)/2 - (20+40)/2 = 11 Efecto de A*B = (52+20)/2 – (30+40)/2 =1
B-1 A -1 -1 +1
369
Experimento Experiment o sin interacción B = +1
30
52 Respuesta Promedio
B = -1
40
20
A = -1
A = +1 370
Experimento Experiment o sin interacción
Respuesta
52 40 30 20 A = -1
A = +1
371
Modelo de regresión lineal y
b 0
b1 x1
b 2 x2
b 12 x1 x2
b 0
( 20 40 30 52) / 4
b 1
21 / 2
11
11 / 2
5.5
ˆ
ˆ
b 2 ˆ
35. 5
ˆ
b 12 1 / 2 0.5 35.5 10.5 x1 y ˆ
5.5 x2
0.5 x1 x2
coeficiente e 0.5 es muy pequeño El coeficient dado que no hay interacción 372
Gráfica de contornos
Dirección
De ascenso rápido
Experimentos sin interacción 1
49 46 40
.5
X2
34 0
28 22
-.5 -1
-1 -.6
-.4 -.2 0.0 +.2 +.4 +.6 +.8
+1
X1 373
Superficie de respuesta Experimentos sin interacción Y = respuesta
Superficie de respuesta Gráfica del modelo de regresión
X1 X2
Experim Exp eriment ento o facto factorial rial com complet pleto o – con interacción
Un experimento factorial completo es un experimento donde se prueban todas las posibles combinacio combinaciones nes de los niveles niveles de todos los factores. Factor A : -1
+1
+1
40
12
-1
20
50
Factor B :
Y = Respuesta B+1
Efecto de A*B = {(12+20)-(40+50) {(12+20)-(40+50)}/2 }/2 = -29
B-1 A -1 +1 375
Interacción de dos factores Sin interacción Interacción Interacción Interacción moderada
fuerte
fuerte
Factoriales completos vs fraccionales
376
Experimento Experimen to con interacción B = +1
40
12
Respuesta Promedio 50
20
B = -1
A = -1
A = +1 377
y
Modelo de regresión lineal b 0 b1 x1 b 2 x2 b 12 x1 x2
b 0
( 20 40 30 52) / 4
b 1
2/2
ˆ
ˆ
1
ˆ
b 2 18 / 2 9 b 12 58 / 2 29 ˆ
y ˆ
30.5 1x1
9 x2
29 x1 x2
30.5
El coeficiente -29 es muy grande representando representando la interac interacción ción
379
Dirección De ascenso rápido
Gráfica de contornos
1
49 25
43
.5
40
X2
31 0
34
28
-.5 -1
X1
-1 -.6
-.4 -.2 0.0 +.2 +.4 +.6 +.8
+1 380
Superficie de respuesta Experimentos con interacción
Superficie de respuesta
Gráfica del modelo de regresión
381
Tabla ANOVA – – Experimento de Tratamiento Térmico Origen
DF
SS Sec
SS Aj
MS Aj
F
P
Temp
1
162.000
162.00
162.00
46.29
0.002
Tiempo
1
2.000
2.000
2.000
0.57
0.492
Temp* Tiempo
1
72.000
72.000
72.000
20.57
0.011
Error
4
14.000
Total
7
250.000
14.000
3.500
La Temperatura es significativ significativa. a. El Tiempo, por sí sol solo, o, n no o es significativo. El Tiempo, en combinación con la Temperatura, es significativ significativa. a.
382
Modelo de regresión
383
Gráficas factoriales de efectos principales e interacciones Main Effects Plot (data means) for Res
Interaction Plot (data means) for Res - 1
1
- 1
1
90
A -1 1
88 s e R
86
90 84
n a e M 85
82 A
B
80
-1
1
B
384
Gráficas de contornos y de superficie de respuesta Contour Plot of Res 1
82.5 85.0
87.5 90.0 92.5
B
Surface Plot of Res
0
95
90
-1
Res Re s -1
0
A
85
1 1
80 0 -1
A
B
-1
0 1
385
Ejemplo: En el diseñ dise ño de una pá pági gin na Web se d desea esea max maximi imizzar el n nú úmero Y (miles) de visitas visi tas a la mi misma. sma. Para lo cual se realiza u un n diseño de ex e xperi perimen mentos tos de tres factores con co n dos niveles y dos rép réplicas licas.. Factor Nivel bajo Nivel Alto A. Colores 8 12 B. Intensidad 230 2 40 C. Velocidad de carga 0.6 1 Co mo respuesta se toma el niv Como nivel el de visitas visi tas en u un na escala esc ala de 0 a 30 entre ent re may mayor or sea mejor calida calidad d
386
Paso 1. Generar diseño Stat > DOE > Factorial > Create Factorial Design Sel. 2-Level factorial (default generators); Number of o f factors factors 3
Designs: S Seleccion eleccionar ar Full Full Factor Factor Replicates 2 Blocks 1 Factors: Co Colores lores 8 12 Inten tensid sidad ad 230 240 Veloci Velocidad dad 0.6 1 Options: Qu Quitar itar b bandera andera de Randomize runs OK Puede colocar la matriz del diseño di seño en orden al aleatorio eatorio o es están tándar dar con Stat > DOE > Display Design : Estándar order for design Para cambiar de unidades sin codificar a un unidades idades codificadas: Stat > DOE > Display Design : Coded o Uncoded Units
387
Pas Paso o 2. Introducir los resultado resultados s experim expe rimentales: entales: R un O Orrder Colores Intensidad V Ve elocidad 1 8 230 0.6 2 12 230 0.6 3 8 240 0.6 4 12 240 0.6 5 8 230 1 6 12 230 1 7 8 240 1 8
12
240
1
Y 10 26.5 15 17.5 11.5 26 17.5
8 28 13 19 10 25 19
20
18
388
Paso 3. Anal Analizar izar el diseño
Stat > DOE > Factorial > Analyz Analyze e Factorial Design Des ign Response Y Response Y Graphs: Seleccionar Effects plots Normal Pareto Pareto Alph Alpha a = 0.05 Residual for Plots Standardized Seleccionar Normal Plot y Resi Residuals duals vs vs Fits Fits Results Selecci Seleccionar onar ttodos odos los términ términos os co con n >> OK OK
389
Los result re sultados ados se muestran a continuación. Pareto Chart of the Standardized Effects
(response is Y, Alpha = .05) 2.31 Factor Factor A B C
A
Name C olores In ntte ns nsi da da d V el elocidad
AB AC
m r e T
C Normal Plot of the Standardized Effects
BC
(response is Y, Alpha = .05) 99
B
Effect Type Not Significant Significant
95
ABC 0
2
4
6
8
10
12
14
16
18
Fact Factor or A B C
A
90 80
Standardized Effect
70 t n 60 e c 50 r e 40
Los factores e interacciones significativas significati vas pasan la raya roja roja
P
30 AC
20 10
AB
5 1
-10
-5
0
5
10
15
20
Standardized Effect
390
Nam e C olores In ntte n nss id ad ad V el elocidad
Los términos significati signifi cativvos tienen un P vvalue alue DOE > Factorial Plots Sel. Main Sel. Main Effects Plot: Setup: Respo Response nse Y; Pasar factores factores con con >> Sel. I Sel. Int nteracti eraction on Plot: Setu Se tup: p: Respo Response nse Y; Y; Pasar factores con >> con >> Sel. Cube Sel. Cube Plot: SetUp >> Response Y; Y; Pasar Pasar con >> OK Main Effects Plot for Y Data Means Intensidad
Colores 22 20 18 16 14 n a e M
8
12 Ve locidad locidad
22 20 18 16 14 0.6
1.0
230
240
394
Las in i nteracciones significativas si gnificativas son A*B y A*C Los mejores niveles niveles de operació op eración n son: son: A = 8, B = 230 23 0 y C = 0.6 Colores Col ores = 12
395
El cubo muestra muestra las d diiferent ferentes es Y Y's 's - L La a mejor combi combin nación aci ón es: Cube Plot (data means) for Y 18.25
14.00
19.00
18.25
240
Intensidad
10.75
25.50 1 Velo Ve loci cidad dad
9.00
27.25
230
0.6 8
12 Colores
396
Paso 5. Gráfi Gráficas cas de contornos y de superficie superficie de respuesta Stat > DOE > Contour / Surface P Plots lots Sel. Contou Sel. Contourr Plot: Se Setu tup: p: Respo Response nse Y; Y; Sel. gener. gene r. plots plots for all pair of num. Factors Fac tors Sel. Sur Sel. Surface face Plot: Setup: Resp. Y; Y; Sel. gener. gene r. plots plots for all pair of num. Factors Fac tors OK
Contour Plots of Y Intensidad*Colores
24 240 0
Velocidad*C Vel ocidad*C olores
1. 1.0 0
Y < 10.0 10.0 – 12.5 12.5 – 15.0 15.0 – 17.5 17.5 – 20.0 20.0 – 22.5 22.5 – 25.0 > 25.0
0. 0.9 9
23 237 7
0. 0.8 8 23 234 4 0. 0.7 7 23 231 1 0. 0.6 6 8 1.0 1.0
9
10
11
Velocidad*Intensi Vel ocidad*Intensidad dad
12
8
9
10
11
12
Hold Values C olores 8 In Inttens nsiidad dad 230 Velocidad Vel ocidad
0.9 0.9 0.8 0.8
0.6 0.6
397
0.7 0.7 0.6 0.6 23 231 1
23 234 4
23 237 7
24 240 0
Las flechas mu muestran lla a di direcci rección ón de experiment experimentaci ación ón fu futu tura ra para mejores resultados 398
Gráficas Gr áficas de superf superfici icie e de respu respuesta esta 399
Paso 6. Ampliación Ampliación de la respuesta en la zona z ona de Y = 21 a 24 Stat > DOE > Factorial > Overlaid Contour Plot Seleccionar Response Y Response Y con con > Seleccionar Selecci onar en Setti Settings ngs Hold Extra E xtra factors factors Probar con High y Middle settings Seleccionar Selecci onar en Contours Low 21 21 High 26 Contours Low
Factors X:Axis X:Axis A:Colores Y:Axis Y:Axis B:Intensidad OK
400
Contourr P Contou Plot lot of Y 240.0
Y 21 24
238.5
Hold Values Velocid ad 1
237.0 d a d i 235.5 s n e t n 234.0 I
232.5 231.0 8
9
10 Colores
11
12
401
Paso 7. Obtener una respuesta optimizad optimizadaa F actorial > Response Opti Stat > DOE > Factorial Optimizer mizer
Seleccionar Seleccio nar en Response Response Y Seleccio Seleccionar nar :Colores 10 Intensidad 10 0.8 Seleccionar Seleccio nar en en Options Set up: Goal Maximize Lower 21 21 235 TargetVelocidad 26 OK
402
Sel.y mover las líneas de cada factor hasta obtener el máximo nivel de servicio: Optimal High D Cur 1.0000 Lo Low w
Colores 12.0 [1 2.0] 8.0
Intensid 240.0 [2 30.0] 230.0
Velocida [01.0 .60] 0.60
Composite Desirability 1.0000
Y Maximum y = 27.2500 d = 1.0000
403
Diseños de experimentos experimentos Factoriales completos
404
Diseño de exper ex periment imentos os factoriales factoriales comp complet letos os de tres niveles Se estudia el nivel de servici servicio o de una su sucursal cursal (Y (Y), ), donde se p pie ien nsa que los factores que mayor infl influen uencia cia tienen son la v veloci elocidad dad y el tiempo de espera en ffilas. ilas. Se di diseña seña u un n ex experi periment mento o factoria factoriall completo con dos réplic réplicas as y tres niveles niveles en cada factor como s se e muestra en lla a tabla siguient si guiente. e. Considerar Cons iderar un 5% de nive nivell de significanc significancia ia o 95% de niv nivel el de confianza.
Ti Tiem emp po de es pera en fil fila a (s eg eg.) .) V elocid elocida ad (s eg eg.) .) 150 160 170
200 90.4 90.2 90.1 90.3 90.5 90.7
215 9 0.7 90.6 90.5 90.6 90.8 90.9
230 9 0.2 90.4 89.9 90.1 90.4 90.1 405
PASO 1. GENERAR GENER AR EL DISEÑO D ISEÑO FACTORIAL FACTORIAL Stat > DOE > Factorial > Create Factorial Design seleccionar Type of Design D esign:: Gene General ral Full Ful l Factorial Factorial Design Number factors 2 Nu mber of factors Nu mber of Levels Factor or Number Levels 3 Designs: Fact Factor orAB Name Name Nam eVelocidad Tiempo Fact Nu Number mber of of Replicates 2
Options Quitar bandera ban dera de randomize runs Introducir roducir los niveles niv eles para para Velocidad 200 215 230 Factors Int
Tiempo 150 160 170 OK
406
PASO 2. CARGA PASO CARGA DE DAT DATOS OS DE LA COLUMNA COLUMNA DE RESPUEST DESPUÉS DESPU ÉS DE GENERAR EL DISEÑO O A ARREGLO RREGLO
S tdOrder 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
P tType 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
B locks 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Copiar columna de datos V eloci dad Ti empo Ni vel_S erv 2 00 150 90.4 2 00 160 90.1 2 00 170 90.5 2 15 150 90.7 2 15 160 90.5 2 15 170 90.8 2 30 150 90.2 2 30 160 89.9 2 30 170 90.4 2 00 150 90.2 2 00 160 90.3 2 00 170 90.7 2 15 150 90.6 2 15 160 90.6 2 15 170 90.9 2 30 150 90.4 2 30 160 90.1 2 30 170 90.1 407
PASO 3. A ANALIZ NALIZAR AR EL DISEÑO DISEÑO DE EXPERIMENT EXPERIMENTO OS Stat > DOE > Factorial > Analyze Factorial Design Response Seleccionar Nivel_Serv Terms Pasar todos los térm térm inos a Selected Sel ected con >> >> OK Graphs Graphs
Residuals for Plots Estandardized Residuals Seleccionar Residual plots: Normal y vs fits OK
Results
C ovariate, Unusua Unusuall observations ANOVA ANO VA table, Covariate,
Seleccionar Selecci onar todos los l os térmi términos nos con >> OK
OK Cálculo de res residuales iduales
Y(i,j) estimada= estimada= Promedio de de valores valores en cada ccelda elda (i (i,j) ,j) Residuales o error e(i,j) = Y(i,j) real observada - Y (i,j) estimada 408
Los residuales resi duales vversus ersus Y esti estimada mada son aleatorios con m medi edia a cero Versus Versu sF Fits its (respon (response se is Niv el_Serv )
l
2
a u di s
1
e R d e
0
zi d r
a -1 d n at
S -2 90.0
90.1
90.2
90.3
90.4 90.5 Fitted Value
90.6
90.7
90.8
90.9
Normal Probability Plot (respon (response se is Niv el_Serv ) 99 90
t n e
c 50 r e P 10 1 -3
-2
-1
0 Standardized Residual
1
2
3
Los resi residuales duales se d dis istribuy tribuyen en n normalm ormalment ente e (ape (apego go a la lílín nea rec recta) ta)
409
Multilevel Multilev el Factori Factorial al De Desig sign n Factors: 2 Replicates: 2 Base runs: 9 Total runs: 18 Base blocks: 1 Total blocks: 1 Number of levels: 3, 3 General Linear Model: Nivel_Serv vs Velocidad, Tiempo Factor Temp Presion
Type fixed fixed
Levels 3 3
Values 200, 215, 230 150, 160, 170
Analysis of Variance for Nivel_Serv, with Adjusted SS for T
Significativos a nivel de 0.05 Source
DF
Seq SS
Adj SS
Adj MS
F
P
Velocidad
2
0.76778
0.76778
0.38389 21.59 0.000
Tiempo
2
0.30111
0.30111
0.15056
8.47 0.009
Velocidad*Tiempo Velocidad*T iempo
4
0.06889
0.06889
0.01722
0.97 0.470
Error
9
0.16000
0.16000
0.01778
Total
17
1.29778
No significativo a nivel 0.05 S = 0.133333
R-Sq = 87.67%
R-Sq(adj) = 76.71% 410
PASO 4. GRÁFICAS GRÁFICAS FACTORIALES P PARA ARA IDEN IDEN TIFICAR LAS MEJORES CONDICIO COND ICIONES NES DE OPERACIÓN
Determinados de promedios del Nivel_Serv en cada nivel de factore Least Squares Means for Rendimiento Temp
Mean
SE Mean
200
90.37
0.05443
215
90.68
0.05443
230
90.18
0.05443
150
90.42
0.05443
160
90.25
0.05443
170
90.57
0.05443
Presion
Temp*Presion 200
150
90.30
0.09428
200
160
90.20
0.09428
200
170
90.60
0.09428
215
150
90.65
0.09428
215
160
90.55
0.09428
215
170
90.85
0.09428
230
150
90.30
0.09428
230
160
90.00
0.09428
230
170
90.25
0.09428 411
PASO 5. GRÁFICAS FACTORIALES Stat > DOE > Fac Factorial torial > Fac Factorial torial Plots effects e Interaction Interaction Plots P lots Seleccionar Setup para para Main ambas: En Response seleccionar Nivel_Serv y con >> seleccion seleccionar ar todos los factores OK
Seleccionar Da Datta Mea eans ns OK
De aquí se selecci seleccionan onan los mejores niv niveles eles de acuerdo al resul resultado tado deseado dese ado.. Si la int interacci eracción ón es significa significativ tiva, a, los los mejores niv niveles eles se seleccionan selecci onan de las gráficas gráfica s de iint nteracci eracciones, ones, de otra fforma orma se seleccionan de las gráficas de efectos de los factores principales. 412
Main Effects Plot for Nivel_Serv Data Means Velocida Velo cidad d 90.7
90.6
90.5
n a M
e 90.4
90.3
Tiempo
90.2 20 200 0
21 215 5
23 230 0
150 150
160 160
170 170
Para maximizar el nivel de servicio se seleccionan: Ve V eloci dad = 215 s eg . T iempo = 17 170 s eg . 413
Interaction In teraction Plot for Nivel _Ser v Data Means 90.9
Velo cid ad 200
90.8
215 230
90.7 90.6 n 90.5 a e M 90.4
90.3 90.2 90.1 90.0 150
160
170
Tiempo
Esta gráfica no es util utilizada izada debid de bido o a que q ue la la interacción no fue fue significati sig nificativ va 414
15.. Estu 15 Estudi dios os de de R&R R&R -
Concordancia por atributos
415
Estudios de R&R – Concordancia por atributos
• Introducción • Ejemplos
416
Análisis de concordancia por atributos Se usa para evaluar la concordancia de calificaciones nominales u ordinales dadas por diversos evaluadores. Las mediciones son evaluaciones subjetivas dadas por p or las personas más que que medicion medici ones es directas. di rectas. Por ejemplo: ejemplo:
Evaluaci Evaluación ón de desempeño desempeño de automoviles automoviles - Clasificación Clasifica ción de calidad de fibras como "buena" "buena" o ""mal mala" a" - Evaluaci Evaluación ón del color del vino, su aroma, y sabor en un una escala escala del 1 al 10. En estas situaciones, las características de calidad son difíciles de definir y evaluar. Para obtener clasificaciones significativas, se utiliza más de un evaluador para clasificar la medición de la respuesta. Si los evaluadores concuerdan, existe la posibilidad de que las calificaciones sean exactas. Si no hay acuerdo, acuerdo, la utilidad utilidad de las calificacion calificaci ones es es limitada.
417
Por ejemplo: Una institución evaluadora está capacitando a cinco nuevos evaluadores de la parte escri una una prueba. habilidad de los evaluadores evalu adores para p ara calificar calific la prueba pru eba debe d escrita ebe ser staerde consistente consistent e conLaestándares. Cada eval evaluador uador califica quince quincear reactivos en una una escala es cala de cinco puntos puntos (-2, -1, 0, 0 , 1, 2) File le > Open Worksheet ESSAY.MTW. 1 Fi Appraiser Sample Rating Attribute Simpson 1 2 2 Montgome 1 2 2 Holmes 1 2 2 Duncan 1 1 2 Hayes 1 2 2 Simpson 2 -1 -1 Montgome 2 -1 -1 Holmes 2 -1 -1 Duncan 2 -2 -1 Etc. Etc. Etc. Etc. 418
2 Stat > Quality Tools Too ls > Attr Attribute ibute Agreement Analysis Analysis.. 3 En Attribute Attribute column c olumn,, seleccionar selecci onar Rating Rating .. 4 En Samples, Samples, seleccionar selecci onar Sample .
5 En Appraisers, Appraisers, seleccion selecci onar ar Appraiser Appraiser .. standard/attri tribute bute,, seleccion selecci onar ar Attr Attribute ibute . 6 En Known Know n standard/at 7 Seleccionar Categories of the attribute data are ordered ordered y y click OK. OK.
419
Los resultados resultados son los siguientes: s iguientes: Results for: Essay.MTW Attribute Agreement Analysis for Rating Each Appraiser vs Standard Assessment Agreement Appraiser # Inspected # Matched Duncan 15 8 Hayes 15 13 Holmes Montgomery Simpson
15 15 15
15 15 14
Percent 53.33 86.67
95 % CI (26.59, 78.73) (59.54, 98.34)
100.00 100.00 93.33
(81.90, 100.00) (81.90, 100.00) (68.05, 99.83)
420
Kendall's Correlation Coefficient
Appraiser Duncan Hayes Holmes
Coef 0.87506 0.94871 1.00000
SE Coef 0.192450 0.192450 0.192450
Z 4.49744 4.88016 5.14667
P 0.0000 0.0000 0.0000
Montgomery Simpson
1.00000 0.96629
0.192450 0.192450
5.14667 4.97151
0.0000 0.0000
Between Appraisers Assessment Agreement # Inspected # Matched 15 6
Percent 40.00
95 % CI (16.34, 67.71)
421
Date of study: Repo r ted b y : Name o f p rro o du du cctt: Misc :
Assessment Assessm ent Ag Agreem reement ent
Apprai A ppraiser ser vs St Standard andard 100
95.0% CI Percent
80
t n e c r e P
60
40
20
0 Duncan
Hayes
Holmes Appraiser Appr aiser
Montgomery
Simpson
422
Interpretación: Se mu muestran estran ttres res tablas d de e co concordan ncordancia cia:: Cad Cada a evalu evaluador ador ccont ontra ra el Es Están tándar, dar, entre evalu evaluado adores, res, y todo todoss llos os evalu evaluado adores res contra el estándar. Se incluyen las estadísticas de Kappa y Kendall en cada una. En general los estadísticos sugieren un buen acuerdo. El coeficiente de Kendall
entre eval entre evaluadores uadores es 0.966 0.966317 317 (p=0.00 (p=0.0000). 00). El coefici coeficient ente e de Kendall para todos los evalu evaluadores adores contra el están estándar dar es 0.9580 0.958012 12 (p=0.0000). La tabla de cada evaluador contra el estándar indica que Duncan y Hayes tienen baja concordancia concordancia contra estándar, H Holmes olmes y Montgomery concor. en 15 de 15 15.. La gráfica g ráfica de eval evaluadores uadores contr contra a el estándar propo proporciona rciona un una a vista de la tabla de concordan co ncordancias cias de ccada ada uno de los evalu evaluadores adores cont contra ra el estándar. Con base en esto, Dun Duncan, can, H Hayes ayes y Si Simpson mpson requ requieren ieren capa capaciac ciación ión adi adicional. cional. 423
Concordancia por Atributos Ejemplo: comparación pasa no pasa 1. Selecciona un mínimo de 20 unidades del proceso. Estas unidades deben representar el espectro completo de la variación del proceso (buenas, erróneas y en límites). 2. Un inspector “experto” realiza una evaluación de cada parte, clasificándola como “Buena” o “No Buena”. 3. Cada persona evaluará las unidades, independientemente independi entemente y en orden aleatorio, y las definirá como “Buenas” o “No Buenas”. 424
GR&R GR &R por por At Atri ribu buto tos s - Ejem Ejempl plo o Legend Leg enda a de Atribut Atributos os G =Bueno NG = No Bueno Población Conocida Muestra # Atributo 1 G 2 G 3 G 4 G 5 G 6 G 7 G 8 G 9 NG 10 NG 11 G 12 G 13 NG 14 G 15 G 16 G 17 NG 18 G 19 G 20 G
COND. DE PRUEBA: Acuerdo
Persona #1 #1 G G G G G NG G G G NG G G NG G G G NG G G G
#2 G G G G G G G G G NG G G NG G G G NG G G G
G G G G G G G G NG G G G NG G G G NG G G G
G G G G G G G G NG G G G NG G G G NG G G G
Y Y Y Y Y N Y Y N N Y Y Y Y Y Y Y Y Y Y
Y=Sí N=No Y Y Y Y Y N Y Y N N Y Y Y Y Y Y Y Y Y Y
Esta es la medida general de consistencia entre los operadores y el “experto”.
¡90% es lo mínimo!
(1)
% DEL EVALUADOR -> (2) % VS. EL ATRIBUTO ATRIBUTO ->
95.00% 90.00%
100.00% 95.00% (3)
% DE EFECTIVIDAD DE DISCRIMINACION -> 85.00% (4) % DE EFECTIVIDAD DE DISCRIMINACION VS. EL ATRIBUTO ->
85.00%
425
Muestra 1 2 3 4 5 6 7 8 9 10
Atributo G G G G G G G G NG NG
1 11 2 13 14 15 16 17 18
G G NG G G G NG G
Datos Persona 1en A PeMinitab rsona 1B Persona 2A G G G G G NG G G G NG
G G G G G G G G G NG
G G G G G G G G NG G
Persona 2B G G G G G G G G NG G
G G NG G G G NG G
G G NG G G G NG G
G G NG G G G NG G
G G NG G G G NG G
19 20
G G
G G
G G
G G
G G 426
Instrucci strucciones ones d de e Minitab: 1 Stat > Quality Tools Too ls > At Attri tribu bute te Agreement Analysis . 2 En Multiple columns, seleccion seleccio nar Spersona 1A - Persona 2B 3 4
En Nu Number mber of Appraisers Appraisers, 2 Number mber of Trials, 2 En Nu
5
En Kn Known own standard/att standard/attri ribute bute, seleccionar selecci onar Atributo
6
En Graphs selecci seleccion onar ar todo
Click OK.
427
Los resultados se muestran a continuación: Attribute Agreement Analysis for Persona 1A, Persona 1B, Persona 2A, Persona 2B Within Withi n Appraiser App raiser s
Appraiser
Assess ment A Agreem greement ent
# Inspected
# Matched
Percent
1
20
19
95.00
2
20
20
100.00
95 % CI (75.13,
99.87)
(86.09, 100.00)
# Matched: Appraiser agrees with him/herself across trials. Fleiss' Kappa Statistics Appraiser
Response
Kappa
SE Kappa
Z
P(vs > 0)
1
G
0.82684
0.223607
3.69774
0.0001
NG
0.82684
0.223607
3.69774
0.0001
2
G
1.00000
0.223607
4.47214
0.0000
NG
1.00000
0.223607
4.47214
0.0000
Each Appraiser vs Standard Appraiser
Assessment Agreement
# Inspected
# Matched
Percent
95 % CI
1
20
18
90.00
(68.30, 98.77)
2
20
19
95.00
(75.13, 99.87) 428
Between Appraisers # Inspected
Assessment Agreement
# Matched
Percent
17
85.00
20
95 % CI (62.11, 96.79)
# Matched: All appraisers' assessments agree with each othe Fleiss' Kappa Statistics Response
Kappa
SE Kappa
Z
P(vs > 0)
G
0.663222
0.0912871
7.26524
0.0000
NG
0.663222
0.0912871
7.26524
0.0000
All Appraisers vs Standard # Inspected
Assessment Agreement
# Matched
Percent
17
85.00
20
95 % CI (62.11, 96.79)
# Matched: All appraisers' assessments agree with the known standard. Fleiss' Kappa Statistics Response Kappa SE Kappa
Z
P(vs > 0)
G
0.792005
0.111803
7.08391
0.0000
NG
0.792005
0.111803
7.08391
0.0000 429
Interpretación de Resultados •
% del Evaluado Evaluadorr es la consiste consistencia ncia de una persona persona..
•
% Evaluador Evaluador vs Atributo Atributo es el acuerdo acuerdo entre entre la evaluación del operador y la del “experto”.
•
% de Efectividad Efectividad de Selección Selección es el acuerdo que existe entre los operadores.
•
% de Efectividad Efectividad de Selecció Selección n vs. el Atributo medida general de la consistencia entre los operadores y el acuerdo con el “experto”.
431
Estudio Estud io de Repeti Repetibilidad bilidad y Repr Reproducibil oducibilidad idad de Atributos tributos - Guías de Aceptabilid Aceptabilidad ad Porcentaje De 90% a 100%
Guía Aceptable
De 80% a 90%
Marginal
Menos de 80%
Inaceptable
432
16. Capacidad de
procesos por atributos
433
Estudios de capacidad por atributos
• Introducción • Capacidad de procesos con distribución binomial
• Capacidad de procesos con distribución de Poisson
434
Estudios Estudi os de capacidad por atribut atributos os Distribución binomial Se usa este tipo de estudio de capacidad de proceso cuando los datos
provienen de una distribución binomial de número de defectivos entre Un total de elementos totales.
Se utiliza esta distribución si los datos cumplen las condiciones siguientes:
• Cada elemento es resultado de condiciones idénticas • Cada elemento puede resultar en dos resultados posibles (falla/no falla) • La probabilidad de éxito o falla es constante para cada elemento • Los resultados de los elementos son independientes unos de otros
435
Estudios Estudi os de capacidad por atribut atributos os Distribución binomial Se obtienen los resultados siguientes:
• Carta de control P para verificar que el proceso esté en control • Carta de % defectivo acumulado, verifica que la cantidad de muestras es suficiente para tener un estimado estable del % defectivo
• Histograma de % defectivo, muestra la distribución de los defectivos de las muestras colectadas
• Gráfica de tasa de defectivos, verifica que el porcentaje de defectivos no es influenciada por los tamaños de muestra colectados
436
Suponga que se evalúa la responsabilidad del área de ventas telefónicas de la empresa. Se registran las llamadas no contestadas por los representantes de Ventas durante los últimos 20 días. Así como el total de llamadas : Unavail Date able Calls 8/5/96 432 1908 8/6/96 392 1912 8/7/96 497 1934 8/8/96 459 1889 8/9/96 433 1922 Etc. Etc. Etc.
Instrucciones de Minitab: File > Ope Open n wor works kshe hee et > BPC BPCAP APA. A.MT MTW W 1. File 2. Stat > Qu Quality tools > Capabi Cap abilit lity y ana analys lysis is > Binomial Binomial 1. Defectives Unavailable Use siz sizes es in Calls 2. OK
437
La p acumulada Tiende al 22%.
Binomial Binom ial Process Pr ocess Capability Analysis of Unavailable P Chart 0.26
Rate of Defectives
1
26
UCL=0.25552
n 0.24 o i t r o p 0.22 o r P
e v i 24 t c e f e D 22 %
_ P=0.22643
0.20
LCL=0.19733 1
3
5
7
9 11 13 Sample
15
17
Z de 0.75 es un valor muy bajo
20 1840
19
1920 2000 Sample Size
Tests performed w ith unequal sample sizes Cumulative %Defective
Histogram Summary Summar y Stats
23.5
Tar 8
El proceso requiere mucha mejora
(95.0% confidence)
e 23.0 v i t c e 22.5 f e D % 22.0 21.5 5
Test TEST from Test
10 Sample
15
20
% D efec efectt iiv v e: Low er er C I : Up pp pe r C I : T arget: PPM De eff: Low e r C I :
22. 22. 6 64 4 22.22 23.07 0.00 226427 2222 41 41
Up pp pe r C I : P rro o ces cesss Z: Low e r C I : Up pp pe r C I :
2306 54 54 0.75 0.7507 07 0. 7 73 36 7 0. 7 76 64 6
6
y c n e u 4 q e r F
Process Proc ess Z = - nomsinv(P nomsinv(Ppro prom) m)
2 0
0
4
8 12 16 20 %Defective
24
Results for P Chart of Unavailable 1. One point more than 3.00 standard deviations center line. Failed at points: 3 438
Estudios Estudi os de capacidad por atribut atributos os Distribución de Poisson Se usa este tipo de estudio de capacidad de proceso cuando los datos provienen de una distribución de Poisson del número de defectos por unidad de inspección (cuyo tamaño puede variar).
Se utiliza esta distribución si los datos cumplen las condiciones siguientes:
• La tasa de defectos por unidad de espacio o tiempo es la misma en cada Elemento
• El número de defectos observados en las unidades de inspección son independientes unos de otros
439
Estudios Estudi os de capacidad por atribut atributos os Distribución de Poisson Se obtienen los resultados siguientes:
• Carta de control U para verificar que el proceso esté en control • Carta de media acumulada de Defectos por Unidad (DPU) verifica que la cantidad de muestras es suficiente para tener un estimado estable de la media
• Histograma de DPU, DPU, muestra la distribución de los defectos por unidad de las muestras colectadas
• Gráfica de tasa de defectos (con subgrupos variables) verifica que el DPU no es influenc influenciada iada por los tamaños de muestra muestra col colectados ectados
440
Suponga que se evalúa la efectividad del proceso de asilamiento en un cable. Se toman muestras de cable de longitudes aleatorias donde se prueban con alto voltaje para encontrar debilidades de aislami aislamiento. ento. Se registran los defectos y la longitud de la muestra: Instrucciones de Minitab: 1. File File > Ope Open n wor works kshe hee et > BPC BPCAP APA. A.MT MTW W 2. Stat > Qu Quality tools > Capabi Cap abilit lity y ana analys lysis is > Binomial Binomial 1. Defects Week spots Use siz sizes es in Lenght OK
Weak Spots Length 2 132 4 130 3 120 1 124 2 138 5 148 Etc. Etc.
441
Poisson Capability Analysis of Weak Spots ti
U Chart n r
Defect Rate
1
0.075 U
UC L=0 L=0.069 .06904 04
e P
0.075
0.050 t n u o C
0.025
0.050 U P
_ U=0.02652 D
0.025
le p m
LCL=0
0.000 a S
1
11
21
31
41 51 61 Sample
71
81
0.000 100
91
120 140 Sample Size
La DPU acumulada tiende a 0.0265
Tests performed with unequal sample sizes Cumulative DPU
Histogram Ta r
Summary Stats
0.030
16
(95.0% confidence) 0.025 U P D
0.020
0.015
Mean DPU: Lo w er er C I : U p pe pe r C I :
0. 0.02 0265 65 0 .0 .0 23 23 7 0 .0 .0 29 29 5
M in in D P U : Max DPU: T a rrg g DPU:
0 ..0 00 00 00 0 ..0 07 75 53 0 .0 .0 00 00 0
y
12 n
c q
u
e
8 Fr
e
4
La tasa tasa de D DPU PU no parece ser afectado por la Longitud de cable tomado
0 0
20
40 60 Sample
80
100
0 1 0 2 3 0 4 0 5 6 0 7 0 . 0 . . 0 . . . 0 . . 0 0 0 0 0 0 0 0
DP U
Poisson Capability Analysis of Weak Spots Test Results for U Chart of Weak Spots TEST 1. One point more than 3.00 standard deviations
from center line. Test Failed at points:
36 442
17. Capacidad de procesos
443
Capacidad de procesos
• Procesos normales
• Procesos no normales
444
Capacidad de procesos normales
445
Capacidad de procesos normales
446
Prueba de normali normalidad dad Es una prueba de hipótesis de una población para determinar si la muestra se extrae de una población normal, que es la hipótesis nula. La hipótesis alterna es que no es normal. Se puede hacer por diversos métodos:
1. Método gráfico Se trata de probar la flamabilidad de una fibra y ver si sigue una distribución normal, además se quiere observar su valor en el percentll 87avo.
1 2 3 4
File > Open worksheet worksheet FLAMERTD.MTW. Graph > Probabili ty Plot. Probab ility Seleccionar Single, Single, click OK OK.. En Graph variables variables,seleccionar ,seleccionar Fabric .
5 6
Scale,, y click el Percentile Lines . Lines . Click Scale OK en cada cuadro de diálogo. En Show percentile lines at Y values, values , teclear 87 . Click OK
447
Probability Plot of Fabric Normal - 95% CI 99
95 90 80 70
e
cr
e
n
t
60 50
87
Mean StDev N AD P-Value
3.573 0.5700 15 0.31 0.310 0 0.517
P
40 30 20 10 5
5 1 2 . 4
1
2
3
4 Fabric
5
6
Los puntos no salen del intervalo de confianza del 95% y el P value es menor de 0.05 por tanto los datos de la muestra siguen una distribución normal. El IC del 87% se encuentra entre los valores 3.84295 y 4.58790 448
Los resultados se muestran a continuación Process Capability of Supp Supp2 2 LS L
US L
Process Data
Media Desviación est ándar
LS L T a rget USL S a mp mple M e an an S a m ple N S t D ev ev ( W Wii th th in in ) StDev (Ov (Ov er eral all) l)
Within Overall
59 6 * 60 4 60 0 0.. 2 23 3 10 0 1 .7 .7 0 04 49 99 9 1.87 1.8738 388 8
Potential (Within) Capability Cp 0. 7 8 C PL P L 0. 8 3 C PU P U 0. 7 4 C pk pk
0. 7 4
O verall C apabi apabilit lity y
597.0 O bser bserved ved Perfor Performance mance % < LS L % > U SL SL % T ot a l
0. 0 0 2. 0 0 2. 0 0
598.5
Exp. Within P erformance % < LS L % > U SL SL % T o tal
0. 66 1. 35 2. 01
600.0
601.5
603.0
Pp PPL
0. 7 1 0. 7 5
PPU P pk C pm
0. 6 7 0. 6 7 *
Índice de capacidad potencial (Cp y real del proceso (Cpk deben ser mayores a 1.33 para que el proceso sea capaz
604.5
Exp. Ov erall Performance % < LS L % > U SL SL % To Total
1. 20 2. 21 3. 41
Fracción defectiva fuera de especificaciones debe ser menor a 3.4 ppm (0.000 34 %)
453
Capacidad de procesos No normales
454
Capacidad de procesos para par a variables no normal normales es T ransformación de Box Cox Transformació Transf ormaciónn de B Box ox Cox (para ddatos atos ag agru rupados pados en subgrupos subgrupos de tamaño n >1 y con valor posi positivo), tivo), ident identifi ifica ca la poten p otencia cia lamda a la que hay que elevar los datos para que sigan una distribución normal. Ejemplo: Se mide la torcedura que tienen los ladrillos en un horno, los datos están en el archivo TILES.MTW. TILES.MTW. Se miden mide n 10 ladrillos di diarios arios por 10 días. días.
455
Warping
Histogram ram > Simple Graph > Histog
Variable Variab le Warping
1.60103 Histogram of Warping
0.84326 14
3.00679
12
1.29923
10
2.24237 2.63579 0.34093
y c n e u q e r F
6.96534
8 6 4
3.46645 2
1.41079 0
Etcetera..
1
2
3
4 Warping
5
6
7
8
Se observ obse rva a una una distrib d istribución ución no no normal 456
Haciendo una una prueba de d e normalidad con: co n: Stat > Basi Basicc statistics > Normality Normality test Variable Warping Ander Anderson son Darlin Darling g Probability Plot Pl ot of Warping Warping Normal 99.9
Mean S tDev N AD P -Va -Vallue
99 95 90
t n e c r e P
2.923 1.786 100 1.028 1.028 0.0 .01 10
80 70 60 50 40 30 20 10 5 1 0.1
-4
-2
0
2 4 Warping
6
8
10
Se obtiene un valor valor P de d e 0.01 indicando indica ndo que los datos no son normales. normales. 457
Ahora Ahor a se tran transfor sforman man los datos por el mét método odo de Box Cox: File e > Open worksheet worksheet TILES.MTW. TILES.MTW. 1 Fil 2 Seleccionar Stat > Con Control trol Ch Charts arts > Box Box-Cox -Cox Transformati Tran sformation. on. 3 En Single column column,, seleccion seleccio nar Warping . En Subgroup size size,, 5 . Click OK. Box-Cox Plot of Warping Lo w er C L
40
U p p er C L
Lambda (using 95.0% 95.0% co nfidence)
30
v e D t S
E stimate
0.39
Lo w er C L Up p er C L
0.17 0.64
Ro u un n de ded V Va alu e
0.50
20
10
Limit
0 -2
-1
0
1
2
3
4
5
Lambda
458
La tabla tabla de La Lambda mbda contiene su vvalor alor esti estimado mado de 0.50, con u un n intervalo de confianz intervalo confianza a de (0.17 a 0.64) . E Este ste iin nterv tervalo alo contiene valores lamda que se encuentran dentro más menos una sigma de la línea horizontal, de modo que se puede tomar cualquier valor en el in interv tervalo. alo. Si lamda es ce cero, ro, tomar el logaritmo natural natural de los d datos atos En este caso el exponente al que hay que elevar los datos es 0.5 o sacar sacar raí raízz cuadrada cuadrada.. El anális análisis is co con n la tran transformació sformación n de raíz raíz cuadrada de los datos es: 1 Stat > Quality tools > Cap Capability ability analys analysis is > No Normal rmal siz e - 5 2 Single column - Warping Subgroup siz Lower spec Spec 8 spec 0 Upper Spec 3 Seleccionar Box-Cox > Box-Cox power transform transformation ation (W = Y**Lambda). Sel. Lambda = 0.5 (raíz cuadrad cuadrada). a). 4 En Estimate, seleccionar R-Bar y sel. Use unbiased constants to calculate overall std. Dev. 459
Process Capabil Capability ity of Warpin Warping g Using Box-Cox Transformation With Lambda = 0.5 LS L*
U S L*
transformed data
Process Data LS L 0 T arget * USL 8 Sa am mple M ea ean 2.92307 S ample N 100 St StDe Dev( v(W Within) 1.7 .75 5501 StDev(Over StDe v(Overal all) l) 1.79 1.790 048
Within Overall P otential (W (Within) ithin) C apability Cp 0.89 C P L 1.02 C PU PU 0.76 C pk 0.76 O v erall erall C apabilit apability y
A fter Transfo Transformati rmation on LS L* T arget* U S L* Samp Sam ple Mea Mean n* StDev(W StDev( Wit ithi hin n)* StDev(Ov er erall all))*
Pp PPL PPU P pk C pm
0 * 2.82843 1.62 1.623 374 0.52 0.5291 9153 53 0.539 0.53934 344 4
0.0
0.4
0.8
1.2
1.6
2.0
O bser bserv v ed P erforman erformance ce P P M < LS L 0.00
Exp. Within Performance P P M < LS L* L* 1075. 4 45 5
Exp. O v erall P erfor erformanc mance e P P M < LS L* L* 1303.73
PPM > USL 20 2000 000. 0.00 00 PPM To Total 20000.0 .00 0
PPM > USL* 11 1140 404. 4.16 16 PPM To ottal 12479.61
PPM > USL USL* * 1275 12754. 4.26 26 PP PM M T ot otal 14057.99
2.4
0.87 1.00 0.74 0.74 *
2.8
460
Interpretación: Un Cpk de 0.76 indica que el proceso no es cap capaz az de cum cumplir plir especificaci especi ficaciones ones del clien cliente te (0 a 8), deberí deberíaa ser > = 1.33
Considerando el Ppk Pp k de 0.74, también dis dista ta much muchoo del de l vvalor alor requerido de 1.33 mínimo.
461
T ransformación de Jonhson (para n>= 1) alt alterno erno a Box Cox Para datos no normales, esta transformación selecciona una función de tres familias famili as d de ed distribuciones istribuciones de una variable, que son fácilmen fácilmente te transformadas a una distribución normal. Las distribuciones son Sb, Sl y Su, donde B, L y U se refieren a la variable que se acota, lognormal y no acotada. Minitab muestra muestra los val valores ores P para las di distribuciones stribuciones origi original nal y transform tran sformada ada para comparaci comparación. ón. No siempre sie mpre es posi posible ble encon encontrar trar la fu función nción óptima.
462
Para el ejemplo de los ladrill ladri llos: os: 1 File File > Open worksheet w orksheet TILES.MTW. Johnso n Transformati Trans formation on.. 2 Seleccionar Stat > Quality Quality Tools > Johnson 3 En Data are arranged as, as, seleccionar selecci onar Single column column;; seleccionar Warping. 4 En Store transformed data in, in, seleccionar selecci onar Single column column;; C2 . 5 Click Options. Options. En P-Value to select se lect best fit, fit, poner 0.05. diálogo. álogo. Click OK en OK en cada cuadro de di
463
Johnson Transf Transformation ormation for Warping Pr obabilit obability y Plot for Or igin iginal al Data
99.9
Select a Transformation
0.6 t
N 100 AD 1.028 1.028 P-Val P-Valu ue 0.01 0.010 0
99
s e
0.8 t D
0.6
90 t
A r
n o ce
f
0.4 0.2
50 r
e ul
e P a V
10 P
1 0.1
Ref P
0.0 0.2
-5
0
5
10
0.4
0.6
0.8 Z Value
1.0
1.2
(P-Value = 0.005 means Open workshee w orksheett > TILES.MTW Too ls > Ca Capab pabilility ity Analysis Analysis > Normal. No rmal. 2 Selecc. Stat > Quality Quality Tools 3 En Data arranged aass Single column, poner column, poner Warping , en Subgroup size size,, 1 Estimate,, seleccionar using moving range ra nge lenght n = 2 2 y 4 En Estimate sel. Use unbiased constants to calculate overall std. Dev. 5 En Lower spec, spec, poner -3.3136. En E n Upper spec, spec, poner poner 2.68435 2.6843 5 OK en en cada cuadro cuadro de diálogo di álogo Click OK La gráfica resultan resultante te se mu muestra estra a continuación: continuación:
466
Process Capability of C2 LS L Process Data LS L -3.3136 T arget * USL 2. 68436 Sa am m pl ple M e ea an 0. 01 011196 S am ple N 100 S tD tD e ev v(W Wiithin) 0. 94 941167 StDev(Ov StDe v(Ov e rral alll) 0. 9 99 9 74 74 62 62
U SL Within Overall Potential (Within) (Within) C apability Cp 1. 06 C PL 1. 18 C P U 0. 95 C pk 0. 95 O v eral eralll C apabilit apability y Pp PPL
1. 00 1. 11
PPU P pk
0. 89 0. 89
C pm
-3 O bser bserv v ed Performance P P M < LS L 0. 00 P P M > U SL S L 20000. 00 P PM PM T o ottal 20000. 00
-2
Exp. Within Performance P PM PM < LS L 205.72 P P M > U S L 2253.83 P PM PM T o ottal 2459.55
-1
0
1
2
*
3
Exp. Ov erall Performance P PM PM < LS L 429. 18 P P M > U S L 3681. 55 55 P P M T ot otal 4110. 73
El Cpk es un poco mayor que con el método de Box Cox 467
Identif Ident ificación icación de la función que mejor ajuste los ddatos atos Se puede ident id entifi ificar car un una fun funci cion on de entre entre 14 tip tipos os parametricos: parametric os: Por ejemplo para el caso de los ladrillos: 1 Fil Filee > Open worksheet w orksheet > TILES.MTW. Identification.. 2 Stat > Quality Tools > Individual Distribution Identification column, Warping . 3 En Data are arranged as, as, sel. Single column, sizz e: e: 1 Subgroup si 4 Seleccionar Use all distributions. distributions. Click OK OK..
468
Box-Cox transformation: Lambda = 0.5 Johnson transformation function: 0.882908 + 0.987049 * Ln( ( X + 0.132606 ) / ( 9.31101 - X ) )
Goodness of Fit Test Distribution Normal Box-Cox Transformation
AD 1.028 0.301
P 0.010 0.574
LRT P
Lognormal
1.477
View more...
Comments