MINITAB AVANZADO Contenido PDF

August 31, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download MINITAB AVANZADO Contenido PDF...

Description

 

MINITAB  AVANZADO

 

Contenido Parte A: 1. Configuraci Configuración ón p personaliza ersonalizada da de de Minitab 2. Gráficas especiales 3. Manipulac Manipulación ión de datos 4. Cálculos y pa patrones trones de datos en columnas 5. Distribucione Distribuciones s de probabilidad 6. Estadística inferencial – inferencial – Pruebas de hipótesis 2  

Contenido Parte B: 7. Tamaño de muestra y potencia 8. Análisis exploratorio exploratori o de datos 9. Estadística Estadística no paramétrica 10. Tablas y pruebas no paramétricas 11. Regresión lineal y cuadrática 12. Regresión múltiple

3  

Contenido Parte C: 13. Series de tiempo 14. Diseño de experimentos experimento s factoriales factoria les 15. Estudios de R&R – Concordanci Concordancia a por atributos 16. Capacidad de procesos por atributos 17. Capacidad de procesos 18. Cartas de control control ponderadas ponderadas en el tiemp tiempo o 4  

Contenido Parte A: 1. Configuraci Configuración ón p personaliza ersonalizada da de de Minitab 2. Gráficas especiales 3. Manipulac Manipulación ión de datos 4. Cálculos y pa patrones trones de datos en columnas

5. Distribucione Distribuciones s de probabilidad 6. Estadística inferencial – inferencial – Pruebas de hipótesis 5  

Configuración personalizada personalizada del Minitab

• Barras de tareas • Personalización • Opciones • Perfiles • Seguridad de archivos

7  

Barras de tareas: Tools > toolbars toolbars

8  

Barras de tareas: Tools > toolbars toolbars > Standard Standard

Ayuda Editar el último diálogo Ctrl-E Comando anterior Alt-F2 Comando siguiente F2

Cancelar Buscar siguiente

Buscar Ctrl-F 9  

Tools > toolbars toolbars > Project Project Manager Manager

Mostrar

Mostrar Infor-

Mostrar reporte

Project Mgr.

Borrar gráficas

folder de sesión Mostrar folders de hojas Ctrl-Alt-D y Gráficas Ctrl-Alt-G

Mación Ctrl-Alt-I Mostrar historial Ctrl-Alt-H

Ctrl-Alt-R

Ctrl-I

Mostrar documentos Relacionados Datos Ctrl-Alt-L

Mostrar hoja de Datos Ctrl-D

Mostrar diseño Ctrl-Alt-E

Mostrar sesión Ctrl-M

10  

Tools > toolbars toolbars > Worksh Worksheet eet

Asignar Fórmula a columna

Insertar celda renglón y columna

Mover columna

Mostrar Filas de Datos de Puntos Selec. Con Brush

Borrar

11  

Tools > toolb toolbar arss > Gr Graph edi editin ting g

Selección Brush Borrar selección

12  

Tool oolss > tool toolba bars rs > Grap Graph h an anno nota tati tion on to tool ol

Selección

Insertar rectángulo círculo, línea, punto

Insertar dibujo de línea o superficie

Insertar Texto

13  

toolbar arss > 3-D 3-D Gr Graph to tools ols Tools > toolb

Rotación inversa y

Rotación inversa y

Rotación inversa y

Rotación inversa y normal ligera en los

normal en el eje X

normal en el eje Y

normal en el eje Z

ejes ejes X, Y y Z

Zoom +y-

Regreso a parámetros inciales

14  

Tools > toolbars toolbars > Factorial Factorial designs designs

Crear diseño factorial Definir diseño factorial Seleccion ar Diseño óptimo

Analizar Diseño factorial

Optimizador

Analizar variabilidad Preproceso de respuestas para análisis de variabilidad

Gráficas factoriales

Modificar y mostrar diseño

Gráficas de contornos overlaid

Gráficas de contorno y superi sup erific fice e de respuesta 15

 

Tools > toolbar toolbarss > Resp Response onse surf surface ace desi designs gns

Crear diseño

Analizar

Optimi-

Modificar

de superficie de respuesta

Diseño de Superficie de respuesta

zador

y mostrar diseño

Definir diseño de superficie de respuesta

Seleccionar Diseño óptimo

Gráficas de contornos overlaid

Gráficas de contorno y super sup erifi ifice ce de respuesta

16  

toolbars > Mixture Mixture designs Tools > toolbars

Crear diseño factorial Definir diseño factorial Seleccion ar Diseño óptimo

Analizar Diseño factorial Gráficas factoriales Gráfica Del diseño Simplex

Gráficas de trazo de respuesta

Optimizador

Modificar y mostrar diseño

Gráficas de contornos overlaid

Gráficas de contorno y superi sup erific fice e de respuesta 17

 

Tools > toolba toolbars rs > Taguc Taguchi hi des designs igns

Crear diseño de Taguchi

Analizar Diseño de Taguchi

Definir diseño de Taguchi

Modificar y mostrar diseño

Predecir resultado

18  

Tools > Customize Para personalizar las opciones de menú, seleccionar y arrastrar el comando específico, a una barra de menú existente

 

Tools > Options

Para personalizar las opciones por Default, de cada una de las opciones y menús de Minitab

 

Tools > Profiles

Para personalizar las opciones y menús de Minitab, definidos para un perfil específico

 

Seguridad para archivos Permite asig a sign nar passwords pass words en archivos archivos de proy proyectos. ectos. para protegerlos p rotegerlos de uso no autorizado. autorizado.

Secu rity Tools > File Security File > Save Project P roject As > Security

Password to open proj Password project ect fil file e (Hasta (H asta 15 caracteres)

Clave para abrir un archivo de proyecto

Password Passw ord to modi modify fy project fil file e Clave para modificar modifi car archivo archivo de proyect proyect Permite su acceso de solo so lo lectura lectura Read Only  NOTA: Si el password se olvida o pierde, no hay forma de recuperarlo

 

Gráficas especiales • Gráfic Gráficas as de dispersión de dos variables • Gráfic Gráficas as matriciales de dispersión

• Gráfic Gráficas as tridimensionales • Gráficas de contornos

• Gráfic Gráficas as de superficies de respuest respuesta a

24

 

Gráficas Gráfi cas de dispersión de dos va variables riables Gráfica de Gráfica d e dispersión simple File > Open Worksheet > Pulse.mtw Graph > Scatterplot > Simple

o Copiar Copi ar los datos datos de Archiv de Archivos os Datos Módul Módulo o

Indicar en Y variable Weig W eight ht y en X variable Height La gráfica de dispersión d ispersión simple se muestra muestra a continuación: continuación: Scatterplot of Weight vs Heigh Heightt 220 200 180

    t      h 160    g       i    e      W 140

120 100 60

62

64

66

68 Height

70

72

74

76

25  

Gráfica Gráfi ca de d dispersión ispersión Simple con una va variable riable categórica:

P ulse.mtw se.mtw File > Open Worksheet > Pul Graph > Scatterplot > Simple Indica ndicarr en Y variable Weight y en X variable Height Heig ht Se puede agregar otra variable para estratificar haciendo doble click en los puntos y seleccionando la pestaña Groups e indicando indic ando la vvariable ariable categórica Sex. Scatterplot of Weight vs Height 220

Sex

1 2

200 180     t       h 160     g        i     e      W 140 120 100 60

62

64

66

68 Height

70

72

74

76

26  

Para cambiar cambi ar el titipo po se sí símbolo mbolo por categoría para impresión i mpresión en blan blanco co y negro: negro: Click sobre cualquie cualquiera ra de los puntos, puntos, para seleccionarl selecci onarlos os todos Click sobre los puntos puntos de un una a cierta ci erta categoría Doble click para que aparezca el cuadro de diálogo que permita cambiar color, símbolo y tamaño para los puntos de ese grupo.

27  

Para marcar más de un punto a la vez se utili utiliza za Brush Editor tor > Brush, Brush, se pueden Con el gráfico seleccionado con un click, seleccionar Edi seleccionar los puntos uno a uno o con un cuadro seleccionar varios a la vez,. manteniendo mant eniendo presi presionado onado el botón izquierdo del de l ratón mient mientras ras se selecci seleccionan onan.. Otra forma de activar acti var Bru Brush sh es con la barra d de e herramientas Graph Editi Editing ng llllamada amada

desde: Tools > Tool Bars > Graph Editing

28  

Con Brush activado y con la ventana de gráfica activa, en el Menu Editor seleccionar  Set ID Variables indicar Pulse 1, Pulse 2, Ran, Smokes,  Activity  Activ ity seleccionar Include (row numbers) Se muestra la siguiente si guiente información: información:

29  

Para poner la Act la Activ ividad idad a cada pun punto to se usa: Graph > Scatter p plot: lot: With Groups Labels > Data Labels > seleccionar Use Labels from Colu Co lumn mn Activity

30  

Para hacer un Zoom de una zona del diagrama hay que cambiar los valores mínimo y Range  poner los adecuados. máximo de los ejes, selecci seleccionar onar cada un uno o y en Scale Range Eje X Eje Y

Minimum Minimum

100 61

Maximum Maximum

1 20 64

31  

Para identificar las coordenadas de los puntos

de la gráfica seleccionar la gráfica Editor > Crosshair  El cursor se convierte en una cruz que se puede colocar en el punto punto para ver las coordenadas

32  

Gráficas Gráf icas de dispersión B Bivari ivariantes antes con páneles: Se utiliza el archivo REHEAT.MTW de REHEAT.MTW de Minitab localizado en DATA . File > Open Worksheet > Reheat.Mtw Graph > Scatter plot: With Connect Line para unir unir los puntos puntos Y variab variable le Quality  X variables Time Multiple ltiple graphs > By Variables Vari ables > En En By  By variab variables les in separate panel pa nels s Temp Mu

33  

Para modificar modifi car la apariencia de la gráfica, seleccionarla y : Editor > Panel > Options Seleccionar  Don´t  Don´t alternate alternate panels pa nels Seleccionar Group information information:: Both variable nam names es and a nd levels levels Scatterplot of Quality vs Time Temp = 350

Temp = 375

Temp = 400

Temp = 425

Temp = 450

Temp = 475

8 6 4 2

    y        t      i      l     a      u       Q  

0 8 6 4 2 0 25

30

35

25

30

35

25

30

35

Time

34  

Graficas bivariantes con distribuciones de frecuencia adicionales: Reheat.Mtw Reheat.Mtw File > Open Worksheet> Reheat.Mtw

Graph > Marginal Variables Varia bles Y = PVPPlotX = Pot(CV) Se tienen 3 posibilidades después de indicar la variable Y y X como antes:

Marginal P lot of Height vs Weight

       t          h       g            i       e          H

75

75

70

       t  70         h       g            i       e          H

65

65

100

150

200

Marginal Plot of Height vs Weight

75

70

65

100

150

Weight

100

150

Weight

Weight

       t          h       g            i       e          H

Marginal P lot of Height vs Weight

200

200

35  

Matrices de Graficas bivariantes simples: Pulse.Mtw Simple File > Open Worksheet Worksheet > Pulse.Mtw Graph > Matrix Matrix Plot > Si Simple mple Se tienen varias varias posibilidades posi bilidades después después de indicar i ndicar las variables: variables:

Matriz de "todas" por "todas" Matriz " todas" las variables var iables seleccionadas

Permite seleccionar  toda la matriz o solo la parte inf i nferior  erior  o superior de la misma

36  

Matri Mat rix x Plot of Pulse1 Pulse1,, Pulse2, Pulse2, Heigh Height, t, Weight Weight 50

100 100

150 150

100 100

150 150

200 100 100

75

Pulse1

50

15 150 0

10 100 0

Pulse2

50 75 70 Height 65

20 200 0 15 150 0

Weight

10 100 0 50

75

100 100

65

70

75

37  

Matrices de Grafi Graficas cas bivari bivariantes antes por grupos: Pulse.Mtw Pulse.Mtw Por grupos File > Open Worksheet > Pulse.Mtw Graph > Matrix Plot > With groups Graph variab variables les > Pulse 1 Pulse 2 Height Weight Categorical variables for subgroups Sex OK Matrix Plot of Pulse1, Pulse2, Height, Weigh Weightt 50

100

150

100

150

200 100

75

Pulse1

Sex 1 2

50

150

100

Pulse2

50 75 70 Height 65

200 150

Weight

100 50

75

100

65

70

75

38  

Matrices de Graficas bivariantes varias X vs varias Y: Pulse.Mtw Por grupos File > Open Worksheet > Pul P ulse.Mtw se.Mtw Graph > Matrix Plot > Each Y vs Each X > With Smoother  Y variables > Pulse 1 Pulse 2 X Variables Variables  Height Weight OK

Matrix Plot of Pulse1, Pulse2 Puls e2 vs Height, Weigh Weightt 100

125

150

175

200 100

     1     e      s       l     u       P

75

50 150

125      2     e      s  100      l     u       P

75 50 60

64

68 Height

72

76 Weight

39  

Gráficas de dispersión tridim tridimensionales: ensionales: Coches.Mtw Grafica bivariada en tres dimensiones

Graph > 3D Scatter Plot Se utiliza utili za de nuevo nuevo el archivo arc hivo COCHES.MTW anexo

3D 3DScatterplot Scatterplot of PVP vsPot. t.(CV) (CV) vsCil Cil.( .(cc) cc)

45000000

30000000

15000000

Indicar las variables para el eje Z, Y y X

450 0

300 0

2000

150 4000

Cil.(cc)

000

Pot.(CV)

0

40  

Con la herramienta Tools > Tool Bars > 3D Graph tools se tools  se puede modificar la gráfica:

Girar gráfi ca Sobre la gráfica de 3 dimensiones d imensiones se pueden usar también las opciones Brush, modificar ejes, puntos, etc. haciendo doble click sobre ellos.

Zoom

Posi ción ini cial

En algunos casos se desea tener los líneas lí neas verticales para los puntos, puntos, esto se hace en e n el menu menu de: Graph > 3D Scatter Plot Data View Seleccionar en Data Display Di splay Projected lines

41  

Grafica Grafi ca bivariada en tres dimensiones estratificada estratificada por po r una variable categórica Graph > 3D Scatter Plot

3DScatterplot ofPVPvs Pot. t.(CV (CV)vs Cil.(cc) Num.Cil. 2 4 5 6 8 12

45000000

Indicar las variables Z, Y y X así como la variable (s) categórica categóric a (s)

30000000

PVP 15000000 450 0

300 0

150 2000

Cil.(cc)

6000

Pot.(CV)

0

42  

ContourPlo lotofC3vs sC C2,C1

Curvas de nivel (Contour Pl Plots) ots)

5.0 -0.4

-0.4 -0.4

Graph > Contour Plot Columnas de datos para Z, Y y X de Mesh

-0.8

2.5

    2     C  0.0

0.4

0.4

0.8

-0.8

0.8

-2.5

0.0 -0.4

-0.4

-0.8 -0.8

-5.0 -5.0

-2.5

-0.8

0.0 C1

2.5

5.0

43  

Superficie mallada (Wireframe) (Wireframe) o sup superificie erificie con textura (surface)

Graph > 3D Scatter Plot Generar datos para la superficie por medio de una función ya establecida con: Calc > Make Mesh Data

Columnas donde se guardan los datos generados

Datos para un sombrero vaquero

Obtener la gráfica con: Graph > 3D Surface Plot 44  

Obtener la gráfi Obtener gráfica ca c con: on: Graph > 3D Sur S urface face Plot Colu Col umn mnas as d de e da dato tos s pa para ra Z, Y y X de M Mesh esh

Se ttien ienen en dos opcio opcion nes, mallada o superficie

Surface Plot of C3 vs C2, C1

1

C3

0

5 -1

0 -5

0 C1

5

C2

-5

45  

Extraer subconjuntos de datos da tos de hojas de trabajo (Worksheets)

Data ta > Subset worksheet worksheet Da

48  

La secci s ección ón de la hoja hoja de trabajo resu resultan ltante te es:

49  

Dividir hojas de trabajo (Worksheets) Data > Split worksheet Spli t worksheet

50  

Reunir hojas de trabajo (Worksheets)

Data > Merge worksheet

OK

51  

Copias diversas Data > Copy OK

52

 

Apilar Apil ar columnas Data ta > Stack colum column ns Da OK

C olumnas resultan resultantes tes

53  

Desapilar columnas Data > Unstack columns OK

Columnas resultantes

54  

Transponer columnas Transpo Tran spone ne columnas columnas a renglones Por ejemplo, e jemplo, se tienen datos de estudiantes estudiantes arreglados a rreglados e en n colu column mnas as pero se quiere quiere rearreglarlos rearreglarlos por tipo de ejer ejercicio cicio:: Task

Lyn

Bi l l

Sam

Mari e

Pushups

50

69

70

57

Pul l ups

66

85

81

76

Si tups

73

88

95

79

Fi File le > Open Worksheet > Exercise.Mtw Data > Transpose columns En Transpo Transpose se the following columns columns Lyn Bill B ill Sam Marie seleccionar After  After last colu column mn in use En Store Transpose Transpose seleccionar En Create variable names using columns, columns, anotar Task OK 55  

Los resul resultados tados se muestran a contin continuación: uación: Labe l s

P us h up s

P ul l up s

Si tups

Lyn

50

66

73

Bi l l

69

85

88

Sam

70

81

95

Mari e

57

76

79 56

 

Ordenar datos por una más columnas co lumnas

En los siguientes datos de ventas, se desea un listado por agencia: Inde x

Quarte r

Ye ar

Sal e s

A dv e rti s

Capi tal

AdAge ncy

1

1

1991

94

17

8 Ome ga

2

2

1991

99

10

6 Ome ga

3

3

1991

98

9

12 Al pha

4

4

1991

92

22

16 Al pha

5

1

1992

106

24

29 Al pha

6

2

1992

116

18

32 Al pha

7

3

1992

113

13

33 Ome ga

8

4

1992

108

14

36 Ome ga

File > Open Worksheet > Market.Mtw Data > Sort En Sort column column(s), (s), seleccionar Sales Advertis AdAgency En la primera By column column se  seleccionar leccionar AdAgency En la segun seg unda da By column column selecci  seleccionar onar Advertis y seleccionar Descending En Store sorted data data seleccionar se leccionar Colu Co lumns(s) mns(s) of cur c urrent rent worksheet seleccionar C8 C9 C10 OK 57  

Los result resultados ados son los los sig s igu uien ie ntes:

Sal e s

A dve rti s

A dAge ncy

106

24 A l pha

92

22 A l pha

116

18 A l pha

98

9 A l ph a

94

17 Ome ga

108

14 Ome ga

113

13 Ome ga

99

10 Ome ga 58

 

Borrado de datos d atos de renglones y columnas Data > Delete D elete Rows

OK Data > Erase variables

OK

59  

Uso de tablas de conversión Se desea codificar los nombres de estados a sus números de ID Tabla de conversión

STID

State

StNam

StCod

MT

AL

1

CO

AK

2

CO

AZ

3

OR

AR

4

WA

CA

5

La Tabla resultante resultante es la si siguiente: guiente:

CA WA

CO CT

6 7

File > Open Worksheet > States. Mtw Crear una columna columna nuev nueva a STID para los códi c ódigos gos Data > Code > Use conversion Table En Input column, seleccionar  State En Output En  Output column, seleccionar STID  Column of Original Values, seleccionar StNam En Column En En Co En  Colum lumn n of New Values, seleccionar  StCod  StCod OK

State MT

StNam AL

StCod

CO

AK

2

6

CO

AZ

3

6

OR

AR

4

3 37 7

WA

CA

5

47

CA

CO

6

5

WA

CT

7

4 47 7

CO

DE

8

6

1

STID

2 26 6

60  

Cambio de tipo de variabl variables es Tabla resultan re sultante te

Data > Change data type

C 1-T

C 2-D

Fe chas Ene - 10

Date s Ene - 2010

Fe b- 10

Fe b- 2010

Mar-10

Mar- 2010

Abr-10

Abr- 2010

May-10

May- 2010

Jun- 10

Jun- 2010

Se desea de sea ca cambiar mbiar da datos tos de fecha en tex texto to a datos e en n for formato mato de fecha Fechas

Ene-1-10 Feb-1-10 Mar-1-10  Abr-1  Abr-1-10 -10 May-1-10 Jun-1-10

Instrucciones de Minitab: Data > Change data type > Text Text to Date/T Da te/Time ime En Change text column, seleccionar  Fechas En Store En  Store D Date ate / Time columns columns in, i n, seleccionar Dates  Format of text colu columns mns (e.g. (e.g. mm-dd-yy), mm-yy En Format En OK NOTA: mmm da el nombre del mes

61  

Extracción Extracci ón d de e datos de fechas

Data > Extract Extract from Date / Time

Tabla resultante C2-D FechaNum

Dates Enee-2 2010

201001

Feb eb-2 -20 010

201002

Mar-2 -20 010

201003

Abrr-2 Ab -20 010

201004

Mayy-2 2010

201005

Jun-20 -2010

201006

62

 

Concatenar columnas Se usa para combinar columnas de texto en una columna más amplia Por ejemplo, e jemplo, los nombres y apellidos de estudi estudiant antes, es, estan en 2 co colu lumn mnas: as: Apel elli lid do

Nombre

Al l e n

Jo

Charl e s

Dave

Pe rki ns

Max

Ri chards

Bob

Ste phe ns

Mary

Fil File e > Open worksheet w orksheet > S  STU TUDE DENT NTS.MTW S.MTW Data > Concatenate En Concatenate Co ncatenate text columns, columns, First Last  s, poner Students En Store Result Resu lts OK

Tabla resultante Students

Jo Allen Dave Charles Max Perkins Perki ns Bob Richards Mary Stephens Stephe ns 63

 

Despiegue de contantes y matrices

Data > Display data Muestra datos seleccionados Muestra selecci onados de constantes constantes y matrice matricess almancenadas almancenadas dado que no se mostraron en la ventana de sesión. Las constantes son números o textos definidos, para uso en fórmulas y cálculos. Todas las constantes se identifican con un nombre que inicia con K (K1, (K 1, K2, K2 , etc.). Minitab Minitab tiene tres constantes constantes reservadas: K998 = * K999 = 2.718 (e ) K1000 = 3.4142 (Pi) También se pueden asignar asi gnar otros nombres a las constantes. constantes.

64  

Las matrices son bloques rectangulares de números sobre los que se realizan realiz an operaciones operaci ones matemáticas. Porr ejemplo una matriz 3 x 4 (filas x columnas) Po columnas) es:

Las matrices tienen una identificación que inicia con M (M1, M2, etc.) También se pueden asignar otros nombres a las matrcies. Instru nstrucci cciones ones de Minitab: Minitab : Data > Display Data En Co Colu lumn mns, s, constants, constants, and matrices matrice s to dis d isplay, play, las que se quieren mostrar  OK

65  

Cálculo y patrones de datos en columnas Calculadora aritmética aritmética de d e columnas columnas

La calculadora se utiliza para realizar operaciones aritméticas, comparaciones, operaciones lógicas y operaciones entre columnas. Se puede realizar la operaciòn inmediata, o asignarla como fórmula a una columna o constante. Las expresiones no pueden contener matrices. C1-C4 C1-C 4 no es un un rango rango de valores, se interpreta como C1 C1 menos menos C4. C4. Ejemplo:

File > Open worksheet > PULSE.Mtw Calc > Calculator  Store results in variable, Pulse Diff 

En Expresion, poner Pulse2 - Pulse 1 En  OK 68  

Los resultados son:

Pul se 1

Pulse 2

Pul se Diff  

64

88

24

58

70

12

62

76

14

66

78

12

64

80

16

69  

Asignación de un una a constante Se desea des ea asi a signar gnar el v valor alor 1.25 en u un na con co nstante stante Calc > Calculator  Store result resu lts s in variable, K1 En  Expresion, poner 1.25  En OK

70  

Cálculos con datos de fechas

Restar dos columnas de fechas

Fecha Hoy - Fecha Anterior 

Restar 30 días a la fecha de hoy y guardar el resultado numérico

TODAY() - 30 

Restar 30 días a la fecha de hoy DATE(TODAY() DAT E(TODAY() - 30) y guardar el resultadocomo fecha Extraer la fecha de una columna de Fecha Fecha /T Tie iempo mpo

DATE(fecha)

03") Guardar un indicador (verdadero Fecha = WHEN("3/15/ WHEN ("3/15/03") falso) en un una a ccolum olumn na, ccon on base en la fecha y tiempo de una columna column ad de e fe fecha cha

(1= verdadero, 0=falso) 71  

Guardar un indicad Guardar indicador or (verdadero Tiempo >= TIME TIME ("7: ("7:30") 30") AND falso) en e n una una columna, columna, con co n base Tiempo TODAY()TODAY ()-30  30  Guardar un indicad Guardar indicador or (verdadero Fecha contr con tratada falso) en e n una una columna, columna, con co n base en comparación de datos de fechas fechas Guardar un indicad Guardar indicador or (verdadero Fecha con contr tratada atada >DATE("3/15/03")-30  >DAT E("3/15/03")-30  falso) en e n una una columna, columna, con co n base en comparación de datos de fechas fechas

72  

Expresiones generales Calcular una expresión matemática Coeficien Coefici ente te de variación

STDEV(C1)/MEAN(C10)*100 

 Área del círcu círculo lo

K1000*C1**2 

Grados centígrados

5/9*(Farenheit - 32)

Guardar texto en columna

"Verde" 

Guardar un indicador de verdadero o falso en e n col. (1= verdadero, 0=falso)

C1 C2  (C1=16)

73  

Estadísticas Estadísti cas de fila y c columna olumna Determina las estadísticas de filas y columnas con las pantallas sig.: Calc > Column stati s tatistics stics

Calc > Row stati statistics stics

74  

Estandarizar valores de variable va riable Se utiliza para determianr los valores Z correspondientes a valores X almacenados en una una colum c olumna: na: Calc > Standaridi Standaridiz ze

75  

Patrones de datos en columnas Facilita el llenado de una columna con números que siguen un patrón tales como 1 al 100, o 5 subconj subconju untos de 1, 2 y 3. Se pueden obten obtener er patrones con nú números meros igual i gualmen mente te esp espaci aciados ados o con espaciamient espaciami entos os di diferen ferentes tes como 10, 20, 50….

pa tterned Calc > Make patt erned data

76  

Por ejemplo: Da ta > Simple Calc > Make Patterned Data Simple set of numbers Store patterned data, poner ID En  From firs value, poner 1, en To last value, poner 100 En OK Tabla resultante: result ante:

ID 1 2 3 4 5

77  

Otros ejemplos:

78  

Otros ejemplos:

79  

Arbitrary set of numbers

Text Values

80  

Simpe set of Date/Ti Date/Time me values values Ar Arbit bitrary rary set of Date/Ti Date/Time me values values

81  

Variables Variabl es indicadoras parea la regresión Convierte datos categóricos en variables indicadoras para uso en regresión Ejemplo:  AL realizar realizar un an análisis álisis de regresión regresión de llos os dat datos os de ven entas, tas, se qu quiere iere in inclu cluir ir la estación estaci ón del año, qu que e es variable categóri categórica, ca, primavera, verano, verano, otoño e invierno invierno (datos en archiv archivo o SEAS SE ASONALSALE ONALSALES.MTW). S.MTW). Season

Daily Sales

Spri ng

3.75

Spri ng

3.89

Spri ng

4.78

Spri ng

3.82

Spri ng

3.63

Etcétera…

82  

Instrucciones de Minitab: Open worksheet File > Open w orksheet >  > SEASONALSALES:MTW  Calc > Make Indicator variables for, Season Store indicator variables in columns, Spring Summer Summ er Fall Winter  OK

83  

Los datos resultantes son:

Season

Da Daily Sales

Fall

Spring

Summer Winter

Spri ng

3.75

0

1

0

0

Spri ng

3.89

0

1

0

0

Spri ng

4.78

0

1

0

0

Spri ng

3.82

0

1

0

0

Spri ng

3.63

0

1

0

0

Etc…

Se pu p uede ahora realizar la la regresió regres ión n con: Instru strucci cciones ones d de e Minitab: Stat > Regresión > Regression En Response, poner Daily Sales Summ er Fall Fall Winter  Winter  En Predictors, Spring Summer OK  

84

Los resultados resultados se muestran muestran a cont c ontinu inuaci ación: ón:

The regression equation is Daily Sales = 0.687 + 0.634 Fall + 3.13 Spring + 4.03 Summer Predictor

Coef

SE Coef

T

P

Constant

0.6870

0.1987

3.46

0.001

Fall

0.6340

0.2811

2.26

0.030

Spring

3.1290

0.2811

11.13

0.000

Summer

4.0310

0.2811

14.34

0.000

S = 0.628497

R-Sq = 88.8%

R-Sq(adj) = 87.8%

85  

Interpretación:

Los coeficientes para Fall, Spring y Summer son significativos. Las vent entas as de de S Spring pring sonm may mayores ores en $3.13 que las de Wi Win nter $0), en general se pueden observar las diferencias de los coeficientes de las estaci es taciones ones para comparar compa rar su sus s efectos en llas as ven ventas. tas. Normal Probability Plot (response is Daily Sales) 99

95 90 80        t        n       e        c        r       e         P

70 60 50 40 30 20 10 5

1

-1.5

-1.0

-0.5

0.0 Residual

0.5

1.0

1.5

Los residuos res iduos muestran norm normalidad, alidad, por p or lo que el modelo es válido

86  

Distribución normal o de Gauss

Estadístico Z 

Inferencia estadística de los parámetros:

m= media Cuando n >= 30 y/o

es conocida (de

datos históricos) m  =proporción Cuando n >= 30

Estadístico t 

Inferencia estadística del parámetro: m= media Cuando n < 30 y desconocida (sin historial del proceso o prov.)

89  

Estadístico

2

Inferencia estadística del parámetro: = desviación estándar Comprobar normalidad del proceso

Estadístico F 

Inferencia estadística del parámetro: 12/ 22 relación de varianzas Revisar normalidad de muestras

90  

Generación de números aleatorios para simulación simulación Permite generar números aleatorios a partir de diferentes distribuciones con base en sus parámetros específico específicos: s: Calc > Random data

91  

Ejemplo para la distribución normal: Calc > Random data > Normal La tabla resultante es:

Datos

113.307163 103.446686 100.30218 118.253584

105.06341

Etcetera

92  

Distribuciones de probabilidad Permite calcular calcular llas as densidade densidades s de probabilidad, p robabilidad, probab probabilidades ilidades acumulativ acumu lativas as y probabi probabilidad lidades es a acumu cumulativ lativas as inv inversas ersas para una un a serie seri e de d distrib istribuciones uciones disc discretas retas y contin continuas: uas: Calc Ca lc > Probabili Prob ability ty distributions distributions

93  

Ejemplo para la distri distribución bución normal: Calc > Probability distributions > Normal

Los resultados son:

Cumulative

Normal

Distribution

with

mean

 x

P( X Probability Distribution Plot. Plot . Seleccionar View Probability Probability,, click OK OK.. Normal.. De la Distribution, Distribution, Seleccionar Normal En Mean, Mean, poner 1211 . En Standard deviation deviation,, poner 320 . By,, seleccionar X Value Value.. Click en Shaded area. area . En Define Shaded Area By Click Right Tail Right Tail.. En X value value,, poner 1738 . Distribution Plot Click OK en OK en cada cuadro de diálogo Normal, Mean=1211, StDev=320 0.0014 0.0012 0.0010     y      t       i     s     n     e

0.0008

      D 0.0006

0.0004 0.0002 0.0498 0.0000

1211

1738

 X 

97  

O para un 10% del área: area.. En Define Shaded Area By, By, seleccionar Probab., Right Tail, 0.10 5 Click en Shaded area

Distribution Plot Normal, Mea n=1211, StDev=320

0.0014 0.0012 0.0010

10

    y   0.0008      t      i      s     n      e       D 0.0006

0.0004 0.0002

0.1

0.0000

1211

1621

 X 

El valor de 1738 si entra en la zona.

98  

Solo como demostración para el caso de dos colas: By, sel. Probab., Proba b., Bot Both h Ta Tails, ils, 0.10 0.10.. 5 Click en Shaded area. area . En Define Shaded Area By, Distribution Plot Normal, Mean=1211, StDev=320 0.0014 0.0012 0.0010     y        t  0.0008      i     s      n     e       D 0.0006

0.0004 0.0002 0.05 0.0000

0.05 685

1211  X 

1737

99  

Prueba de normali normalidad dad Es una prueba de hipótesis de una población para determinar si la muestra se extrae de una población normal, que es la hipótesis nula. La hipótesis alterna es que no es normal.

Se puede hacer por diversos métodos:

1. Método gráfico Se trata de probar la flamabilidad de una fibra y ver si sigue una distribución normal, además se quiere observar su valor en el percentll 87avo.

1 2 3 4 5 6

File > Open worksheet worksheet  FLAMERTD.MTW. Probab ility Graph > Probabili ty Plot. Seleccionar Single, Single, click OK OK.. variables,seleccionar ,seleccionar Fabric  . En Graph variables Click Scale Scale,, y click el Percentile Lines . Lines . OK  en cada cuadro de diálogo. En Show percentile lines at Y values, values , teclear 87  . Click OK

100  

Probability Plot of Fabric Normal - 95% CI 99

95 90

87

Mean StDev N  AD P-Value

3.573 0.5700 15 0.31 0.310 0 0.517

80 70

t n e cr e P

60 50 40 30 20 10 5

        5          1         2   .         4

1

2

3

4 Fabric

5

6

Los puntos no salen del intervalo de confianza del 95% y el P value es menor de 0.05 por tanto los datos de la muestra siguen una distribución normal. El IC del 87% se encuentra entre los valores 3.84295 y 4.58790 101  

6. Estadística inferencial Pruebas de hipótesis

104  

Estadística inferencial • Introducción

• Intervalos de confianza • Pruebas de hipótesis de una población • Pruebas de hipótesis de dos poblaciones Análisis de vari varianza anza de un una a vía ((ANOV ANOVA A One way) way) • Análisis • Anális Análisis is de varianz varianza a de dos vías (ANOV (ANOVA A two wa ways) ys)

• Análisis de medias (ANOM) ANOV VA bal balanc anceado eado • ANO 105  

IC = Est Estadís adístico tico ++- err error or mu muestr estral al

Intervalo de confianza (95%) , rango de valores para estimar los parámetros , , 2, 

Población, total de productos y servicios (N)

Muestra (n)

Inferencia estadística de los parámetros: m= media s= desviación estándar 2 = varianza =proporción

Estadísticos X, s, p

106  

Distribución normal o de Gauss

Estadístico Z 

Inferencia estadística de los parámetros:

m= media Cuando n >= 30 y/o datos históricos) m =proporción Cuando n >= 30

es conocida (de

Estadístico t 

Inferencia estadística del parámetro: m= media Cuando n < 30 y desconocida (sin historial del proceso o prov.)

107

 

Estadístico

2

Inferencia estadística del parámetro: = desviación estándar Comprobar normalidad del proceso

Estadístico F 

Inferencia estadística del parámetro: 12/ 22 relación de varianzas Revisar normalidad de muestras

108  

IC = Est Estadís adístico tico ++- err error or mu muestr estral al

Intervalo de confianza (95%) , rango de valores para estimar los parámetros , , 2, 

Población, total de productos y servicios (N) Estadísticos utilizados:  Z o t 

m = media, =proporción

Muestra (n)

s= desviación estándar, 12/

2

22 Rel. de varianzas

Estadísticos X, s, p

109  

Intervalos de confianza para la media Determinar el intervalo de confianza para la media poblacional , con los datos tomados del índice de calidad del vino, con los datos en el archivo Wine.Mtw. Desv. Estándar = 2.04 Se utiliza el estadístico Z por ser n > 30

File le > Open worskeet > Wine.Mtw Wine.Mtw Fi Stat > Basi B asic c statistics statisti cs > 1-Sample-Z 1-S ample-Z (Test (Test and confidence in i nterv terval) al) Samples in columns seleccionar columna  columna Quality Estándar deviatio deviation n 2.04 Options Co Conf nfid idence ence lev level el 95% OK Individual Individu al Value Plot of Quality Graphs seleccionar Individual value plot OK OK (with 95% Z-confidence interval for the Mean, and StDev = 2.04)

 _  X

Intervalo donde se encuentra La media poblacional

7

8

9

10

11

12 Quality

13

14

15

16

110  

Se obtienen los resultados siguientes: One-Sample Z: Quality The assumed standard deviation = 2.04 Variable Quality

N

Mean

StDev

SE Mean

38

12.437

2.045

0.331

95% CI (11.788, 13.085)

Conclusión: para un 95% de nivel de confianza, con los datos obtenidos de la muestra mues tra del ínid ínidice ice de c calidad alidad de dell vino (Quality), el intervalo qu que ec contiene ontiene al ííndice ndice promedio de calida c alidad d para toda la producc producción ión de vino es: (11.788 (11. 788 a 13.085) La gráfica de puntos que muestra la distribución de los valores del índice de calidad y el Intervalo de confianza correspondiente, para un nivel de confianza del 95% es: Individual Value Plot of Quality (with 95% Z-confidence interval f or the Mean, and S tDev = 2.04)

 _  X

7

8

9

10

11

12 Quality

13

14

15

16

111  

Prueba de hipótesis • Una prueba de hipótesis es una afirmación sobre el valor que se estima tiene un parámetro poblacional , , 2,  • Si la afirmación contiene el signo igual (=, >=, 100 Ho: m Basic statistics > 1-sample t

113  

One-Sam OneSample ple Z Los resultados se muestran a continuación TOne-Sample est of m mu u = 100T vs > 100 The assumed standardcannot deviationbe = 5 made with summarized data. * NOTE * Graphs Test of mu = 100 vs not = 100  N

95% Lower Mean StDev

SE Mean

N 20

95% CI

Mean SE Mean Z P (107.66, 112.34) 110.00 5.00Bound 1.12 20 110.00 1.12 108.16 8.94 0.000

T

P

8.94

0.000

Conclusión: El

intervalo de confianza donde se encuentra el promedio de las ventas con base en una muestra tomada es (107.66 a 112.34) para un 95% de nivel de confianza.

El Int Interv ervalo alo de c conf onfianz ianza a de (107.66, 112.34) no contiene a la medi media a de la hipótesis (100) y P value es menor a 0.05, se rechaza Ho y se acepta Ha, ya subió el promedio de ventas.

114  

Cuando se conoce la desviaci desviación ón estándar y la muestra n es mayor a 30. Para el caso de los datos de dell arch archivo ivo Wine.Mtw se trata de probar la afirmación afirmaci ón de que que el aroma es mayor o igual a 4, a un 95% de nivel de confianza. Establecimiento de hipótesis Ha: m= 4 En Minitab:

Stat > Basic B asic statistics > 1-Sample-Z (Test (Test and confidence interval) interval) Samples in columns seleccionar columna  columna Aroma Standard deviation deviatio n 4.847 Pe rform hy Perform hypothesi pothesis s test Hy Hypothesi pothesized zed mean 4 Options ns Co Confidence nfidence level 95% 95% Alternative  Alternative Less Than  Than  OK Optio Graphs seleccionar Individual value plot OK OK

115  

116  

Los result resultados ados se muestran a co cont ntinuación: inuación: One-Sample Z: Aroma Test of mu = 4 vs < 4 The assumed standard deviation = 4.847  

95% Upper

Variable Aroma

N

Mean

StDev

SE Mean

Bound

Z

P

38

4.847

1.082

0.786

6.141

1.08

0.859

Conclusión:  El int i ntervalo ervalo de confianz confianza a donde se encu encuentr entra a el prome promedio dio de A Aroma roma con base en un una a muestra tomada es (…., 6.14 6.141) 1) pa para ra un 95% de nivel de confianz confianza. a.

El Interv Intervalo alo de confianz confianza a de (….., 6.141) SI contiene a la medi media a de la hipótesi hipótesis s (4) y P value value es mayor a 0.05, NO se rechaza Ho, el Aroma ti tiene ene un promedi promedio o >= 4. Individual Value Plot of Aroma

(with Ho and 95% Z-confidence interval for the Mean, and StDev = 4.847)

 _  X Ho

3

4

5

6

7

8

 Aroma

117  

Prueba de hipótesis para una proporción Ejemplo: Un producto tiene accesori accesorios os que se pi piensa ensa nadie usa, se hace un una a encuesta a 200 usuarios y 17 si usan los accesorios.

¿Para un 95% de confianza confianza se confirma la sospecha de q que ue men menos os del 1 10% 0% de usuarios usu arios usan estos acceso accesorios? rios? Establecer hipótesis: Ho: Proporción  >= 0.10

Ha: Proporci Proporción ón  < 0.10

Instrucciones de Minitab Stat > Basic Statistics > 1 - Proportion Options Confidence level 95% Test Proportion 0.1  Alter  Altern nat ativ ive e Less Than nterval val based on normal normal distribution di stribution seleccionar   Use Use test and iinter OK

118  

Se obtuvieron los resultados siguientes:

Test and CI for One Proportion Test of p = 0.1 vs p < 0.1   Sample 1

Upper

Exact

X

N

Sample p

Bound

P-Value

17

200

0.085000

0.124771

0.285

No se rechaza Ho ya que la Proporción del 10% de la hipótesis se encuentra en el intervalo de confianza y el P value es mayor a 0.05, no se acepta la hipótesis alterna. Es válido decir que sólo el 10% de usuarios utilizan los accesorios

119  

Comparación de dos medias - Muestras independientes Ho: Media A (m  A)- Media B (mB) = 0 Ha: Media A (m  A)- Media B (mB) 0 Ejemplo: 10 pieles pi eles son curt curtida idass usan usando do el método A y 10 usan usando do el método B B,, las resistencias a la tracción son las siguientes: Mét étodo odo A Mét étodo odo B 24.3 24.4 25.6 21.5 26.7 25.1 22.7 22.8 24.8 25.2 23.8 23.5 25.9 22.2 26.4 23.5 25.8 23.3 25.4 24.7

¿Se puede decir que los dos métodos producen resistencias a la tracción diferentes? Usar un nivel de confianza del 95%. En Minitab: Se colocan coloc an los vvalores alores en dos column columnas as di diferen ferentes tes C1 y C2 corresp. A Metodos A y B 120  

P aso as o 1. S e real realiza iza un aná anállis is de compara comparación ción de varianzas varianzas poblacional oblacionales es : Ho: Vari Varianz anza a A = Varia Varianz nza aB Ha: Vari Varianz anza a A  Vari  Varianz anza aB

Vari ances Stat > Basic Statistics > 2 Varian ces Samples in different columns First Método A Second Método B Options Confidence level 95% OK

121  

Los resultados son los siguientes: Test for Equal Variances: Método A, Método B 95% Bonferroni confidence intervals for standard deviations F-Test (normal distribution) Test statistic = 1.01, p-value = 0.991

Como el P value es mayor a 0.05 no se rechaza la Hipótesis nula de igualdad de varianz ari anzas, as, por po r tanto se asume que son iiguales. guales. Esta inf. se usará a continuaci continuación: ón:

122  

P as o 2. S e realiza realiza un anál anális is de compa comparación ración de med medias ias poblac poblacion ional ales es Establecer hipótesis H: Media A - Media B = 0

Ha: Media A - Media B



 0

Instrucciones de Minitab: Stat > Basic Statistics > 2 - Sample t Samples in i n different column columns s Fi rst Método A Second Método B seleccionar  Assume  Assume equal variances Options Confidence level 95% Test differen di fference ce 0.0  0.0  Altern  Alternativ ative e Not equal OK OK

123  

La gráfica de d e caja parece iindicar ndicar diferencia entre las las media medias s de las mu muestras estras Boxplot of Método A, Método B 27

26

25

at

a 24 D

23

22

21 Método A 

Método B

124  

Se obtienen llos os siguientes resul resultados: tados: Two-sample T for Método A vs Método B   N Mean StDev SE Mean Método A 10 25.14 1.24 0.39 Método B

10

23.62

1.24

0.39

Difference = mu (Método A) - mu (Método B) Estimate for difference: 1.52000 95% CI for difference: (0.355, 2.685) T-Test of difference = 0 (vs not =): T-Value = 2.74 P-Value = 0.013

DF = 18

Conclusiones: Como el cero no se encuentra en el intervalo de confianza de la diferencia de las dos medias y el valor P value es menor a 0.05 se rechaza la hipótesis nula de igual i gualdad dad de medias y se acepta Ha afirmando afirmando que las medias son diferentes diferentes

125  

Muestras pareadas - Prueba si las diferencias entre sujetos son iguales. Ho: Media de diferencias = 0

Ha: Media de diferencias



Se utilizan cuando cuando se trata de co comparar mparar el efecto de dos tratamientos a los mismos mi smos sujetos u objetos, por ejemplo el peso de individuos antes y después de una rutina. También se aplica aplic a cuando cuan cuando do antes de comparar se hacen parejas de sujetos por ejemplo para comparar los promedios promedi os de alumos de dos universidades universidades,, primero se forman parejas (dos ingenieros, dos administradores, dos do s arquitectos, etc.) Ejemplo: Se hacen dos tratamientos superficiales para pa ra lentes lentes A y B, se seleccio seleccionan nan 10 personas pe rsonas a las que se les instala un uno o de esos lentes en cual cualquier quier lado al a l azar. Después de un periodo se mide mi de el deterio deterioro ro (rayas, desgaste, etc.) de cada lente: lente:

 A un un 95% de nivel de con confian fianz za ¿Se puede afirmar que los 2 tratamien tratamientos tos producen diferent diferente e de deterioro terioro en los lentes? Se colocan los datos en las columnas C1 y C2 para los Lentes A y B.

126  

Persona 1 2 3 4 5 6

Lente A 6.7 5.0 3.6 6.2 5.9 4.0

Lente B 6.9 5.8 4.1 7.0 7.0 4.6

7 8 9 10

5.2 4.5 4.4 4.1

5.5 5.0 4.3 4.8

En Minitab colocar los datos de Lent Le ntes es en dos colu co lumn mnas as Establecer hipótesis Ho: Diferen Di ferencia cia de medias media s = 0

Ha: Diferencia Di ferencia de medias



 0

Instrucciones de Minitab Stat > Basic Statistics > Paired t Samples in i n different column columns s Fi rst Lente A Second Lente B plo t Graphs Individual value plot Options Confidence level 95% Test mean 0.0 mean 0.0  Altern  Alternativ ative e Not equal OK OK

127  

Resultados Paired T-Test and CI: Lente A, Lente B Paired T for Lente A - Lente B   N Mean StDev Lente A 10 4.96000 1.02978 Lente B 10 5.50000 1.13039 Difference 10 -0.540000 0.343835

SE Mean 0.32564 0.35746 0.108730

95% CI for mean difference: (-0.785964, -0.294036) T-Test of mean difference = 0 (vs not = 0): T-Value = -4.97 P-Value = 0.001

Como el cero no se encuent encuentra ra en el intervalo intervalo de confianza confianza de la diferen difere ncia de las do dos s medi medias as y el valor valor P value value es men menor or a 0.05 se rechaza rechaza la hipótesis hipótesi s nula nula de igualdad i gualdad de med media ias s y se acepta ace pta la alterna alterna afirmando afi rmando que los tratamient tratamientos os dan da n deterioros diferent di ferentes. es.

128  

Individual Ind ividual Value Pl ot of Differ ences

(with Ho and 95% t-confidence interval for the mean)

 _  X Ho

-1.2

-1.0

-0.8

-0.6

-0.4

-0.2

Differences

0.0

Como el valor de Ho no se encuentra en el intervalo de confianza de la diferencia de las dos medias, se rechaza Ho y se acepta Ha indicando que el deterioro es diferentes en los dos métodos.

129  

Comparación de dos proporciones Ejemplo: En una encuesta encuesta a 300 clientes cli entes de la zona A, 33 estan descontentos En otra zona B se encuestaron a 250 clientes y 22 se mostraron desconten desc ontentos. tos.  A un 95% de nivel nivel de confianz confianza a o 5% de nivel nivel de sigfinicancia, sigfinicancia, ¿Hay diferencia en las proporciones propo rciones de clientes descontentos en las las dos zon zonas? as? Establecer hipótesis: Ho: Proporción A = Proporción B

Ha: Proporción A  Proporción B

Instru nstrucciones cciones de Minitab (datos resumidos): re sumidos): Stat > Basic Statistics > 2 - Proportion P roportions s Options  Confidence level 95% Options 95% Altern  Alternative ative Not equal, Test Difference = Difference = 0 Seleccionar   Use Use Pooled estimate p for test

OK

130  

Los resul resultados tados so son n los siguientes: Test and CI for Two Proportions Sample 1

X 33

N 300

Sample p 0.110000

2

22

250

0.088000

Difference = p (1) - p (2) Estimate for difference: 95% CI for difference:

0.022

(-0.0278678, 0.0718678)

Test for difference = 0 (vs not = 0):

Z = 0.86

P-Value = 0.392

Como el cero SI se encuentra en el intervalo de confianza de la diferencia de d e las 2 proporcio proporciones nes y el v valor alor P valu alue e es may mayor or a 0.05 no se rechaza rechaza la hipótesis nu nula la de iigualdad gualdad de prop proporciones orciones o sea que no h hay ay raz razón ón para deci decirr que las proporci proporciones ones son diferent diferentes. es.

131  

Análisis de varianza (ANOVA) El Análisis de V Varianz arianza a es una pru prueba eba d de e hipótesi hipótesis s que trat trata a de p probar robar la igualdad de varias medias al mismo tiempo:  H 0



 1



 2   

 

 3



....



 k 

 H 1 :  Al  menos

dos s medias  so do  sonn diferentes

.

Requiere que las poblacio p oblaciones nes sean norm normales ales y con varianza varianza si similar. milar. ANOVA de una vía con datos de tratamientos en diferentes columnas: Ejemplo: Los técnicos de un una a fábrica fábri ca de papel hacen un ex experimento perimento de un factor  para ver que varied variedad ad de árbol produce menos fen fenoles oles en los desechos de pa pasta sta de papel. Se colectan los siguientes datos en porcentajes:  A un un 95% de nivel de con confian fianz za, ¿hay algu algun na v variedad ariedad que que produ produz zca m más ás ffenol enoles es qu que e ot otra? ra? Se colocan los datos en tres colum columnas nas distintas:

132  

Instru nstrucci cciones ones de Minitab: Stat > ANOVA > One Way (Unstacked) Responses in separate columns A columns A B C Confidence Level 95 Tukey's, 's, family error rate: 5 rate:  5 Comparisons Tukey Graph Graphs: s: Residual plots Box plot of data Norm Normal al plot of residuals OK

133  

Los resultados resultados se muestran a continuació continuación: n: One-way ANOVA: A, B, C

Como el valor P value value es menor  a 0.05 existe una diferencia significativa signific ativa entre entre algunas algunas medias medi as

Source DF Factor 2 Error 12 Total 14 S = 0.2309     Level A B C    

N 4 5 6

SS MS 0.9000 0.4500 0.6400 0.0533 1.5400 R-Sq = 58.44%

Mean 1.9000 1.3000 1.4000

StDev 0.1414 0.2121 0.2828

F 8.44

P 0.005

R-Sq(adj) = 51.52%

Individual 95% CIs For Mean Based on produce más fenoles fenoles que B,C Pooled St A produce ----+---------+---------+ ----+---------+---------+---------+-----------+-----(-------*--------) (-------*--------) (------*-------) (------*-------) (------*------) (------*------) ----+---------+---------+---------+----1.20 1.50 1.80 2.10

Las medias B y C son similares

Pooled StDev = 0.2309

D esviación estándar poblacional

La media de A es diferente a B y C

134  

Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons Individual confidence level = 97.94% A subtracted from:

Como el cero ce ro no está en el intervalo interv alo de la di diferen ferencia cia B B-A -A o C-A, A es diferente de B y C

  B

Lower -1.0130

Center -0.6000

Upper -0.1870

-----+---------+---------+---------+ -----+---------+---------+---------+------(---------*---------)

C    

-0.8974

-0.5000

-0.1026

(---------*--------) (---------*--------) -----+---------+---------+---------+----0.80 -0.40 -0.00 0.40

B subtracted from:   Lower Center C    

-0.2728

0.1000

Upper

-----+---------+---------+-------------+---------+---------+---------+---+----

0.4728

(---------*--------) (---------*--------) -----+---------+---------+---------+----0.80 -0.40 -0.00 0.40

El intervalo intervalo de la d diferencia iferencia C-B C -B si incluye incluye el cero por tanto B no es diferen di ferentes tes de C

135  

Los resultados gráficos son los siguientes: Boxplot of A, B, C 2.2

2.0

1.8     a       t      a        D

1.6

1.4

1.2

1.0  A 

B

C

Se observ ob serva a que la m medi edia a de A es diferen di ferente te a las medias de B y C (si se s e superpone superpo ne B y C tienen ti enen elementos elementos comunes comunes y son iguales) Los árboles á rboles B y C produ prod ucen menos menos cantidad de fenoles. 136  

Los resultados gráficos son los siguientes: Normall Pr obab Norma obability ility Plot (responses are A, B, C) 99

95 90 80 70      t      n 60     e      c  50     r     e  40       P 30 20 10 5

1

-0.50

-0.25

0.00 Residual

0.25

0.50

Los residuos o errores se apegan a la recta normal, por tanto el modelo ANOVA es un modelo adecuado para los datos 137  

ANOVA de una vía ccon on datos d dee tratamientos en una sola columna Los datos del ejemplo anterior se arreglan en dos columnas column as como se mu muestran estran a continu continuaci ación: ón:

A

B

C

1.9

1.6

1.3

1.8 2.1 1.8

1.1 1.3 1.4 1.1

1.6 1.8 1.1 1.5 1.1

Fenoles

Árbol

1.9 1.8 2.1

A A A

1.8 1.6 1.1 1.3 1.4 1.1 1.3 1.6 1.8 1.1 1.5

A B B B B B C C C C C

1.1

C 138

 

Instru nstruccio cciones nes de Minitab: Stat > ANOVA > One Way Response Fenoles Factor Árb Factor Árbol ol Confidence Level 9 Level 95 5 Comparisons Tukey's, Comparisons Tukey's, family error rate: 5 rate:  5 Graphs: s: Residual Residual plots Box plot of data Norm Normal al plot of residuals Graph OK

Los resultados que se obtienen son iguales a los ejemplo anterior.

139  

Ejercicios: Las calificaciones de un curso de liderazgo para 18 participantes de tres diferentes departamentos fueron las mostradas en la tabla siguiente. Probar a un 95% de nivel de confianza o 5% de nivel de significancia si el aprovechamiento fue similar en los tres departamentos o en su caso cuál fue el peor. DEPARTAMENTO

Arreglados en dos columnas quedan como:

De Dept pto_ o_A A

Dept pto_ o_B B

Dept pto_ o_C C

8 7

7 8

5 6

7 Dep Depto_ to_A A

8

7

6

8 Dep Depto_ to_A A

6

7

7

6 Dep Depto_ to_A A

7

6

7

7 Dep Depto_ to_A A

8

8

6

8 Dep Depto_ to_A A

 

Calificaciones   Depto

8 Dep Depto_ to_A A

7 Dep Depto_ to_B B 8 Dep Depto_ to_B B 7 Dep Depto_ to_B B 7 Dep Depto_ to_B B 6 Dep Depto_ to_B B 8 Dep Depto_ to_B B 5 Dep Depto_ to_C C 6 Dep Depto_ to_C C 6 Dep Depto_ to_C C 7 Dep Depto_ to_C C 7 Dep Depto_ to_C C 6 Dep Depto_ to_C C

140  

a) Con datos en tres columnas

Instru nstruccio cciones nes de Minitab: Mi nitab: Stat > ANOVA > One Way (Unstacked) Responses in separate sepa rate colu co lumn mnss Depto _   A Depto Depto_B _B Depto_ Depto_C C Confidence Level 95 Comparis ons Tukey's, Comparisons Tukey's, family error rate: 5 rate:  5 Graphs: Residual plots Box plot of data Normal plot of residuals OK Como el valor P de

es

que 0.05, se concluye concluye que

El peor aprovechamiento aprovechamiento lo tuvo tuvo el departamento De las gráficas de diferencias de Tukey, las medias de los procesos que son diferentes son  (dado que el cero no se encuentra en el intervalo de confianza de la diferencia de medias  – Pairwise comparisons): comparisons):

b) Otra opción con datos en una sola columna

Instru nstruccio cciones nes de Minitab: Mi nitab: A NOVA > One Way Stat > ANOVA Response Calificación Factor Depto Confidence Level Level 9  95 5 Comparisons ons Tukey's, Tukey's, family error rate: 5 rate:  5 Comparis

Graphs: Residual plots Box plot of data Normal plot of residuals OK Identificar la media que es diferente a las demás (donde el cero no pertenezca al intervalo 141  

b) Otra opción con datos en una sola columna

Con Mini Minitab: tab: Stat > ANOVA One way Response Calificaciones Factor Depto Comparisons: Tukey’s, family error rate 5

Graphs: Box polot of data Graphs: OK ESTADÍSTICAS ESTADÍST ICAS > ANOVA AN OVA UN FACTOR RESPUESTA CALIF CALIF   FACTOR DEPTO. COMPARACIONES: TUKEY, TASA DE ERROR DE LA FAMILIA 5 GRÁFICAS: DIAGRAMA DE CAJA DE DATOS OK Identifi carr la media que es diferente Identifica di ferente a las demás (donde el cero no ppertenezca ertenezca al al iintervalo ntervalo de confianza de la l a diferencia de medias entre cada dos tr trata atamientos mientos Depto).

142  

Análisis de varianza varianz a de d dos os vías (ANOVA (ANOVA T wo way) Prueba la igualdad de medias medi as poblaci poblacional onales es cuan cuando do la clasifi clasificación cación de tratamientos es por variables o factores, las las celdas deben estar balan balanceadas ceadas con el mismo número de observaciones y los factores deben ser fijos. Para mostrar las medias en las celdas y sus desviaciones estándar utilizar la opción Cross Tabulati Tabulation on and Chi C hi Square. Si se desea que ciertos factores sean aleat aleatorios, orios, usar ANOVA balanceado o el Modelo lineal general general si desea comparar medias usan usando do co comparaciones mparaciones mú múltiples. ltiples.

Por ejemplo:

Se estu e studia dia el plancton plancton en dos lagos. lago s. Se preparan prep aran doce tanques en el laboratorio, seiss con agua de cada sei c ada uno de los lagos, lago s, se agre agrega ga uno de tres nutrientes nutrientes en cada tanque tanque y al mes se cuenta cuenta el plancton en cada unid unidad ad d de e volu volumen men de ag agua. ua.  Se ut utiliza iliza el ANOVA de d dos os vías vías para pa ra este experiment experi mento. o. 143  

Instrucciones nstrucciones de Minitab: Open pen worksheet worksheet > EXH_AOV.MTW. 1 File > O Zooplank to ton Supplement

34 43 57 40 85 68 67 53 41 24 42 52

2 3 4 5

1 1 1 1 2 2 2 2 3 3 3 3

Lak e

Rose Rose Dennison Dennison Rose Rose Dennison Dennison Rose Rose Dennison Dennison

Stat > ANOVA > Two-Way. En Response, seleccion selecci onar ar Zooplankton . En Row factor , seleccionar seleccionar Supplement . Seleccionar Seleccionar Display means. En Column factor , seleccion selecci onar ar Lake . Sel. Display means. Click OK. 144

 

Los resultados se muestr muestran an a continuación: Two-way ANOVA: Zooplankton versus Supplement, Lake Source Supplement

DF 2

SS 1918.50

MS 959.250

F 9.25

P 0.015

Lake

1

21.33

21.333

0.21

0.666

Interaction Error

2 6

561.17 622.00

280.583 103.667

2.71

0.145

11

3123.00

Total S = 10.18

 

R-Sq = 80.08%

R-Sq(adj) = 63.49%

Individual 95% CIs For Mean Based on

 

Pooled StDev

Supplement

Mean

1

43.50

2 3

68.25 39.75

 

--+---------+--+---------+---------+-------------+---------+---------+------(-------*----(-------*-------) --) (--------*----(--------*-------) --) (--------*---(--------*-------) ---) --+---------+---------+---------+-------

 

30

45

60

75

Interpretación: De la tabla de ANOVA se s e ve que no no hay una in i nteracción teracci ón signific significativa ativa entr entre e Supplement*Lake y tampoco Lake es significativo. 145  

 

Individual 95% CIs For Mean Based on

 

Pooled StDev

Supplement

Mean

1

43.50

2 3

68.25 39.75

 

--+---------+---------+---------+-------+---------+---------+---------+------(-------*-------) (--------*-------)

(--------*-------)

--+---------+---------+---------+-------

 

30

45

60

75

 

Individual 95% CIs For Mean Based on

 

Pooled StDev

Lake

Mean

Dennison

51.8333

Rose

49.1667

 

-----+---------+---------+---------+-------+---------+---------+---------+---(----------------*----------------) (----------------*----------------) (----------------*----------------) (----------------*----------------) -----+---------+---------+---------+----

 

42.0

48.0

54.0

60.0

Hay evidencia significativa que Supplement afecta al crecimiento para un alfa de 0.05. De gráfica de medias pparece arece que Supplem Supplement ent 2 es mejor para crecimient crecimie ntoo del plancton plancton.. Para examinar comparaciones múltiples de medias, utilizar el modelo lineal general. 146  

Análisis de medias Sirve para realizar un un análisis análisis de medias medi as (ANOM (A NOM)) para datos normales, binomiales o de Poisso P oissonn y opcional opci onalmen mente te imprime una tabla resumen para datos normales o binomiales.

Por ejemplo para datos normales: Se ev e valúa alúa el efecto de tres tiempos de d e nivel niveles es de proceso y tres niveles niveles de resistencia en la densidad. Se analizan las medias y un diseño de dos vías para identificar int i nteracciones eracciones o efectos principales si significativos. gnificativos.

147  

Instrucciones nstrucciones de d e Minitab: worksh eet EXH_AOV.MT 1 File > Open worksheet  E XH_AOV.MTW. W. D ensi ty

M i nutes

S trength

7 8 10 7 1 4 3 2 6 7 8

10 10 10 10 15 15 15 15 15 15 15

3 3 3 3 1 1 1 1 2 2 2

  Etcétera…

3 En Response, seleccionar Density . 4 Seleccionar Normal. 5 En Factor 1, seleccionar Minutes . En Factor 2, seleccionar selecci onar Strength. Strength. Click Clic k OK. 148  

Los resultados se muestran a continuación: Two-Way Normal ANOM for Density  Alpha = 0.05

Interaction Intera ction Effect Effect s 2

    t    c      e      f     f     E

1.578 0

0

-2 Strength Minutes

-1.578 1 10

2

3

1 15

2

3

Main Ef fect s f o r Min ut es

   n    a     e      M 6

2

3

Main Effect s fo r S t ren gt h 7.145

7

1 18

6.222

8    n    a  6    e      M 4

7.145 6.222 5.300

5.300 2

5 10

15 Minutes

18

1

2 Strength

3

149  

Interpretación: Se muestra la gráfica de interacción y de efectos principales para 2 factores. La gráfica ANOM tiene una línea central y límites de decisión, si un punto cae fuera de estos e stos límites límites es evidente qu que e es diferente de la gra gran nm medi edia. a. Si la interacción fu fuera era significati si gnificativ va, y ya a no se consideran los efectos principales por separado, dado que unos dependen de otros.  En este caso no es significativo.

El punto que representa la media del nivel 3 del factor Minutes se muestra con un asterisco en rojo, indicando que hay evidencia al nivel de alfa = 0.05 de que que difiera difie ra significati significativ vamente amente de la la media general. general. En el caso de Strenght, hay evidencia de que los efectos principales para los niveles 1 y 3 se encuentren fuera de los límites de decisión  y son diferentes de la media general. Los pun puntos tos que es están tán fuera fuera se pueden inv investi estigar. gar. 150  

Ejemplos Ejempl os con datos binomiales

Se cuenta cuenta el número úmero d de e soldaduara soldaduara rechazadas en muestras muestras d de e tamaño 80 para identifi identificar car que proporci proporciones ones están fu fuera era de la línea línea con otras muestras. muestras. Como las muestras tienen 2 resultados, resultados, la proporci proporción ón de éxitos es constante constante y son independie independien ntes se usa el análisi análisiss de medias para datos bin bi nomiales. 1 File > Open worksheet EXH_AOV.MTW. eldRejects

3 6 8 14 6 1 8 1 8 10 1

151

 

2 3 4

Stat > ANOVA > Analysis Analysis o off Means Means.. En Response Response,, seleccionar WeldRejects .  en Sample size size.. Click OK. Seleccionar Binomial y poner 80  en One-Way One-W ay Binomial Binomial ANOM ffor or WeldRejects  Alpha = 0.05 0.20

0.1547

0.15

     n      o         i       t       r      o       p        o       r       P

0.10 0.075 0.05

0.00

0

1

2

3

4

5

6 Sample

7

8

9

10

11

152  

Intrepretación: La gráfica g ráfica muestra la proporción proporció n de defectos para p ara cada cad a muestra, muestra, la lín línea  central  cent ral como la proporción proporci ón promedio, y los límites límites superior e in i nferior.

En este caso la muestra muestra 4 sale sa le de los límites límites de decisión deci sión y es anormal. anormal.

153  

Ejemplo con datos de Poisson Una Un a fábri fábrica ca d de e jugu juguetes, etes, quiere monitorear el nú número mero de defectos de carros ca rros de jugu juguete. ete. Se toman 20 muestr muestras as de carros y se crea una una carta de medias para examinar el n núm úmero ero de defectos en cada mu muestra. estra. 1 File > Open work  worksheet sheet TOY TOYS.MTW. S.MTW. Defects

Defects

9 11 2 5 15 13 8 7 5 2

4 4 2 5 5 2 3 2 1 6 154

 

2 3 4

Stat > ANOVA > Analysis of Means. En Response, seleccion selecci onar ar Defects Seleccionar Poisson . Click OK. One-Way Poisson ANOM for Defects  Alpha = 0.05

16

12.49

12     s       t      c      e        f     e        D

8 5.55 4

0

0

1

2

3

4

5

6

7

8

9

10 11 12 13 14 15 16 17 18 19 20 Sample

155  

Interpretación: La gráfic g ráficaa muestra el número número de defectos defectos en cada cada muestra, la línea línea central es el promedio promedi o de defectos, y los límites límites de deci d ecisión sión superior e in i nferior.

En este caso, el número número de ddefectos efectos de los carros cinco y seis son anormales ya que caen fuera de los límites de decisión.

156  

ANOVA Balancea Ba lanceado do Se usa pa para ra realizar anál análisi isiss univariado univariado de varianza varianza pa para ra cada una de las variables ddee resp respuuesta. El diseño debe ser balanceado, con las mismas observaciones por celda. Los factores pueden ser cruz cruzado adoss o anidados, anidad os, fijos o aleatorios. aleatorio s. Se pueden incluirir hasta 50 variables inclu aria bles de respuesta con hasta 31 factores simultan simultaneos. eos. Los factores son so n predi predictores ctores (independie (independienntes) que se seleccionan a que que varien sistemáticamente durante un experimento para determinar su efecto en llaa variable ddee resp respuuesta (variable de dependiente). pendiente).

157  

Por ejemplo, ejemplo, si  si se quiere evaluar el acabado superficial de partes metálicas producidas por varias máquinas y se miden por varios operadores. Tanto Tan to "Máquin "Máq uina" a" como ""Operador" Operador" son factores en este experimento. Los factores pueden ser cruzados o anidados, dependiendo de cómo se colecten los datos. Factores cruzados:

Do s factores son Dos s on cru cruzzado adoss cuando cada nivel nivel de un factor ocurr ocurree en combinación con cada nivel del otro factor. Por ejemplo, los m mismos ismos tres operadores operado res evalúan evalúan el acabado superficial superficia l de las 2 máquinas.

158  

Modelo:

En la caja de Model solo se especifican las X's no la Y. La opción Make Patterned data, single set of numbers puede ay a yudar a cargar carga r los números números de d e niveles de un factor.

L as as r e las  para expresar modelos son: 1 * indica indi ca un un término de interacc interacció ión, n, por ej ejemplo emplo A*B. A*B .

Por ejemplo: Dos factores cru cruz zados: A B A*B

159  

Por ejemplo para un diseño cruzado de tres vías con niveles a, b  y c de factores A, B, C, con n observaciones por celda, se tiene: F3 (Reset  (Reset def.). 1 Calc>Make Patterned Data > Simple set of numbers, F3 i n. Poner 1 en From first value, value,   Poner Poner A en Store patterned patterned data in niveles de A en To last value.   Poner el producto bcn  e  en n List the whole sequence sequence.. Clik OK 2 Calc>Make Patterned Data > Simple set of numbers, F3 F3 (Reset  (Reset defaul defaults). ts).   Poner Poner B en Store patterned patterned data in i n. Poner 1 en From first value, value, niveles de B en To last value.

  Niveles de A en List each value. value. Poner cn  e  en n List the whole sequence. sequence. Click OK 3 Calc>Make Patterned Data > Simple set of numbers, F3 F3 (Reset  (Reset defaul defaults). ts). in.. Poner 1 en From first value, value,   Poner C en Store patterned patterned data in niveles de C en To last value. value.. Poner el tamaño de muestra n   Producto ab en List each value en List th the e whole sequence. sequence. Clik Clik OK 160  

Ejemplo de ANOVA con dos factores cruz Ejemplo cruzados ados Se quiere probar probar cuanto toma usar un unaa ca calcu lculadora ladora nu nueva eva y uuna na antigua. Seis ingenieros Seis ingenie ros trabajan en ambos un prob problema lema estadíst estadístic icoo y un unoo de ingeniería usando cada modelo de calculadora y se toma el tiempo en minutos que toma resolver el problema. Los in i ngenieros se consideran como bloques del di diseño seño experimental experimental.. Hay dos factores: Tipo de pproblema roblema y Modelo de calcual calcualadora, adora, cada uno con dos niuveles. Como cada nivel del factor ocurre en combinación con cada nivel del otro factor, los factores son cruzados.

161  

1 File > Open worksheet EXH_AOV.MTW. SolveT Solv eTime ime Engine Engineer er Pr Prob obTy Type pe Calcula Calculattor Engine Engineer er Pr Prob obTy Type pe Calcula Calculattor  3.1 Jones Stat New Dixon Stat New 7.5 Jones Stat Old Dixon Stat Old 2.5 Jones Eng New Dixon Eng New 5.1 Jones Eng Old Dixon Eng Old 3.8 Williams Stat New Erickson Stat New 8.1 Williams Stat Old Erickson Stat Old

2.8    5.3 3 7.6 2 4.9

Williams Williams Adams Adams Adams Adams

Eng Eng Stat Stat Eng Eng

New Old New Old New Old

Erickson Erickson Maynes Maynes Maynes Maynes

Eng Eng Stat Stat Eng Eng

New Old New Old New Old

162  

2 3

Stat > ANOVA > Balanced ANOVA. ANOVA. seleccio nar SolveTime . En Responses, Responses , seleccion

4 5 6

En Model, Model, seleccion seleccio nar Engineer ProbType | Calculator . Calculator . Factors s, seleccion seleccio nar Engineer  Engineer .. En Random Factor Click Results Results.. En Display means correspon corresponding ding to the terms   poner ProbType Calculator . Click OK en cada cuadro de diálogo.

7

163  

Los resultados se muestran a continuación: ANOVA: SolveTime vs Engineer, ProbType, Calculator Factor Type Levels Values Engineer random 6 Adams, Dixon, Erickson, Jones, Maynes, Williams

ProbType Calculator

fixed fixed

2 2

Eng, Stat New, Old

Analysis of Variance for SolveTime Source DF SS MS F Engineer 5 1.053 0.211 3.13 ProbType 1 16.667 16.667 247.52 Calculator 1 72.107 72.107 1070.89 ProbType*Calculator 1 3.682 3.682 54.68 Error 15 1.010 0.067 Total 23 94.518 S = 0.259487 R-Sq = 98.93% R-Sq(adj) = 98.36%

P 0.039 0.000 0.000 0.000

164  

Means ProbType Eng Stat

N 12 12

Calculator New Old

SolveTime 3.8250 5.4917

N 12 12

SolveTime 2.9250 6.3917

ProbType Eng Eng Stat

Calculator New Old New

N

SolveTime 6 2.4833 6 5.1667 6 3.3667

Stat

Old

6

7.6167 165

 

Interpretación:

Se muestran muestran los los factores con c on su tipo (fijos o aleatorios), aleatori os), número de niveles y valores. Después se muestra la tabla de ANOVA, A NOVA, indicando indic ando uunna in i nteracción teracció n significativ significati va entr entree tipo de problema p roblema y calcul calculadora. adora. También ambi én se muestran muestran las las medias medi as de d e todos los factores y sus sus combinaciones como efectos principales. Donnde se pu Do puede ede observ obse rvar ar que el tiempo tiempo se reduce  al cambiar de la calculadora antigua a la nueva.

166  

Contenido Parte B: 7. Tamaño de muestra y potencia 8. Análisis exploratorio exploratori o de datos 9. Estadística Estadística no paramétrica 10. Tablas y pruebas no paramétricas 11. Regresión lineal y cuadrática 12. Regresión múltiple 168  

7. Tamaño Tamaño de mu muestra estra y potencia

169  

Tamaño de muestra y potencia

• Introducción • Prueba de una y dos medias • Prueba de una y dos proporciones ANOV VA de una vía • Prueba de ANO

• Diseño de experimentos de dos niveles

170  

 T amaño de muestra y potencia potencia Potencia:  Es la capaci Potencia: Es ca pacidad dad d de e un una a prueba para d detectar etectar u una na diferen diferencia cia c cuan uando do cuando realmente existe. Hipótesis Hipótes is N ula D es ic ici ó n

V er dader a

No rechaz rec haza a D es es i c i ó n c o rre c ta p=1-a Rechazar  E rro r ti p o I p=a

F als a

E rrrro r ti p o II p=b D e s i c i ó n c o rre c ta p=1- b Potencia

La poten po tencia cia d de e la pru prueba eba e es s la probabilida probabilidad d de de rechaz rec hazar ar correctament correctamente e la hipótesis nula nula siendo si endo que en realidad es falsa. El análisis de potencia puede a ayu yudar dar a c cont ontestar estar pregun preguntas tas como: * ¿C uán uántas tas muestras muestras se deben ttomar omar para el an análisis? álisis? * ¿E s suficient suficiente ee ell tamaño tamaño d de e muestra? * ¿Qué tan grande grande e es s la di diferen ferencia cia que la prueba puede detectar? * ¿S on realmen realmente te val valioso iosos s los result resultados ados de la pru prueba? eba? 171  

Para estimar la potencia, Minitab requiere de dos de los siguientes parámetros: * Tamaños de muestra muestra * Diferencias - un corrimiento significativo de la media que se desea detectar  * Valores de potencia potencia - La probabilidad deseada de rechazar rechazar Ho cuando cuando es fals

Caso 1. Prueba t de una media poblacional

Ejemplo: Se tiene una una poblaci población ón normal normal con media media de 365 y llíímites de especificaci especi ficación ón de 360 y 370. Si la media medi a se desplaz de splazaa 2.5 gramos por arriba de la media, media , el núm número ero de defectos sería sería in i naceptable, la desviaci desviación ón están estándar dar histórica es de 2.403:

172  

Caso 1. Prueba t de una media poblaci poblacional onal Ejemplo: Se tiene una una poblaci población ón n normal ormal con m media edia de 365 y lí límites mites de especi especificaci ficación ón de 360 y 370. Si la media se desplaz d esplaza a 2.5 gramos por arriba de la media, el nú número mero de defectos sería sería in i naceptable, la desviación estándar histórica histórica es de 2.403: Si ze > 1 - Sample t Stat > Power and Sample Size Completar el diálogo como sigue: si gue:

173  

Los resultados se muestran a continuación:

Power and Sample Size 1-Sample t Test Testing mean = null (versus not = null) Calculating power for mean = null + difference Alpha = 0.05  

Assumed standard deviation = 2.403

Se tiene un 53.76% de Potencia para detectar  una un a diferencia di ferencia de 2.5 2 .5 si se usan 6 muestras muestras O sea que hay una una probabilid probab ilidad ad del 46.24% que no se rechaze Ho y se concluya que no hay diferencia significa s ignificativa. tiva.

Sample

Difference   2.5

Size 6

Power 0.537662

CORRIDA DE 2.5 GRS. EN PROMEDIO

0.18 0.16

Ha: Corrida 367.5

Ho: LIE 360

Meta 365

 

 Variable

LIE 370

Original Corrida

1.0

0.14 0.12     a       t      a       D         Y

0.8

0.10 0.6

0.08 0.06 0.04

    r     e     w     o      P

0.4

Power Curve for 1-Sample Z Test Sample Size 2 4 6 8 10 12  A ssumptions  A lpha 0.05 S tD ev 2. 403  A lternative Not =

0.2

0.02 0.00 355

360

365

370

0.0

375

-3

-2

C1

-1

0 Difference

1

2

3

174  

¿Cuántas muestras se requieren para tener un ¿Cuántas un 80% de probabi p robabilidad lidad de d e detectar el corrimiento, y para 85%, 90% y 95%? Stat > Power and Sample Size > 1 - Sample t

Se cambia este parámetro

Los resultados se muestran a continuación:   Difference   2.5   2.5   2.5   2.5

Sample Size 10 11 12 15

Target Power 0.80 0.85 0.90 0.95

Actual Power 0.832695 0.873928 0.905836 0.962487

Si la potencia es demasiado alta por decir 99% se pueden detectar diferencias que realmente no son significativas. 175  

Caso 2. Prueba t de comparación de dos medias poblacionales Ejemplo: La potencia potencia de un una a prueba depende de la di diferen ferencia cia qu que e se quiera detectar  respecto a la desviación estándar estándar,, para un una a si sigma gma poner 1 en diferencia y desv desviaci iación ón estándar, con valores deseados de Potencia de 0.8 y 0.9. Stat > Power and Sample Si Siz ze > 2 - Sample t Power and Sample

2-Sample t Test

Testing mean 1 = mean 2 (versus not =) Calculating power for mean 1 = mean 2 + difference Alpha = 0.05

Assumed standard deviation = 1

  Difference

Sample

Target

Size

Power

Actual Power

 

1

17

0.8

0.807037

 

1

23

0.9

0.912498

Se requieren tamaños de muestra de entre 17 y 23 176  

Caso 3. Prueba de 1 proporción Para estimar la poten po tencia, cia, Minitab requiere de dos de los siguientes siguientes parámetros: * Tamaños de muestra * La proporción p roporción - una una proporción que que se desea detectar d etectar con alta alta probabilida probabilidad d * Valores de potencia potencia - Probabilidad Probabi lidad deseada dese ada de rechazar rechazar H Ho o cuan cuando do es falsa Suponiendo que se desea detectar una proporción de 0.04 con el 0.8 y 0.9 de niveles de Potencia:

Proporción que se desea detectar con alta probabilidad (0.80, 0.90) Es la proporción de la Hipótesis nula Test for One Proportion Testing proportion = 0.02 (versus > 0.02) Alpha = 0.05 Alternative Sample Target  Proportion Size Power Actual Power   0.04 391 0.8 0.800388   0.04 580 0.9 0.900226 177  

Caso 3. Prueba de 1 proporción Para estimar la poten potencia, cia, Minitab requiere de dos de los si siguien guientes tes parámetros: * Tamaños de muestra * La proporción - u una na proporción qu que e se desea detectar con al alta ta probabilidad probabi lidad * Valores de poten potencia cia - P robabilidad desead deseada a de rechaz rechazar ar Ho cuan cuando do es e s falsa Suponiendo que q ue se desea dese a de detectar tectar una una proporci proporción ón de 0.04 con co n el 0.8 y 0.9 de nivel iveles es de Potencia:

Proporción que se desea detectar con alta alta probabilidad (0. (0.80, 80, 0.90) Es la proporció prop orción n de lla a Hipótesis Hipó tesis nula nula

178  

Los resultados se muestran a continuación: Test for One Proportion Testing proportion = 0.02 (versus > 0.02) Alpha = 0.05 Alternative

Sample

Target

 Proportion

Size

Power

Actual Power

 

0.04

391

0.8

0.800388

 

0.04

580

0.9

0.900226

179  

La Poten Po tencia cia de pru p rueba eba si se util tiliz iza a un tamaño tamaño de d e muestra muestra de 500: Samp le Siz Stat > Power and Sampl S ize e > 2 - Proportions Proportions Sample Sa mple sizes sizes = 500  Alternative  A lternative values of o f p 0.04 Hypothetized p: 0.02 p: 0.02 Options: Greater Than

Po 1.0

0.8

Significance Level = 0.05     r     e 

Los Lo s resultados resultados se muestr m uestran an a cont co ntinu inuaci ación: ón: Test for One Proportion Testing proportion = 0.02 (versus > 0.02)

    w     o       P

0.6

0.4

0.2

Alpha = 0.05 Alternative

Sample

 Proportion

Size

Power

500

0.865861

 

0.04

0.0 0.0

0.2

Po r ttant Por anto o con co n un tamaño de muestra de 5 500, 00, la potencia d de e la prueb prueba a para detect de tectar ar un un corrimient corrimiento o de 2% a 4% es e s del 86.6% 180  

Caso 4. Prueba de 2 proporci proporciones ones Para estimar estimar la poten potencia, cia, Mi Min nitab requiere de dos de los si sigu guientes ientes parámet parámetros: ros: * Tamaños de mu muestra estra * La proporción proporci ón 1 - un una a proporci proporción ón qu que e se desea detectar con alta probabili probabilidad dad * Valores de poten potencia cia - Probabilidad Probabi lidad d deseada eseada de rech rechaz azar ar Ho cuan cuando do es falsa o una proporción 2 - contra la que se prueba la igualdad de prop. Ejemplo: Suponiendo que se desea detectar una proporción de 0.04 con el 0.8 y 0.9 de niveles de Potencia:

OPTIONS

Proporción que se desea detectar con alta alta probabili probabilidad dad (0.80, 0.90)

GRAPHS 181  

Power and Sample Size Test for Two Proportions

Testing proportion 1 = proportion 2 (versus not =) Calculating power for proportion 2 = 0.05 Alpha = 0.05   Proportion 1   0.04   0.04

Sample Size 6745 9030

Target Power 0.8 0.9

Actual Power 0.800005 0.900030

The sample size is for each group.

182  

Ejemplo: En política política se desea d esea saber si s i hay diferencia diferencia entre entre las proporciones de hombres y mujeres mujeres qu q ue apoyen a poyen una una reforma fiscal. fis cal. Encuestas anterio ant eriores res muestran que que el 30% 30 % (p=0.3) de los votantes votantes apoyan ap oyan la reforma. Se encuestan a 1000 personas de cada género, ¿cuál es la potencia para detectar detectar un una diferencia di ferencia ent e ntre re hombres y mujeres mujeres que soporten sopo rten la reforma en 5% o más? más? Stat > Power an and d Sample S ample Size > 2 - Proportion P roportions s Sample siz si zes, 1000 Proportio n 1 valu values es 0.25 0.35  Prop ortion Proportion 2, ingresar  0.30  OK

183  

Los resultado resultados s se se muestran a cont continu inuaci ación: ón: Power and Sample Size Test for Two Proportions Testing proportion 1=proportion 1=proportion 2 (vs not =) Calculating power for proportion 2 = 0.3

Alpha = 0.05  

Sample

Proportion 1

Size

Power

 

0.25

1000

0.707060

 

0.35

1000

0.665570

184  

Power Curve for Test for Two Proportions 1.0

Sample Size 1000

0.8

    r     e      w     o       P

 A ssumptions  A lpha 0.05 Propo Proporrtio tio n 2 0.3 0.3  A lternativ e Not =

0.6

0.4

0.2

0.0 0.0

0.2

0.4 0.6 Proportion 1

0.8

1.0

185  

Caso 5. ANOVA ANOVA de una vía Sirve para determinar el tamaño de muestra necesario para detectar diferencia máxima máx ima en medias media s de niveles niveles de un factor, factor, con base en tamaño tamaño de muestra muestra y potencia potencia de la pru p rueba eba deseada. d eseada. Ejemplo: Se trata de determinar si o no 4 trat tratamie amient ntos os afectan el rendi rendimiento miento de un producto, para lo cual se utilizan utilizan 5 observaciones ob servaciones por po r tratamie tratamient nto. o. Se sabe s abe que la media del grupo de cont c ontrol rol es de 8 y se trata de e encon ncontrar trar diferencia significativa de +4. De investigaciones previas se determino una desviación estándar de 1.64.

186  

Instrucciones de and Minitab: Sample 1. 1.  Stat > Power S ample Size > One way ANOVA 2. Number Numbe r of levels levels, 4 3. Sample sizes, sizes, 5  4. En Values of the maximum diff difference erence between betw een means, means , 4 deviati viation on,, 1.64 5. En Estándar de OK Los resu res ultados son los sig siguient uientes: es: Power and Sample Size One-way ANOVA Alpha = 0.05 SS

Sample

Means  

Assumed std. Dev. = 1.64

8

No. Levels = 4

Maximum

Size

Power

Difference

5

0.826860

4

The sample size is for each level.

187

 

Power Curve for One-w O ne-way ay ANOVA 1.0

Sample Size 5

0.8

 A ssumptions  A lpha 0.05 S tD ev 1.64 # Lev els 4

0.6     r     e      w     o       P

0.4

0.2

0.0 0

1

2

3 4 5 Maximum Di Maximum Diffe ffere rence nce

6

7

8

Interpretación: Si se asi asignan gnan 5 obse observ rvaci aciones ones para cada tratamien tratamiento, to, se tiene u una na poten potencia cia del 83% de detectar d etectar u un na di diferen ferencia cia de 4 un unida idades des o más ent entre re las medias media s de los tratam tratamientos. ientos. Tam Tambié bién n se mu muestra estra la curv curva a OC de la potencia. 188  

Caso 6. 6 . Diseños de experimentos de dos niveles Si rve Sirv e para de determin terminar ar el n nú úmero de réplic réplicas as necesario para detectar de tectar el efecto especí es pecífico fico en el n nivel ivel de potencia espec especííficado ficado,, con base e en n el número nú mero de pun puntos tos centrales y efec efecto to mínimo mínimo.. Ejemplo: Se quiere determinar el "mejor" aju ajuste ste de 4 variab ariables les de entrada (factores) para mejorar la trasnparencia trasnparencia de un una a pa parte rte plástica. S Se e ha determinado qu q ue el diseño dis eño adecuado es un ffactoria actoriall fr fracci accional onal (1/2) con 8 corridas experim. y 3 puntos puntos central centrales. es. S Se e iin nten tenta ta detec detectar tar efectos de magnitu magnitud d 5 o más. más . Experimentación previa previa sugiere que la desviación desviaci ón estándar estándar es de 4 4.5. .5.

189  

Instruccio nstrucciones nes de Minitab: Mi nitab: Factorial Design Design 1.  1. Stat > Power and Sample Size > 2 level Factorial 2. Number o f factors factors, 4 3. Number of corner p points oints,, 8 4. En Replicates, Replicates , 1 2 3 4 Effects,, 5  5. En Effects 6. En Number of center points per block, block , 3 deviation on,, 4.5  7.  7. En Standard deviati OK Los resultados se muestran a continuación: Power and Sample Size 2-Level Factorial Design Alpha = 0.05 Assumed standard deviation = 4.5 Factors: 4 Base Design: 4, 8 Blocks: none Including a term for center points in model. Center Points   3   3   3   3

Effect 5 5 5 5

Reps 1 2 3 4

Total Runs 11 19 27 35

Power 0.157738 0.518929 0.730495 0.856508 190

 

Power Curve for 2-Level Factorial Design 1.0

Reps, Ctr Pts Per Blk  1, 3 2, 3 3, 3 4, 3

0.8

    r     e      w     o       P

 A ssumptions  A lpha 0.05 S tD ev 4.5 # F actors 4 # C orner P ts 8 # B lock s none # T erm s O m miitte d 0

0.6

0.4

Term Included In Model C en enter P oints

0.2

0.0 -5.0

-2.5

Interpretación:

0.0 Effect

2.5

5.0

Y es

Si hay un una réplica de dell diseño, solo se tien tiene e el 16% de posi posibili bilidad dad de d detectar  etectar  diferencias de 5. Con C on 4 réplicas réplicas del d el diseño (1/2) ffraccional raccional para 35 corridas (32 puntos puntos vér vértice tice y 3 pun puntos tos centr centrales) ales) se tiene el 86% de posibi po sibilidad lidad de encontrar efectos importantes. La curva curva muestra las combinacio combinaciones nes de pa parámetros rámetros y la la po poten tencia cia de la pru prueba. eba. 191  

8. Análisis exploratorio de datos (EDA)

192  

Análisis exploratorio de datos (EDA)

• Introducción • Prueba de una muestra por Poisson • Prueba de dos muestras por Poisson Poisson • Análisis de medianas de dos vías

• Regresión resistente • Suav Suavizam izamient iento o resi resiste stente nte • Prueba de normalidad con gráfica de desviaciones

193  

Introducción (EDA) A) se utilizan • Los métodos de análisis de datos exploratorio (ED para explorar los datos antes de utilizar otros métodos más tradicionales, o para examinar los residuales de un modelo.

• Permiten identificar observaciones anormales (Outliers) y violaciones a los supuestos tradicionales tales como no linealidad o varianza no constante.

194  

Prueba de una muestra por Poisson Calcula el intervalo de confianza de la tasa de ocurrencia y el número medio de ocurencias de eventos en una muestra en un proceso de Poisson, y prueba la hipótesis de que la tasa de ocu o curren rrencias cias es iigual gual a un un vvalor alor especi especificado. ficado.

Un proceso de Poisson describe el número de ocurrencias de un evento en un cierto periodoo de tiempo como área, vvolu period olumen men,, etc. Por ejemplo:   El nú número de llam llamadas adas telef telefónicas ónicas diari diarias as a uunn cent centro ro de serv servici icioo a cl clientes ientes   El núm número ero de defectos defecto s en un tramo de alambre





195  

Por ejem ejemplo: plo: La A de cada receptores de durante TV cuenta número unidades con pantallas defectivas queempresa se producen trimestre loselúltimos 10de años. Los directiv di rectivos os establecen que que 20 defectivos por cu cuatrimestre atrimestre es el máximo máximo aceptable, y quieren determinar si la producción actual cumple este requerimiento. 1 2 3 4

File > Open Open the worksheet TVDEFECT.MTW. Stat > Basic Statistics > 1-Sample Poisson Rate . En Samples in columns, Seleccionar 'Defective A '. Seleccionar Perform hypothesis test. En Hypothesized rate, poner 20 .

selecci onar less than. 5 Click Options. En Alternative, seleccionar 6 Click OK en cada cuadro de diálogo

196  

Defec efecttive ive A Def Defect ectiv ive e B 18

20

18

35

21

19

14

30

Resultados:

19

26

14

22

Et c .

Et c .

Test and CI for One-Sample Poisson Rate: Defective A Test of rate = 20 vs rate < 20  

Total

Variable Defective A

Rate of

95% Upper

Exact

Occurrences

N

Occurrence

Bound

P-Value

713

40

17.8250

18.9628

0.001

Length of observation = 1.

Como P valu value e es men menor  or  a 0.05, se rechaza Ho y se acepta Ha donde la tasa de defectos es men menor or a 20 197  

Prueba de dos muestras por Poisson Se puede probar si la empresa A tiene un una tasa mayor de defectos q qu ue la empresa B. La empresa A mide cada cad a tres meses su sus s defectos y la empresa B cada seis se is meses. Se trata de probar cual empresa empresa ti tiene ene la menor menor tasa de d e defectos de fectos mensual mensual.. 1 Fi File le > Open th the e worksheet TVDEFECT.MTW. 2 Stat > Basic Statistics > 2-Sample Poisson Rate. Rate . 3 Samples in different columns,  columns, Seleccionar Selecci onar 'Defective A '. 4 First 'Defective A'  'Defective B'ength" 5 Second  Second Options. . En "L "Leng th" of obs. o bs. [time, [time, items, items, area, vol. etc], etc], ner '3 6 Click Options 7 Confidence level 95.0 Test difference 0 Alternative Not equal 8 Seleccionar Use pooled estimate of rate to test a zero difference 9 Click OK  en cada cuadro de diálogo OK en

6 '

198  

Los resul resultados tados s se e muestran a contin continuación: uación: Test and CI for Two-Sample Poisson Rates: Defective A, Defective B

Total Variable

"Length" of

Rate of

Mean

Occurrences

N

Observation

Occurrence

Occurrence

Defective A

713

40

3

5.94167

17.825

Defective B

515

20

6

4.29167

25.750

Difference = rate(Defective A) - rate(Defective B) Estimate for difference: 1.65 95% CI for difference: (1.07764, 2.22236) Test for difference = 0 (vs not = 0): Z = 5.50 P-Value = 0.000 Exact Test: P-Value = 0.000

Co mo el v Como valor alor P val value ue es menor a 0.05 se ace acepta pta la h hipó ipótesis tesis a alt lterna erna que qu e AyB s son on di differen erentt donde B tiene lla a meno tasa de ocur ocurren rencia cia Difference = mu (Defective A) - mu (Defective B) Estimate for difference: -7.925 95% CI for difference: (-10.5053, -5.34474) Test for difference = 0 (vs not = 0): Z = -6.40 P-Value = 0.000 Exact Test: P-Value = 0.000 199  

Prueba de bondad de ajust ajuste e (Chi cuadrada) Permite comparar compa rar los valores valores observados de la distribución con los valores valores esperados espe rados de la misma di distribución stribución y prueba la hipótesis ipó tesis nul ula a de que los valores valores soi soin n similares: * Prueba que ttan an bien ajust ajusta a una una di distribución stribución tteórica eórica a un conjunto de datos * Prueba si un modelo estadí estadístico stico ajusta a a llos os datos. Por ejemplo la regresión regresió n Logistics Logisti cs usa una una prueba de bondad de aju ajuste ste con Chi cuadrada para probar si modela de manera adecuada los datos NOTA: Si las frecuencias NOTA: frecuencias esperadas esperada s en alguna alguna celda c elda so son n menores menores a 5, los resultados pueden no ser válidos.

200  

Por ejempl ejemplo: o: Ho: Los datos d atos si siguen guen u una na distrib distribución ución Mu Multinomial ltinomial Ha: Los datos no siguen lla a di distribución stribución Mul Multinomial tinomial La filiación política de ciera ciudad es: Republicanos 52%, Demócratas 40% e independientes independientes 8%. Se quiere probar si esta filiación política es similar a la de otra población. Para lo cual u utilizan tilizan u una na mu muestra estra de 200 p personas ersonas (datos en POLL.M Polit Po litic ica al PartCou PartCount ntss

Pr Prop opor orti tion onss

Re publ i can

121

0.52

De mocrati c

75

0.4

4

0.08

Othe rs

Instr nstrucciones ucciones d de e Minitab: 1 File > Open Worksheet > POLL.MTW. Square are Goodness of o f Fit (1 (1 var.) 2 Sel. Stat > Tables > Chi Squ 3 En Observed counts counts,, poner Counts . 4 En Category names names,, poner Political Party  5 Seleccionar Specific proportions proportions,, poner Proportions cuadro de diálogo Click OK en cada cuadro 201  

Los resultados se muestran a continuación: Chi-Square Goodness-of-Fit Goodness-of-Fit Test for Obs. Counts in Counts Using category names in Political Party  

Test

Category

Contribution

Observed

Proportion

Expected

to Chi-Sq

Republican

121

0.52

104

2.77885

Democratic

75

0.40

80

0.31250

4

0.08

16

9.00000

Others   N

DF

Chi-Sq

200

2

12.0913

P-Value 0.002

Interpretación: Como el valor P de la prueba es menor a un alfa de 0.05, se rechaza la hipótesis nula y se concluye que la filiación política no es la misma en las las ciudades co comparadas mparadas 202

 

Chart of Observed and Expected Values Expected Observed

120

100

80      e      u        l      a        V

60

40

Chart of Contribution to the Chi-Square Value by Category 20

0 Category

9 8 Republican

Democratic

Others

7   e   u    l   a 6    V    d   e 5    t   u    b    i   r 4    t   n   o    C 3

2 1 0 Others

Republican Category

Democratic

203  

Análisis nálisis de medianas med ianas de d dos os vías Es similar al análisis de varianza de dos vías (ANOVA two way), pero no e es s más robusta en cuanto cuanto a puntos puntos aberrantes a berrantes (Outliers) (Outliers) Ejemplo: Se trata de probar tres tipos tip os de remaches, remaches, en los los que se aplicó aplic ó la fuerza fu erza por el frente frente y por detrás, y se mide mid e el impacto, i mpacto, para pa ra determinar si hay diferencias en los tres tipos de remaches.

204  

Inst nstrucciones rucciones de d e Minitab: Mi nitab: Paso: Realizar el análisi análisis s de medianas Open pen worksheet w orksheet > EXH_STAT.MTW. 1 File > O 2 Seleccionar Stat > EDA > Median Polish. 3 En Response, poner Impact . factor  or , HelmetType . En Column factor , poner Location 4 En Row fact 5 En Common effect, poner CommonEffect . En Row eff effects ects, poner RowEffect. En E n Column eff effects, ects, po  poner ner ColumnEffect. ColumnEffect. 6 Check Residuals. Click OK. Paso 2. Mostrar los resultados 1 Seleccionar Data > Display Data. 2 En Columns, cons constants, tants, and matrices matrices to display d isplay, poner Com Comm m onEffect, onE ffect, RowEffect, RowEffect, y  ColumnEffect.  OK. K. Click O

205  

Los resultados resultados se mu muestran estran a co con ntinu tinuaci ación: ón:

CommonEffect Row RowEffect

44.5000 ColumEffect

  1

0

-1

  2   3

23 -3

1

Interpretación: El efecto general general de impacto i mpacto es 44.5.

Los efectos de fila son 0, 23 y -3 respecto al valor común que correspon correspo nden al remach remache e 1, 2 y 3 respec respectivamen tivamente. te. Se observa o bserva que el remache 2 titiene ene u un n mayor mayor impac impacto. to.

Los efectos de colum column na d de e -1 y 1 iin ndi dican can que hu hubo un una a pequeña reducción de impacto ligera respecto al valor  común en el frente y un poco mayor para la parte de atrás 206  

Con Co n los los residuos resi duos se pu p ueden ident id entifcar ifcar Outliers. Outliers. 1

Seleccionar Data > Display Data.

2 En Columns, constants, and matr matrices ices to display, poner RESI1. Click OK.  OK. RESI1   3.5 -0.5 3.5

0.5 -5.5 -4.5

1.5 -1.5

2.5

0.5 -1.5 -0.5

Celda 1,1

207  

Regresión resistente Es similar s imilar al análisi análisis s de regresió reg resión n lineal lineal excepto excepto que es más robu rob usta ante puntos aberrantes (Outliers). Se sugiere utilizarla al principio para observar si hay relación lineal. Stat > EDA > Resistant line Resistan t line

208  

Suavizamiento resistente Suaviza una serie ordenada de datos colectados durante el tiempo para remover fluctuaciones aleatorias y descubrir tanto las tendencias como los puntos aberrantes (Outliers). Ofrece Ofr ece varios métodos Stat > EDA > Resistant Smoothing

209  

Prueba de nor normal malidad idad con grá gráfi fica ca de desviaciones El rotograma es e s un histograma is tograma suspendido con u un na distribució di stribución n normal norm al que lo ajusta. ajusta. Muestra Muestra las desviaci d esviaciones ones a partir pa rtir del ajuste aju ste de la dis d istribució tribución n normal, normal, como lo hace hace p por or percen perce ntiles protege contra puntos aberrantes (Outliers) y cuentas anormales de eventos. eventos. Ejemplo:

Se utiliza un un rotograma rotograma para pa ra determinar si o no las mediciones medic iones de peso de 92 9 2 estu es tudi diant antes es siguen si guen una una distribución di stribución normal. normal. Instrucciones de Minitab   Open pen worksheet w orksheet > PULSE.MTW. 1 File > O 2 Seleccionar Stat > EDA > Rootogram 3 En Variable, Variable, poner Weight .  OK. K.   Click O Click

Weight 140 14 0    

14 145 5 160 160 19 190 0 155 15 5

Etcétera 210  

Los resultados resultados se mu muestran estran a con continu tinuaci ación ón

211  

Interpretación: La gráfica mu muestra estra resid residu uales dobles para iin ndic dicar ar que tan tanto to los datos se separan de la distrib distribu ución norm normal, al, Se observa una concentración ligera de signso negativos en el

lado in i nferio feriorr y una mayor concen concentració tración n de s sig ign nos p posi ositivos tivos en la parte central y superio superior. r. Sin embargo en ambos casos permanecen dentro del intervalo de confianza, indicando que los pesos son normales.

212  

9. Estadística no paramétrica

213  

Estadística no paramétrica

Introducción

• Prueba de signos de la mediana • Prueba de una mediana de Wilconox • Prueba de rangos de dos muestra de Mann Whitney • Prueba de igualdad igualdad de medianas de Krus Kruskal kal Wallis • Prueba de igualdad de medianas de Mood • Experi Experiment mentos os aleato aleatoriza rizados dos bloqueados bloqueados de Friedman

• Prueba de rachas 214  

ESTADÍSTICA NO PARAMÉTRICA  Acciones a ttomar omar sobre los datos normal ormales es antes antes de opt optar ar por est estas as pruebas: pruebas: Revise y asegúrese de que los datos no siguen una distribución normal. • Desarroll Desa rrollar ar un una a Prueba de normalidad normalidad . Para la prueba de Bartlet (P valu value e Open worksheet > Exh_Stat.Mtw Exh_Stat.Mtw Stat > Nonparametrics > 1-Sample Sign. En Variables Variables,, seleccion selecci onar ar PriceIndex Confidence interv i nterval al level 90  median an y poner  115  en el cuadro Seleccionar Test medi En Al En  Alte tern rnat ativ ive e, Seleccion Seleccionar ar greater than than.. Click OK. Los resultados son los siguientes: Sign Test for Median: PriceIndex Sign test of median = 115.0 versus > 115.0   N Below Equal Above P PriceIndex 29 12 0 17 0.2291

Inte terp rpre reta tación ción de resu resultltad ados os::

Median 144.0

Como Com oe ell vsuficiente al alor or P de de lla ap pru rueb eba ae ess > >0. 0.1 1n no hay ay evidencia para rechazar Ho yolah mediana no es mayor a 115. 218

 

Prueba de una mediana de Wilconox Ho: mediana = mediana hipotetizada versus versus

Ha: mediana ≠ mediana mediana hipotetizada hipotetizada

Se registran regi stran llos os resultados de exam examenes enes en ciencias para 9 estu estudia diant ntes. es. Se quiere probar si hay suf sufici icient ente e evidencia de que la mediana sea men menor or a 77 con alfa = 0.05. Nivel de confianza = 1 - alfa = 95% File > Open worksheet > Exh_Stat.Mtw Stat > Nonparametrics > 1-Sample Wilconox En Variables Variables,, seleccionar Achievement Confidence interval level 95  Seleccionar  Test  Test median y poner  77 en el cuadro En Alt En  Alter ern nat ativ ive e, Seleccionar less Th Than an.. Click OK. Los resultados son los siguientes: siguientes: Wilcoxon Signed Rank Tes Te st: Achieveme Achievement nt Test of median = 77.00 versus median < 77.00

    Achievement

N 9

N for Test 8

Interp terpre reta tación ción de resu resultltado ados: s:

Wilcoxon Statistic 19.5

P 0.610

Estimated Median 77.50

Como Como e ell val valor or P d de e la la p pru rueba eba es >0.05 0.05 no h hay ay evidencia suficiente para rechazar Ho y la mediana no es estadísticamentemenor a 77.

219  

Prueba de rangos r angos de dos muestras muestras de Mann M ann Whit Whitney ney H0: h1 = h2 versus versus

H1: h1 ≠ h2 , donde h es mediana de la población.

Se asume que las mu muestras estras provienen de dos poblaci poblaciones ones con la misma forma y v varianz arianza a Ejemplo: Se compara la presión diastólica de dos muestras extraidas de dos poblaciones Se quiere quie re probar a un 5% de nivel de significa significancia ncia si hay diferen di ferencia cia ent entre re las media medianas. nas. Nivel de confianza = 1 - alfa = 90% File > Open worksheet > Exh_Stat.Mtw Stat > Nonparametrics > Mann-Whitney En First Sample, Sample, sleccionar DBP1. En Second Sample Sample,, seleccionar seleccionar DBP DBP2. 2. Click OK. OK. level el 95 y en en Alter  Altern nativ ative e, Seleccionar Not equal. equal. Click OK OK.. En Confidence lev

220  

Los resultados resultados son los si siguien guientes: tes: Mann-Whitney Test and CI: DBP1, DBP2 N

Median

DBP1

8

69.50

DBP2

9

78.00

Point estimate for ETA1-ETA2 is -7.50 95.1 Percent CI for ETA1-ETA2 is (-18.00,4.00) W = 60.0 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.2685 The test is significant at 0.2679 (adjusted for ties)

Inter erpr pret etac ación ión de rres esu ultad ados os::

Com Como o el val alor or P de lla a pr pru ueba eba es >0. 0.05 05 n no o hay hay evidencia suficiente para rechazar Ho y las medianas no son diferentes estadísticamente.

221  

Prueba de igualdad de medianas de Kru Kruskal skal Walli Wallis s H0: Las medianas poblacionales son todas iguales vs

H1: Al menos hay un una a diferente

Esta es e s una generalización generalización de la prueba de Mann Whitney Whitney Ejemplo: Se quiere probar si el efecto de tres tratamientos diferentes influyen influyen en el crecimiento de bacterias a un 5% de nivel de significancia Nivel de confianza = 1 - alfa = 90% File > Open worksheet > Exh_Stat.Mtw Stat > Nonparametrics > Kruskal-Wall Kruskal-Wallis. is. En Response, Response, seleccionar Growth . En Factor , seleccionar Treatment . Click OK OK.. Los resultados son los siguient sig uientes: es: Kruskal-Wallis Test: Growth versus Treatment Kruskal-Wallis Test on Growth Treatment

N

Median

Ave Rank

Z

1

5

13.20

7.7

-0.45

2 3

5 6

12.90 15.60

4.3 12.7

-2.38 2.71

Overall

16

8.5

H = 8.63

DF = 2

P = 0.013

H = 8.64

DF = 2

P = 0.013

Interpretación Interpretación de resultados: Como el valor P de la prueba es < 0.05 hay evidencia suficiente para rechazar Ho y las medianas son diferentes estadísticamente. La mediana 3 difiere menos de la mediana general Las medianas 1 y 2 tienen una mayor diferencia respecto a la mediana general.

(adjusted for ties)

222  

Prueba de igualdad igualdad de medianas de Mood M ood Prueba similar simi lar a la an anterior: terior: H0: h1 = h2 = h3, versus H1: no todas las h's son so n iguales con h's medianas poblacionales . de OT OTIIS para los tres nivel niveles es e educacionales. ducacionales. Ejemplo: Se mide mid e la habilidad intelect intelectual ual de 179 estudiant estudiantes es en base al di dibuj bujo o de fi figuras guras después se aplica una pru prueba eba OTI OTIS S y se quiere p probar robar si a un al alfa fa de 5% hay diferencia significativa signific ativa en entre tre el n nivel ivel de educación 0 - Preprofesi Preprofesional onales es 1 -P -Profesionales rofesionales 2 - Preparatoria File > Open worksheet > Cartoon.Mtw

Nivel de confianza = 1 - alfa = 90%

Stat Nonparametrics Nonparametrics Mood s Median Medi an Test Test En Response, Response, seleccion seleccio nar OTIS OTIS.. En Factor , seleccion seleccio nar ED ED.. Click OK OK..

223  

Los resultados son los siguient sig uientes: es: Mood Median Test: Otis versus ED

Interpretación de resultados: Como el v valor alor P es menor a 0.05 indica que las medianas no son

Mood median test for Otis Chi-Square = 49.08 DF = 2

iguales

 

P = 0.000

Individual 95.0% CIs

ED

N

Median

Q3-Q1

0

47

9

97.5

17.3

1

29

24

106.0

21.5

2

15

55

116.5

16.3

 

----+---------+---------+---------+-(-----*-----) (------*------) (----*----) ----+---------+---------+---------+--

 

96.0

104.0

112.0

120.0

224  

Exp. aleatorizado bloqueado (equivale a ANOVA 2 vías) Prueba de Friedman Ho: Los efectos de todos tod os los tratamientos son cero H1: Los efectos de los tratamientos difieren de cero Ejemplo: Se quiere probar un tratamiento de drogas sobre la actividad enzimatica. Se prueba p rueba con tres tratamientos en an animales imales de diferentes granjas. Enzym nzymeA eAcctiv ivit it

Ther herapy

Litte itterr

0.15

1

1

0.26

1

2

0.23

1

3

0.99

1

4

0.55

2

1

0.26

2

2

-0.22

2

3

0.99

2

4

0.55

3

1

0.66

3

2

0.77

3

3

0.99

3

4

225  

Instrucciones de Minitab: File > Open worksheet > EXH_STAT.MTW Stat > Nonparametrics Nonparametrics > Fried Friedman. man. En Response Response,, seleccionar EnzymeActivity. En Treatment Treatment,, selecionar Therapy. En Blocks Blocks,, seleccionar Litter. Click OK. OK. Los resultados son los siguient sig uientes: es: Friedman Frie dman Test: Test: EnzymeAct EnzymeActivity ivity versus versus Therapy Therapy blocked blocked by Litte Litte S = 2.38

DF = 2

P = 0.305

S = 3.80

DF = 2

P = 0.150 (adjusted for ties)

 

Sum Su m

  Therapy

N

Est Median

of Ranks

1 2

4 4

0.2450 0.3117

6.5 7.0

3

4

0.5783

10.5

Los valores P son mayores mayores a 0.10 por tanto no hay evidencia para decirr que el efecto de los deci tratamientos tratamient os sea diferente de cero

Grand median = 0.3783 226  

Prueba de Rachas Prueba de Rachas paramétrica: Racha es un punt punto o o seri serie e consec consecutiva utiva de pun puntos tos que caen en un lado de la medi mediana. ana.

Se usa cuando se buscan evide evidencias ncias de cciertos iertos pa patron trones es no aleatorios e en n el proceso, proces o, indicando que la variación variaci ón es anormal form formando ando grupos, osci oscilaciones, laciones, mezclas mezclas y que que se de deben ben tomar acciones correc correctivas. tivas. Si la muestra muestra es de uno determina la línea línea central como la media mediana na y si la muestra es de subgrupos une las medias de los subgrupos con una línea. Las hipotesis de esta prueba son: H0: Las rachas son aleatorias H1: Las rachas siguen si guen un un patrón no no aleatorio a leatorio

227  

Por ejemplo con el archivo RADON.MTW de este módulo se tiene:

File le > Open Worksheet > Radon.mtw Fi Stat > Quality Tools > Run Chart En Si Single ngle column column, seleccionar selecci onar Membrane . size,, poner 2 . Click OK. OK. En Subgroup size Run Chart of Membrane 45 40     e      n     a     r  35      b      m     e  30     M 25 20 1

2

Number of runs about median: Expect cte ed nu num mber of ru runs ns: Longest run about median:  Approx  Appr ox P-V P-Val alue ue for Clusterin tering: g:  Approx  Appr ox P-V P-Val alue ue for Mixture xtures: s:

3

4 3 6.00000 5 0.022 .02209 0.97791

5 6 Sample

7

8

Number Number of runs up or down: Ex Expe pect cte ed num number o off ru runs ns: Longest run up or down:  Approx  Appro xP P-Va -Value for Trends:  Approx  Appro xP P-Va -Value for Os Oscil cilllati ation: on:

5 6.33333 3 0.13 0.13455 0.86545

9

10

Interpretación de resultados Interpretación Como el P value de Clustering es menor a 0.05 indica que el patrón no es aleatorio y se deben investigar las posibles causas. 228  

Prueba de rachas no paramétrica

rachas son aleatori aleatorias as H0: Las rachas

H1: Las rachas rachas siguen un patrón no aleatorio

Un entrevistador entrevistador e encu ncuesta esta a 30 per personas sonas al azar y les hace un una a pregunta con 4 posi posibles bles

respuestas (0, 1, 2 y 3). Se quiere probar si hay una respuesta aleatoria en el orden de las respuestas o que no h haya aya sesgo en el entrevistado. Usar el archivo File > Open Worksheet > EXH_STAT.MTW. Stat > Non Nonparametric parametricss > Runs Runs Test. En Variables, Variables, seleccionar Response . Click OK OK.. Los resultados son los siguientes: Runs Test: Response Runs test for Response Runs above and below K = 1.23333 The observed number of runs = 8 The expected number of runs = 14.9333 11 observations above K, 19 below P-value = 0.005

Interpretación de resultados: Interpretación Como P value es menor a 0.05 se tiene evidencia de que el comportamiento de las respuestas no es aleatorio y debe investigarse la causa. 229  

10. Tablas y pruebas no paramétricas

230  

Tablas y pruebas no paramétricas

• Contador de eventos • Estadístic Estadística a descriptiva de tablas • Tabulación cruzada y Chi cuadrada • Análisis Chi cuadrada con tabulación cruzada • Tablas de contingencia

231  

Contador de eventos Se usa para mostrar cuenta, cuenta acumulada, porcentajes, y porcentajes acumulados para cada variable especificada Suponiendo que se está estudiando la influencia de la actividad de paciente en el desempeño de una droga nueva. Después de colectar los datos, se examina la distribución de la actividad del paciente. 1

File > Open worksheet EXH_TABL.MTW Activity Moderat e Moderate  A lot Slight Moderate Slight  A lot Moderate Moderate Etc.

2 3 4 5

Repetir c on GENDER y HEIGHT Los resultados son los siguientes: Tally for Discrete Variables: Activity Activity

Count

CumCnt

Percent

CumPct

  A lot Moderate

21 61

21 82

23.08 67.03

23.08 90.11

  Slight

9

91

9.89

100.00

 

N=

91

La actividad ligera tiene un 9.89%, la actividad moderada

Stat > Tables > Tally Individual Variables. Variables. un 67.03% y alta 23.08% Variables,, poner Act En Variables  Activity  ivity . En Display Display,, seleccionar Counts, Percents, Cumulative counts, counts, y Cumu Cumula lative tive percents Click OK

232  

Estadística descriptiva de tablas Se usa para generar tablas conten conteniendo iendo frecuencias frecuencias estadí estadísticas sticas para variables categóricas categó ricas y estadí estadísticas sticas resumidas para p ara variables numéricas asociadas. Ejemplo: Se desea d esea resumir resumir las estadí estadísticas sticas ddee frecu frecuencias encias de datos de pul pulso so para las personas p ersonas en el estu estudio dio,, calasifica calasificadas das por gé génnero y nnivel ivel de actividad (datos en el archivo EXT-TABL.MTW)

233  

Gender

Activit y

Smokes

Heigh t

Weig ht

P ulse

Male Male Male

Moderate Moderate A lot

No No Yes

66 72 73.5

140 145 160

64 58 62

Male Male

Slight Moderate

Yes No

73 69

190 155

66 64

Etcétera…

Instru strucci cciones ones de Minitab: Minitab : 1 File Open > Workshe Worksheet et > EXH_TABL.MTW. Statistics. 2 Seleccionar Stat > Tables > Descriptive De scriptive Statistics 3 En For rows, poner Gender . En For columns, poner Smokes . Percentss. 4 Sel. Categorical variables, check Counts and Row Percent 5 Sel. Associated variables, poner Pulse . Sel. Display Means Click OK en cada cuadro de diálogo 234

 

Los resul resultados tados se muestran a continu continuaci ación: ón: Tabulated Rows:

statistics:

Gender

 

Gender,

Columns:

Smokes

No

Yes

All

Female

74.59

84.50

76.86

   

27 77.14

8 22.86

35 100.00

Male

70.00

72.42

70.82

 

37

19

56

 

66.07

33.93

100.00

All

71.94

76.00

73.14

 

64

27

91

 

70.33

29.67

100.00

Cell    

Contents:

Pulse

Smokes

:

Mean Count %

of

Row 235

 

Interpretación: Se muestra la tabla resumen tanto de la variable categórica y la variable asociada. Minitab muestra muestra el e l valor valor medio medi o del del pulso, pulso, el el contado contadorr y los porcentajes porcent ajes de fila fi la clasificados clasificado s por gén g énero ero y estado de fumar fumar

De los 56 hombres, 19 son fu fumadores, madores, su pulso pulso medio es 72.42 72 .42 y su porcentaje porcent aje correspondiente correspondiente de fila es de 33.93%

236  

Ejemplo: Se desea resumir los pesos y estaturas de las personas en el estudi calsificados calsifica dos por p or género género y nivel nivel de actividad. Instru strucci cciones ones de de Minitab: 1 File Open > Workshee Worksheett > EXH_TABL.MTW. Desc riptive ve Stati S tatistics stics.. 2 Seleccionar Stat > Tables > Descripti 3 En For rows, rows, pon poner Gender  Gender .. En For columns, columns, poner Activity  poner Activity .. Heigh gh y W Weight eight 4 Sel. Associated variables, variables, poner Hei 5 En Display, Display, seleccion selecci onar ar Means, Std. Dev., Dev ., y N Missing Clickk OK en cada cuadro de diálogo Clic diá logo 237  

Los resultados resultados se mu muestran estran a co con ntinu tinuaci ación: ón: Tabulated statistics: Gender, Activity Rows: Gender Columns: Activity   Female            

A lot 64.60 121.0 2.074 21.02 0 0 5

Moderate 65.62 124.5 2.735 12.78 0 0 26

Slight 65.00 123.0 2.160 7.70 0 0 4

All 65.40 123.8 2.563 13.37 0 0 35

 

14.29

74.29

11.43

100.00

Male  

71.12 155.5

70.43 158.1

72.40 170.0

70.80 158.4

           

2.649 13.21 0 0 16 28.57

2.521 20.58 0 0 35 62.50

2.510 19.69 0 0 5 8.93

2.579 18.77 0 0 56 100.00 238

 

All

69.57

68.38

69.11

68.73

 

147.3

143.8

149.1

145.1

 

3.773

3.532

4.485

3.679

 

21.12

24.27

28.80

23.87

 

0

0

0

0

 

0

0

0

0

 

21

61

9

91

 

23.08

67.03

9.89

100.00

Cell Contents:

Height

:

Mean

 

Weight

:

Mean

 

Height

:

Standard deviation

 

Weight

:

Standard deviation

 

Height

:

Missing

 

Weight

:

Missing

 

Count

 

% of Row

Interpretación: Minitab muestra la media, medi a, des desv viac iación ión estándar, y tamañ tamaño od de e muestra para Height Hei ght y Weig Weigh ht, clasific clasificados ados por Gender y Activity Activity..

El hombre con actividad moderada tiene peso medio de 158.1 lbs. con desv. desv. Est. De 20.58 lbs. Es Estos tos val valores ores so son n con base en 35 observaciones. Al A l final se muestran llas as estadí estadística sticas s totales. 239  

T abulaci abulación ón cruzada y Chi cuadrada Se usa pa para ra generar tablas de frecuencia frecuencia y porcentajes. T Tambi ambién én se puede realizar rea lizar u un na prueba C Ch hi cuadrada y selecci seleccionar onar el Layou Layoutt de la tabla.

240  

241  

242  

243  

Ejemplo: Serí Se ría a co conv nvenient eniente e clasi clasificar ficar las p personas ersonas de dell estu estudi dio o po porr género, si fuman o no y peso como la variable as asoci ociada ada.. Presentar esta informaciòn informaci òn en u una na tabla d de e tres ví vías. as.

Instrucciones de Minitab: File e Open Open > Worksheet > EXH_TABL.MTW. 1 Fil Tab ulation on and Chi Squar  Squ ar  2 Seleccionar Stat > Tables > Cross Tabulati 3 En For rows, rows, poner Gender  Gender .. En For columns, columns, poner Activity  poner  Activity .. En For Layers, Layers, poner Smokes. 4 En Display, Display, seleccionar Counts Click OK en cada cuadro de diálogo di álogo

244  

Los resul resultados tados se muestran a continu continuaci ación: ón: Tabulated statistics: Gender, Activity, Smokes Results for Smokes = No

Rows: Gender  

Columns: Activity

A lot

Moderate

Slight

All

4

20

3

27

Male

12

22

3

37

All

16

42

6

64

Female

Cell Contents:

Count

Results for Smokes = Yes

Rows: Gender  

Columns: Activity

A lot

Moderate

Slight

All

Female

1

6

1

8

Male

4

13

2

19

All

5

19

3

27

Cell Contents:

Count 245

 

Interpretación: Minitab crea una tabla de dos vías para cada nivel de la variable por capas, capa s, Smoke. La variable ddee fifila la es Gender y la vvariab ariable le de

colum column n a es Acti Activ v ity. T Tambi ambién én se puede c cambi ambiar ar el La Lay y out de la tabla asign asi gnan ando do variables a trav través és de las filas, debajo de las columnas o por capas.

246  

Ejemplo de cambio de Layout Layo ut de tabla Instrucciones de Minitab: 1 File Open > Worksh Worksheet eet > EXH_TABL.MTW. Tabu lation ion and Chi C hi Squar  2 Seleccionar Stat > Tables > Cross Tabulat 3 En For rows rows,, poner Gender  Gender .. En For columns columns,,  Activi  Activity ty Smoke Sm oke 4 En Display Display,, seleccion seleccio nar Counts Click OK en cada cuadro cuadro de diálogo di álogo

247  

Los resul resultados tados se muestran a cont continu inuaci ación: ón: Tabulated statistics: Gender, Activity, Smokes Rows: Gender  

Columns: Activity / Smokes

A lot

Moderate

Slight

All

  Female

No 4

Yes 1

No 20

Yes 6

No 3

Yes 1

All 35

Male

12

4

22

13

3

2

56

All

16

5

42

19

6

3

91

Cell Contents:

Count

Interpretación: La variable variab le de fila e es s Gender, lla a variable de colum column na superi superior or es  Activity  Activ ity y la inf inferior erior es Smo Smokes. kes. 248  

Análisis nálisis Chi cuadrada cuadr ada con T abulación cruzada cruzad a Hay interés en determianr si hay asociación entre el Género y el nivel de ac activ tivid idad ad para las personas en el estudio. Hacer una una prueba pru eba Ch C hi Cu C uadrada. adrada . Instruccio nstrucciones nes de Minitab: Mi nitab: Worksheet eet > EXH_TABL.MTW. 1 File Open > Worksh 2 Seleccionar Stat > Tables > Cross Tabulation Tabulation and Chi Squar  Squ ar  3 En For rows rows,, poner Gender  Gender .. En For columns, columns, poner Activity poner Activity Display,, seleccionar selecci onar Counts 4 En Display 5 Sel. Chi Square > Chi > Chi Cuad. Anal A naly ysi sis, s, Exp. Cell Ce ll count counts, s, Std. Re Click OK en cada cuadro de diálogo

249  

250  

Cell Contents:  

Count Expected count

 

Standardized residual

Pearson Chi-Square=2.487, DF=2, P-Value=0.288

Likelihood Ratio Chi-Square = 2.613, DF = 2, P-Value = 0.271 * NOTE * 1 cells with exp. counts less than 5

Interpretación: Las celdas en la tabla continen continenen en las frecu frecuencias encias,, las frecuen frecuenci cias as esperadas y llos os residuos estandariz estandarizados. ados. Como P value es mayor a 0.05, no hay evidencia de asociación entre Gender y Activity  Activi ty . Como hay una frecuencia menor a 5, se

debe deb e tener precuaci precuación ón al in intepretar tepretar los resul resultados tados 251  

T ablas de Contingencia Contingencia La Tabla de contingencia es una prueba de independencia entre variables. Ho: La variable de renglón es independiente de la variable de columna   Las proporci proporciones ones en todas las columnas columnas de cada renglón son iguales iguales Ha: La variable de renglón tiene dependencia de la variable de columna   Las proporci proporciones ones en las columnas columnas de cada renglón son diferentes diferentes Ejemplo: Se tiene interés de probar si la afiliación política depende del sexo y del partído polític político, o, para lo cual se encuestan a 100 personas. Dem emo ocrat rat Rep epu ublican

Hombres Mujeres

28 22

18 27

Other 

4 1

Las instrucciones son las siguientes: File > Open worksheet Exh_Tabl.Mtw. Stat > Tables > Chi-Square Test (Tabla Test (Tabla en en Worksheet). En Columns Columns que  que contiene la tabla, indicar Democrat, Republican y Other . Click OK. 252  

Los resul res ultados tados son los si siguient guientes: es: Chi-Square Test: Democrat, Republican, Other Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts  

Democrat

Republican

Other

Total

28

18

4

50

25.00

22.50

2.50

0.360

0.900

0.900

22

27

1

 

25.00

22.50

2.50

 

0.360

0.900

0.900

50

45

5

 

1

 

 

2

Total

NOTA: L NOTA: Las as frecuencias esperadas esperada s deb deberí erían an ser mayores a 5. 50

100

Chi-Sq = 4.320, DF = 2, P-Value = 0.115 2 cells with expected counts less than 5.

El valor P es mayor a 0.05 y no se rechaza Ho por tanto tanto el tip tipo o

de partido es independiente del sexo de los votantes.

253  

Ejercicios: 1. Los errores present pres entados ados en tres tipos de s servicios ervicios c cuan uando do se pres prestan tan por tres regiones se muestran a continuación, continuación, probar con un una a tabla d de e co cont ntingencia ingencia s sii los errores dependen del tipo de se serv rvici icio o y regió región n para un 95% de niv nivel el de c conf onfianza. ianza.

Servicio

Region A Region B Region C

1 2 3

27 41 42

12 22 14

8 9 10

Ho: Los errores NO dependen en cada región del tipo de servicio. Ha: Los errores en cada región, dependen del tipo de servicio, Con Minitab: sq uare test (two way table in worksheet) Stat > Tables > Chi square Columns containing the table Region A Region B Region C  OK 254  

 Probar ar a un una a alfa de 0.05 si los errores que se cometen al facturar facturar 2. Prob en di ferentes ramos son si mi lares. Ni vel de confi anza = 1 - alfa = 95 Orden   Far Farma maci cia a Consumo Consumo Comput. Comput. Tel Telecom ecom.. Correcta 207 136 151 178 Incorrecta 3 4 9 12 Ho: El nú número de errores no depende dep ende del ramo indu i ndustrial strial Ha: El nú número de errores depende de pende de dell ramo industrial industrial Con Minitab:

Stat > Tables > Chi square test (two way table in worksheet) Columns containing the table Farmacia Consumo Comput. Telecom. OK

255  

11. Regresión lineal y cuadrática

256  

Regresión lineal y cuadrática

• Correlación y regresión lineal gráfica a • Regresión simple por medio de gráfic

• Regresión cuadrática cuadrática por medio de gráfica

257  

Correlación y Regresión lineal y cuadrática simple Coeficiente de Correlación Establece si existe una relación entre las variables y responde a la pregunta, ”¿Qué tan evidente es esta relación?". La correlación es una prueba fácil y rápida para eliminar factores que no influyen en la predicción, para una respuesta dada. * Es una medida de de la fuerza fuerza de la relación lineal entre d dos os vvariables ariables x y y. * Es un número entre -1 y 1 * Un valor positivo indica que cuando una variable aumenta, la otra variable aumenta * Un valor negativo indica que cuando una variable aumenta, la otra disminuye * Si las dos variables no están relacionadas, el coeficiente de correlación tiende a 0.

258  

 

Correlación Negativa Evidente

 Correlación Positiva 25

       Y

Evidente

25

20

20

15

15

10 5 0

       Y

10 5

0

5

10

15

20

Sin Correlación

25

0

r= 1

X

0

25

5

10

r = -1

15

20

25

X

20 15        Y

Correlación Positiva

25

10

Correlación Negativa

5

r= 0

0 0

5

10

15

20

25

25

20

X

20

15 15        Y

10

       Y

r = 0.8

5

r = -0.8

10 5

0 0

5

10

15

20

0

25

0

5

10

15

20

25

X X

259  

Ejemplo: Se utiliza el archivo PULSE.MTW campos Peso (Weight) y Altura (Height) File > Open Worksheet > Pulse.Mtw  o cop copiar iar lo los da dato toss d del el arch archii  Antes d  Antes de e ca calcula lcularr e ell coe coefficien iciente te d de e co corr rrela elación ción se su sugie giere re ha hacer cer un dia diagr gram ama a bivariante para identificar posibles valores anómalos, relaciones no lineales, etc.

Graph > Sc Scatterp atterplot: lot: Si Simple mple

Y = Wei Weight ght y X = Hei Height ght

Scatterplot of Weight vs Height 220 200 180

t

h 160 g i e

W 140 120 100 60

62

64

66

68 Height

70

72

74

76

260  

 Ahora se calcula c alcula el ccoef oeficiente iciente de Cor Correlación relación que mide el grado de relación relación que exi exist ste e entre dos variables, como sigue:

Stat > Basic Statistics > Correl Co rrelation ation Seleccionar en Variables Weight Height Display splay P values values Seleccionar Di Los resultados son los siguientes: Correlations: Weight, Height Pearson correlation of Weight and Height Coef Coeficiente iciente de ccorr orrelación elación P-Value = 0.000

Como el P value es menor a 0.05, la correlación si es significativa

261  

Coeficiente de correlación Reglas empíricas Coeficiente de correlación

Relación

0.8 < r < 1.0

Fuerte, positiva

0.3 < r < 0.8

Débil, positiva

-0.3 < r < 0.3

No existe

-0.8 < r < -0.3 -1.0 < r < -0.8

Débil, negativa Fuerte, negativa

262  

Análisis de Regresión El análisis de regresión es un método estandarizado estandarizad o para localizar localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción. Puede ser usado para analizar las relaciones entre: • Una Una sol sola a “X” “X” predictora y una sola “Y” • Múltiples predictores “X” y una sola “Y” • Varios predictores “X” entre sí 263  

Modelo de regresión lineal simple Fitted Line Plot Resultados de prueba (%) = 31.21 + 0.6955 Tiempo de estudio (horas) S R- Sq R- Sq (ad j)

80

) 75 %(

4.47182 77.0% 74.2%

R^2 Coef. de determinación

a

b 70 e ur p

e 65 d s o

d 60 a tl u

esR 55 50 30

40 50 60 Tiempo de estudio (horas)

70

Mínimos cuadrados 264  

Regresión s sim imple ple por medio de gr gráfi áfica: ca: File le > Open Worksheet > Pulse.Mtw Fi Stat > Regression > Fitted line Plot Seleccionar en Response (Y) Weight Weight  y en Predictor (X) Height Regres sion on model Linear   Type of Regressi Seleccionar modelo Type duals Standardized > Normal Plot y Resi Residuals duals vs vs fits fi ts Sel. en e n Graphs > Resi Residuals OK

Ecuación de Regresión

Fitted Line Plot Weight = - 204.7 + 5.092 Height 220

S Desv. Estandar de los residuos (valor real-estimado por la regresión)

200 180     t       h 160     g        i     e      W 140

S R-S q R-S q q((adj)

14.7920 61.6% 61.2%

120 100 60

62

64

66

68 Height

70

72

74

76

R-Sq Coeficient Coeficiente e de Determinación en porcentaje de variación explicada ex plicada por la ecuación de regresión

R-Sq (Adj) - Sólo para regresión múltiple 265  

Regression Analysis: Weight versus Height The regression equation is Weight = - 204.7 + 5.092 Height S = 14.7920

R-Sq = 61.6%

R-Sq(adj) = 61.2%

Analysis of Variance Source

DF

SS

MS

F

1

31591.6

31591.6

144.38

Error

90

19692.2

218.8

Total

91

51283.9

Regression

P 0.00

El valor p menor a 0.05 indica que SI es significativa la Correlación de Y y X.

266  

Análisis de los residuos

 Versus Fits

Normal Probability Plot

(response is Weight)

(response is Weight)

4

99.9 99

3 la

95 u di

90

2 s e R

80 70 60 50 40 30 20

d

t n

1 e iz

e c r e

d r a

P

0 d n a

10 t S

5

-1

1

-2 0.1

100

110

120

130

140 150 Fitted Value

160

170

-4

180

Los re residuos m muuestran aleatoriedad

-3

-2

-1 0 1 Standardized Residual

2

3

4

Los re residuos si siguen una distribución normal

267  

Regresión cuadrática cuadr ática por medio de gráfica: File > Open Worksheet > Exh_Reg.Mtw Stat > Regression > Fitted line Plot Seleccionar en Response (Y) EnergyConsumption EnergyConsumption  y en Predictor (X) MachineSettin Seleccionar modelo  modelo  Type of Regression Model Quadratic Sel. en Graphs > Residuals Standardized > Normal Plot y Residuals vs fits OK Ecuación de Regresión

Fitted Line Plot EnergyConsumption = 128.8 - 13.11 MachineSetting EnergyConsumption + 0.3289 MachineSetting** MachineSetting**2 2 40

S R-Sq R- Sq Sq (a (ad j) j)

n 30 iot p m

u 20 s

6.00002 79.3% 73.4%

S Desv. Estandar de los residuos residuos (valor real-estimado por la regresión)

n o C rg

y E

n

e 10

R-Sq Coeficiente de Determinación en porcentaje de

variación explicada por la ecuación de regresión

0 10

15

20 MachineSetting

25

30

R-Sq (Adj) - Sólo para regresión múltiple

268

 

Resultados Polynomial Regression Analysis: EnergyConsumption versus Ma The regression equation is EnergyConsumption = 128.8-13.11 MachineSetting+0.3289 Machi S = 6.00002

R-Sq = 79.3%

R-Sq(adj) = 73.4%

Analysis of Variance Source

DF

SS

MS

F

P

Regression

2

963.81

481.904

13.39

0.004

Error

7

252.00

36.000

Total

9

1215.81

El valor p menor a 0.05 indica que SI es significativa la Correlación de Y y X.

Sequential Analysis of Variance Source Linear Quadratic

DF 1

SS 28.500

F 0.19

P 0.673

1

935.308

25.98

0.001

269  

Análisis de los residuos Normal Norm al Proba Pr obabili bility ty Plot (response (res ponse is EnergyConsumption EnergyConsumption)) 99

95 90 80 70

n

t

60 50

Pe

40 30

cr

e

20 10

5

1

-3

-2

-1

0 1 Standardized Residual

2

3

Los residuos siguen una distribución normal 270  

12. Regresión Múltiple

271  

Regresión múltiple

• Introducción • Regresión múltiple • Regresión por pasos

• Regresión por mejores subconjuntos

272  

Introducción

273  

Regres Re gresión ión múltiple Genera una una ecu ecuaci ación ón que que des describ cribe e la relación relació n estad estadíístic stica a entr entre e uno uno o más predictores y la variable de respuesta y predice nuevas observaciones. Utiliza el método de mínimos cuadrados para derivar la ecuación que minimiza la suma de los residuos al cuadrado.

Los resultados resultados de la regresi regresión ón indican la dirección, direcci ón, ttamañ amaño, o, y significancia estadística de la relación entre los predictores y la respuesta. * El signo de cada coefici coeficient ente e indica la dirección de la la relació relación n. * Los coefici coeficient entes es representan el cambio pormedio en la respuesta respuesta para una unidad de cambio en el predictor, mientras se mantienen constant const antes es otros o tros predic predictores tores del modelo.

274  

* El valor valor P de cad cada a coefi coeficiente ciente pru prueba eba la h hipó ipótesis tesis nu nula la de que el coeficient coefici ente e es igual a cero (si (sin n ef efecto). ecto). Por tant tanto, o, vvalores alores bajos de P sugieren que el predictor tiene un efecto significativo en el modelo. * La ecuación predice nuevas observaciones con base en valores específicos especí ficos de los predi predictores ctores

275  

Regresión múltiple •

Cuando se usa más de una variable independiente para predecir los valores de una variable dependiente, el proceso se llama

análisis de regresión múltiple, incluye el uso de ecuaciones lineales.

Y u



 b 0   b 1 X u1    b    2 X    u  2

 ....... 

 b k  X uk    u

Se asume que los errores u tienen las características siguientes: •

Tienen media cero y varianza común



Son estadísticamente independientes.



Están distribuidos en forma normal.

2.



276  

Tamaño de muestra •

Tomar 5 observaciones para cada una de las variables independientes, si esta razón es menor de5 a 1, se tiene el riesgo de “sobreajustar  “sobreajustar ” el modelo



Un mejor nivel deseable es tomar 15 a 20 observaciones por cada variable independiente

277

 

Multicolinealidad



La multicolineali multicolinealidad dad implica implica una dependencia dependencia cercana cercana entre regresores (columnas de la matriz matriz X ), de tal forma que si hay una dependencia lineal exacta hará que la matriz X’X sea singular.



La presencia de dependencias cercanamente lineales impactan dramáticamente en la habilidad para estimar los coeficientes de regresión.



La varianza de los coeficientes de la regresión son inflados debido a la multicolinealidad. Es evidente por los valores diferentes de cero que no están en la diagonal principal de X’X. Que son correlaciones simples entre los regresores.

278  

Multicolinealidad •

Una prueba fácil fácil de probar si hay multicolinea multicolinealidad lidad entre dos variables es que su coeficiente de correlación sea mayor a 0.7



Los elementos de la diagonal principal de la matriz X’X se denominan Factores de inflación de varianza (VIFs) y se usan como un diagnóstico importante de multicolinealidad. Para el componente j – j – és ésim imo o se tien tiene: e:



Si es mayor a 10 implica que se tienen serios problemas de multicolinealidad. 1 VIF  VI F  j 2 1  R j 



279  

Análisis de los residuos •

Los residuos graficados vs la Y estimada, pueden mostrar diferentes patrones indicando adecuación o no adecuación del modelo:



La gráfica de residuos residuos aleatorio aleatorios s cuya suma es cero (null plot) indica modelo adecuado



La gráfica de residuos mostrando una no linealidad curvilínea indica necesidad de transformar las variables



Si los residuos se van abriendo indica que la varianza muestra heteroestacidad y se requiere transformar transformar las variables. Se puede probar probar con la prueba prueba de Levene de homogeneid homogeneidad ad de varianzas

280  



Escalamiento de residuos En algunos casos es difícil hacer comparaciones directas entre los coeficientes de la regresión debido a que la magnitud de bj  bj refleja refleja las unidades de medición del regresor  Xj.  Xj. Por ejemplo:

Y  ˆ





5    X   1    1000X  2

Para visualización deestandarizar residuos ante diferencias en losfacilitarla coeficientes, coeficientes, se sugiere o grandes estudentizar los residuos

281

 

Escalamiento de residuos •   R es iduos es tanda ndari ri za zado dos s  – Se obtienen dividiendo cada residuo entre la desviación estándar de los residuos

d i

    

ei  MSE 

,

 – Después de la estandarización, los residuos tienen una media de 0 y desviación estándar de 1  – Con más de 50 datos siguen a la distribución t, de manera que si exceden a 1.96 (límite para alfa 0.05) indica significancia estadística y son “outliers “outliers””

282  

Escalamiento de residuos •   R es iduos es tude udent ntiza izado dos s  – Son similares a los residuos donde se elimina una observación y se predice su valor, pero además se elimina la i-ésima observació observación n en el cálculo de la desviación desviación estándar estánd ar usada para estandariza estandarizarr la í-ésima observación observación  – Puede identificar observaciones que tienen una gran influencia pero que no son detectadas por los residuos estandarizados r i

ei 

 MSE (1



hii )

,

283  

Escalamiento de residuos •

El estadí estadísti stico co PRESS PRESS (Predi (Predicti ction on Error Error Sum Sum of Squar Squares) es) es es una medida similar a la R2 en la regresión. Difiere en que se estiman n1 modelos de regresión.



En cada modelo se omite una observación en la estimación del modelo de regresión y entonces se predice el valor de la observación omitida con el modelo estimado. El residuo iésimo será:



e Y    Y  ) El residuo residuo PRESS PRESS es la( i )suma ial cuadrado cua( idrado de de los residuos residuos individuales e indica una medida de la capacidad de predicción   

 N 

 PRESS   PR ESS  

 i 1

2

e( i )

 





    Y i  Y ( i )  

ˆ

ˆ



2 2

 R Pr  edicción  



1

 PRES  PRE S S  

S YY  284

 

Gráficas parciales de regresión •

Para mostrar el impacto de casos individuales es más efectiva la gráfica de regresión parcial. Un caso “outlier  “outlier ” impacta en la pendiente de la ecuación de regresión (y su coeficiente).



Una comparación visual de la gráfica de regresión parcial con y sin la observación muestra la influencia de la observación



El coeficiente de correlación parcial es la correlación de la variable independiente Xi y la variable dependiente Yi cuando se han eliminado de ambos Xi y Yi



La correlación correlación semipar semiparcial cial refleja refleja la correlación correlación entre entre las variables independiente y dependiente removiendo el efecto Xi 285

 

Por ejemplo: Se inv i nvestig estiga a el efecto de los factores q que ue afectan a % de rotura rotura de pap papas as (v (varia ariable ble de respuesta) antes de su embarq embarque. ue. Los predi predictores ctores son el % de papa  respec  respecto to a otros ingredi ingredient entes es y la la temperatura de horneado en grados celsius. % de papas pap as rotas = 4.231 - 0.044(% papas) + 0.023 Temp Pre di dictor

Coe fi ficie nt nte

Constante % papas Temp

4.231 -0.044 0.023

P

0.322 0.001 0.02

R-Sq = 67.2%

286  

Co mo el P valu Como value e de a ambos mbos predictores pred ictores es e s menor menor a 0.05, son sign sig nificativos, ific ativos, ex explican plican el 67.2% de la varia varian nza d del el % de papas rotas. * Por cada ca da grado g rado C de in i ncrement cremento o en la temperatura, temperatura, el % de papas rotas se espera se incremente en 0.023% * Para predecir el % de papas rotas con el 50% de papas y una temperatura temperatura de cocción cocci ón de 1 175 75 ºC, se calcu ca lcula la el val valor  or  esperado de 4.831% de papas pap as rotas.

287  

Regresión múltiple

288  

Ejemplo: Como parte p arte de un una a prueba de e ener nergí gía a térmica solar, so lar, se mide el el calor total en Fluxes en las las casas. casas . Se desea des ea examin examinar ar si este e ste calor puede puede predecirse predeci rse por la posició posi ción n de los pu pun ntos focales en el Este; Sur y Norte. HeatFlu x 271.8

East 33.53

So ut h 40.55

N ort h 16.66

264

36.5

36.19

16.46

238.8

34.66

37.31

17.66

230.7

33.13

32.52

17.5

251.6

35.75

33.71

16.4

257.9

34.46

34.14

16.28  Etc… Etc.. E tc..

289  

Instrucciones nstrucciones de Minitab: 1 2 3 4 5 6  7 

worksheet > EXH_REGR.MT File > Open worksheet > E XH_REGR.MTW. W. Seleccionar Stat > Regression > Regression. Regression . selecci onar HeatFlux . En Response, Response, seleccionar selecci onar East South North . EIn Predictors, Predictors, seleccionar Click Graphs. En Residu Residuals als for Plots, seleccionar Standardized. En  Residual Plots, En Plots, seleccion selecci onar ar Individual Plots. Plots. Histogram of residuals residuals,, Normal rmal plot of residuals, residuals, y Residuals versus fits. fits. Click OK.  No

8 Click Options. Options. En Display Display,, seleccionar PRESS y PRESS y predicted predicted R-square R-square.. Click OK en cada caja caja de diálogo. di álogo.

290  

Los resultados resultados se muestran a continu continuaci ación: ón: Regression Analysis: HeatFlux versus East, South, North

The regression equation is HeatFlux = 389 + 2.12 East + 5.32 South - 24.1 North

Predictor Constant

Coef 389.17

SE Coef 66.09

T 5.89

P 0.000

2.125

1.214

1.75

0.092

South

5.3185

0.9629

5.52

0.000

North

-24.132

1.869

-12.92

0.000

East

S = 8.59782

R-Sq = 87.4%

R-Sq(adj) = 85.9%

291  

PRESS = 3089.67

R-Sq(pred) = 78.96%

Analysis of Variance Source

DF

SS

MS

F

P

3

12833.9

4278.0

57.87

0.000

Residual Error

25

1848.1

73.9

Total

28

14681.9

Regression

Source

DF

Seq SS

East

1

153.8

South

1

349.5

North

1

12330.6

Unusual Observations Obs

East

HeatFlux

Fit

SE Fit

Residual

St Resid

  4

33.1

230.70

210.20

5.03

20.50

2.94

  22

37.8

254.50

237.16

4.24

17.34

2.32

R denotes an observation with a large standardized resi 292  

Interpretación:

* El valor valor P d de e la ANOVA (0.00) indica que el modelo de regresión regresi ón es si signific gnificativo ativo a un n nivel ivel alfa de 0.05. 0 .05. Indica Indica que al menos un coe coefici ficiente ente es diferen di ferente te de cero. * Los valores P para los coefici c oeficient entes es estimados es timados de North y South South (P = 0.000 0.000)) indican indi can que tienen influ influencia encia si signific gnificativa ativa en el HeatFlux HeatFlux.. El P-valu P-value e de East Ea st de 0.092 indica qu q ue no es significativo si gnificativo a un nivel de significancia de 0.05.  Además la la suma suma secu secuen encial cial de cuadrados cuadrados (sequen (sequential tial su sum m of squares) squares) indica que el predictor East, no explica una gran cantidad de varianza, Por  lo que el modelo con c on solo North y South serìa serìa apropi ap ropiado ado.. * El valor de R-sq (adj) (a dj) de 85.9% 8 5.9% tomando en e n cuenta cuenta el núm número ero d de e predictores predic tores en el modelo, in indic dica a que el modelo ajusta ajusta bien bi en a los datos.

293  

* El Predicted R-Sq de 78.96% es cercano al valor de R-Sq, el modelo no parece estar es tar sobreaju sobreajustado stado y tiene bu buena ena capacidad capacida d predictiv predi ctiva. a. * Las observ o bservaciones aciones 4 y 22 se identifican como anormales anormales dado que el valor val or estandari estandarizado zado de sus resi residuos duos es mayor a 2. Pueden ser Outlie Outliers. rs.  Versus Order

Normal Probability Plot

(response is HeatFlux)

(response is HeatFlux) 99

2 l a

90

u id s e R t n d e e

50 c

iz r d e r

P

0 a d n a t S

10

-2 2

4

6

8

10

12 14 16 18 Observation Order

20

22

24

26

1

28

-3.0

-1.5

0.0 Standardized Residual

 Versus Fits

Histogram

(response is HeatFlux)

(response is HeatFlux)

1.5

3.0

8

2 l a

6 u id s e y R c n d e e u

4

iz q d e r

r

0 a d

F

n a t S

2

-2

0 200

220

240 Fitted Value

260

280

-2

-1

0 1 Standardized Residual

2

3

294  

Interpretación: * La gráfica de Histograma indica que pueden existir puntos aberrantes aberran tes en los los datos, da tos, indicado por las dos barras derechas. * La gráfica grá fica de probab p robabili ilidad dad normal muestra muestra un patrón aprox. lineal consistente con una distribución normal. Hay dos puntos que salen de la línea, línea, con Brushing Brushing se identifica i dentifican n como el 4 y 22. * La gráfica de residuos contra valores estimados, muestra que son más pequ peq ueños conforme se in i ncrementa el valor valor esti estimado mado de Y, lo que puede in i ndicar di car qu q ue los resiu resi udos no tienen un una varianza constante y tal vez sea necesaria una transf. de datos.

295  

Regresión por pasos y mejores subconjunto su bconjuntoss

296  

Regresión por pasos (Stepwise regression) Remueve y agrega Remueve agreg a variables al al m mode odelo lo de regresió reg resión n con el propósito propó sito de d e identifica i dentificarr un un subconju subconjunt nto o útil de predictores. predi ctores. Se tienen tres tres procedimient procedi mientos: os: * Regresión Regresi ón estándar por pasos, agrega y remueve remueve variables. aria bles. * Regresión hacia delante (forward regression), agrega variables * Regresión hacia atrás (backward regression), remueve variables Cuando se selecciona el método Cuando método p por or pasos (stepwise), (stepwise), se puede introducir introdu cir un conju conjunt nto o inicia i niciall de variables predictoras predi ctoras en e n la la caja ca ja Predictors Predictor s in initial m odel,  estas serán removid remov idas as si s i sus s us valores valores p son mayores mayores al a l valor valor A  Alp lpha ha to enter e nter . Si se quieren quie ren manten mantener er en el modelo a pesar pe sar de ssus us valores valores P incluirlas inclu irlas en e n la la caja Predictor Predictors s to include in every model. m odel. 297  

Cuando se seleccion seleccio na el método de regresi regresión ón h haci acia a ade adelan lante, te,  Alpha pha to enter. se puede introducir el valor de Al

Cuando se seleccion seleccio na el método de regresi regresión ón h haci acia a atrás, se puede introducir el valor de Al  Alpha pha to remove.

Ejemplo: Un grupo de estudiantes registra su peso, estatura, género, preferencia por fumar, nivel de ejercicio y pulso en reposo.  Algunos  Algun os de ell ellos os corren dur durant ante eu un n minu minuto, to, desp despu ués de lo cual todos se toman el pulso por segunda vez. Se desea encontr encon trar ar los mejores predi predictores ctores para la 2 2a. a. tasa de pul pulso. so. Pulse1

Pulse2

Ran

Smokes

Sex

Height

Weight

Activity

64

88

1

2

1

66

140

2

58

70

1

2

1

72

145

2

62

76

1

1

1

73.5

160

3

66

78

1

1

1

73

190

1

64

80

1

2

1

69

155

2

298  

Instr nstrucciones ucciones d de e Mi Minitab: nitab: 1 File > Open worksheet > PULSE.MTW. 2 Pulsar [CTRL] + [M] para acti activ var la Session window . 3 Sel. Editor > Enable C Commands ommands para que Minitab muestre comandos. 4 Seleccionar Stat > Regression > Stepwise Stepw ise.. seleccio nar Pulse2 . 5 En Response, Response, seleccion 6 En Predictors, Predictors , seleccion seleccio nar Pulse1 Ran  Weight . 7 Click Options Options.. p auses,, anotar 2 . 8 In Number of steps between pauses 9 Click OK en cada caja caja de diálogo. 10 En la Se Sessi ssion on window, en el 1er. More More? ? prompt, poner Yes . More? ? prompt, poner No . 11 En E n lla aS Sessi ession on w window, indow, en el 2do. More

299  

Los resultados resultados se muestran a continuaci continuación: ón: Stepwise Regression: Pulse2 versus Pulse1, Ran, Alpha-to-Enter: 0.15

Alpha-to-Remove: 0.15

Response is Pulse2 on 6 predictors, with N = 92 Step

1

2

Constant

10.28

44.48

Pulse1

0.957

0.912

T-Value

7.42

9.74

P-Value

0.000

0.000

Ran

-19.1

T-Value

-9.05

P-Value

0.000

S

13.5

9.82

R-Sq

37.97

67.71

R-Sq(adj)

37.28

66.98

Mallows Cp

103.2

13.5 300

 

More?

(Yes,

SUBC>

yes

No,

Step

Subcommand,

or

Help)

or

Help)

3

Constant

42.62

Pulse1

0.812

T-Value

8.88

P-Value

0.000

Ran

-20.1

T-Value

-10.09

P-Value

0.000

Sex

7.8

T-Value

3.74

P-Value

0.000

S

9.18

R-Sq

72.14

R-Sq(adj)

71.19

Mallows

Cp

More?

(Yes,

SUBC>

no

1.9 No,

Subcommand,

301  

Interpretación: El ejemplo utiliza seis predictores. Se pidio que Minitab realice dos etapas en el m método étodo de regresión por pasos automático, muestre los resultados y permita intervenir. En la primera etapa del modelo, la vvariab ariable le Pulse 1 se introduce al modelo; en el paso 2, entra la variable Ran, no se removió ninguna variable. En cada paso Minitab indica la constante, Coeficientes

y el valor valor T para cad cada a mode modelo, lo, desviació desviación n están estándar dar y R-sq (adj).  Al dar Y Yes es en la segun segunda da etapa, el procedimient procedimiento o agrega la variable Sex, como ya no hay más variables que entren o salgan, sa lgan, el procedi procedimiento miento pregun pregunta ta de nu nuevo, evo, al constestar con No, No, se d detiene. etiene. 302  

Regresión por mejores subconjuntos (Best subsets) Este método de regresión reg resión identifica los mjeores modelos de regresión regresió n qu que e pueden ser formados co con n las las variables predictoras que se especifiquen. Minitab in i nicia ici a p por or analiz analizar ar los modelos mode los de un predictor, y después los de dos do s predictores, predi ctores, etc. Solo muestra muestra dos de los mejores modelos en cada caso.

303  

Ejemplo: Como parte de una prueba de energía térmica solar, se mide el calor total en Fluxes en las casas. Se desea examinar si este calor puede puede predecirse predeci rse por las variables variables de posici p osición ón de los Norte rte ; la Insulation y la hora. puntos focales en el Este; Sur y No Time Tim e of tthe he day . Heat Flu x

East

So u th

271.8

33.53

40.55

264

36.5

36.19

238.8

34.66

37.31

230.7

33.13

32.52

251.6

35.75

33.71

257.9

34.46

34.14

304  

Instrucciones nstrucciones de d e Minitab: 1 Fil Filee > Open worksheet w orksheet >  > EXH_REGR.MTW. 2 Seleccionar Stat > Regression > Best Subsets 3 En Response Response,, seleccionar HeatFlux . redictorss, seleccionar Insulation - Time . 4 En Free PPredictor Click OK en cada caja de diálogo.

305  

Los resultados se muestran a continuación: Best Subsets Regression: HeatFlux vs Insolation, East, ... Response

is

HeatFlux

 

I

 

n

 

s

 

o

 

l

 

a

 

t i

E a

o o u r

o

s

t

t

n

t

h

h

Mallows Vars

R-Sq

R-Sq(adj)

Cp

S

1

72.1

71.0

38.5

12.328

 

1

39.4

37.1

112.7

18.154

 

2

85.9

84.8

9.1

8.9321

 

2

82.0

80.6

17.8

10.076

3

87.4

85.9

7.6

8.5978

 

3

86.5

84.9

9.7

8.9110

X

 

4

89.1

87.3

5.8

8.1698

X

 

4

88.0

86.0

8.2

8.5550

X

5

89.9

87.7

6.0

8.0390

X

S N

X X X

X X

X X X

X

X

X

X

X

X

X

X

X

X 306

 

Interpretación de resultados: Interpretación Cada Ca da línea línea represe represent nta a un modelo diferent di ferente. e. Va Vars rs es el nú número mero de variables predi p redictoras ctoras en el m mode odelo, lo, R R-Sq -Sq (adj) está en %. El modelo con co n ttoda odass las variables titiene ene u un n vvalor alor de C Cp p de Mallow de 6.0 (debe (de be se serr aprox. igual ig ual al n núm úmero ero de p predi redictores ctores más la constante), tiene una R-Sq(adj) de 87.7% y el menor valor de desviación estándar S (8.0390). Compite con el modelo de cuatro predictores (sin el timepo) tiene un valor de Cp de 5.8, una S uin poco mayor (8.16) y la R-Sq (adj) es ligeramente más baja (87.3%). En el modelo de tres predictores se observa que el agregar  la varia variable ble E East ast no ayu ayuda da a all aju ajuste ste del mod modelo. elo.

307  

Ejemplo de datos de autos: Estadística Estadí stica de coches:

Stat > Regression > Regression Response Velo.max Response  Velo.max   Predictors Nu Num.Cil, m.Cil, C Cil.(cc), il.(cc), Pot.(CV) Graphs: Graph s: Fou Fourr in On One e Re Residu sidual als s vers versu us variab variable les s Pot.(CV) Options: Prediction intervals for new observations 4 1124 100

308  

Se obtienen o btienen los siguientes resul resultados: tados: Regres Regr essi sion on Ana Analy lysi sis: s: Vel Velo. o.ma max x ve vers rsus us Num Num.C .Cil il., ., Cil Cil.( .(cc cc), ), Pot Pot.( .( The regression equation is Velo.max = 157 - 5.72 Num.Cil. - 0.00218 Cil.(cc) + 0.521 Pot. 244 cases used, 3 cases contain missing values Predictor Coef SE Coef T P Constant 157.178 2.562 61.34 0.000 Num. Nu m.Ci Cil. l. -5.7 -5.717 177 7 0.98 0.9893 93 -5. -5. Si Significati gnificativo vo (P valu alue e < 0.05) Cil. Ci l.(c (cc) c) -0.0 -0.002 0217 178 8 0.00 0.0016 1610 10 -1. -1. No sign sig nificativo ifi cativo (Pvalu (Pvalue e > 0.05) Pot. Po t.(C (CV) V) 0.52 0.5209 092 2 0.01 0.0192 927 7 27. 27. Si Significati gnificativo vo (P valu alue e < 0.05) S = 9.76245 R-Sq = 89.1% Analysis of Variance Source DF SS Regression 3 187887 Residual Error 240 22873 Total 243 210760 Source Num.Cil. Cil.(cc) Pot.(CV)

DF 1 1 1

Seq SS 98419 19841 69627

R-Sq(a MS 62629 95

Coef. De determinación F 657.14

P 0.000

R residuos con más de 2 sigmas X residuos resi duos mu muyy alejados del grupo normal 309

 

R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large influence. Predicted Values for New Observations Obs

Fit

SE Fit

  1

183.951

1.161

95% CI

95% PI

(181.663, 186.239)

(164.584, 203.318)

Values of Predictors for New Observations Obs

Num.Cil.

Cil.(cc)

Pot.(CV)

  1

4.00

1124

100

310  

Los residuos resi duos muestran un un comportamiento normal por lo que el modelo es adecuado

Residuall Plots ffor Residua or Velo. Velo.m max Norm ormal Pro Proba babi bili lity ty Plo Plott of the t he Residu sidua als

Residua iduals Versus rsus the Fitte itted dV Va alue lues

99.9

    t     n    e      c    r     e      P

99

20

90

    l    a  0    u      d     i     s     e      R -20

50 10 1

-40

0.1

-40

-20

0 Residual

20

150

40

Histo tog gramof th the e Residuals

200

250 Fitt Fitted ed Value

300

Residuals Versus th the Order o off th the e Data

80 20 60    y    c      n    e     u  40    q     e    r      F 20

    l    a  0    u      d     i     s     e      R -20 -40

0 -40

-30

-20

-10 0 Residual

10

20

1 20 40 60 80 100 120 140 160 180 200 220 240

Observation Order

311  

Resid idualls sVersu susPot.( .(CV)

El comportamiento de los residuos vs Potencia Potencia sugiere que es necesaria una transformación de variables por ejemplo sacarle raíz cuadrada.

(respo (responseis isVelo.m Velo.max) 30 20 10      l 0     a      u       d  -10      i     s      e       R

-20 -30 -40 -50 0

100

200

300

400

500

Pot.(CV)

312  

Transforman Tran sformando do la variable Pot.(CV) por Pot2 = rai raizz cu cuadrada adrada de Pot.(CV) se tiene: Regression Analysis: Velo.max vs Num.Cil., Cil.(cc),Pot2

The regression equation is Velo.max = 73.5-1.42 Num.Cil.-0.00699 Cil.(cc)+ 12.8 Pot2 Predictor Constant Num.Cil. Cil.(cc) Pot2

Coef 73.502 -1.4201 -0.006988 12.8232

S = 7.03547

SE Coef 2.258 0.6770 0.001202 0.3177

R-Sq = 94.4%

T 32.56 -2.10 -5.82 40.36

R-Sq(a

P 0.000 0.037 0.000 Sig Significati nificativo vo 0.000

(P vvalu alue e < 0.05)

Mejora el ajuste

Predicted Values for New Observations Obs

Fit SE Fit

95% CI

95% PI

  1 1342.286 29.024 (1285.111, 1399.461) (1283.455, 1401.117)XX

XX denotes a point that is an extreme outlier in the pred Values of Predictors for New Observations Obs Num.Cil. Cil.(cc) Pot2   1 4.00 1124 100

313  

Residual Plots for Velo.m Velo.max ax Norm ormal Proba Probabi billity Pl Plot ot of the Re Resi sidua dualls 99.9

Re Resi sidua dualls Vers Versus us the Fitted Val Value uess 20

99

    t     n    e     c     r    e      P

90

     l 0    a     u       d        i    e    s      R -20

50

10 1

-40

0.1

-40

-20

0

20

150

200 200

250

300

Residual

Fitted Value

Hist oog gram o f t h hee Residuals

Residuals Versus t he he Order o f t he he Dat a 20

40    y      c     n 30    e     u     q      e  20    r     F 10

     l 0    a     u       d        i    s     e      R -20

-40 0

-30.0 -22.5 -15.0 -7.5

0.0

7.5

15.0

1

20

40

60

80 100 120 140 160 180 200 220 240

Observation Order

Residual

314  

Los residuos residuos vs Pot2 ya tienen u un n mejor comportamient comportamiento o más a aleatorio: leatorio: Residu Resi dual als s Versus Pot2 (response is is Velo.m Velo.max) 20 10 0

l a u di

s -10 R

e

-20 -30 -40

5.0

7.5

10.0

12.5

15.0

17.5

20.0

22.5

Pot2

315  

Selección Selecci ón de la mejor ecuac ecuación: ión: Best Subsets Permite obtener un "buen modelo" e en n fu función nción de su sencillez o faci facilidad lidad de interpretación. Stat > Regression > Stepwise

Variables candidatas a entrar en el modelo Variables Vari ables forzadas a entrar en llos os modelos

316  

Mínimo numero de variables en el modelo 1 Máximo número Máximo número de d e variables en el modelo todas Número de ecuaciones Número ec uaciones que aparec aparecen en con 1, 2, 3.... Variables regresoras

317  

Los resul resultados tados son so n los siguientes: Best Subsets Regression: Velo.max vs Num.Cil., Cil.(cc), ... Response is Velo.max 244 cases used, 3 cases contain missing values   N C P  

u i o

 

m l t

 

. . .

 

C ( ( P

 

i c C o

 

Mallows

l c V t

Vars

R-Sq

R-Sq(adj)

C-p

S

. ) ) 2

 

1

92.5

92.5

109.0

8.0 Buen Buenos os

 

1

86.6

86.5

385.3

10.813

 

2

94.3

94.2

29.3

7.0 Incluye ncluye sólo

 

2

93.6

93.6

58.0

7.4544

X X

 

3

94.8

94.8

3.9

6.7261

X X X

 

3

94.4

94.3

26.5

 

4

94.9

94.8

5.0

modelos X

Ci Cil.(cc) l.(cc) y Pot2

7.0 Incluye ncluye Num.Ci Num.Cil,l, Cil.(Cc), Ci l.(Cc), Pot2 P ot2 6.7269

X X X X 318

 

Selección de la mejor m ejor ecuac ecuaciión: Stepwise Stepwise Se usa cuan cuando do e ell n núm úmero ero de varia ariables bles es mu muy y gran grande de ma may yor a 31, antes da los mismos resul res ultados tados q que ue el m método étodo anterior: Variable de d e respuest respuesta a

Variables candidatas a entrar en lós modelos

319  

Cri terio para la entrada y salida Criterio de variables El método implica que las las variables puedan ir entrando o saliendo. sali endo. Inic Inicia iando ndo con ninguna. ninguna. Las variables van entrando pero ya no no salen sa len Las variables van saliendo a partirr de tomar todas parti toda s y no no vuelven vuelven a entrar  Permite mostrar en cada paso las mejores opciones además de la seleccionada y el número de pasos entre entre pausas.

320  

Los resultados resultados obtenidos son los sigu sig uientes: Stepwise Regression: Velo.max versus Num.Cil., Cil.(cc), Pot.(CV), Pot2 Alpha-to-Enter: 0.15

Alpha-to-Remove: 0.15

Response is Velo.max on 4 predictors, with N = 244

N(cases wit with hm miss iss ing ob observat servation ions) s) = 3 N(all cases ) = 247 Step Constant

1

2

78.97

71.48

Variables que entran en cada 43 paso y su calidad de ajuste

Pot2

10.41

12.69

17.41

T-Value

54.66

40.50

18.33

P-Value Cil.(cc)

0.000

0.000 -0.00845

0.000 -0.00722

T-Value

-8.58

-7.48

P-Value

0.000

0.000

Pot.(CV)

-0.206

T-Value

-5.23

P-Value

0.000

S

8.08

7.08

6.73

R-Sq

92.51

94.26

94.85

R-Sq(adj)

92.48

94.21

94 Modelo adecuado

Mallows C-p

109.0

29.3

3.9 321

 

Contenido Parte C: 13. Series de tiempo 14. Diseño de experimentos factoriales 15. Estudios de R&R – Concordanci Concordancia a por atributos 16. Capacidad de procesos por atributos 17. Capacidad de procesos 18. Cartas de control control ponderadas ponderadas en el tiempo 323  

13. Series de tiempo

324  

Series de tiempo

• Introducción • Método de Tendencia lineal y cuadrática • Método de Promedio móvil • Método de Suavización exponencial simple • Método de Suavización exponencial doble • Método de Winters

325  

INTRODUCCIÓN

Los métodos de análisis de series de tiempo consideran el hecho que los datos tomados en diversos periodos de tiempo pueden tener algunas características de autocorrelación, tendencia o estacionalidad que se debe tomar en cuenta. Definición de serie de tiempo:   Es una secuencia ordenada de valores de una variable en intervalos de tiempo periódicos y consecutivos.  Aplicación:  la aplicación de estos métodos tiene dos propósitos: comprender las fuerzas de influencia en los datos y descubrir la estructura que produjo los datos observados. Ajustar el modelo y proceder a realizar pronósticos, monitoreo, retroalimentación y control en avance.

Las aplicaciones incluyen pronósticos económicos, análisis de presupuesto, análisis del mercado, etc. 326  

Tendencias: 

los datos muestran unalos tendencia, se Como puedenelajustar los del datos con algún tipo deSicurva o recta y modelar residuales. propósito ajuste es simplemente remover la tendencia a largo plazo, una línea recta es ssuficiente. uficiente.

327  

Estacionalidad:  son

fluctuaciones periódicas, por ejemplo cuando hay picos de ventas en la navidad y después declinan. La serie de tiempo de ventas mostrarán un incremento durante septiembre a diciembre y una declinación durante enero y febrero.

328  

INDICADORES DE MODELOS DE SERIES DE TIEMPO

Estos indicadores sirven para comparar la efectividad de diferentes modelos utilizados. Siempre se busca el valor menor en los indicadores MAPE, MAD y MSD ya que representa un mejor ajuste del modelo.

MAPE:  Porcentaje

promedio absoluto de error, mide la exactitud de los valores estimados de la serie de tiempo. La exactitud se expresa como un porcentaje con  yt    igual al valor observado,  yt    es el valor estimado y n el número de ˆ

observaciones.

329

 

MAD: Desviación

media absoluta, mide la exactitud de los valores estimados de la serie de tiempo. Expresa la exactitud en las mismas unidades de los datos.

MSD: 

Desviación cuadrática media, es más sensible a errores anormales de pronóstico que el MAD.

330  

MÉTODOS DE PRONÓSTICO Los métodos de series de tiempo incluyen métodos de pronóstico y de suavizamiento simples, métodos de análisis de correlación y métodos de Box Jenkins ARIMA.

Métodos de pronóstico y suavizamiento simple: se basan en la idea de que hay patrones visibles en una gráfica de series de tiempo que pueden ser extrapolados al futuro. El método se selecciona dependiendo de si los patrones son estáticos (constantes en el tiempo) o dinámicos (cambian en el tiempo), la naturaleza de los componentes de tendencia y estacionalidad y que tan lejos se quiera pronosticar, son métodos generalmente fáciles y rápidos de aplicar.

331  

Métodos de pronóstico ARIMA (Autoregressive Integrated Moving Average):  Average):  también usan patrones de datos, sin embargo puede que no sean fácilmente visibles en la serie de tiempo. El modelo usa funciones de diferencias, autocorrelación y autocorrelación parcial para ayudar a identificar un modelo aceptable. El modelo ARIMA representa una serie de pasos de filtraje hasta que solo queda ruido aleatorio. Es un proceso iterativo que consume tiempo de ejecución. 

332  

Por ejemplo: Se colectan datos de empleo en un sector de negocios durante 60 meses y se desea predecir la tasa de empleo para los siguientes 12 meses, EMPLOY.MTW. Trade 322 317 319 323 327

Food 53.5 53 53.2 52.5 53.4

Metals 44.2 44.3 44.4 43.4 42.8

Trade 351 354 355 357 362

Food 63.6 68.8 68.9 60.1 55.6

Metals 44.5 45 44.8 44.9 45.2

Etc.

Etc.

Etc.

Etc.

Etc.

Etc.

333  

MÉTODO DE TENDENCIA LINEAL Las instrucciones de Minitab son las siguientes: 1 File > Open Worksheet > EMPLOY.MTW. 2 Ejecutar Stat > Time Series > Trend Analysis . 3 En Variable, poner Trade. 4 En Model Type, seleccionar Linear   5 Seleccionar Generate forecasts y poner 12 en Number of forecasts. 6 Seleccionar Storage . 7 Seleccionar Fits (Trend Line) , Residuals (detrended data), y Forecasts. Seleccionar OK en cada diálogo.

334  

 

Trend Analysis Analysis Plot P lot for Trade Linear Trend Model  Yt = 313.989 + 1.16485*t 400 390 380 370     e       d  360     a      r      T

350 340

 Variable  Ac tual Fits Forecasts  Ac cur acy Measures M A PE PE 1.8999 MA D 6.6177 MS SD D 67. 43 4325

Forecasts Period Forecast 61 385.045 62 386.209 63 387.374 64 388.539 65 389.704 66 390.869 67 68

392.034 393.199

69 70 71 72

330 320 310 1

7

14

21

28

35 42 Index

49

56

63

70

MAPE MAD MSD

394.363 395.528 396.693 397.858

1.8999 6.6177 67.4325 335

 

MODELO CUADRÁTICO 1 Open Worksheet W orksheet EMPLOY.MT EMPLOY.MTW. W. 2 Ejecutar Stat > Time Series > Trend Analysis. 3 En Variable, poner Trade. 4 En Model Type, seleccionar Quadratic. 5 Seleccionar Generate forecasts y poner 12 en Number of forecasts. 6 Seleccionar Storage . 7 Seleccionar Fits (Trend Line) , Residuals (detrended data), y Forecasts. Seleccionar OK en cada diálogo.

336  

 

Trend Analysis Analysis Plot for Trade Tr ade Quadratic Trend Model  Yt = 320.762 320.762 + 0.50937 0.509373*t 3*t + 0.0107456*t** 0.0107456*t** 2 410 400 390 380      e         d 

370

 Variable  Ac tual Fits Forecasts  Ac cur acy Measures MAPE MAP E 1.70 .7076 M AD AD 5.9566 MS MSD D 59.13 .1305

Forecasts Period Forecast 61 391.818 62 393.649 63 395.502 64 397.376 65 399.271 66 401.188

     a       r       T

360 350 340 330 320 1

7

14

21

28

35 42 Index

49

56

63

70

67 68 69 70 71 72

403.127 405.087 407.068 409.071 411.096 413.142

 MAPE 1.7076  MAD 5.9566  MSD 59.1305 337  

PROMEDIO MÓVIL

Suaviza los datos al promediar observaciones consecutivas en la serie Este método es adecuado cuando no hay componente de tendencia ni de tiempo. estacionalidad  Se calcula el promedio móvil de la serie. Por ejemplo si se tienen los números 4, 5, 8, 9, 10 y se usa un promedio móvil de 3. Los primeros dos valores no existen. El tercer valor es el promedio de 4, 5, y 8; el cuarto valor es el promedio de 5, 8, y 9; el quinto valor es el promedio de 8, 9, y10  

338  

Ejemplo: Se desea predecir el empleo durante los próximos 6 meses en el segmento de metales con los datos de los últimos ú ltimos 60 meses. Se usa el método de promedio pr omedio

móvil si no se tienen patrones bien definidos de tendencia o estacionalidad en los datos. 1 File > Open worksheet EMPLOY.MTW. 2 Seleccionar Stat > Time Series > Moving Average Average.. length, poner 3. 3 En Variable, Variable, seleccionar Metals. En MA length, 4 Seleccionar Center the moving averages. averages. forecasts. Click 5 Seleccionar Generate forecasts, forecasts, y poner 6 en Number of forecasts. OK OK..

339  

 

Moving Average Average Plot Pl ot for Metals

Forecasts

52

 Variable

50

 Ac tual Fits Forecasts 95.0% PI Moving Av era erage ge Le Lengt ngth h 3

48     s       l     a       t  46     e       M

 Ac curacy MAPE MAD MS MSD D

Measures Measures 1.5 .55 5036 0.70292 0.76433

44

42

Period

Forecast

61

49.2

62

49.2

63

49.2

64

49.2

65

49.2

66

49.2

40 1

7

14

21

MAPE MAD MSD

28

35 Index

42

49

56

63

1.55036 0.70292 0.76433 340

 

MÉTODOS DE SUAVIZA SUAVIZACIÓN CIÓN EXPONENCIAL SIMPLE

Se aplica cuando solo si se tiene un comportamiento de la serie de tiempo sin tendencia o estacionalidad. El componente simple dinámico en un modelo de promedio móvil es el nivel. Peso especificado 1. Se usa el promedio de los primeros seis (o N si N Open worksheet EMPLOY.MTW. worksheet EMPLOY.MTW. Seleccionar Stat > Time Series > Single Exp Smoothing. Smoothing . Variable,, poner Metals. En Variable Seleccionar Generate forecasts, forecasts, y 6  en  en Number of forecasts. forecasts. Click OK OK..

Los resultados se muestran a continuación: Single Exponential Smoothing for Metals Data

Metals

Length

60

Smoothing Constant Alpha

1.04170

342  

 

Single Exponential Smoothing Plot for Metals 52

 Variable  Ac tual Fits Forecasts 95.0% PI

50

Smoothing C onsta onstant nt  Alp ha 1.04170 1.04170

48

 A ccur acy MAPE MAD MSD MSD

     l     s     a        t  46     e       M

44

Measures 1.1 .11 164 648 8 0.5 .50 0427 0.4 .42 2956

Forecasts Period Forecast 61 48.0560 62 48.0560 63 64 65 66

48.0560 48.0560 48.0560 48.0560

42

40 1

7

MAPE MAD MSD

14

21

28

35 Index

42

49

56

63

1.11648 0.50427 0.42956 343

 

SUAVIZAMIENTO EXPONENCIAL EXPONENCIAL DOBLE (HOLT) Se aplica cuando en la serie de tiempo se presenta una tendencia ascendente o descendente pero sin estacionalidad.

Pesos especificados 1. Se hace una regresión lineal en los datos de la serie (Y) contra el tiempo (X). 2. La constante de esta regresión es el valor inicial estimado del componente de nivel, el coeficiente de la pendiente es el estimado inicial del componente de

tendencia. Pronósticos: el método de suavizamiento exponencial doble usa los componentes de nivel y de tendencia para generar los pronósticos.

344  

Por ejemplo: File > Open worksheet EMPLOY.MTW. Seleccionar Stat > Time Series > Double Exp Smoothing. En Variable, poner Metals.

1 2 3

4 Seleccionar  en Number of forecasts. Generate forecasts, y 6  en Click OK. OK. Los resultados se muestran a continuación:

Double Exponential Smoothing for Metals Data

Metals

Length

60

Smoothing Constants Alpha (level) Gamma (trend)

1.03840 0.02997 345

 

 

Double Exponential Smoothing Plot for Metals 54

 Variable  Ac tual Fits Forecasts 95.0% PI

52 50

Smoothing C onstants onstants  Alp ha (level) 1.0 1.0384 3840 0 Gamma Gam ma (t (trend) rend) 0. 0.02 0299 997 7

    s  48      l     a       t      e       M 46

 Ac cur acy MAPE MAD MS MSD D

44 42 40 1

7

MAPE MAD

14

21

28

35 Index

1.19684 0.54058

42

49

56

63

Measures 1.1 .19 9684 0.5 .54 4058 0.4 .46 6794

Forecasts Period Forecast 61 48.0961 62 48.1357 63 48.1752 64 48.2147 65 66

48.2542 48.2937

MSD

0.46794 346

 

MÉTODO DE WINTERS Se aplica cuando en la serie de tiempo se presentan los patrones de tendencia y estacionalidad. Suaviza los datos por el método exponencial de Holt  –  Winters. Se recomienda este método cuando se tienen presentes los componentes de tendencia y estacionalidad ya sea en forma aditiva o multiplicativa.

El efecto multiplicativo se presenta cuando el patrón estacional en los datos depende del tamaño de los datos o sea cuando la magnitud del patrón estacional se incrementa conforme los valores aumentan y decrece de crece cuando los valores de los datos disminuyen. El efecto aditivo es mejor cuando el patrón estacional en los datos no depende del valor de los datos, o sea que el patrón estacional no cambia conforme la serie se incrementa o disminuye de valor. 347  

El método de Winters calcula los estimados de de tres componentes: nivel, tendencia y estacionalidad. Calcula estimados dinámicos con ecuaciones para los tres componentes: nivel, tendencia y estacionalidad. Estas ecuaciones dan una mayor ponderación a observaciones recientes y menos peso a observaciones pasadas, las ponderaciones decrecen geométricamente a una tasa constante. La ponderación seleccionada para Nivel, tendencia y estacionalidad es de 0.2 si se quiere hacer una correspondencia con el modelo ARIMA u otros valores entre 0 y 1 para reducir  los  los errores de estimación.

348  

Ejemplo de pronósticos utilizando el Método de Winters W inters   Se desea predecir el empleo para los siguientes seis meses en la industria alimenticia usando datos colectados sobre los últimos 60 meses, usando el método de Winters con el modelo multiplicativo, dado que hay componente estacional y de tendencia aparente en los datos. Instrucciones de Minitab 1 File > File > Open Worksheet > EMPLOY.MTW. 2 Ejecutar Stat > Time Series > Winters' Method. Method . 3 En Variable, Variable, poner Food . In Seasonal length, length, 12 . Type,, seleccionar Multiplicative. Multiplicative. 4 En Model Type 5 Seleccionar Generate forecasts poner 6 en Number of forecasts. forecasts. Seleccionar OK. OK.

349  

 

Winters' Method Plot for Food

Multiplicative Method 75

70

     d      o      o       F

65

60

55

 Variable  Ac tual Fits Forecasts 95.0% PI Smoothing C onstants onstants  Alph a (level) (level) 0.2 Gam Gamma (tre (trend) nd) 0.2 Del Delta ta (sea (seassonal onal)) 0.2  Ac curacy Meas Measures ures MAPE 1.8 .88 8377 MAD 1.1 .12 2068 MS MSD D

2.8 .86 6696

Period Forecast 61 57.8102 62 57.3892 63 57.8332 64 57.9307 65 58.8311 66 62.7415

50 1

7

14

21

28

35

42

49

56

63

Index

Smoothi Smoo thing ng Con Consta stants nts Alpha (level) 0.2 Gamma (trend) 0.2 Delta (seasonal) 0.2

MAPE 1.88377 MAD 1.12068 MSD 2.86696 350

 

14. Diseños de experimentos

351  

Diseño de experimentos

• Introducción • Diseños de experimentos 2K

• Diseños de experimentos factoriales completos

352  

Introducción

353  

Diseño de experimentos factoriales •

Es una prueba o serie de pruebas donde se inducen cambios deliberados en las variables de entrada de un proceso, para observar su influencia en la variable de salida o respuesta

Entradas

Salidas (Y)

Proceso

Entradas

Salidas (Y)

Diseño de Producto

354  

y Número de niveles



En Dos Nivel Niveles es nos perm permite ite considerar únicamente los efectos lineares. 1

2 2 Niveles

y



En Tres Tres Niveles Niveles hay la necesidad necesidad de ejecutar másbuscar pruebas, sin embargo, nos permite la curvatura, es decir,, los efectos cuadráticos. decir 1

2

3

3 Niveles 355  

Pas Pa sos de del DO DOE - genera neralles • Establecer objetivos

• Seleccionar variables del proceso • Seleccionar un diseño experimental • Ejecutar el diseño •  Asegurar que los datos sean co consistentes nsistentes con con los supuestos •  Analizar e interpretar interpretar los resulta resultados dos • Usar / presentar los resultados (pueden orientar a corridas futuras) 356  

Pas Pa sos del del DOE DOE - deta detalllad lado • Proceso en control, evaluar capacidad • Deter Determina minarr CTQ objetivo objetivo a me mejorar  jorar  • Definir como medir la variable de respuesta • Determinar los factores de influencia • Determinar los niveles de experimentación

357  

Pasos del DOE – DOE – detallado… detallado… • Seleccionar diseño experimental a utilizar  • Verificar el error R&R del sistema de medición • Planear y asignar recursos a los experimentos experimentos • Realizar los experimentos • Medir las unidades experimentales

358  

Pas Pa sos del del DOE DOE - deta detalllad lado • De resultados identificar factores significativos • Determinar la mejor combinación de niveles de factores para lograr los objetivos • Correr un experimento de confirmación • Establecer controles para mantener la solución • Re evaluar la capacidad del proceso 359  

Tipos de Experimen Experimentos tos Tipos Comunes

Número Típico de

de Experimentos 1. Facto ctoria rial Compl mpleto

Objetivos

Factores Controlables

• Encontrar los niveles de

(todas las combinaciones de factores y niveles)

factor que proporcionan los mejores resultados. • Construir un modelo matemático (evalúa todas las interacciones).

4 o menos

• Encontrar los niveles de

2. Fracc racciional Fa Fact cto oria rial (subgrupo del número total de combinaciones)

factor que proporcionan los mejores resultados. • Construir un modelo matemático (evalúa todas las interacciones).

5 o más

3. Examen

• encntra Probar rmuchos factores para encntrar los po pocos cos vi vitales. tales.

7 o más

(no evalúa interacciones). 360

 

Tipos de Experimentos (continuación) Tipos Comunes de Experimentos 4. •

Diseñ eño o Central Compuesto o Box-Behnken

5.

Diseño R Ro obusto

Objetivos • •

 





6.

Diseñ eño o Robusto Dinámico de Taguchi (Función Ideal)

Número Típico de Factores Controlables

Optimizar  Construir un modelo matemático cuando no haya efectos lineales (Superficie de respuesta).

Optimizar  Para encontrar los niveles de factores a fin de reducir al mínimo la variación ante factores de ruido cambiantes. • •



Optimizar Optimizar la función de un producto o proceso de manufactura. Reducir al mínimo la sensibilidad al ruido y aumentar al máximo la sensibilidad a la señal de entrada.

3 o menos

5 o más

7 o más

361  

Los Factores Pueden Afectar... 1. La Variación del Resultado Tiempo de Ciclo Largo

3. La Variación y el Promedio Temp  Alta Temp Baja

Tiempo de Ciclo Corto

Dimensión de la Parte

2. El Resultado Promedio Presión de Sujeción Baja

Dimensión de la Parte

4. Ni la Variación ni el Promedio Presión de Sujeción Alta

Dimensión de la Parte

 Ambos materiales materiales producen el mismo resultado

Dimensión de la Parte

362  

Estrategia cuando el “ Val  Valor or Me Meta ta es Me Mejor jor”  Paso Pa so 1: Encu Encuent entra ra los los facto factores res que que afectan afec tan la variac variación. ión. Usa Usa estos factores facto res para para reducir reducir al mínimo mínimo la variación. Paso Pa so 2: 2: Encue Encuentr ntra a los los facto factores res que que desplazan el promedio (y no afect afe ctan an la varia variació ción). n). Usa Usa estos estos factores para ajustar la salida promedio con la meta deseada.

Meta

363  

Estrategia cuando el  Valor Mínim Mínimo o es M Mejor ejor”   “ Tendencia de salida baja

0

• El objetivo en este caso es encontrar los factores que

afectan la sal afectan salida ida pro promed medio io (tiem (tiempo). po). Usa es estos tos fac factore toress para hacer que la tendencia del promedio sea baja. se reduce la variación en la salida salida al mínimo, • Cuando se también se mejora salida al los factores que contribuyen en granlamedida a detectar la variación.

364  

Diseños de experimentos experimentos 2K

365  

Diseños factoriales de dos niveles El número de combinaciones de prueba para un factorial completo con factores k, cada uno en dos niveles es:

n



k 2

Por lo tanto, a estos diseños se les conoce como diseños .

k 2

366  

Diseño factorial completo 2K ALTO ALTO

Representación ció n Gr Gráfi áfica ca

B

B

ALTO BAJO

BAJO

C

A ALTO

BAJO

A

Factor

BAJO

BAJO

ALTO

Prueba A

Representación Tabular

1 2 3 4

A

B

+ +

+ +

1 2 3 4 5 6 7 8

+ + + +

B

C

+ + + +

+ + + + 367

 

Diseño factorial completo 2K Niveles Factores Velocidad (seg.)

Bajo 350

Alto 400

Tiempo

1min.

2min.

Todas las combinaci combinaciones ones Velocidad C or r ida 1: C or r ida 2: C or r ida 3: C or r ida 4:

350 350 400 400

Tiempo 1min. 2min. 1min. 2min.

368  

Experim Exp eriment ento o facto factorial rial com complet pleto o – sin interacción 

Un experimento factorial completo es un experimento donde se prueban todas todas las po posibles sibles combin combinaciones aciones de los niveles de todos todos los

factores. Factor A : -1

+1

+1

30

52

-1

20

40

Factor B :

Y = Respuesta B+1

Efecto del factor A = (52+40)/2 - (30+20)/2 = 21 Efecto del factor B = (3 (30+52)/2 0+52)/2 - (20+40)/2 = 11 Efecto de A*B = (52+20)/2 – (30+40)/2 =1

B-1  A -1 -1 +1

369  

Experimento Experiment o sin interacción B = +1

30

52 Respuesta Promedio

B = -1

40

20

 A = -1

A = +1 370

 

Experimento Experiment o sin interacción

Respuesta

52 40 30 20 A = -1

A = +1

371  

Modelo de regresión lineal  y



 b 0



b1 x1



b 2 x2



b 12 x1 x2

 b 0



( 20  40  30  52) / 4

 b 1



21 / 2



11

11 / 2



5.5

ˆ

ˆ

 b 2 ˆ





35. 5

ˆ

 b 12  1 / 2  0.5   35.5  10.5 x1  y  ˆ



5.5 x2



0.5 x1 x2

coeficiente e 0.5 es muy pequeño El coeficient dado que no hay interacción 372  

Gráfica de contornos

Dirección

De ascenso rápido

Experimentos sin interacción 1

49 46 40

.5

X2

34 0

28 22

-.5 -1

-1 -.6

-.4 -.2 0.0 +.2 +.4 +.6 +.8

+1

X1 373  

Superficie de respuesta Experimentos sin interacción Y = respuesta

Superficie de respuesta Gráfica del modelo de regresión

X1 X2  

Experim Exp eriment ento o facto factorial rial com complet pleto o – con interacción 

Un experimento factorial completo es un experimento donde se prueban todas las posibles combinacio combinaciones nes de los niveles niveles de todos los factores. Factor A : -1

+1

+1

40

12

-1

20

50

Factor B :

Y = Respuesta B+1

Efecto de A*B = {(12+20)-(40+50) {(12+20)-(40+50)}/2 }/2 = -29

B-1  A -1 +1 375

 

Interacción de dos factores Sin interacción Interacción Interacción Interacción moderada

fuerte

fuerte

Factoriales completos vs fraccionales

376

 

Experimento Experimen to con interacción B = +1

40

12

Respuesta Promedio 50

20

B = -1

A = -1

A = +1 377

 

 y

Modelo de regresión lineal   b 0  b1 x1  b 2 x2  b 12 x1 x2

 b 0



( 20  40  30  52) / 4

 b 1



2/2

ˆ

ˆ





1

ˆ

 b 2  18 / 2  9  b 12  58 / 2  29 ˆ

 y ˆ

  30.5  1x1





9 x2



29 x1 x2

30.5

El coeficiente -29 es muy grande representando representando la interac interacción ción

379

 

Dirección De ascenso rápido

Gráfica de contornos

1

49 25

43

.5

40

X2

31 0

34

28

-.5 -1

X1

-1 -.6

-.4 -.2 0.0 +.2 +.4 +.6 +.8

+1 380

 

Superficie de respuesta Experimentos con interacción

Superficie de respuesta

Gráfica del modelo de regresión

381  

Tabla ANOVA  –  – Experimento de Tratamiento Térmico Origen

DF

SS Sec

SS Aj

MS Aj

F

P

Temp

1

162.000

162.00

162.00

46.29

0.002

Tiempo

1

2.000

2.000

2.000

0.57

0.492

Temp* Tiempo

1

72.000

72.000

72.000

20.57

0.011

Error

4

14.000

Total

7

250.000

14.000

3.500

La Temperatura es significativ significativa. a. El Tiempo, por sí sol solo, o, n no o es significativo. El Tiempo, en combinación con la Temperatura, es significativ significativa. a.

382  

Modelo de regresión

383  

Gráficas factoriales de efectos principales e interacciones Main Effects Plot (data means) for Res

Interaction Plot (data means) for Res  - 1

 1

 - 1

 1  

90

 A -1 1

88      s       e        R

86

90 84

    n     a     e      M 85

82  A

B

80

-1

1

B

384  

Gráficas de contornos y de superficie de respuesta Contour Plot of Res 1

82.5 85.0

87.5 90.0 92.5

      B

Surface Plot of Res

0

95

90

-1

Res Re s -1

0

 A

85

1 1

80 0 -1

 A

B

-1

0 1

385  

Ejemplo: En el diseñ dise ño de una pá pági gin na Web se d desea esea max maximi imizzar el n nú úmero Y (miles) de visitas visi tas a la mi misma. sma. Para lo cual se realiza u un n diseño de ex e xperi perimen mentos tos de tres factores con co n dos niveles y dos rép réplicas licas.. Factor Nivel bajo Nivel Alto  A. Colores 8 12 B. Intensidad 230 2 40 C. Velocidad de carga 0.6 1 Co mo respuesta se toma el niv Como nivel el de visitas visi tas en u un na escala esc ala de 0 a 30 entre ent re may mayor or sea mejor calida calidad d

386  

  Paso 1. Generar diseño Stat > DOE > Factorial > Create Factorial Design Sel. 2-Level factorial (default generators); Number of o f factors factors 3

Designs: S  Seleccion eleccionar  ar  Full  Full Factor  Factor  Replicates  2 Blocks 1 Factors:  Co Colores lores 8 12 Inten tensid sidad ad 230 240 Veloci Velocidad dad 0.6 1 Options:  Qu Quitar itar b bandera andera de Randomize runs OK Puede colocar la matriz del diseño di seño en orden al aleatorio eatorio o es están tándar dar con Stat > DOE > Display Design : Estándar order for design Para cambiar de unidades sin codificar a un unidades idades codificadas: Stat > DOE > Display Design : Coded o Uncoded Units

387  

  Pas Paso o 2. Introducir los resultado resultados s experim expe rimentales: entales: R un O Orrder Colores Intensidad V Ve elocidad 1 8 230 0.6 2 12 230 0.6 3 8 240 0.6 4 12 240 0.6 5 8 230 1 6 12 230 1 7 8 240 1 8

12

240

1

Y 10 26.5 15 17.5 11.5 26 17.5

8 28 13 19 10 25 19

20

18

388  

  Paso 3. Anal Analizar izar el diseño

Stat > DOE > Factorial > Analyz Analyze e Factorial Design Des ign Response Y Response  Y Graphs: Seleccionar Effects plots Normal Pareto  Pareto  Alph  Alpha a = 0.05 Residual for Plots Standardized   Seleccionar Normal Plot y Resi Residuals duals vs vs Fits Fits Results Selecci Seleccionar onar ttodos odos los términ términos os co con n >> OK OK

389  

Los result re sultados ados se muestran a continuación. Pareto Chart of the Standardized Effects

(response is Y, Alpha = .05) 2.31 Factor Factor  A B C

 A 

Name C olores In ntte ns nsi da da d V el elocidad

 AB  AC

   m    r    e      T

C Normal Plot of the Standardized Effects

BC

(response is Y, Alpha = .05) 99

B

Effect Type Not Significant Significant

95

 ABC 0

2

4

6

8

10

12

14

16

18

Fact Factor or  A B C

 A 

90 80

Standardized Effect

70      t      n 60     e      c  50     r     e  40

Los factores e interacciones significativas significati vas pasan la raya roja roja

     P

30  AC

20 10

 AB

5   1

-10

-5

0

5

10

15

20

Standardized Effect

390  

Nam e C olores In ntte n nss id ad ad V el elocidad

Los términos significati signifi cativvos tienen un P vvalue alue DOE > Factorial Plots Sel. Main Sel.  Main Effects Plot: Setup: Respo Response nse Y; Pasar factores factores con  con >> Sel. I Sel.  Int nteracti eraction on Plot: Setu Se tup: p: Respo Response nse Y; Y; Pasar factores con >> con >> Sel. Cube Sel.  Cube Plot: SetUp >> Response Y; Y; Pasar  Pasar con >> OK Main Effects Plot for Y  Data Means Intensidad

Colores 22 20 18 16 14      n      a       e        M

8

12  Ve locidad locidad

22 20 18 16 14 0.6

1.0

230

240

394  

Las in i nteracciones significativas si gnificativas son A*B y A*C Los mejores niveles niveles de operació op eración n son: son: A = 8, B = 230 23 0 y C = 0.6 Colores Col ores = 12 

395  

El cubo muestra muestra las d diiferent ferentes es Y Y's 's - L La a mejor combi combin nación aci ón es: Cube Plot (data means) for Y  18.25

14.00

19.00

18.25

240

Intensidad

10.75

25.50 1  Velo  Ve loci cidad dad

9.00

27.25

230

0.6 8

12 Colores

396  

Paso 5. Gráfi Gráficas cas de contornos y de superficie superficie de respuesta Stat > DOE > Contour / Surface P Plots lots Sel. Contou Sel.  Contourr Plot: Se Setu tup: p: Respo Response nse Y; Y; Sel. gener. gene r. plots plots for all pair of num. Factors Fac tors Sel. Sur Sel.  Surface face Plot: Setup: Resp. Y; Y; Sel. gener. gene r. plots plots for all pair of num. Factors Fac tors OK

   

Contour Plots of Y  Intensidad*Colores

24 240 0

 Velocidad*C  Vel ocidad*C olores

1. 1.0 0

 Y  < 10.0 10.0  – 12.5 12.5  – 15.0 15.0  – 17.5 17.5  – 20.0 20.0  – 22.5 22.5  – 25.0 > 25.0

0. 0.9 9

23 237 7

0. 0.8 8 23 234 4 0. 0.7 7 23 231 1 0. 0.6 6 8 1.0 1.0

9

10

11

 Velocidad*Intensi  Vel ocidad*Intensidad dad

12

8

9

10

11

12

Hold Values C olores 8 In Inttens nsiidad dad 230  Velocidad  Vel ocidad

0.9 0.9 0.8 0.8

0.6 0.6

397

0.7 0.7 0.6 0.6 23 231 1

23 234 4

23 237 7

24 240 0

Las flechas mu muestran lla a di direcci rección ón de experiment experimentaci ación ón fu futu tura ra para mejores resultados 398  

Gráficas Gr áficas de superf superfici icie e de respu respuesta esta 399  

Paso 6. Ampliación Ampliación de la respuesta en la zona z ona de Y = 21 a 24 Stat > DOE > Factorial > Overlaid Contour Plot Seleccionar Response Y Response Y con  con > Seleccionar Selecci onar en Setti Settings ngs Hold Extra E xtra  factors factors   Probar con High y Middle settings Seleccionar Selecci onar en Contours  Low 21 21   High 26 Contours Low

Factors X:Axis X:Axis   A:Colores  Y:Axis  Y:Axis B:Intensidad OK

400  

Contourr P Contou Plot lot of Y  240.0

 Y  21 24

238.5

Hold Values  Velocid ad 1

237.0      d      a       d      i  235.5     s      n     e       t      n 234.0      I

232.5 231.0 8

9

10 Colores

11

12

401  

Paso 7. Obtener una respuesta optimizad optimizadaa F actorial > Response Opti Stat > DOE > Factorial Optimizer  mizer 

Seleccionar Seleccio nar en Response Response  Y Seleccio Seleccionar nar  :Colores 10   Intensidad 10 0.8 Seleccionar Seleccio nar en en Options Set up: Goal Maximize Lower 21 21  235 TargetVelocidad 26 OK

402  

Sel.y mover las líneas de cada factor hasta obtener el máximo nivel de servicio: Optimal High D Cur 1.0000 Lo Low w

Colores 12.0 [1 2.0] 8.0

Intensid 240.0 [2 30.0] 230.0

Velocida [01.0 .60] 0.60

Composite Desirability 1.0000

 Y  Maximum y = 27.2500 d = 1.0000

403  

Diseños de experimentos experimentos Factoriales completos

404  

Diseño de exper ex periment imentos os factoriales factoriales comp complet letos os de tres niveles Se estudia el nivel de servici servicio o de una su sucursal cursal (Y (Y), ), donde se p pie ien nsa que los factores que mayor infl influen uencia cia tienen son la v veloci elocidad dad y el  tiempo de espera en ffilas. ilas. Se di diseña seña u un n ex experi periment mento o factoria factoriall completo con dos réplic réplicas as y tres niveles niveles en cada factor como s se e muestra en lla a tabla siguient si guiente. e. Considerar Cons iderar un 5% de nive nivell de significanc significancia ia o 95% de niv nivel el de confianza.

Ti Tiem emp po de es pera en fil fila a (s eg eg.) .) V elocid elocida ad (s eg eg.) .)   150 160 170

 200 90.4 90.2 90.1 90.3 90.5 90.7

215 9 0.7 90.6 90.5 90.6 90.8 90.9

230 9 0.2 90.4 89.9 90.1 90.4 90.1 405

 

PASO 1. GENERAR GENER AR EL DISEÑO D ISEÑO FACTORIAL FACTORIAL Stat > DOE > Factorial > Create Factorial Design seleccionar Type of Design D esign:: Gene General ral Full Ful l Factorial Factorial Design Number factors 2 Nu mber of factors Nu mber of Levels Factor or Number Levels 3 Designs: Fact Factor orAB Name Name Nam eVelocidad  Tiempo Fact Nu Number mber of of Replicates 2 

Options Quitar bandera ban dera de randomize runs Introducir roducir los niveles niv eles para para Velocidad  200 215 230  Factors Int

Tiempo 150 160 170  OK 

406  

PASO 2. CARGA PASO CARGA DE DAT DATOS OS DE LA COLUMNA COLUMNA DE RESPUEST DESPUÉS DESPU ÉS DE GENERAR EL DISEÑO O A ARREGLO RREGLO

S tdOrder 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

P tType 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

B locks 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

Copiar columna de datos V eloci dad Ti empo Ni vel_S erv 2 00 150 90.4 2 00 160 90.1 2 00 170 90.5 2 15 150 90.7 2 15 160 90.5 2 15 170 90.8 2 30 150 90.2 2 30 160 89.9 2 30 170 90.4 2 00 150 90.2 2 00 160 90.3 2 00 170 90.7 2 15 150 90.6 2 15 160 90.6 2 15 170 90.9 2 30 150 90.4 2 30 160 90.1 2 30 170 90.1 407

 

PASO 3. A ANALIZ NALIZAR AR EL DISEÑO DISEÑO DE EXPERIMENT EXPERIMENTO OS Stat > DOE > Factorial > Analyze Factorial Design Response Seleccionar  Nivel_Serv  Terms Pasar todos los térm térm inos a Selected Sel ected con >> >> OK  Graphs Graphs

Residuals for Plots Estandardized  Residuals Seleccionar Residual plots: Normal y vs fits OK 

Results

C ovariate, Unusua Unusuall observations  ANOVA  ANO VA table, Covariate,

Seleccionar Selecci onar todos los l os térmi términos nos con >> OK 

OK Cálculo de res residuales iduales

Y(i,j) estimada= estimada= Promedio de de valores valores en cada ccelda elda (i (i,j) ,j) Residuales o error e(i,j) = Y(i,j) real observada - Y (i,j) estimada 408  

Los residuales resi duales vversus ersus Y esti estimada mada son aleatorios con m medi edia a cero  Versus  Versu sF Fits its (respon (response se is Niv el_Serv )

l

2

a u di s

1

e R d e

0

zi d r

a -1 d n at

S -2 90.0

90.1

90.2

90.3

90.4 90.5 Fitted Value

90.6

90.7

90.8

90.9

Normal Probability Plot (respon (response se is Niv el_Serv ) 99 90

t n e

c 50 r e P 10 1 -3

-2

-1

0 Standardized Residual

1

2

3

Los resi residuales duales se d dis istribuy tribuyen en n normalm ormalment ente e (ape (apego go a la lílín nea rec recta) ta)

409  

Multilevel Multilev el Factori Factorial al De Desig sign n Factors: 2 Replicates: 2 Base runs: 9 Total runs: 18 Base blocks: 1 Total blocks: 1 Number of levels: 3, 3 General Linear Model: Nivel_Serv vs Velocidad, Tiempo Factor Temp Presion

Type fixed fixed

Levels 3 3

Values 200, 215, 230 150, 160, 170

Analysis of Variance for Nivel_Serv, with Adjusted SS for T

Significativos a nivel de 0.05 Source

DF

Seq SS

Adj SS

Adj MS

F

P

Velocidad

2

0.76778

0.76778

0.38389 21.59 0.000

Tiempo

2

0.30111

0.30111

0.15056

8.47 0.009

Velocidad*Tiempo Velocidad*T iempo

4

0.06889

0.06889

0.01722

0.97 0.470

Error

9

0.16000

0.16000

0.01778

Total

17

1.29778

No significativo a nivel 0.05 S = 0.133333

R-Sq = 87.67%

R-Sq(adj) = 76.71% 410

 

PASO 4. GRÁFICAS GRÁFICAS FACTORIALES P PARA ARA IDEN IDEN TIFICAR LAS MEJORES CONDICIO COND ICIONES NES DE OPERACIÓN

Determinados de promedios del Nivel_Serv en cada nivel de factore Least Squares Means for Rendimiento Temp

Mean

SE Mean

200

90.37

0.05443

215

90.68

0.05443

230

90.18

0.05443

150

90.42

0.05443

160

90.25

0.05443

170

90.57

0.05443

Presion

Temp*Presion 200

150

90.30

0.09428

200

160

90.20

0.09428

200

170

90.60

0.09428

215

150

90.65

0.09428

215

160

90.55

0.09428

215

170

90.85

0.09428

230

150

90.30

0.09428

230

160

90.00

0.09428

230

170

90.25

0.09428 411

 

PASO 5. GRÁFICAS FACTORIALES Stat > DOE > Fac Factorial torial > Fac Factorial torial Plots effects e Interaction Interaction Plots P lots Seleccionar Setup para para Main ambas: En Response seleccionar Nivel_Serv  y con >> seleccion seleccionar ar todos los factores OK

Seleccionar Da Datta Mea eans ns OK

De aquí se selecci seleccionan onan los mejores niv niveles eles de acuerdo al resul resultado tado deseado dese ado.. Si la int interacci eracción ón es significa significativ tiva, a, los los mejores niv niveles eles se seleccionan selecci onan de las gráficas gráfica s de iint nteracci eracciones, ones, de otra fforma orma se seleccionan de las gráficas de efectos de los factores principales. 412  

Main Effects Plot for Nivel_Serv Data Means  Velocida  Velo cidad d 90.7

90.6

90.5

n a M

e 90.4

90.3

Tiempo

90.2 20 200 0

21 215 5

23 230 0

150 150

160 160

170 170

Para maximizar el nivel de servicio se seleccionan:  Ve  V eloci dad = 215 s eg . T iempo = 17 170 s eg . 413  

Interaction In teraction Plot for Nivel _Ser v Data Means 90.9

 Velo cid ad 200

90.8

215 230

90.7 90.6     n 90.5     a      e       M 90.4

90.3 90.2 90.1 90.0 150

160

170

Tiempo

Esta gráfica no es util utilizada izada debid de bido o a que q ue la la interacción no fue fue significati sig nificativ va 414  

15.. Estu 15 Estudi dios os de de R&R R&R -

Concordancia por atributos

415  

Estudios de R&R – Concordancia por atributos

• Introducción • Ejemplos

416  

Análisis de concordancia por atributos Se usa para evaluar la concordancia de calificaciones nominales u ordinales dadas por diversos evaluadores. Las mediciones son evaluaciones subjetivas dadas por p or las personas más que que medicion medici ones es directas. di rectas. Por ejemplo: ejemplo:

  Evaluaci Evaluación ón de desempeño desempeño de automoviles automoviles  - Clasificación Clasifica ción de calidad de fibras como "buena" "buena" o ""mal mala" a"  - Evaluaci Evaluación ón del color del vino, su aroma, y sabor en un una escala escala del 1 al 10. En estas situaciones, las características de calidad son difíciles de definir y evaluar. Para obtener clasificaciones significativas, se utiliza más de un evaluador para clasificar la medición de la respuesta. Si los evaluadores concuerdan, existe la posibilidad de que las calificaciones sean exactas.  Si no hay acuerdo, acuerdo, la utilidad utilidad de las calificacion calificaci ones es es limitada.

417  

Por ejemplo: Una institución evaluadora está capacitando a cinco nuevos evaluadores de la parte escri una una prueba. habilidad de los evaluadores evalu adores para p ara calificar calific la prueba pru eba debe d escrita ebe ser staerde consistente consistent e conLaestándares. Cada eval evaluador uador califica quince quincear reactivos en una una escala es cala de cinco puntos puntos (-2, -1, 0, 0 , 1, 2) File le > Open Worksheet ESSAY.MTW. 1 Fi Appraiser Sample Rating Attribute Simpson 1 2 2 Montgome 1 2 2 Holmes 1 2 2 Duncan 1 1 2 Hayes 1 2 2 Simpson 2 -1 -1 Montgome 2 -1 -1 Holmes 2 -1 -1 Duncan 2 -2 -1 Etc. Etc. Etc. Etc. 418  

2 Stat > Quality Tools Too ls > Attr Attribute ibute Agreement Analysis Analysis.. 3 En Attribute Attribute column c olumn,, seleccionar selecci onar Rating  Rating .. 4 En Samples, Samples, seleccionar selecci onar Sample .

5 En Appraisers, Appraisers, seleccion selecci onar ar Appraiser   Appraiser .. standard/attri tribute bute,, seleccion selecci onar ar Attr  Attribute ibute . 6 En Known Know n standard/at 7 Seleccionar Categories of the attribute data are ordered ordered y  y click OK. OK.

419  

Los resultados resultados son los siguientes: s iguientes: Results for: Essay.MTW   Attribute Agreement Analysis for Rating Each Appraiser vs Standard Assessment Agreement Appraiser # Inspected # Matched Duncan 15 8 Hayes 15 13 Holmes Montgomery Simpson

15 15 15

15 15 14

Percent 53.33 86.67

95 % CI (26.59, 78.73) (59.54, 98.34)

100.00 100.00 93.33

(81.90, 100.00) (81.90, 100.00) (68.05, 99.83)

420  

Kendall's Correlation Coefficient

Appraiser Duncan Hayes Holmes

Coef 0.87506 0.94871 1.00000

SE Coef 0.192450 0.192450 0.192450

Z 4.49744 4.88016 5.14667

P 0.0000 0.0000 0.0000

Montgomery Simpson

1.00000 0.96629

0.192450 0.192450

5.14667 4.97151

0.0000 0.0000

Between Appraisers Assessment Agreement # Inspected # Matched   15 6

Percent 40.00

95 % CI (16.34, 67.71)

421  

Date of study: Repo r ted b y : Name o f p rro o du du cctt: Misc :

 Assessment  Assessm ent Ag Agreem reement ent

 Apprai  A ppraiser ser vs St Standard andard 100

95.0% CI Percent

80

     t      n     e      c      r     e       P

60

40

20

0 Duncan

Hayes

Holmes  Appraiser  Appr aiser

Montgomery

Simpson

422  

Interpretación: Se mu muestran estran ttres res tablas d de e co concordan ncordancia cia:: Cad Cada a evalu evaluador ador ccont ontra ra el Es Están tándar, dar, entre evalu evaluado adores, res, y todo todoss llos os evalu evaluado adores res contra el estándar. Se incluyen las estadísticas de Kappa y Kendall en cada una. En general los estadísticos sugieren un buen acuerdo. El coeficiente de Kendall

entre eval entre evaluadores uadores es 0.966 0.966317 317 (p=0.00 (p=0.0000). 00). El coefici coeficient ente e de Kendall para todos los evalu evaluadores adores contra el están estándar dar es 0.9580 0.958012 12 (p=0.0000). La tabla de cada evaluador contra el estándar indica que Duncan y Hayes tienen baja concordancia concordancia contra estándar, H Holmes olmes y Montgomery concor. en 15 de 15 15.. La gráfica g ráfica de eval evaluadores uadores contr contra a el estándar propo proporciona rciona un una a vista de la tabla de concordan co ncordancias cias de ccada ada uno de los evalu evaluadores adores cont contra ra el estándar. Con base en esto, Dun Duncan, can, H Hayes ayes y Si Simpson mpson requ requieren ieren capa capaciac ciación ión adi adicional. cional. 423  

Concordancia por Atributos Ejemplo: comparación pasa no pasa 1. Selecciona un mínimo de 20 unidades del proceso. Estas unidades deben representar el espectro completo de la variación del proceso (buenas, erróneas y en límites). 2. Un inspector “experto” realiza una evaluación de cada parte, clasificándola como “Buena” o “No Buena”. 3. Cada persona evaluará las unidades, independientemente independi entemente y en orden aleatorio, y las definirá como “Buenas” o “No Buenas”. 424

 

GR&R GR &R por por At Atri ribu buto tos s - Ejem Ejempl plo o Legend Leg enda a de Atribut Atributos os G =Bueno NG = No Bueno Población Conocida Muestra # Atributo 1 G 2 G 3 G 4 G 5 G 6 G 7 G 8 G 9 NG 10 NG 11 G 12 G 13 NG 14 G 15 G 16 G 17 NG 18 G 19 G 20 G

COND. DE PRUEBA:  Acuerdo

Persona #1 #1 G G G G G NG G G G NG G G NG G G G NG G G G

#2 G G G G G G G G G NG G G NG G G G NG G G G

G G G G G G G G NG G G G NG G G G NG G G G

G G G G G G G G NG G G G NG G G G NG G G G

Y Y Y Y Y N Y Y N N Y Y Y Y Y Y Y Y Y Y

Y=Sí N=No Y Y Y Y Y N Y Y N N Y Y Y Y Y Y Y Y Y Y

Esta es la medida general de consistencia entre los operadores y el “experto”.

¡90% es lo mínimo!

(1)

% DEL EVALUADOR -> (2) % VS. EL ATRIBUTO ATRIBUTO ->

95.00% 90.00%

100.00% 95.00% (3)

% DE EFECTIVIDAD DE DISCRIMINACION -> 85.00% (4) % DE EFECTIVIDAD DE DISCRIMINACION VS. EL ATRIBUTO ->

85.00%

425  

Muestra 1 2 3 4 5 6 7 8 9 10

Atributo G G G G G G G G NG NG

1 11 2 13 14 15 16 17 18

G G NG G G G NG G

Datos Persona 1en A PeMinitab rsona 1B Persona 2A G G G G G NG G G G NG

G G G G G G G G G NG

G G G G G G G G NG G

Persona 2B G G G G G G G G NG G

G G NG G G G NG G

G G NG G G G NG G

G G NG G G G NG G

G G NG G G G NG G

19 20

G G

G G

G G

G G

G G 426

 

Instrucci strucciones ones d de e Minitab: 1 Stat > Quality Tools Too ls > At Attri tribu bute te Agreement Analysis . 2 En Multiple columns, seleccion seleccio nar Spersona 1A - Persona 2B 3 4

En Nu Number mber of Appraisers Appraisers, 2 Number mber of Trials, 2 En Nu

5

En Kn Known own standard/att standard/attri ribute bute, seleccionar selecci onar Atributo

6

En Graphs selecci  seleccion onar ar todo

Click OK.

427  

Los resultados se muestran a continuación: Attribute Agreement Analysis for Persona 1A, Persona 1B, Persona 2A, Persona 2B  Within  Withi n Appraiser App raiser s

Appraiser

Assess ment A Agreem greement ent

# Inspected

# Matched

Percent

1

20

19

95.00

2

20

20

100.00

95 % CI (75.13,

99.87)

(86.09, 100.00)

# Matched: Appraiser agrees with him/herself across trials. Fleiss' Kappa Statistics Appraiser

Response

Kappa

SE Kappa

Z

P(vs > 0)

1

G

0.82684

0.223607

3.69774

0.0001

 

NG

0.82684

0.223607

3.69774

0.0001

2

G

1.00000

0.223607

4.47214

0.0000

 

NG

1.00000

0.223607

4.47214

0.0000

  Each Appraiser vs Standard Appraiser

Assessment Agreement

# Inspected

# Matched

Percent

95 % CI

1

20

18

90.00

(68.30, 98.77)

2

20

19

95.00

(75.13, 99.87) 428

 

Between Appraisers # Inspected  

Assessment Agreement

# Matched

Percent

17

85.00

20

95 % CI (62.11, 96.79)

# Matched: All appraisers' assessments agree with each othe Fleiss' Kappa Statistics Response

Kappa

SE Kappa

Z

P(vs > 0)

G

0.663222

0.0912871

7.26524

0.0000

NG

0.663222

0.0912871

7.26524

0.0000

All Appraisers vs Standard # Inspected  

Assessment Agreement

# Matched

Percent

17

85.00

20

95 % CI (62.11, 96.79)

# Matched: All appraisers' assessments agree with the known standard. Fleiss' Kappa Statistics Response Kappa SE Kappa

Z

P(vs > 0)

G

0.792005

0.111803

7.08391

0.0000

NG

0.792005

0.111803

7.08391

0.0000 429

 

Interpretación de Resultados •

% del Evaluado Evaluadorr es la consiste consistencia ncia de una persona persona..



% Evaluador Evaluador vs Atributo Atributo es el acuerdo acuerdo entre entre la evaluación del operador y la del “experto”.



% de Efectividad Efectividad de Selección Selección es el acuerdo que existe entre los operadores.



% de Efectividad Efectividad de Selecció Selección n vs. el Atributo medida general de la consistencia entre los operadores y el acuerdo con el “experto”.

431  

Estudio Estud io de Repeti Repetibilidad bilidad y Repr Reproducibil oducibilidad idad de Atributos tributos - Guías de Aceptabilid Aceptabilidad ad Porcentaje De 90% a 100%

Guía  Aceptable

De 80% a 90%

Marginal

Menos de 80%

Inaceptable

432  

16. Capacidad de

procesos por atributos

433  

Estudios de capacidad por atributos

• Introducción • Capacidad de procesos con distribución binomial

• Capacidad de procesos con distribución de Poisson

434  

Estudios Estudi os de capacidad por atribut atributos os Distribución binomial Se usa este tipo de estudio de capacidad de proceso cuando los datos

provienen de una distribución binomial de número de defectivos entre Un total de elementos totales.

Se utiliza esta distribución si los datos cumplen las condiciones siguientes:

• Cada elemento es resultado de condiciones idénticas • Cada elemento puede resultar en dos resultados posibles (falla/no falla) • La probabilidad de éxito o falla es constante para cada elemento • Los resultados de los elementos son independientes unos de otros

435  

Estudios Estudi os de capacidad por atribut atributos os Distribución binomial Se obtienen los resultados siguientes:

• Carta de control P para verificar que el proceso esté en control • Carta de % defectivo acumulado, verifica que la cantidad de muestras es suficiente para tener un estimado estable del % defectivo

• Histograma de % defectivo, muestra la distribución de los defectivos de las muestras colectadas

• Gráfica de tasa de defectivos, verifica que el porcentaje de defectivos no es influenciada por los tamaños de muestra colectados

436  

Suponga que se evalúa la responsabilidad del área de ventas telefónicas de la empresa. Se registran las llamadas no contestadas por los representantes de Ventas durante los últimos 20 días. Así como el total de llamadas : Unavail Date able Calls 8/5/96 432 1908 8/6/96 392 1912 8/7/96 497 1934 8/8/96 459 1889 8/9/96 433 1922 Etc. Etc. Etc.

Instrucciones de Minitab: File > Ope Open n wor works kshe hee et > BPC BPCAP APA. A.MT MTW W 1. File 2. Stat > Qu Quality tools > Capabi Cap abilit lity y ana analys lysis is > Binomial Binomial 1. Defectives Unavailable Use siz sizes es in Calls 2. OK

437  

La p acumulada Tiende al 22%.

Binomial Binom ial Process Pr ocess Capability Analysis of Unavailable P Chart 0.26

Rate of Defectives

1

26

UCL=0.25552

   n  0.24    o     i     t    r     o     p  0.22    o    r      P

   e    v      i 24     t    c      e      f    e      D 22     % 

 _  P=0.22643

0.20

LCL=0.19733 1

3

5

7

9 11 13 Sample

15

17

Z de 0.75 es un valor muy bajo

20 1840

19

1920 2000 Sample Size

Tests performed w ith unequal sample sizes Cumulative %Defective

Histogram Summary Summar y Stats

23.5

Tar 8

El proceso requiere mucha mejora

(95.0% confidence)

   e  23.0    v     i     t    c      e  22.5     f    e      D     %  22.0 21.5 5

Test TEST from Test

10 Sample

15

20

% D efec efectt iiv v e: Low er er C I : Up pp pe r C I : T arget: PPM De eff: Low e r C I :

22. 22. 6 64 4 22.22 23.07 0.00 226427 2222 41 41

Up pp pe r C I : P rro o ces cesss Z: Low e r C I : Up pp pe r C I :

2306 54 54 0.75 0.7507 07 0. 7 73 36 7 0. 7 76 64 6

6

   y    c      n    e     u  4    q     e    r      F

Process Proc ess Z = - nomsinv(P nomsinv(Ppro prom) m)

2 0

0

4

8 12 16 20 %Defective

24

Results for P Chart of Unavailable 1. One point more than 3.00 standard deviations center line. Failed at points: 3 438

 

Estudios Estudi os de capacidad por atribut atributos os Distribución de Poisson Se usa este tipo de estudio de capacidad de proceso cuando los datos provienen de una distribución de Poisson del número de defectos por unidad de inspección (cuyo tamaño puede variar).

Se utiliza esta distribución si los datos cumplen las condiciones siguientes:

• La tasa de defectos por unidad de espacio o tiempo es la misma en cada Elemento

• El número de defectos observados en las unidades de inspección son independientes unos de otros

439  

Estudios Estudi os de capacidad por atribut atributos os Distribución de Poisson Se obtienen los resultados siguientes:

• Carta de control U para verificar que el proceso esté en control • Carta de media acumulada de Defectos por Unidad (DPU) verifica que la cantidad de muestras es suficiente para tener un estimado estable de la media

• Histograma de DPU, DPU, muestra la distribución de los defectos por unidad de las muestras colectadas

• Gráfica de tasa de defectos (con subgrupos variables) verifica que el DPU no es influenc influenciada iada por los tamaños de muestra muestra col colectados ectados

440  

Suponga que se evalúa la efectividad del proceso de asilamiento en un cable. Se toman muestras de cable de longitudes aleatorias donde se prueban con alto voltaje para encontrar debilidades de aislami aislamiento. ento. Se registran los defectos y la longitud de la muestra: Instrucciones de Minitab: 1. File File > Ope Open n wor works kshe hee et > BPC BPCAP APA. A.MT MTW W 2. Stat > Qu Quality tools > Capabi Cap abilit lity y ana analys lysis is > Binomial Binomial 1. Defects Week spots Use siz sizes es in Lenght OK

Weak Spots Length 2 132 4 130 3 120 1 124 2 138 5 148 Etc. Etc.

441  

Poisson Capability Analysis of Weak Spots ti

U Chart n r

Defect Rate

1

0.075 U

UC L=0 L=0.069 .06904 04

e P

0.075

0.050 t n u o C

0.025

0.050 U P

 _  U=0.02652 D

0.025

le p m

LCL=0

0.000 a S

1

11

21

31

41 51 61 Sample

71

81

0.000 100

91

120 140 Sample Size

La DPU acumulada tiende a 0.0265

Tests performed with unequal sample sizes Cumulative DPU

Histogram Ta r

Summary Stats

0.030

16

(95.0% confidence) 0.025 U P D

0.020

0.015

Mean DPU: Lo w er er C I : U p pe pe r C I :

0. 0.02 0265 65 0 .0 .0 23 23 7 0 .0 .0 29 29 5

M in in D P U : Max DPU: T a rrg g DPU:

0 ..0 00 00 00 0 ..0 07 75 53 0 .0 .0 00 00 0

y

12 n

c q

u

e

8 Fr

e

4

La tasa tasa de D DPU PU no parece ser afectado por la Longitud de cable tomado

0 0

20

40 60 Sample

80

100

   0    1    0    2    3    0  4    0    5    6    0     7    0  .    0  .  .    0  .  .  .    0  .  .    0    0    0    0    0    0    0    0

DP U

Poisson Capability Analysis of Weak Spots Test Results for U Chart of Weak Spots TEST 1. One point more than 3.00 standard deviations

from center line. Test Failed at points:

36 442

 

17. Capacidad de procesos

443  

Capacidad de procesos

• Procesos normales

• Procesos no normales

444  

Capacidad de procesos normales

445  

Capacidad de procesos normales

446  

Prueba de normali normalidad dad Es una prueba de hipótesis de una población para determinar si la muestra se extrae de una población normal, que es la hipótesis nula. La hipótesis alterna es que no es normal. Se puede hacer por diversos métodos:

1. Método gráfico Se trata de probar la flamabilidad de una fibra y ver si sigue una distribución normal, además se quiere observar su valor en el percentll 87avo.

1 2 3 4

File > Open worksheet  worksheet FLAMERTD.MTW. Graph > Probabili ty Plot. Probab ility Seleccionar Single, Single, click OK OK.. En Graph variables variables,seleccionar ,seleccionar Fabric  .

5 6

Scale,, y click el Percentile Lines . Lines . Click Scale OK  en cada cuadro de diálogo. En Show percentile lines at Y values, values , teclear 87  . Click OK

447  

Probability Plot of Fabric Normal - 95% CI 99

95 90 80 70

e

cr

e

n

t

60 50

87

Mean StDev N  AD P-Value

3.573 0.5700 15 0.31 0.310 0 0.517

P

40 30 20 10 5

        5          1         2   .         4

1

2

3

4 Fabric

5

6

Los puntos no salen del intervalo de confianza del 95% y el P value es menor de 0.05 por tanto los datos de la muestra siguen una distribución normal. El IC del 87% se encuentra entre los valores 3.84295 y 4.58790 448  

Los resultados se muestran a continuación Process Capability of Supp Supp2 2 LS L

US L

Process Data

Media Desviación   est ándar

LS L T a rget USL S a mp mple M e an an S a m ple N S t D ev ev ( W Wii th th in in ) StDev (Ov (Ov er eral all) l)

Within Overall

59 6 * 60 4 60 0 0.. 2 23 3 10 0 1 .7 .7 0 04 49 99 9 1.87 1.8738 388 8

Potential (Within) Capability Cp 0. 7 8 C PL P L 0. 8 3 C PU P U 0. 7 4 C pk pk

0. 7 4

O verall C apabi apabilit lity y

597.0 O bser bserved ved Perfor Performance mance % < LS L % > U SL SL % T ot a l

0. 0 0 2. 0 0 2. 0 0

598.5

Exp. Within P erformance % < LS L % > U SL SL % T o tal

0. 66 1. 35 2. 01

600.0

601.5

603.0

Pp PPL

0. 7 1 0. 7 5

PPU P pk C pm

0. 6 7 0. 6 7 *

Índice de capacidad potencial (Cp y real del proceso (Cpk deben ser  mayores a 1.33 para que el proceso sea capaz

604.5

Exp. Ov erall Performance % < LS L % > U SL SL % To Total

1. 20 2. 21 3. 41

Fracción defectiva fuera de especificaciones debe ser menor a 3.4 ppm (0.000 34 %)

453  

Capacidad de procesos No normales

454  

Capacidad de procesos para par a variables no normal normales es T ransformación de Box Cox Transformació Transf ormaciónn de B Box ox Cox (para ddatos atos ag agru rupados pados en subgrupos subgrupos de tamaño n >1 y con valor posi positivo), tivo), ident identifi ifica ca la poten p otencia cia lamda a la que hay que elevar los datos para que sigan una distribución normal. Ejemplo: Se mide la torcedura que tienen los ladrillos en un horno, los datos están en el archivo TILES.MTW. TILES.MTW. Se miden mide n 10 ladrillos di diarios arios por 10 días. días.

455  

Warping

Histogram ram > Simple   Graph > Histog

Variable Variab le   Warping

1.60103 Histogram of Warping

0.84326 14

3.00679

12

1.29923

10

2.24237 2.63579 0.34093

    y       c      n     e      u      q       e      r      F

6.96534

8 6 4

3.46645 2

1.41079 0

Etcetera..

1

2

3

4 Warping

5

6

7

8

Se observ obse rva a una una distrib d istribución ución no no normal 456  

Haciendo una una prueba de d e normalidad con: co n: Stat > Basi Basicc statistics > Normality Normality test Variable Warping  Ander  Anderson son Darlin Darling g Probability Plot Pl ot of Warping Warping Normal 99.9

Mean S tDev N  AD P -Va -Vallue

99 95 90

    t      n     e      c     r      e      P

2.923 1.786 100 1.028 1.028 0.0 .01 10

80 70 60 50 40 30 20 10 5 1 0.1

-4

-2

0

2 4 Warping

6

8

10

Se obtiene un valor valor P de d e 0.01 indicando indica ndo que los datos no son normales. normales. 457  

 Ahora  Ahor a se tran transfor sforman man los datos por el mét método odo de Box Cox: File e > Open worksheet worksheet TILES.MTW.  TILES.MTW. 1 Fil 2 Seleccionar  Stat > Con Control trol Ch Charts arts > Box Box-Cox -Cox Transformati Tran sformation. on. 3 En Single column column,, seleccion seleccio nar Warping . En Subgroup size size,, 5 . Click OK. Box-Cox Plot of Warping Lo w er C L

40

U p p er C L

Lambda (using 95.0% 95.0% co nfidence)

30

     v      e         D       t         S 

E stimate

0.39

Lo w er C L Up p er C L

0.17 0.64

Ro u un n de ded V Va alu e

0.50

20

10

Limit

0 -2

-1

0

1

2

3

4

5

Lambda

458  

La tabla tabla de La Lambda mbda contiene su vvalor alor esti estimado mado de 0.50, con u un n intervalo de confianz intervalo confianza a de (0.17 a 0.64) . E Este ste iin nterv tervalo alo contiene valores lamda que se encuentran dentro más menos una sigma de la línea horizontal, de modo que se puede tomar cualquier valor en el in interv tervalo. alo. Si lamda es ce cero, ro, tomar el logaritmo natural natural de los d datos atos En este caso el exponente al que hay que elevar los datos es 0.5 o sacar sacar raí raízz cuadrada cuadrada.. El anális análisis is co con n la tran transformació sformación n de raíz raíz cuadrada de los datos es: 1  Stat > Quality tools > Cap Capability ability analys analysis is > No Normal rmal siz e - 5 2 Single column - Warping Subgroup siz Lower spec  Spec   8 spec  0 Upper Spec 3 Seleccionar Box-Cox > Box-Cox power transform transformation ation (W = Y**Lambda). Sel. Lambda = 0.5 (raíz cuadrad cuadrada). a). 4 En Estimate, seleccionar R-Bar y sel. Use unbiased constants to calculate overall std. Dev. 459  

Process Capabil Capability ity of Warpin Warping g Using Box-Cox Transformation With Lambda = 0.5 LS L*

U S L*

transformed data

Process Data LS L 0 T arget * USL 8 Sa am mple M ea ean 2.92307 S ample N 100 St StDe Dev( v(W Within) 1.7 .75 5501 StDev(Over StDe v(Overal all) l) 1.79 1.790 048

Within Overall P otential (W (Within) ithin) C apability Cp 0.89 C P L 1.02 C PU PU 0.76 C pk 0.76 O v erall erall C apabilit apability y

 A fter Transfo Transformati rmation on LS L* T arget* U S L* Samp Sam ple Mea Mean n* StDev(W StDev( Wit ithi hin n)* StDev(Ov er erall all))*

Pp PPL PPU P pk C pm

0 * 2.82843 1.62 1.623 374 0.52 0.5291 9153 53 0.539 0.53934 344 4

0.0

0.4

0.8

1.2

1.6

2.0

O bser bserv v ed P erforman erformance ce P P M < LS L 0.00

Exp. Within Performance P P M < LS L* L* 1075. 4 45 5

Exp. O v erall P erfor erformanc mance e P P M < LS L* L* 1303.73

PPM > USL 20 2000 000. 0.00 00 PPM To Total 20000.0 .00 0

PPM > USL* 11 1140 404. 4.16 16 PPM To ottal 12479.61

PPM > USL USL* * 1275 12754. 4.26 26 PP PM M T ot otal 14057.99

2.4

0.87 1.00 0.74 0.74 *

2.8

460  

Interpretación: Un Cpk de 0.76 indica que el proceso no es cap capaz az de cum cumplir plir especificaci especi ficaciones ones del clien cliente te (0 a 8), deberí deberíaa ser > = 1.33

Considerando el Ppk Pp k de 0.74, también dis dista ta much muchoo del de l vvalor alor requerido de 1.33 mínimo.

461  

T ransformación de Jonhson (para n>= 1) alt alterno erno a Box Cox Para datos no normales, esta transformación selecciona una función de tres familias famili as d de ed distribuciones istribuciones de una variable, que son fácilmen fácilmente te transformadas a una distribución normal. Las distribuciones son Sb, Sl y Su, donde B, L y U se refieren a la variable que se acota, lognormal y no acotada.  Minitab muestra muestra los val valores ores P para las di distribuciones stribuciones origi original nal y transform tran sformada ada para comparaci comparación. ón. No siempre sie mpre es posi posible ble encon encontrar trar la fu función nción óptima.

462  

Para el ejemplo de los ladrill ladri llos: os: 1 File File > Open worksheet w orksheet TILES.MTW. Johnso n Transformati Trans formation on.. 2 Seleccionar Stat > Quality Quality Tools > Johnson 3 En Data are arranged as, as, seleccionar selecci onar Single column column;; seleccionar Warping. 4 En Store transformed data in, in, seleccionar selecci onar Single column column;; C2 . 5 Click Options. Options. En P-Value to select se lect best fit, fit, poner 0.05. diálogo. álogo. Click OK en OK en cada cuadro de di

463  

Johnson Transf Transformation ormation for Warping Pr obabilit obability y Plot for Or igin iginal al Data

99.9

Select a Transformation

0.6 t

N 100  AD 1.028 1.028 P-Val P-Valu ue 0.01 0.010 0

99

s e

0.8 t D

0.6

90 t

A r

n o ce

f

0.4 0.2

50 r

e ul

e P a V

10 P

1 0.1

Ref P

0.0 0.2

-5

0

5

10

0.4

0.6

0.8 Z Value

1.0

1.2

(P-Value = 0.005 means Open workshee w orksheett > TILES.MTW Too ls > Ca Capab pabilility ity Analysis Analysis > Normal. No rmal. 2 Selecc. Stat > Quality Quality Tools 3 En Data arranged aass Single column, poner column, poner Warping , en Subgroup size size,, 1 Estimate,, seleccionar using moving range ra nge lenght n = 2  2 y 4 En Estimate sel. Use unbiased constants to calculate overall std. Dev. 5 En Lower spec, spec, poner -3.3136. En E n Upper spec, spec, poner poner 2.68435 2.6843 5 OK en  en cada cuadro cuadro de diálogo di álogo  Click OK La gráfica resultan resultante te se mu muestra estra a continuación: continuación:

466  

Process Capability of C2 LS L Process Data LS L -3.3136 T arget * USL 2. 68436 Sa am m pl ple M e ea an 0. 01 011196 S am ple N 100 S tD tD e ev v(W Wiithin) 0. 94 941167 StDev(Ov StDe v(Ov e rral alll) 0. 9 99 9 74 74 62 62

U SL Within Overall Potential (Within) (Within) C apability Cp 1. 06 C PL 1. 18 C P U 0. 95 C pk 0. 95 O v eral eralll C apabilit apability y Pp PPL

1. 00 1. 11

PPU P pk

0. 89 0. 89

C pm

-3 O bser bserv v ed Performance P P M < LS L 0. 00 P P M > U SL S L 20000. 00 P PM PM T o ottal 20000. 00

-2

Exp. Within Performance P PM PM < LS L 205.72 P P M > U S L 2253.83 P PM PM T o ottal 2459.55

-1

0

1

2

*

3

Exp. Ov erall Performance P PM PM < LS L 429. 18 P P M > U S L 3681. 55 55 P P M T ot otal 4110. 73

El Cpk es un poco mayor que con el método de Box Cox 467  

Identif Ident ificación icación de la función que mejor ajuste los ddatos atos Se puede ident id entifi ificar car un una fun funci cion on de entre entre 14 tip tipos os parametricos: parametric os: Por ejemplo para el caso de los ladrillos: 1 Fil Filee > Open worksheet w orksheet > TILES.MTW. Identification.. 2 Stat > Quality Tools > Individual Distribution Identification column, Warping . 3 En Data are arranged as, as, sel. Single column, sizz e: e:   1 Subgroup si 4 Seleccionar Use all distributions. distributions. Click OK OK..

468  

Box-Cox transformation: Lambda = 0.5 Johnson transformation function: 0.882908 + 0.987049 * Ln( ( X + 0.132606 ) / ( 9.31101 - X ) )

Goodness of Fit Test Distribution Normal Box-Cox Transformation

AD 1.028 0.301

P 0.010 0.574

LRT P

Lognormal

1.477

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF