SPSS

March 12, 2017 | Author: Ethel Sp | Category: N/A
Share Embed Donate


Short Description

spss 17...

Description

O F F I C E

E M P R

1

-

-

CD ROM con ~ d e u ~ ~ l

Estadística con

'

Estadística con SPCS 16

DATOS DE CATALOGACIÓN BIBLIOGRÁFICA Estadística con SPSS 16 Autor: Nel Quezada Lucio

O Derecho de autor reservado Empresa Editora Macro ElRL O Derecho de edición, arte gráfico y diagramación reservados Empresa Editora Macro ElRL Paseo de la República 5613 - Miraflores Empresa Editora Macro ElRL Paseo de la República 5613 - Miraflores ,

Primera edición: Febrero 2008 - 1000 ejemplares Impresión ISAGRAF SRL Av. República de Panamá 5115 - Surquillo

ISBN No978-603-4007-41-3 Hecho el Depósito Legal en la Biblioteca Nacional del Perú No2008-01476 Prohibida la reproducción parcial o total, por cualquier medio o método de este libro sin previa autorización de la Empresa Editora Macro EIRL.

la

Datos del Autor

Nel Quezada Lucio Licenciado en Estadística de la Universidad Nacional de Ingeniería con Maestria en Cienciascon mención en Ingeniería desistemas-UN/. Catedrático de la Escuela Profesional de Ingeniería Económica de la Universidad Nacional de Ingeniería. Asesor principal de Cerveza Taski.

l b

este libro sin

Estadistica con SPSS 16

Dedicatoria: Nancy Meza Arteaga y Ulises Liñan Quezada

Estadistica con

Introducción

Introducción Estadística ciencia que sirve para la toma de decisiones en situaciones de incertidumbre. Dedicada a la recolección, descripción, análisis e interpretación de datos y, por ello, constituye la metodología científica principal que permite transformar datos en información. Esto la hace especialmente atractiva, ya que en cualquier sociedad desarrollada existe una inmensa variedad de problemas cuya solución sólo es posible mediante la utilización de técnicas estadísticas. Así, por ejemplo, la Estadística es imprescindible, para modelar y predecir diversas variables como económicas, sociológicas, medicas, psicológicas, ambientales o para detectar factores de riesgo asociados a una determinada variable, establecer la eficacia de una variable, en desarrollo de productos, series económicas, tráfico telefónico etc. He aquí la importancia del software estadístico SPSS 16 que resulta ser una herramienta muy poderosa que facilita los cálculos estadísticos. Las potentes técnicas analíticas de SPSS le ayudan a tomar las decisiones más adecuadas para hacer crecer su organización.

Estadística con

PSS

..-

Estadistica con SPSS 16

Prólogo El libro trata de conseguir un mayor aprovechamiento de la información con los datos disponibles, mediante casos prácticos de investigación. Analizando datos a través de Estadísticas Descriptivas, Probabilidad, ' ~ e ~ r e s i óyn Correlación, Modelos de Análisis de Varianza (ANOVA), Pruebas no paramétricas. Se estudiará la influencia de una serie de factores en el comportamiento de una variable de interés. Se modelará la respuesta de una variable por medio de Regresión. Se buscara el modelo que mejor se adecue a los datos gracias al campo de los Modelos Lineales Generalizados, sobre el cual se centran, en la actualidad, numerosas investigaciones. Todas estas materias se expondrán con claridad y gran aplicabilidad práctica a lo largo del presente libro. Permitiendo resolver problemas de negocios y de investigación con el análisis predictivo del SPSS. SPSS 16 está dirigido a estudiantes y profesionales de Economía, Administración, Sociología, Psicología, Medicina, Biología, Ciencias Ambientales y a todas las personas que tomen hoy las decisiones adecuadas para que aumenten sus posibilidades de éxito en el futuro, que desean conocer lo que sucede en su organización en el presente y adelántese al futuro con el Análisis Predictivo de SPSS 16.

:.:

Estadística con

m

índice I

lndice Capítulo 1

INTRODUCCIÓNAL SPSS ..................................................................................................... 26

.................................................................................................................................. 26 Requisitos de Hardware y de Software ................................................................................26 Modulos del SPSS ............................................................................................................... 27 Iniciar SPSS .............................. . ...................................................................................... 28 Pasos básicos a seguir ........................................................................................................ 28 Datos: (Paso 1).................................................................................................................... 29

SPSS

Procedimiento (Paso 2) .......................................................................................................30 Variables y Opciones: (paso 3) ........................................................................................... 30 Examen de resultados: (Paso 4) .......................................................................................... 31 Barra de Menu ................................................................................................................... 32

....................................................................................................... 34 Ventanas ........................................................................................................................... 34 Barra de Herramientas

....................................................................................................................34 Visor ............................................................................. ...................................................... 34 Visor de borrador ............................................................................................................... 35 Editor de tablas pivote ........................................................................................................ 35 Editor de gráficos ................................................................................................................ 35 ........................................................... 35 Editor de resultados de texto ............................. . . ................................................................................35 Editor de sintaxis ............................ Editor de datos

I

l

l

1 l

Editor de procesos ............................................................ ..

Capítulo 2 MANIPULACI~NDE DATOS ...............................................................................................

38

Manejo de Datos ................................................................................................................38 Introducción Directa de Datos ............................................................................................ 38 . . .. . 1. Realizando la encuesta ................................................................................................ '?1.'39 ......... #

2. Codificando la encuesta ................................

índice

Estadistica con CPSS 16

3. Llenar la base de datos (Editor de datos) .......................................................................41

Ejercicios Propuestos

Extrayendo un archivo de disco .......................................................................................

Tablas

46

-

......................

Un paseo por el Menú ...................................................................................................... 46

Tablas Personalizadar ,

Menú Archivo (File) ........................... . . .......................................................................... 47

Tablas de respuestas d

Menú Edición (Edit) ............................................................................................................ 48

Ejercicio Practico N' ,1

Menú Ver (View) ................................................................................................................. 49

Tablas Personalizadas -

Menú Datos (Data) ......................................................................................................... 49

Ejercicio Teórico .......-

Menú Transformar (Transform) ............................................................................................. 51 Menú Analizar (Analyze) .....................................................................................................54 Menú Gráficos (Graphs) ...................................................................................................... 55

Capítulo 4

Menú Utilidades (Utilities) ................................................................................................ 55

Análisis: Comparar me5i

Complementos (Add ons) ...................................................................................................56

Comparar medias (Pniebi

Ventana (Window) .........................................................................................................

Ejercicio Práctico N' 1

56

-

..................................................................................................... 56 Uso de los cuadros de diálogo ...........................................................................................57 Ejercicio Práctico No1 Manipulación de Datos .................................................................. 59

Prueba T para una muem

Ejercicio Práctico No2 Manipulación de Datos ................................................................... 63

Prueba T para muestrasa

Ejercicios Propuestos (Crear archivos) ................................................................................ 64

Prueba T para muestrasm

Menú Ayuda (Help) ?

Medias ..................... Prueba T ...................-

ANOVA de un factor,--

Comparaciones múiüplesc

Capítulo 3

Comparaciones a postem

Análisis: Informes, Estadísticas Descriptivas y Tablas Personalizadas .........................68

Ejercicios Propuestos

Informes (Reports) ....................... . i ..................................................................................68

Modelo lineal genen

Ejercicio Práctico No

,.................................................................................................

70

~ s t a d í s t i c a s ~ e s c r i ~ t i v..:a.................................................................................................. s 75

.,e., ..

Ejercici$ Práctico No 1....................................................... ............................................. 76 ,..-..

Medidas de posición y de tendenda central ...................................................................... 80

c-'

........................................81 Medidas de tendencia No Central ...................................................................................82 ~~ercici~.&á&co No2 ....................................................................................................... 88 P-P Plots ............................. ..............................................................................................90 Medidas de tendencia Central: Media, mediana, moda y suma

Ejercicio Práctico N'

-

:

Análisis de varianza dedos ANOVA AB - EF - CA

-

Medidas Repetidas .. Análisis de varianza d ANOVA A - EF- MR .., Ejercicios Propuestos Correlación ...............Ejercicio Práctico

-

N' 1

Ejercicios Propuestos .........................................................................................................92 Tablas ...................................................

..........................................................................93 Tablas Personalizadas .......................................................................................................93 Tablas de respuestas múltiples ........................................................................................... 93 Ejercicio Practico No 1 ......................................................................................................... 94 Tablas Personalizadas ....................................................................................................... 94 Ejercicio Teórico ............................................................................................................... 98

'

Capítulo 4

.

Análisis: Comparar medias Modelo Lineal General y Correlación ........................... 102 Comparar medias (Prueba de Hipótesis) ...................I;.....................................................102

i

1 /

Ejercicio Práctico N' 1 ....................................................................................................... 104 Medias ..........................................................................................................................104 Prueba T .......................................................................................................................106 Prueba T para una muestra .............................................................................................. 106

I1

1

Prueba T para muestras independientes .....................................................................108 Prueba T para muestras relacionadas ...............................................................................109 . .

.

.

...................................................................................................... 111 Comparaciones múltiples entre medias .................................................... . . . ., ................ 112 Comparaciones a posteriori ..................................................................... . . ........... 114 Ejercicios Propuestos ........................................................................................................ 115 .L....-.. l, Modelo lineal general ................................................................................................... .!... ... Ejercicio Práctico N' 1 ........................................................................ ....... ...............119 .@ Análisis de varianza de dos factores .....................................,................... .i=...................... 119 .* . .. ANOVA AB - EF - CA .......................................................... ....................................119 4 * ~ .p Medidas Repetidas ...................................................................................... A;i .............;...123 Análisis de varianza de un factor con medidas repetidas ................................................ 123 ANOVA A .EF- MR .................................................................................... ......................123 F.. ,.y,. Ejercicios Propuestos ............................................................................................ 125 .... Correlación ...................................................................................................................... 126 . Ejercicio Práctico N' 1 ....................................................................... .......-. .....,............. 2. . 9 7 .. '

ANOVA de un factor

"

5

>-

? ..'

'>-

4"

p-

f@--

.

:Estadistica con CPSS 16

Bivariadas ......................................................................................................................... 127 Ejercicio Práctico No2 ................................:.................................................................. 131 Correlaciones .................................................................................................................... 131

Capítulo 5 Análisis: Regresión. Loglineal. Clasificar. Reducción de datos y Escalas ....................134 134 Regresión .......................................................................................................................... Análisis de regresión lineal simple .................................................................................. 137 137 Ejercicio Práctico No 1........................................................................................................ 141 Bondad de ajuste del modelo ........................................................................................... 144 Análisis de Regresión Lineal Múltiple ............................................................................... 146 Ejercicio Práctico No2 ....................................................................................................... 146 Regresión .......................................................................................................................... Ejercicios Propuestos ...................................................................................................... 148 149 Loglineal .............;............................................................................................................ Ejercicio Práctico No 1....................................................................................................... 150 Modelos Loglineal ......................... ;..................................................................................150

........................................................................................................................... 164 Ejercicio Práctico No 1.': y ........................................................................................ 165 165 Conglomerados de K medias .................................................................................... 171 Análisis Discriminante ....................................................................................................... Reducción de datos .......................................................................................................... 175 Clasificar

7

'

"

6"

Análisis .Factorial .......:.

.................................................................................................... 177 Escalas ..........:................................................................................................. . 180 . Análisis de fiabilidad .S.- .................................................................................................. 180 .. Escalamiento multidimensional ....................................................................................... 180 Escalamiento multidimensional (PROXSCAL) .................................... ...............................180 t%q

i



Ejercicio Práctico N" 1........................................................................................................202 ..

.""\ i+ Serie Temporal ...................................................................... ..... .........................................202 .......

.

Series Temporales con SPSS .............................................................................................. 202 ...

@"'

Representación gráfica de una serie temporal ......................................m .... ...................204 Distinción entre el esquema aditivo y esquema multiplicativo de una serie temporal

....205

. . ............... 206

Método Analítico de las Diferencias y Cocientes Estacionales+ ,................... !

-'\

Método Gráfico de la Media y de la Desviación Típica ......h~. .......................................... .

208

Determinación de la tendencia de una serie temporal ....................................................208 Método de Ajuste Analítico

C ..............................:.P.%%..............................F;....;;-?, ................ :208 a.b*

"h.& ......

Estadistica m SPSC 16

Método de la Media Móvil para determinar la tendencia ..............................................211 Determinación de la componente estaciona1 de una serie temporal ...............................212 214 Supervivencia .................................................................................................................. Respuestas múltiples ...................................................................................................... 215

. . .............................................................................

Ejercicio Práctico No 1...................

216

Definir Conjuntos .............................................................................................................217 218 Frecuencias ..................................................................................................................... 219 Tablas de Contingencia ....................................................................................................

Capítulo 8 GRAFICOS .........;................................................................................................................. 222 :.............................................222 Galería de gráficos .............................................................. Creación de un gráfico .....................................................................................................224 Barras .............................................................................................................................

224

Líneas .............................................................................................................................. 225

................................................................................................................................ 226 227 Sectores .......................................................................................................................... 227 Máximos y mínimos ......................................................................................................... Pareto .......................E* ..................................................................................................228 .. . . Control ....................L........'l ................................................................................................ 229

Areas

:

.

1

Diagramas de cajas ......................................................................................................... 229 p.*%.

...........................::.....................................................................................230 m Dispersión .........................................................................................................................230 Barras de error

.........................................................233 Q-Q ...... ,............. .. .................................................................................. .............. 234 . 6Secuencia ......................................................................................................................... 235 Serie Temp.oral .......................................................................................................... 236 . Serie temporal: autocorrelaciones ............................................................................ 236 Serie temporal: correlaciones cruzadas ............................................................................237 M e r i e temporal: análiepectral ....;..+ :% ..........................................................................237 P-P .......................................................................

4.

-5 hk

COR .....................................................

..........................................................................238 Galería de gráficos Enteractivos ...................................................................................... 239 Creación de gráficos interactivos ......................................................................................240 Creación de gráficos según la estructura de los datos ......................................................249

Capítulo 9 MANIPULACI~NDE CASOS Y VARIABLES .......................................................................252

................................................................252 Variables .......................................................................................................................... 253 Buscar datos... (Find) .....................................................................................................254 254 Ir a caso ............................................................................................................................ Insertar variable (Datallnsert Variable...) ......................................................................... 255 Insertar caso (Data/lnsert Case...) .................................................................................255 Ordenar casos (DataISort Cases...) ..................................................................................256 Segmentar archivo (DataISplit File...) .................... . ......................................................257 Seleccionar casos (DataISelect Cases...) .............................. . . .....................................258 Calcular Variable (Compute variable...) ............................................................................259 Recodificar (Transform/Recode...) ....................................................................................260 Recodificación automática... ....................................................................... .................263 Ventana de Dialogo Herramienta Memoria (Recall Toll) ..........................,f.......;............ 263 . .........................................................264 Herramienta Estructuras de Sintaxis .................... -64 El Botón Ejecutar Programa ......................................................................... ;.................... Ejercicios Propuestos............................................................................... , ........... .... 265 Ver información de datos (Display Data Info...)

I

.

%

PFa"'

Capítulo 10

.{.e-

.,.

Examen de Resultados .......................................................................................................268 EXAMEN DE RESULTADOS ........................................................................................... 268 .. "

emanales en un ~ u ~ e r m realizando ~ o , e!siguiente cuestionario.

Capitulo 2: Manipulaci6n de datos Marque con una "x" la alternativa correcta o escriba en las líneas Punteadas. 1) Edad: ........................................ a) Adolescente O

b) Joven O

c) Adulto O

2) Sexo: a) Varón O

b) Mujer O

3) Grado de Instrucción: a) Primaria O

b) Secundaria O

c) Superior O

b) Casado O

c) Divorciado O

b) Tarde O

c) Noche O

d) No tiene O

4) Estado Civil: a) Soltero O

.

.

d) Viudo O

5 ) Horario de Compra

a) Mañana

O

6) Compras Semanales en Artículos de Aseo Personal (Nuevo Soles)

......................

7) Compras Semanales en Verduras (Nuevo Soles)

.......................

8) Compras Semanales en Abarrotes (Nuevo Soles)

.......................

9) Compras Semanales en Bebidas (Nuevo Soles)

.......................

1. Realizando la encuesta Se recopilan los datos correspondientes al cuestionario, .es décir se realiza el llenado de datos de la encuesta mostrada anteriormente. Dicho cuestionario consta de 9 preguntas, cada una de ellas constituye una variable medida en diferentes niveles. Trabajaremos con las respuestas correspondientes a una muestra de 30 sujetos. Puesto que los datos constituyen una muestra aleatoria de los clientes del supermercado, la interpretación de los análisis realizados se referirá tan solo a esta muestra de sujetos.

2. Codificando la eeuesta: l

1

En segundo lugar las variables del cuestionario serán codificadas utilizando los códigos que se muestran a continuación en cada variable. Por ejemplo la primera variable E$.ad, a Adolescente le corresponde el código "O", a Joven le corresponde el código "1" y adulto el código "2". Esto ocurre hasta la variable X5 (Turno). A partir de la variable X6 no es necesario codificar. X1: Edad (O;.Adolescente; 1;Joven; 2: Adulto). XZ: sexd'(0: Mujer; 1:Varón).

X3: Grado de Instrucción (1: No tiene; 2;,Primaria; 3: Secundaria 4: Superior). cff

-

X4: Estado Civil (1: Soltej~;2: Casado; 3: Divorciado 4: Viudo).

arde; 2: Noche)

X5: Turno (O: ~ a ñ a n a r l :

X6: Venta de Artículos de Aseo Personal (Nuevo Soles). X7: Venta de,Verduras (Nuevo Soles). X8: ~ent;de

barrotes s. (Nuevo Soles).

X9: Venta de Bebidas (Nuevo Soles). La tabla representa las encuestas codifl;l"aefas, donde las columnas indican las variables, y las filas los casos. .

Estadistica con SPSS 16

Usted pueden llenar directamente los datos del cuestionario al editor de datos (matriz de datos) sin necesidad de ibdificar.

Capitulo 2: Manipulación de datos

3. Llenar la base de datos (Editor de datos) Cuando recolectamos los datos de "n" casos (sujetos) en "j" variables, lo primero que se debe hacer es introducirlos en la matriz de datos del SPSS. Para ello hay que situarse en la ventana Editor de datos, esta ventana contiene Vista de datos (Data View) y Vista de variables (Variable View) a) Vista de Datos (Data View): Ingreso de datos Vista de datos (Data View) presenta una matriz de n casos (sujetos) x J variables Cada columna representa una variable Única y cada fila un caso individual de cada variable. Para introducir datos basta con pinchar sobre una casilla y teclear el dato. Si donde tecleamos el dato la variable no está definida, SPSS asigna automáticamente un nombre de variable a la columna y la define con sus parámetros por defecto. Variables

,

1

V

A

W ~ ~ ~ 0 ~ 0 0 3 ~ ) 1 ,o0 1 ,DO

2 ,O0

500

303

6,DO

P

\1Zi 3

Observación:

1

1

1

3 .o0

VA&

Casos

7 . 1

'

Si bien es cierto se puede empezar a introducir directamente los datos en la matriz de datos (Vista de datos) es recomendable primero la definición de las variables en Vista de variables. b) Vista de Variables (Variable View): ~ e f i n ivariables r Pulsando en la pestaña Vista de variables (Variable View) accederemos a una matriz similar a la de datos, pero en este caso contiene las variables definidas del modo siguiente: cada fila representa una variable (1,2,3....) y cada columna un parámetro o especificación de esa variable (Name, Type, etc.). Éstos se asignan por defecto, pero podemos modificarlos a nuestra conveniencia. La lista de parámetros o especificclción de variables es: ~ a m e A

A 3*r-> 1

Type

1

1 Decimals 1

Width

Label

1

+ Estadistica descriptivos -> Explorar, cuyo cuadro de diálogo es el siguiente:

/

,& sexo [sexo1

; & Grado de Instrucción . 8,Estado Civil (civil] l&

i/ i

Trasladar aquí la variable o variables para las que se desee obtener un análisis descriptivo

turno [turno) Venia de MCUIOS

Pulsar aquí para solicitar un diagrama de tallo y hojas

d

venta de Verduras

1

@ Venia de Abarrdes [.

,

YeCp de-Bebicas-[b

Display-----

.. -a.

l %.

[T 1 T .i e l

[ E --4 lc- ancei :Ji,,nelpN:j - - . - - - --

... _ _ .,___-__ ---

*

A l _

,.

%

,-í+'

El cuadro de diálogo ofrece diferentes posibilidades de análisis de datos. Por el momento nos centraremos tan sólo en las que nos interesan. En este caso, es elaborar un diagrama de tallo y hojas. Para ello, en primer lugar se seleccionan las variables para las que se desee este tipo de diagrama y se trasladan al cuadro "Dependientes". , í .% A continuación se selecciona el botón de la opción 'gráficos' y aparece el stguiente cuadro de diálogo:

Estadistica con CPSS 16

Para diagramas de tallo y hojas, seleccionar esta opción.

Veamos un ejemplo con la variable 'Venta de Artículos de Aseo Personal'. Los resultados obtenidos son los siguientes: Venta de Artículos de Aseo Personal Stem-and-Leaf Plot Frequency Stem & Leaf

O . 222233345 1. 02355 2. 0335 3 . 03 4. 55 5. 0556 6 . 0005 Stem width: 1.00 . 9.00 5.00 4.00 2.00 2.00 4.00 4.00

Each leaf:

1case(s)

Medidas de posición y de tendencia central Las medidas de posición son de dos tipos: a) Medidas de posición central: lnforman sobre los valores medios de la serie de datos. Las principales medidas de posición central son las siguientes: Suma, Media, Mediana y Moda.

b) Medidas de posición no centrales: lnforman de como se distribuye el resto de los valores de la serie. Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros.indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales'como. Cuartiles: Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o ,,.m decreciente. Deciles: Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles:,tSon 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en'cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. Los estadísticos de posición y tendencia central para las variables definidas en el editor de datos pueden obtenerse desde diferentes cuadros de diálogo. A continuación veremos los procedimientos +as empleados para cada una de ellas.

~

Capitulo 3: Análisis: Informes, Estadísticas Descriptivas y Tablas Personalizadas

El

Medidas de tendencia Central: Media, mediana, moda y suma Estos estadísticos pueden obtenerse prácticamente desde cualquier cuadro de diálogo del menú Analizar -> Stodkticas descriptivas. Uno de los más empleados es el del cuadro de diálogo "Frecuencias"ya que cuando se elabora una tabla de frecuencias normalmente también se desea obtener las medidas de posición. h r a ello se pulsa en el botón "Estadísticas", luego aparece el cuadro de diálogo aquí se selecciona

k estadísticas que se desean utilizar en el estudio. En nuestro ejemplo se pide calcular la "media", 'mediana", "moda" y "Suma" esto se logra simplemente marcando cada opción.

bego se presiona el botón continuar y después aceptar (OK). El SPSS calcula estos Cuatro valores estadísticos para el listado de variables seleccionadas. Statistics

Venta de Articulas de Aseo Personal Valid Missing Median Surn

2.6533 2.1 500

79.60

Lamedia que se obtiene se corresponde con la media aritmética, la mediana con el valor central cuando los &os se ordenan en modo creciente y la moda con el valor que obtiene la frecuencia absoluta mayor.

e r a conocer las estadísticas descriptivas de las variables también puede seleccionarse el procedimiento 'Descriptivas". Este procedimiento presenta un cuadro de diálogo m 4 parecido al del procedimiento -ecuencias". El cuadro de diálogo del procedimiento "Descriptivas" es el siguiente.

Pulsar para indicar qué estadísticos uní variados se desea obtener.

Estadistica con SPSS 16 Para obtener las estadísticas descriptivas, primer se trasladan las variables correspondientes al cuadro "variables" y luego se pulsa en Opciones, obteniéndose el cuadro de diálogo siguiente.

En este caso, solamente está disponible la estadística de tendencia central de "media" y "suma" que, como antes, representa la media aritmética para las variables seleccionadas. Veamos un ejemplo para algunas variables del archivo. Descrlptive Statistics

Venta de Artlculos de Aseo Personal Venta de Verduras Venta de Abarrotes Venta de Bebidas Valid N (listwise)

30

Seaprecia que las30 personasgastaron en totalS/.79.60 en artículos de Aseo personal, en el supermercado la media de los gastos es S/. 2.6533. En forma similar se aprecia en la venta de Verduras que las 30 personas gastaron S/. 356.00 en total con una media o promedio de gastos de S/. 12.533.

Medidas de tendencia No Central: Los percentiles (Centiles), los deciles y los cuartiles: Los centiles y otros cuantiles pueden obtenerse desde el procedimiento Frecuencias. En la parte inferior de este cuadro de diálogo hay un botón llamado 'Estadísticos'. Si se selecciona se obtiene el siguiente cuadro de diálogo. I ,

-

Si se desea obtener, los Cuarteles indicar grupos de 4, para los Deciles 10 y para los Centiles 100

Esta opción es especifica para los centiles y permite definir el centil (entre l'y 99) que se desee obtener. Para indicar varios escribir el número y pulsar en Añadir (Add). Sucesivamente D)OGUC-

[ Z J l E n c c > M j -82-

Capítulo 3: Análisis: Informes, Estadísticas Descriptivas y Tablas Personalizadas Desde aquí puede indicarse que se obtengan diferentes tipos de cuantiles o los percentiles. Se puede -dicar el número exacto del percentil que se desee obtener e ir añadiendo a la lista inferior. Continuemos m n la variable artículos de aseo personal. Si le pedimos que nos dé los cuartiles, deciles y los percentiles 25 y 30, se obtiene: Statistlcs

Venta de Artlwlos de Aseo Personal N Valid 30

Percentiles

Missing 10 20 25 30 40

O 2000 3000

50

3750 6500 1 3800 2 1500

60 70

2.6000 4 5000

75 80

5 1250 5 5000

90

6 O000

Como se observa, hay un 75% de sujetos que gastan S/. 5.1250 como máximo en las compras del supermercado y el 10% gasta S/. 0.20 como máximo en la compra de artículos de aseo personal. Medidas de variación Las medidas o estadísticas de variación se obtienen de forma muy similar y desde los mismos menús Y

los cuadros de diálogo que las de posición y tendencia central. Las más empleadas son: la varianza

v la desviación típica, aparecen por defecto en muchos menús del SPSS y en aquellas opciones que se

&nominan "descriptivas" sin especificar exactamente a qué se refieren. Ilarianza, desviación típica, rango, mínimo y máximo

l La varianza y desviación típica, rango, mínimo y máximo pueden obtenerse a partir del procedimiento kecuencia" en el botón "Estodisticas". Desde aquí puede pedirse que se calcule: la desviación típica, la wrianza y la amplitud total o rango de las puntuaciones.

I=[=]lj

-. - , - --- .-.---Cha forma de proceder para obtener medidas de variación es desde el menú Analizar ->Estadísticos &criptivos -> Descriptivos o de desde el menú Analizar ->Explorar (Estadisticas). Desde ambos medimientos se ofrecen exactamente las mismas opciones (desviación típica, varianza y amplitud rnl,'el mínimo y máximo). l

"

Estadistica con SPSS 16 Veamos un ejemplo para la venta de aseo personal. Desde cualquiera de los cuadros de diálogo señalados se obtienen los siguientes resultados: Statistlcs

.

Venta de Artículos de Aseo Personal Valid Missing Std. Deviation 2.2463 Vatianca 5.0550

Minlrnum Maxirnum

6.50

Nota Importante: Conviene tener en cuenta un aspecto importante. El programa SPSS tiene la peculiaridad de que proporciona la cuasi varianza. Es decir, cuando se le pide que nos dé la varianza y la desviación típica, lo que da exactamente es el resultado de las fórmulas:

$3:' =

1(>4- x

)~

n-1

n-1

Gráficos de cajas y bigotes:

El SPSS también ofrece la posibilidad de elaborar los gráficos que expresan la dispersión de los datos en una variable. En concreto, desde el menú Analizar -> Explorar (Gráficos).Puede definirse un diagrama de cajas y bigotes para una variable en estudio. Este tipo de diagramas ofrece información sobre el rango de la variable y los cuarteles, por ejemplo para la variable "artículos de aseo personal" se obtiene el gráfico siguiente.

1

--

7-

i

Se observa en la gráfica, qÚejos gastos oscilan entre 0,20 y 6,50 Nuevos Soles estando la mediana en 2,15 Nuevos Soles. Asimetría y Curtosis: La asimetría (Skewness)y la curtosis (~urit6SB) pueden obtenerse a partir del menú Analizar-> Frecuencias pulsando el botón "Estadísticas" luego marcando las respectivas distribuciones.

Capítulo 3: Análisis: Informes, Estadísticas Descriptivas y Tablas Personalizadas También se obtiene el mismo resultado desde el menú Analizar-> Estadísticas descriptivos -> Descriptivas. Desde ambos cuadros de diálogo se ofrecen exactamente las mismas opciones: el índice de asimetría de Fisher para cada variable y el índice de curtosis. Además del valor de la estadística tanto para la asimetría como para la curtosis, el SPSS proporciona información sobre el error típico en el cálculo de estos índices. Veamos un ejemplo para algunas variables de la encuesta en el supermercado. Statistics Venta de Artlculos de Aseo Personal

N Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis

Valid Mlssing

30 O ,435

Venta de Verduras

.

30

Venta de Abarrotes

,562

30 O -.O50

.427

,427

,427

-1.413

-.565

,082

.833

,833

,833

O

Tablas de Contingencia: Veremos cómo se obtienen distribuciones conjuntas de frecuencias y su representación gráfica para dos o más variables de diversos tipos. Los datos utilizados son de la encuesta del supermercado. La forma de proceder en el SPSS es como ya vimos, todos los análisis se realizan desde el menú Analizar

-> Estadísticas descriptivas -> Tablas de contingencia (Crosstabs..).

r

Dos variables cualitativas:

'

Para describirlas dos variables cualitativas primero 'debemos elaborar una Tabla de contingencia ((Crosstabs..). ,

;

Si se selecciona el procedimiento "Tablas de contingencia" aparece el cuadro de diálogb que se muestra en la figura siguiente.

)<

Pulsar para indicar si se desea obtener los datos en porcentajes

Seleccionar si se desea obtener un diagrama de barras para las variables

Estadística con SPSS 16 Supongamos que deseamos conocer la distribución conjunta de frecuencias de las variables "Edad" y "Estado Civil". Para indicar al SPSS esta instrucción, primero se seleccionan las variables. Por ejemplo, las categorías de la variable Edad pueden ser las filas (Row[s]) de la tabla de frecuencias y las de la variable Estado Civil las columnas (Colum[s]) como se muestra en la figura anterior. Este cuadro de diálogo también permite obtener una representacióngráfica para las dos variables. Si se pulsa en el botón Aceptar el resultado obtenido es el siguiente: Edad Estado Civll Crosstabulatlon Count Total Edad

Adolescente Joven Adulto

Total

12

4

22 30

Count Addewsnle

Joven

Adullo

Edad

En la tabla de resultados se observa las distribuciones conjuntas y marginales de las variables y la representación gráfica del diagrama de barras conjunto. Como se observa, de los 30 sujetos de la muestra 3 son Adolescentes, 5 son Jóvenes y 22 son Adultos. De los Adultos la mayoría son viudos (8 son viudos) etc,. Las distribuciones conjuntas también pueden obtenerse en frecuencias relativas o porcentajes para ambas variables (filas y columnas). Para ello se selecciona el botón Celdas (Cells) del cuadro de diálogo anterior. Cuyo aspecto es el siguiente: -+"-

.-si

,.~Señ3larsi se desea obtener las frecuencias conjuntas relativas para las filas y las , .* columnas &JS

&&~alsd siadartlized

," %,

'

-*sm-"

,

0 &e*ties

.! : .

wbataray

..

.

. .

.

. .

. . . . . . . . . . .

-.

.

.-; .

.....

.

.

.

.

~

.

).

Crea un gráfico con los cuantiles de distribución de una variable'respecto a los cuantiles de una distribución cualquiera de prueba. Es decir, por cada variable especificada proporciona dos gráficos: en el primero se representan los valores de los cuantiles esperados bajo el supuesto de distribución normal (por defecto) de media cero y varianza uno frente a los observados. En el segundo, en lugarde los cuantiles esperados, se representan los residuos. Las distribuciones de prueba disponibles son las mismas que en P-P.

Estadistica con SPCC 16 Ejemplo: Para la variable venta de Verduras se puede decir que si tiene una distribución normal. Normal Q-Q Plot of Venta de Verduras

='Y

Detrended Normal Q-Q Plol of Venta de Verduras

' 7

Ejercicios Propuestos Trabajando los datos de la encuesta del supermercado resuelva la siguiente pregunta: a) ¿Cuáles el gasto mínima y máxima para cada una de las variables (Aseo Abarrotes, etc.) de los sujetos de la muestra? b) ¿Qué porcentaje gasta menos de S1 3.00 en cada una de las variables? c) ¿Cuál es el valor centralm cada variable? d) Obtenga el valor de la'venta de artículos de Aseo que es superado por el 30% de los sujetos de la muestra: e) ¿Cuántossujetos tienen grado de instrucción primaria? xc I. Trabajando con los datos del ejercicio fierapia a los trabajadores responda las siguiente preguntas: a) ¿Cuántas horas t r a b a j a m m o míniíno el 70% de los sujetos? b) Obtenga la @presentación gráfica más adecuada para las siguientes variables: Sexo, P:,

.

c) Edadphorastr2bajadas. d) ¿Qué porcentaje de sujetos trabaja más,de 3 horas al día? 4'

e) Confeccione el diagramade tallo y hojas en la variable horas trabajadas para la muestra de varones, para la de mujeres y d r a la' muestra total. Comente el resultado

f) ¿Quiénestrabajan más horas, los varones o las mujeres?

Capitulo 3: Análisis: Informes, Estadísticas Descriptivas y Tablas Personalizadas

Tablas En primer lugar, se establecerán criterios generales sobre su estructura que se deben tener en cuenta en la construcción de cuadros. Del mismo modo, se estudiarán los tipos de cuadros que se pueden elaborar para distintos fines y de acuerdo a las características de los datos disponibles.

Tablas Personalizadas: Genera tablas que muestran estadísticosde clasificación cruzada y de subgrupo. Las variables de resumen seleccionadas se resumen en las casillas definidas por las variables de subgrupo. Para todas las variables resumidas se emplean los mismos estadísticos. Si no existen variables de resumen, se muestran los recuentos.. Se pueden definir casillas para mostrar subgrupos de casos empleando las combinaciones: Hacia abajo de la página (como filas distintas). A través de la página (como columnas distintas). La combinación de Hacia abajo y A través genera una presentación en forma de tabla de contingencia. Repartidas en Tablas distintas. Las variables de esta lista subdividen la tabla en capas o en grupos de capas, de manera que sólo puede verse una capa de la tabla cada vez. Una vez en el Visor, para ver las otras capas se deben pivotar. Anidar significa que se muestran las categorías de una variable bajo cada una de las categorías de la variable anterior. La apelación muestra las categorias de cada variable como un bloque; se puede entender como la extracción de tablas diferentes y su unión en la misma presentación. Se pueden generar tablas que muestren diferentes estadísticos para distintas variables, variables de respuestas múltiples, anidación y apilación mixta o totales complejos. En la mayoría de las circunstancias es necesario seleccionar una variable de fila. También se puede seleccionar una o más variables para definir columnas o capas. Por ejemplo, para generar una tabla de contingencia simple debemos seleccionar una variable para definir las filas y otra para definir las columnas. Si tiene una variable de capa, también es necesario tener una variable de fila y una de columna.

Tablas de respuestas múltiples: Gea tablas de frecuencia y de contingencia básicas en las que una o más variables es un conjunto de respuestas múltiples (si no, sería conveniente utilizar Tablas básicas). Si no seleccionamos la.opción Anidar para una dimensión, se producirán tablas separadas para cada variable pero conectadas físicamente (concatenadas). Las restantes opciones son similares a las descritas anteriormente. Genera tablas especiales que contienen varias variables con los mismos valores. Por defecto, las variables forman columnas y las categorías filas (todas las variables de Frecuéncias para deben tener las mismas categorias). Cada casilla muestra el número de casos en esa categoría. Permite variables de subgrupo. Mediante Subgrupos se puede dividir la tabla en columnas dentro de cada tabla o en tablas diferentes (capas). Al dividirla se mostrarán todas las variables para cada subgrupo. Hay diversas variables en una de las listas de la sección Subgrupos, se puede elegir entre anidarlas o apilarlas (se crean las tablas por separado pero se unen en la presentación).

Estadistica con SPSS 16

Ejercicio Practico No1 Permitirá utilizar los principales procedimientos de tablas. Los datos utilizados serán los recopilados en la encuesta del supermercado presentado en el capitulo dos. Empecemos a utilizar este menú haciendo clic en Analizar -> Tablas ( Tables), como se muestra en el siguiente gráfico. Reeorts

b

Para realizar análisis con los procedimientos de Tablas ('Tablas Personalízadas, Tablas de respuestas múltiples) se debe seguir los cuadros de dialogo que se va presentado. -

Tablas Personalizadas Para entender mejor dividamos Custom table en Normal, Compct y tablas con Layers (Capas) . Normales (Normal): Cuando hacemos clic en Tablas generales (custom table). Aparece el cuadro de diálogo que ofrece el siguiente aspecto:

En el cuadro izquierdo aparece el listado de variables del archivo de datos que está abierto. El cuadro de la derecho presenta dos botones uno para la filas y el otro para las columna esperando a que le indiquemos qáé variables queremos analizar, las variables se trasladan de un cuadro a otro arrastrando. Por ejemplo. Trasladando la variables al cuadro de la derecha del modo siguiente la variable Edad a la fila y la variable Sexo a la columna. Y se obtiene la siguiente presentación. -"

Capitulo 3: Análisis: Informes, Estadísticas Descriptivas y Tablas Personalizadas

4 Venta de Verduras l... &'

venta de Absrrolm l...

R Vema de &bidas

...

lb

1

I

I I

-

l

=

~

l

~

I

~

J

l

~

J

Luego pulsar en el botón Aceptar (OK) para que se ejecute la orden. Los resultados obtenidos aparecen en la ventana Visor de resultados: Tahle 1

Mu'er Edad

Adolescente Joven Adulto

Varbn

19

Además si pulsamos en el botón categories and totals, obtenemos como resultado el cuadro de diálogo siguiente.

:

SehCled V a r a Edad

':''!y$

rMsplay

!

1

1 -

r

l

Cdegor'es onilted trom eY

' hiPhiPj t

.

.+

t

#&asc~egc+iosl o wtncn

1 !

h

-Show 1

! OIM

M?di4smoYates

EWY '% -

OIM vnl?ieo !win

@meare scrwisd

l I

- . - -- - --

-.

---

--- --

-

-

--_

"

Estadistica con SPCC 16 Aquí se puede excluir las categorías (cuadro izquierdo) ue usted desee simplemente trasladando las categorías al cuadro del lado derecho mediante el botón .

b

Ejemplo. Trasladamos al cuadro de la derecha la categoría Joven es decir excluimos del análisis la variable joven y el resultado será el siguiente. Table 1

Mi1 er

Edad

Varón

Adolescente Adulto

Para el caso de Cornpct es similar a normal Layers (Capas): Si hacemos clic en layers cuando estamos en el cuadro de dialogo de Tablas generales (custom table). Aparece el cuadro siguiente.

En el cuadro izquierdo aparece el listado de variables del archivo de datos que está abierto. El primer cuadro dq la derecho presenta dos botones uno para la filas y el otro para las columnas el siguiente cuadros presenta el botón Layers estos cuadros están esperando a que le indiquemos qué variables queremos analizar, las variables se trasladan de un cuadro a otro arrastrando. Por ejemplo. Trasladando lasvariables al cuadro de la derecha del modo siguiente la variable Edad a la fila, la variable Sexo a la columna y la variable Estado Civil a Lager. Y se obtiene la siguiente presentación.

Capítulo 3: Análisis: Informes, Estadísticas Descriptivas y Tablas Personalizadas

m

Por ejemplo. Trasladando las variables al cuadro de la derecha del modo siguiente la variable Edad a la fila, la variable Sexo a la columna y la variable estado civil a lager. Se obtiene el siguiente resultado. TaMe 1

ro Sexo Muier

Varón

Count Edad

Adolescente Joven A ~ U ~ O

Count

O 2 2

O O 1

En la misma Tabla se puede analizar los subgrupos de la variable Estado civil (Soltero, Casado, Divorciado y Viudo). Basta con hacer doble clic en "Estado Civil Soltero". Como se muestra en la tabla. Table 1

Joven Adulto

2 2

Estadística con SPSS 16

Ejercicio Teórico En el ejercicio práctico se mostrará los lineamientos para la Construcción de Cuadros Estadísticos El gráfico muestra un cuadro típico que reúne un conjunto de características que son:

E

Cuadro 1

Cantidad de Autos Vendidos en (En unldudea

MFG

1959

Chrysler T"yota H@.

Other

1990

1991

1992

3,437,086 3,308,983 2,909.460 2,843.860 2,908,689 2,177,866 1,935,531 1,636.050 1.777.633 1,878,149 1,019,963 860.834 702,518 679,586 834.132 760.159 74 1,826 77.920 742,021 676,939 783.102 854.879 803,367 768,845 716,440 454.250 413.733 510.371 417,970 482,646 l. 172,385 1,106,526 967.537 965.058 935,977

-....-

.,.

--.--.--S----

X\TOM

9,7T7.712

8,598,923

8,174,688

8,213,111 8,497,859

Incluyala oto prcducbxea FüENTE: Anualo b I u k 8 c o Ward 1904 p.105

Gráfico 1.-Portes de un Cuadro Estadistica

A. Número de Cuadro y Titulo (A). Toda cuadro estadístico debe ser numerado. B. Las unidades (B) en que están medidas las cantidades presentadas. C. Los nombres colocados en la parte superior de las columnas se llaman cabeceras (C).

1

D. También se ponen líneas continuas y de mayor intensidad para separar las cabeceras de columnas

(DI. E. Para cuadros muy extensos es conveniente poner líneas indicadoras (E) que permitan una lectura fácil. F. Constituyen los niveles de la variable respuesta (F).

G. Los nombres colocados al lado izquierdo de las columnas se les llamará marcas de categorías (G).

H. Los datos se pueden ordenar descendentemente o ascendentemente (H). l. Las notas al pie del cuadro proveen explicaciones adicionales que deberían estar incorporadas en el cuadro y que permiten esclarecer aún más la información (1). J.

La fuente (J) es una nota importante que forma parte del cuadro.

Tablas Cruzadas

l

Siempre es importante saber la relación que existe entre dos o más variables. Por ejemplo, en el ámbito de la investigación de mercados estaremos interesados en saber: ¿Cuantos compradores de determinado producto son hombres? ¿El nuevo producto se ajusta a la edad y nivel educativo? ¿Está relacionada la propiedad del producto con los gastos realizados? Estas preguntas se pueden resolver mediante el estudio de las tablas cruzadas, por que, permite analizar varias variables simultáneamente, mostrando la distribución conjunta de dos o más variables con un tiúrriero limitado de categorías o distintos valores.

I

l I 1 1

-98-

Capitulo 3: Análisis: Informes, Estadísticas Descriptivas y Tablas Personalizadas Dimensiones de una Tabla Los cuadros pueden ser bidimensionales, una variable en las columnas, y la otra variable, en las filas. Una tercera variable definirá una distribución conjunta para cada uno de los valores que tome. Así, en esta tercera dimensión se definirán segmentos. Como muestra el gráfico 2, las tres dimensiones de una tabulación cruzada se asemeja a las tres dimensiones físicas: ancho, profundidad y altura.

-

SECMKñTOI

Gráfico 2.- Tres dimensionespara una Tabulación Cruzada

Tablas Bidimensionales: La tabulación cruzada bivariada conocida como tabla bidimensional. Dos variables han sido clasificadas de manera cruzada, los porcentajes pueden calcularsetanto por filascomo por columnas. La manera correcta de calcular los porcentajes depende de cuál sea la variable independiente y cuál es la dependiente.

Gráfico 3. Tiempo de Residencia y Familiaridad con el Departamento de Almacén

En el gráfico 3, la variable independiente puede ser el Tiempo de Residencia y la Familiaridad la variable dependiente porque estamos interesados en conocer el grado de familiaridad que los residentes de una zona tienen con respecto a un nuevo almacén de ventas. Al ser el Tiempo de Residencia la variable independiente, la manera correcta de calcular los porcentajes seria como se muestra en el gráfico.

Familiar

Total

53 80% 100.00%

60.98 lW.0076

32.9W lW.OO%

Gráfico 4 Familiaridad con el Deportomento de Almocén por Tiempo de Residencia

Analizando el cuadro vemos que las personas que viven en la zona entre 13 y 30 años son los que están más familiarizados con el nuevo almacén. Sin embargo, se.nota que la proporción de personas que viven en la zona por más de 30 años es menor que el grupo de gente que vive menos de 13 años. Tablas Tridimensionales Frecuentemente la introducción de una tercera variable clarifica la asociación inicial observada entre dos variables. Al ingresar una tercera variable en el análisis puede suceder cualquiera de las cuatro posibilidades:

- - Clarifica la asociación observada entre las dos variables originales.

- Puede indicar falta de asociación entre las dos variables, aunque la asociación fue inicialmente observada.

-

Puede indicar una asociación entre las dos variables iniciales, aunque la asociación inicialmenteWd-fue observada.

Estadistica con SPSS 16

- Puede indicar estabilidad en la asociación inicial. Inarcraeo ComprPn

krtanóvlbs

Cvrn

E 4 M Edwaddn Superior Ssaindmlm

Altos

Eaici~ib, Supaior

Ceair~dalh

Gráfico 5. Propietarios de Automóviles Caros por Grado de Instrucción y Nivel de Ingresos

Análisis: Comparar medias, .Modelo Lineal General y ~orre1a6'ión

"-L--<

.,. . .

Estadística con SPSS 16

Análisis: Comparar medias. Modelo Lineal General y Correlación El menú analizar es el más importante en el SPSS. Analizar: se centra en los componentes estadísticos básicos de SPSS. Es un capítulo eminentemente práctico donde se presentan numerosas técnicas estadisticas básicas y se discutirán situaciones en las que son aplicables cada una de ellas, las hipótesis previas necesarias para cada una de ellas y cómo realizar e interpretar los resultados. Las potentestécnicas analíticas de SPSS le ayudan a tomar las decisiones más adecuadas para hacer crecer su organización. La amplia gama de técnicas estadisticas permite ir más de las estadísticas descriptivas y las filas y columnas. SPSS proporciona procedimientos que permiten resolver sus problemas de negocio e investigación.

Comparar medias (Prueba de Hipótesis) Comparar medias del SPSS, es un procedimiento estadístico que permite realizar distintos tipos de contrastes sobre una, dos y hasta "n" medias.

Medias: Calcula medias de subgrupcjr~kstadísticosunivariados relacionados para variables dependientes dentro de las categorías de una o más variables independientes. Permite mejorar en la creación de medias armónicas y geométricaa. Pueden obtenerse el análisis de varianza de un factor, la eta y eta2. Prueba de linealidad con/ y r2. Cálculo de estadísticas para la muestra total. . kh Prueba T parguna muestra: Prueba t de una muestra pa.ra compararbmedia con la media de referencia de su elección. Es decir ammsta si la media de una s o h variable difiere de una constante especificada.

Capítulo 4: Análisis: Comparar Medias. Modelo Lineal General y Correlación Prueba T para muestras independientes: Compara las medias de dos grupos de casos. Los sujetos deben asignarse aleatoriamente a dos grupos, de forma que cualquier diferencia en la respuesta sea debida al tratamiento (o falta de tratamiento) y no a otros factores. Cuando esto no es posible (por ejemplo comparando una variable entre hombres y mujeres ya que el sexo de una persona no se asigna aleatoriamente), debemos asegurarnos de que las diferencias en otros factores no enmascaren o resalten una diferencia significativa entre las medias (por ejemplo los estudios respecto al sexo). Además compara estadísticas de muestras independientes: compara las medias de dos muestras para estimaciones combinada y separada de la varianza con la prueba de Levene para varianzas iguales. Prueba T para muestras relacionadas: Compara las medias de dos variables de un solo grupo. Calcula las diferencias entre los valores de las dos variables de cada caso y contrasta si la media difiere de cero. Compara estadísticas de muestras relacionadas: correlación entre pares, diferencia entre medias, probabilidad bilateral para prueba de no diferencia y para prueba de correlación cero entre pares. ANOVA de un factor:

Genera un análisis de varianza de un factor para una variable dependiente cuantitativa respecto a una Única variable de factor (la variable independiente). El análisis de varianza se utiliza para contrastar la hipótesis de que varias medias son iguales. Esta técnica es una extensión de la prueba t para dos muestras. Además de determinar que existen diferencias entre las medias, es posible que se desee saber qué medias difieren. Existen dos tipos de contrastes para comparar medias: los contrastes a priori y las pruebas post hoc. Los contrastes a priori se plantean antes de ejecutar el experimento y las pruebas post hoc se realizan después de haber llevado a cabo el experimento. También se pueden contrastar las tendencias existentes a través de las categorías. Contrastes: Lineal, cuadrática, cúbico, de órdenes superior, definido por el usuario. Pruebas de'postchoc: Duncan. LSD, Bonferroni, Student-Newman-Keuls, Scheffe, prueba alterna deTukey, Tukey-HSD, Sidak, Gabriel, hochberg, Tamhane, Dunnett T3, Waller-Duncan y otros.

Estadistica con SPSS 16

Ejercicio Práctico No 1 Permitirá utilizar los principales procedimientos del menú comparación de medias. Los datos utilizados serán los recopilados en la encuesta del supermercado. En el menú Analizar se encuentra el procedimiento Comparar medias que permite realizar diferentes tipos de contrastes sobre una, dos y hasta "n" medias. El aspecto de dicho menú es el siguiente: Analizar -> Comparación de Medias (Compare M ea ns).

Contraste sobre 1media (p) -r

~

O

G

I

V

%

W

v

~

M Mems... 1

Ons-sar#eT Tesi...

Contraste sobre 2 media (p,-y) con /muestras independientes. Contraste sobre 2 media (p,-p,) con muestras-independientes.

5 pie-ww ANWA...

Contraste sobre J media (p,-p,- ...p,) con muestras independientes

Para realizar análisis con los procedimientos de Tablas Personalizadas ('Medias, Prueba T para una muestra, Prueba T para muestras independientes, Prueba T para muestras relacionadas, ANOVA de un factor) se debe seguir los cuadros de diálogo que se nos presenta . A continuación se presenta una explicación detallada del cuadro de diálogo correspondiente a los principales procedimientos.

Medias: Utilizando el procedimiento Medias del SPSS, se pueden calcular Medias y variancias. El cuadro de diálogo de la herramienta estadística "Medias" ofrece el siguiente aspecto.

I ,& sexo [sexo] : 8 ~ r s d ode ~nstrucción[i & Esisdo Civil [civil]

'

'

&turno

:

[Layer 1of 17

[turno]

8 Venia de Ailiculos d @ Venia de Verduras [ve...

e bdependeniLlst:

En el cuadro de la izauierda se muestraél listado de las variables de la aue consta el archivo de datos que está abierto. Los cuadi'os de la derecha están vacíos pues están esperando a que le indiquemos ué variable queremos analizar. Dichas variables se trasladan de un cuadro a otro mediante el botón

h.

Veamos un eje'hplo, con las variables de la encuesta del supermercado. Para ello primero debemos trasladar lahariables a quienes se desea analizar a los cuadros de la derecha del modo siguiente. (en nuestro caso las variables son: Venta de artículos de aseo y edad).

m

Capítulo 4: Análisis: Comparar Medias. Modelo Lineal General y Correlación

6g Grado de hstru&% U...

!: ''

.

:

8 VMla de V u b r a s [ve... &' Venla de Absrrdes [ab... @ Vsnla de BeWas

[M..

Luego pulsar en el botón Aceptar (OK) para que se ejecute la orden. Los resultados obtenidos aparecen en la tabla siguiente. Report Venta de Arilculos de Aseo Personal

Joven Adulto

1.7200 2.9182

1.1367 2.4510

22

La tabla muestra una comparación de las medias de la venta de am'culos de Aseo Personal en cada subgrupo de la variable Edad. Como es el caso que la media de los adolescentes en la compra de artículos de aseo personal es 2.2667. La media de los jóvenes en la compra de artículos de aseo personal es 1.7200. Además si pulsamos en el botón "Opciones", obtenemos como resultado el cuadro de diálogo siguiente.

Nurnber of Case? Standard Dcvlslh

j

--

-

----

- .

rStatlstlcs for Flrst Layer

1 '

Donde se observa un listado de estadística como son: media, mediana, valor mínimo, valor máximo es decir todas las estadísticas que se aprecian en el cuadro izquierdo.

Para poder &alizar los cálculos simplemente debemos pasar las estadísticas elegidas al cuadro de la derecha (celda de estadisticas). Dichas estadisticas se trasladan de un cuadro a otro mediante el botón

m.

Veamos un ejemplo. Para elld7iay que trasfadatal cuadro de la derecha las estadisticas (mínimo, máximo) que deseamos analizar del modo siguiente (Puede trasladarse una o más estadisticas).

Estadistica con SPSS 16 Obteniendo la tabla de resultados siguiente: Report Venta de Articulas de Aseo Personal Edad Adolescente Joven Adulto Total

1 1

Mean 2 2667

1 1

N

3 5 22 30

1.7200 2.9182 2.6533

1 1

1 1

Std Deviat~on Minimum 2.1127 .30 1.1367 .30 2.4510 .20 2.2483 .20

1 1

Maximum 4 50 3.30 6.50 6.50

Se observa en la tabla de resultados los valores de la media, desviación estándar, el valor mínimo, el valor máximo de los grupos de edades en las ventas de artículos de aseo personal. También se pueden comparar medias como son: media aritmética, media armónica y media geométrica. Como se observa en el cuadro de resultados siguiente. Repon Vanla de Manoles

Hannonic SOlMO Casado Divadado Viudo Tolal

36 SiW 34.1ñ33 341MO 34.0039 345400

36.4118 34.9282 34.0483 33.8444 34.3904

Geornetnc 36.4652 34.1559 34.0993 33.9674 34.4655

Se observa en la tabla de resultados la comparación de medias de los grupos de edades en las ventas de abarrotes.

Prueba T Para comparar medias utilizando la prueba T hay tres opciones diferentes que permiten realizar contrastes de hipótesis sobre una media, dos medias con muestras independientes y dos medias con muestras relacionadas.

Prueba T para una muestra: Contraste sobre una media: Al seleccionar la opción menú Analizar ->Comparar medias -> Prueba T para una muestra (one-sample T Test) aparece el cuadro de diálogo siguiente.

& Sexo [sexo] ,&Grado de Inslriiccion

'Aturno [turno] Venta de Abarrotes (

.d

El cuadro de la izquierda se muestra el liGado de las variables de la que consta el archivo de datos que está abierto. Los cuadrosxdk la derecha están vacíos pues están esperando a que le indiquemos qué variable queremos analizar. Dichas variables se trasladan de un cuadro a otro mediante el botón

0.

Para realizar el contraste hay que trasladar al cuadro Contrastar variables (Test Variable(s)) la variable cuya media se'hesea contrastar, indicar en Valor de prueba (Test Value.) el valor de la media poblacional en la hipótesis nula y luego pulsar el botón Aceptar (OK). Por ejemplo, si se quiere comprobar si la media poblacional de la Venta de Verduras es igual a "6" (Ho: p = 6 y a = 0,05)se seleccionan las opeiotibs mostradas en cuadro de diálogo de la Prueba T para una muestra (One Sample T Test),

Capitulo 4: Análisis: Comparar Medias. Modelo Lineal General y Correlación

Además si pulsamos sobre el botón Opciones puede modificarse el nivel de confianza que por defecto es 0,95.El cuadro de diálogo de Opciones es el siguiente.

-

Nivel de confianza

El resultado del análisis se muestra en el visor de resultados: El SPSS proporciona dos tablas de resultados. En la primera aparecen el número de casos, la media, la desviación típica y el error típico de la media

(o, = S", 1&)s.

N

Mean 12.5333

Std. Deviation 5.7219 1

Std. Error Mean 1.0447

1 30 1 1 En la segunda tabla aparecen los resultados de la prueba T. En primer lugar el valor de la estadística de contraste. Los grados de libertad (df), el nivel crítico bil.ateral, la diferencia entre la media muestra1 y la media poblacional (p)de la hipótesis nula y, por último, los límites inferior y superior del intervalo de confianza para la diferencia (Media Muestral- p) . . , Estadístico de contraste Nivel Critico Venta de Verduras

\

OneSam~laTest

\

/

/

.P

Test M u e = 6

t Venta de Verduras

6 2%

df

29

Mean S1g (2-lrled) Difference 000 6 5333

'

95% Confidente lnle~al 01 Ihe Difference

1

Lower 4 3967 1

Upper

8 6699

Cuando se realizan contrastes de hipótesis con el SPSS, la decisión sobre H, debe tomarse a partir del nivel crítico, que es la probabilidad asociada al estadístico de contrakte. rC

. a

*

El SPSS suele ofrecer el nivel crítico bilateral. En el ejemplo, el valor de T ha resultado ser 6,254')'nivel crítico bilateral 0,000.Esto significa que P (T I-6.254) + P (T 2 6.254)= 0,000,lo que nos permite rechazar H, con a = 0,05 (a= 0,05> 0.000).Esta decisión también puede tomarse a partir del intervalo de confianza para la diferencia de medias, el cual no incluye el valor O. Para poder visualizar mejor se presenta el gráfico de la distribución T Bilateral (dos Colas). Hipótesis Planteada: Nivel de Sinnificancia:

Ho: P=Po

H,: P*P, .a %

-m-'$-?

Estadistica con SPSS 16 Estadístico de Prueba:

Var (8 ) Renla de decisión

TTd

-Tu/*

< < Tu/*

Se Rechaza la Hipótesis Ho Se Acepta la Hipótesis Ho

En caso de haber deseado realizar un contraste unilateral, es necesario dividir por dos el nivel crítico bilateral. Continuando con el ejemplo, para contrastar la hipótesis: H:, p 1 6 H,: p > 6 Hay que dividir por dos el nivel crítico bilateral: 0,000/ 2 = 0,00,que es la probabilidad correspondiente al suceso: T 2 6.264. En este caso también se rechazaría H, con a=0,05.

Prueba T para muestras independientes: Contraste sobre dos medias independientes. Al seleccionar la opción menú Analizar->Comparar medias-, Prueba T para muestras independientes (Idependent-Samples T Test) aparece el cuadro de diálogo siguiente.

Grada de lnsírucáái

(i

.

Trasladar aquí la variable sobre la que se desea realizar el contraste Para realizar el contraste es necesario indicar cómo están definidos los dos grupos en el editor de datos.

En el cuatlro de diálogo se ha indicado un contraste de las medias de las variables Venta de Verduras, en los dos grupos de la variable Sexo: Además e~~necesario indicar cuál es valor de la variable Sexo en cada grupo, para lo cual se pulsa el botón-Definir grupos (Define Groups), con lo que aparece un subcuadro de diálogo. C

,Daeste modo se indica -y 1 (varón):

comparar los dos grupos, en los

Sexo toma los valores O (mujer)

Capítulo 4: Análisis: Comparar Medias. Modelo Lineal General y Correlación

m

La prueba Tsobre dos medias independientestiene dos versiones, dependiendo de síse asuinen varianza iguales o distintas. El SPSS ejecuta en primer lugar la prueba de Levene para contrastar la hipótesis nula de que las varianzas poblacionales de los dos grupos son iguales. En la siguiente línea presenta la prueba de contrastar la hipótesis nula de que las varianzas poblacionales de los dos grupos son diferentes. A continuación proporciona el resultado de las dos versiones de la prueba T. h d i o n d i n t si",*.

1-

Es responsabilidad del usuario escoger el resultado de una versión de la prueba T, en función del resultado del contraste sobre varianzas. El nivel crítico de cada contraste aparece en la columna Sig.

La hipótesis nula de la prueba de Levene es H:, 02, = 02,, es decir, que la varianza poblacional es igual en ambos grupos. En este ejemplo, el estadístico de contraste (con valor F = 0,262) no ha resultado significativo, según indica el nivel crítico igual a 0,613. Por tanto, al mantenerse H, puede asumirse que las varianzas son iguales. Se puede observarse que en la tabla de resultados aparecen dos valores de T. En este caso se utiliza el primero de ellos, correspondiente al supuesto de igualdad de varianzas (T = -1.218). De nuevo, la decisión sobre la hipótesis nula debe tomarse a partir del nivel crítico (Igual a 0,233),que en este caso indica que el valor de T no es significativo y por tanto, que las medias de las Venta de Verduras son iguales en varones y mujeres. Además si pulsamos sobre el botón Opciones puede modificarse el nivel de confianza que por defecto es 0,95. El cuadro de diálogo de Opciones es el siguiente. .

.-

.-

--

. . -. .

. . -- .

Prueba T para muestras relacionadas: Contraste sobre dos medias relacionadas:Al seleccionar la opción menú Analizar->Compararmedias -> Prueba Tpara muestras relacionadas (Paired Samples T Test) aparece el cuadro de diálogo siguiente. . . / Ingrese aquí la segunda variable Ingrese aquí la primera variable

,

Venta de Mrí*rsa

verh de Abarcles Vmta de &bida

Estadistica con SPSS 16 Para comparar las medias con dos muestras relacionadas es necesario seleccionar dos variables de la lista, tal y como se observa en el cuadro de diálogo. Luego para contrastar la hipótesis nula de que la diferencias de medias de Venta de Verduras (Variable 1)y Venta de Abarrotes (Variable 2) es significativamente diferente de cero. Se pulsa sobre el botón

flecha para trasladar las variables al cuadro de variables seleccionadas. Así como se muestra en la figura siguiente

Luego pulsar en el botón Aceptar (OK) para que se ejecute la orden contraste. Los resultados obtenidos aparecen en la ventana Visor de resultados. Los resultados obtenidos son los siguientes: Paired Samples Statistics

Pair 1

Venta de Verduras Venta de Abarrotes

N

Meen 12.5333 34.5400

30 30

Std. Ermr Mean 1.0447 ,4199

Std. Deviation 5.7219 2.2997

Paired Samples Conelations N Pair 1

Venta de Verduras 8 Venta de Abarrotes

Correlation 30

-.187

Sig. ,323

Para realizar este contraste se calcula una nueva variable que es la diferencia entre las originales D = Venta de verduras - Venta de abarrotes. La salida de resultados muestra la media de la variable D, así como su desviación típica, elerror típico de la media y el intervalo de confianza. También puede verse el estadístico de contraste T, los grados de libertad (df) y el nivel crítico bilateral. Puesto que el flivel crítico vale p =0,000 se rechaza H, con un nivel de confianza de 0,95 y se concluye que la media en la población de diferencia es significativamente distinta de cero. Es decir, existen diferencias significativas entre el promedio de Ventas tanto Verduras como de Abarrotes. Además si pulsamos sobre el Botón Opciones puede modificarse el nivel de confianza que por defecto es 0,95. El cuadro de diálogo de Opciones es el siguiente.

Capitulo 4: Análisis: Comparar Medias. Modelo Lineal General y Correlación

ANOVA de un factor: Análisis de varianza de un factor en un diseño completamente aleatorizado ANOVA A - EF - CA Existen distintos procedimientos en SPSS para realizar un análisis de varianza de un factor en un diseño completamente aleatorizado. Uno de los más directos y sencillos se encuentra dentro del menú: Analizar ->Comparar medias -> ANOVA de un factor (One-Way ANOVA). Se obtiene el siguiente cuadro de diálogo.

3

i

l

venta de ~wduras1 . &' v e ~ de s ~ a n a e s. d Venta de Bebidas h...

Por ejemplo, para contrastar la hipótesis de igualdad de medias en la variable venta de bebidas en los tres grupos de Edad (Adolescente, Joven y Adulto). Se ingresa al menú Analizar ->Comparar medias -> ANOVA de un factor y se procede llenar el cuadro de dialogo de la manera siguiente.

XI

1 1

1

i

1

Dentro del cuadro de diálogo ANOVA de un factor hay varios sub-menús. Por ejemplo si pulsando el botón Opciones... puede indicarse que SPSS calcule estadísticos descriptivos para las variables en los "n" grupos y también que compruebe el supuesto de homocedasticidad (homogeneidad de varianzas). El aiadro de diálogo de Opciones es el siguiente.

Est~disticacon SPSS 16 Si se pulsa Aceptar (OK), el resultado obtenido es el siguiente: Descriptives

Venta de Bebidas

N Adolescente

3 5 22 30

Joven Adulto Total

Mean 5.0000 4.4000 4.0000 4.1667

1/

1 Std. Devialion 1.7321 2.3022 1.6903 1.7633

Std. Error 1.0000

1.0296 ,3604 ,3219

95% Confidente Interval f a Mean Lower Bwnd ' Upper Bound , Minirnurn Maxirnum ,6973 9.3027; 3.00 6.00 1.5415 7.2585 1.00 6.00 3.2506 4.74941 1.00 i 6.00 3.5082 1.00' 6.00 4.8251 1

;

/

Lo primero que aparece en el visor de resultados son los estadísticos descriptivos para los "n" (3) grupos. Como se observa, el grupo que más gasta en bebidas son los adolescente y el que menos Gasta en bebidas son los Adultos. A continuación se muestra el resultado del test de Levene sobre homogeneidad de varianzas, cuya hipótesis nula es H:, 02,= 02,= 02,. Test of Homogenelty of Varlances

Venta de Bebidas 1 ~evene I Statistic ( dfl ,798 1 2

I

1

1

I

1

df2

1

27

Sig. ,460

1

Puesto que el nivel crítico (p = 0,460) es mayor que a se mantiene la hipótesis nula sobre igualdad de varianzas. Por tanto, podemos asumir que se cumple el supuesto de homocedasticidad (homogeneidad de varianzas). A continuación SPSS muestra la tabla resumen el ANOVA:

:

ANOVA

Venta de Bebidas

,

Between Groups WRhin Groups Total

Sum of Squares 2.967 87.200 90.167

df

2 27 29

Mean Square 1.463 3.230

Sig.

F ,459

,637

En la tabla aparecen las suma5'de cuadrados inter.- grupos, intra grupos (error) y total. La tabla también contiene los grados de libertad, medias cuadráticas, estadísticos de contraste F y su nivel crítico (Sig.). En este ejemplo, puesto que el nivel crítico (0.6379) es mayor de 0,05 se acepta la hipótesis nula del ANOVA (H,: p, = p2= p,) y puede concluirse que no existen diferencias significativas en el gasto medio de bebidas por los sujetos de cada edad (Adolescente, Joven y Adulto). ,, *~. Comparaciones múltiples entre medias

~ornparacio66sde tendencia y F planeadas

Es necesario pulsar el botón Contrastes, que se encuentra situado en el cuadro de diálogo del , procedimiento ANOVA de un factor. -'m'

En este ejemplo, como el número de media es n = 3 se podría realizar el contraste de tendencia lineal o cuadrática etc. Si se quiere realizar la comparación de tendencia sobre el componente cuadrático se indicaría del siguiente modo.

Capitulo 4: Análisis: Comparar Medias. Modelo Lineal General y Correlación

El SPS proporciona los resultados del componente indicado y también de los de orden inferior, en este ejemplo, puesto que n = 3, son el cuadrático y el lineal. ANOVA

Between Groups

(Combined) Unear T e n

Ouadratic Ten

1

Sum of Squares 2.967

1

1

90.167

1

df 2

1

29

1

Mean Square 1.483

1

F .459

1

Sig. ,637

Unwelghled WeQhted Denation Unwelghled Weighled

Within Omups Total

1

1

La tabla de resultados proporciona la F del ANOVA. Puede verse que su valor es 0.459 en este ejemplo (el mismo que en la salida de resultados comentada anteriormente). Además proporciona la F del componente lineal en la fila denominada No ponderado, que se toma el valor 0.817 y la del componente cuadrático, que ha resultado ser 0.011. La columna Sig se refiere a la hipótesis sobre cada tendencia, que se acepta en ambos casos con p< 0.05 en la tendencia lineal y p < 0.01 en la cuadrática; Por tanto la relación entre ambas variables es Lineal. Para llevar a cabo comparaciones planeadas es necesario introducir los coeficientes directamente. Por ejemplo, para comparar la media en venta de bebidas del grupo 3 (Adulto) de Edad con la media de los grupos 1(Adolescente) y 2 (Joven)tomados juntos, hipótesis planteada seria:

'

Y en SPSS se indicaría mediante:

Ho:(-l)pl+(-1)CL, + ( 2 )= ~0 ~ H,: (-l)vl+ (-1)P, + (21~1,* 0 .-

r+f

La salida de los resultados in,cluye los coeficientes que se han utilizado en la comparación, lo cual permite comprobar si handi?do asignados correctamente a los grupos. También incluye el estadístico T del contraste de medias, en sus dos versiones: asumiendo varianzas iguales y distintas.

Estadística con SPSS 16 Puesto que la prueba de Levene indicó igualdad de varianzas, el estadístico de prueba T vale - 0.921 y su nivel crítico 0,365 por lo que se mantiene H, y no puede concluirse que existan diferencias significativas entre los sujetos del grupo Adolescentes Jóvenes de frente a los Adultos. Como se aprecia en los siguientes cuadros Contrast Coefiicients Edad Joven -1

1

Adolescente -1 1

Contrast

1

1

Adulto 2

1

Contrast Tests Contrasl Venta de Bebidas Assurne equal varlances 1 Does not assume equal 1

Value oí Contras! 4000 --1 -1 4000

Std Error 1 5198 16061

t -921 -872

'

df

Sig. (Ztailedl

2 7 8383

'

365 408

Comparaciones a posteriori Al pulsar el botón Post Hoc aparece el cuadro de diálogo correspondiente a las comparaciones a posteriori: I

rEqilal Variatices Assumed-

-

1

EqimlVariancesNot Assumed

t

OT-SM

l .

,

..

, ;L.' '..?:.:-.-LL

1

OWST;~

,

,

1

O~gmes-~~wsl Ocqmt*sc

I

, .i

.

: .::, . . ..! . [Xo ; , J / . X .jJ - ', -... . -

.

,

,

.

-

,

;,,

'

.:>;

:

.

.. . . . .

:;

,

..

;

,

.

:_ ,... ~

Puede verse que permite seleccionar distintas pruebas: Tukey, Dunnett, Scheffé, etc. Continuando con el ejemplo, al seleccionar la prueba de Tukey, la salida SPSS muestra la tabla de resultados de dicha ~rueba. .,,e

En la tabla puede verse la diferencia entre las medias de la venta de Bebidas en cada uno de los pares de grupos definidos por la variable Edad. También se incluye el error típico de la diferencia de medias, el nivel crítico asociado a dicha diferencia (Sig.) y los limites del intervalo de confianza. Como se observa, los resultados indican que No existen diferencias significativas entre el grupo Adolescentes y Joven (p Modelo lineal general.

-

ANOVA A EF- MR Para realizar un ANOVA de un factor de diseño de medidas repetidas se ejecuta la opción del menú: Analizar -> Modelo lineal general -> Medidas repetidas (Repeated Measures Define Factor[sJ). El objetivo es comparar las medias de distintas variables medidas sobre los mismos sujetos. Por ejemplo, supongamos que se desea comparar las medias de las, Venta de Verduras, Venta de Abarrotes y Venta de Bebidas. con el objeto de determinar la evolución de las ventas en cada tipos de artículos. Por tanto, tenemos un factor intra-sujetos con J = 3 niveles. Cuando se selecciona el procedimiento Medidas repetidas aparece un cuadro de diálogo en el que se indica cuantas variables se van a comparar. En nuestro caso. son tres variables. luego.

1

mhin-Subpct Factor Name.

L:

factor1

i

i i C

Numbér of bis

Definir el número de niveles y pulsar en Añadir (Add).

A continuación pulsar en Definir

-

. --*

,

--

Acontinuación se pulsa sobre el botón Añadir para que el SPSS interprete que se ha definido i n factor +H7a-sujetos (denominado en el ejemplo Factor 1)con tres niveles diferentes. Después de Añadir se wlsa el botón Definir para indicar al SPSS cuáles son las variables que'formian cada uno de los niveles de =actor 1, en este caso tres niveles. Bi igual que en otros procedimientos, el SPSS muestra un cuadro de dialogo con todas las variables tiel archivo de datos. En este cuadro se seleccionan las variables que forman los grupos del factor intrasujetos, que en el ejemplo son, Venta de Verduras, Venta de Abarrotes y Venta de Bebidas.

-

~sthdisticacon SPCS 15

A continuación, pulsando sobre el botón flecha se trasladan estas variables al cuadro denominado Variables intra-sujetos. De este modo se ha indicado cuáles son los tres niveles del factor intra-sujetos Factor 1. El SPSS proporciona distintas tablas de resultados. La tabla correspondiente a la F del factor intra-sujetos se denomina Pruebas de efectos intra sujetos:

-

Tests of Wlthln-Subjects Effects Measure: MEASURE-1 Source FACTOR1

Ermr(FACTOR1)

Sphencity Assurned Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assurned Greenhouse-Geisser Huynh-Feldt Lower-bound

Type III Surn of Squares 14768.339

14768.339 14768.339 14768.339 833.275

2 1.404 1.454 1.O00 58

MeanSquare 7384.169 10517.592 10156.961 14768.339 14.367

833.275 833.275 833.275

40.721 42.166 29.000

20.463 19.762 28.734

df

F 513.974 513.974 513.974 513.974

Sig. ,000

.O00 .O00 .O00

La tabla contiene la suma de cuadrados Inter-gruposy Error con los correspondientes grados de libertad, medias cuadráticas, el estadístico de conY7aste F y el nivel crítico. El SPSS ofrece los resultados bajo varios estadísticos según se cumple o no el supuesto de esfericidad. Como puede verse en el cuadro de diálogo y en el visor de resultados, este procedimiento tiene muchas máslopciones además de las indicadas. Por ejemplo, pueden realizarse pruebas de tendencia, comparaciones entre medias, gráficos, etc. Asimismo, desde este menú también puede realizar ANOVA con medidas repetidas en un más de un factor y con medidas repetidas solo en algunos de ellos (diseños mixtos). .a*

Capitulo 4: Análisis: Comparar Medias. Modelo Lineal General y Correlación

Ejercicios Propuestos: 1. En ejercicio propuesto Número 3 de Comparación de Medias. Supóngase que se vuelve a medir las horas Trabajadas por los sujetos transcurrido un mes y se obtiene los siguientes resultados Sujeto 'Horas

1

2

3

4

5

6

7

8

9

10

7.53

6.42

9.39

7.18

7.49

9.20

7.24

7.11

8.37

6.29

2. Según estos datos, ¿Puede afirmarse que la terapia sigue teniendo efecto transcurrido un mes con un nivel de confianza del 95%? 3. Un profesor de Estadística de una Facultad, evalúa su asignatura, a partir de 3 controles que se realizan a lo largo del curso y hacen media con la nota del examen final. El profesor desea saber si el rendimiento de los alumnos ha ido aumentando en cada uno de los controles. Para ello selecciona aleatoriamente una muestra de 5 alumnos. Sus calificaciones obtenidas en los tres controles se muestran en la siguiente tabla: Control 1:

7

4

5

3

2

Control 2

5

6

6

4

3

Control 3

5

8

6

5

4

a) Indica las variables que intervienen en el problema y la función que desempeñan. b) Selecciona el modelo de ANOVA más apropiado, plantea la hipótesis pertinente y toma una decisión con = 0,05. c) ¿Existen diferencias entre las calificaciones en los controles? 4. Supongamos que se dispone de los datos sobre si los sujetos considerados son fumadores (1) o no lo son (0) Sujeto

1

2

F

m

a

u

4

3 1

0

5 1

6 1

1

7 0

8 1

10

9

0

1

1

Contrasta el efecto de las variables Edad y Fumar sobre el numero de horas dormidas con = 0,05.

5. Un gabinete de psicología clínica pretende estudiar la eficacia de cuatro terapias (psicoanalítica, conductista, cognitivista y gestáltica) en el tratamiento de los trastornos del sueño.-Para ello asigna aleatoriamente a un grupo de 24 pacientes (mitad varones, mitad mujeres) a cada terapia y mide las horas que duermen transcurrido un mes después de la terapia. Los resultados obtenidos son los siguientes: F= Varones

Mujeres 3 4,>3 ,5,'9 5

Psicoanalitica

6

4

3

Conductista

7

7

8

Cognitivista

9

8

7

6

7

7

Gestáltica

5

6

5

4

5

3

,P.

1) ¿Qué puede concluirse con = 0,01?

2) ¿Qué terapia recomendarías a un paciente que acudiera a t u consulta con insomnio? 3) Representa gráficamente la interacción e interpreta el resultado Correlación (Correlate).

1 Para realizar análisis con los procedimientos de Correlación ('Bivariadas, Parciales y Distancias) se debe seguir los cuadros de diálogo. Acontinuación se presenta una explicación detalladadelcuadrodediálogocorrespondientea los principales procedimientos que nos tocará analizar en este tema como es la herramienta "Correlación".

Bivariadas: índice de asociación lineal El índice de asociación lineal es medido por el procedimiento Bivariada. Para obtener los índices de asociación lineal con variables (la covarianza, S,, y el coeficiente de correlación de Pearson, )r, se utiliza el procedimiento bivariadas se selecciona el menú Analizar -> Correlaciones -> Bivariadas. El cuadro de diálogo para el procedimiento Correlaciones bivariadas tiene el siguiente aspecto: Pulsar para ver opciones 4

Primero trasladar a este cuadro las variables para las que se desee obtener un coeficiente de correlación lineal. Desde aquí se pueden obtener: el coeficiente de: Pearson (rXYJ, Kendally Spearman. Los dos últimos sirven para variables ordinales.

í

i 1 I

I

4

1

i

Test MSignfflcance

_

I

Bbsbpnmcwrei&n~

Í

LoIWO-1-

0-

1

I 'i

*

Si pulsamos el botón "Opciones", aparece el cuadro

Seleccionar si se desea obtener la matriz de varianzas - covarianzas

e.

>

8

k

~

s

-

41

-~

d

Missingvaiues

i i

@ExcUbcssespáwiae

O~xcWe-~wiss

"

~

'

L q E d l z d

L.

-.

>-e

.

-

--

~

~

~

Estadistica con SPSS 16 Desde aquí puede indicarse que se muestren los estadísticos descriptivos (media y desviación típica) para cada una de las variables seleccionadas y también la matriz de varianzas-covarianzas (selección Productos cruzados y covarianzas).

I

1

La matriz de varianzas-covarianzas: Este procedimiento se consigue pulsando opciones luego marcar varianzas-covarianzas (cross-product deviations and covariances). En la covarianza pasa como en la varianza: el estadístico ofrecido es el insesgado. En este caso:

1

1

La matriz de correlaciones: Desde el cuadro de diálogo anterior, una vez se asignan las variables seleccionadas al cuadro "Variables", si se pulsa en Aceptar aparece la matriz de correlaciones de Pearson entre todas las posibles variables seleccionadas en el visor de resultados. Veamos cómo se resuelve en el SPSS alguno de los ejemplos. En este ejemplo parecen los datos de 30 sujetos para dos variables; X: Venta de Verduras e Y: Venta de Abarrotes. Finalmente se pulsa en el botón Aceptar. Los resultados obtenidos son los siguientes: Correlatlons

Venla de Verduras

Venta de Abarrotes

Pearson Correlalion Sig. (2-lailed) Sum of Squares and Cross-products Caiarianu, N P e a r s o n e n Sig. (2-lailed) Surn ol Squares and Crossproducls Covadance N

Venia de Verduras 1,000

Venta de Abanotes -.le7 ,323

949.467

-71.340

32.740 30 -.la7

-2.460 30 1.000

.323 -71.340

153.372

-2.460 30

5.289

30

.Se ha señalado el coeficiente de Pearson con un círculo. Como se observa, se obtienen ,r = -0.187. La Media y la Desviación estándar se muestran en la tabla siguiente. Descriptive Statistics Mean 12.5333 34.5400

Venta de Verduras Venta de"Abahotes

N

Std. Deviation 5.7219 2.2997

30 30

Veamos un ejemplo a partirde los datos de la encuesta. Tomemos las variables "Venta de Aseo Personal: "Venta de Verduras" y "Venta de Bebidas" y obtengamos sus coeficientes de correlación. Los resulta& obtenidos son los siguientes.

..

-1.Hai.

e'-&, . , , 1

y'

,.

.,Correlaciones>Bivariadas. Por ejemplo, para calcular las correlaciones entre los tres días se indica:

Pulsando en el botón Opciones pueden obtenerse los estadísticos descriptivos y la matriz de covarianzas. Según puede verse en el cuadro de diálogo, este procedimiento también permite calcular la correlación de tau de Kendall y la de Spearman, que utilizan únicamente las propiedades ordinales de los datos.

Estadistica con SPSS 16 Al pulsar en Aceptar, el SPSS muestra la matriz de correlaciones entre las tres variables: ~escriptiveStatistics Dia 1 Dla 2 Dia 3

. . Mean .Std.Devialion 5.8900 1.4255 6.3900 1.3404 6.7400 1.5756

N

1o 10 1O

Correlations

Sum of Squares and

.

Covariance

N

1o

10

10

'. Corielation is significant at the 0.01 leve! (2-tailed). Además de los coeficientes de correlación de Pearson (r,. ) para cada combinación de las variables incluidas, la tabla incluye el n'ivel crítico que permite tomar una decisión respecto a cada hipótesis nula : H, : p,, = 0.000. La última fila de la tabla contiene el número de casos (10). Correlación en Gráficos: La correlación lineales permiten evaluar la existencia de relaciones lineales entre variables. Sin necesidad de calcular ningún estadístico, es posibleelaborar un gráfico de dispersión que informe sobre la posibilidad de que se dé este tipo de relación. Por ejemplo, mediante el prgcedimiento: Gráficos > Dispersión >Simples es posible elaborar el siguiente gráfico de dispersión de lasvariables numero de horas trabajadas durante los D i a l y Dia2.

Dfa 2

Cada punto del gráfico se corresponde con las puntuaciones de un sujeto en ambas variables. El gráfico sugiere que existe una relación lineal directa (o positiva) entre ambas, de modo que los sujetos que trabajan más el primerv-díaitambiénlo hacen el segundo día. Para comprobar si esta relación es estadísticamente significativa se utilizan los procedimientos Correlaciones.

+ ,

,C%,

i

1

Análisis: Regresión, ~&lineal, Clasificar, Reducción de datos y Escalas

ibx-17

m

., . ..: Estadistica con SPSS 16

Análisis: Regresión, Loglineal, Clasificar, Reducción de datos y Escalas El menú analizar es el más importante en el SPSS. Analizar: se centra en los componentes estadístico! básicos de SPSS. Es un capitulo eminentemente práctico donde se presentan numerosas técnica! estadísticas básicas y se discutirán situaciones en las que son aplicables cada una de ellas, las hipótesi! previas necesarias para cada una de ellas y cómo realizar e interpretar los resultados. Las potentes técnicas analíticas de SPSS le ayudan a tomar las decisiones más adecuadas para hacer crece su organización. La amplia gama de técnicas estadísticas permite ir más de las estadísticas descriptivas las filas y columnas. SPSS proporciona procedimientos que permiten resolver sus problemas de negocic e investigación.

Regresión: El análisis de regresión es una técnica estadística que se utiliza para estudiar la relación entre variable: Los principales procedimientos de la herramienta regresión son: e+-

fi kmear... &ve ~ s t íion... í

'%!P

Patiiai Lea& Squares...

!LO, BinarlLogistic... fi, NuiiinomialLogistic... , & Orbinal...

$8,proba... ,,,S Nonlinear... '$S

j

.c.

Weighi Esfimath... z-~ag~ e art sqmm...

...

Qpiimal Scaling

Lineal: Estima los coeficientes de la ecuación lineal, con una o más variables independientes, que mejor predig el valor de la variable dependiente. .,*

-

Capitulo 5: Análisis: Regresión, Loglineal, Clasificar, Reducción de Datos y Escalas Estimación curvilinea: Genera estadísticos de estimación curvilínea por regresión y gráficos relacionados para 11 modelos diferentes. Se produce un modelo diferente para cada variable dependiente. También se pueden guardar valores pronosticados, residuos e intervalos pronosticados como nuevas variables. Logistica binaria: Es Útil cuando se desea predecir la presencia o auSencia.de una característica o resultado según los valores de un conjunto de variables predictoras. Es similar a un modelo de regresión lineal pero está adaptado para modelos en los que la variable dependiente es dicotómica. Los coeficientes pueden utilizarse para estimar la razón de las ventajas (odds ratio) de cada variable independiente del modelo. La regresión logística se puede aplicar a un rango más amplio de situaciones de investigación que el análisis discriminante. Se pueden estimar modelos utilizando la entrada en bloque de las variables o cualquiera de los siguientes métodos por pasos. - Condicional hacia adelante. - LR hacia adelante. - Wald hacia adelante. - Condicional hacia atrás. - LR hacia atrás. - Wald hacia atrás. Logistica multinomial: Resulta útil si se desea clasificar a los sujetos según los valores de un conjunto de variables predictoras. Este tipo de regresión es similar a la regresión logística, pero más general, ya que la variable dependiente no está restringida a dos categorías. Se ajusta un modelo logit multinomial para el modelo factorial completo o para un modelo especificado por el usuario. La estimación de los parámetros se realiza a .través de un algoritmo iterativo de máxima verosimilitud. Ordinal: Permite dar forma a la dependencia de una respuesta ordinal politómica sobre un conjunto de predictores, que pueden ser factores o covariables. El diseño de la regresión ordinal se basa en la metodología de McCullagh y en la sintaxis se hace referencia al procedimiento como PLUM. Probit: Mide la relación entre la intensidad de un estimulo y la proporción de casos que presentan una cierta respuesta a dicho estimulo. Es útil para las situaciones en las que se dispone de una respuesta dicotómica que se piensa puede estar influenciada o causada por los niveles de alguna o algunas variables independientes, y es particularmente adecuada para datos experimentales. Este procedimiento permite estimar la intensidad necesaria para que un estimulo llegue a inducir una determinada proporción de respuestas, como la dosis efectiva para la mediana. No lineal: Sirve para encontrar un modelo no lineal para la relación entre la variable dependiente y un conjunto de variables independientes. A diferencia de la regresión lineal tradicional, que está restringida a la estimación de modelos lineales, la regresión no lineal puede estimar modelos con relaciones arbitrarias entre lasvariables independientes y la dependiente. Esto se lleva a cabo usando algoritrnos de estimación iterativos. Este procedimiento no es necesario para modelos polinómicos simples que se pueden estimar usando métodos tradicionales como la Regresión lineal.

Estadistica con SPSS 16 Estimación ponderada:

Los modelos de regresión lineal típicos asumen que la varianza es constante en la población objei de estudio. Cuando éste no es el caso (por ejemplo cuando los casos con puntuaciones mayores E un atributo muestran más variabilidad que los casos con puntuaciones menores en ese atributo), regresión lineal mediante mínimos cuadrados ordinarios (MCO, OLS) deja de proporcionar estimacioni óptimas para el modelo. Si las diferencias de variabilidad se pueden pronosticar a partir de otra variabl~ el procedimiento Estimación ponderada permite calcular los coeficientes de un modelo de regresik lineal mediante mínimos cuadrados ponderados (MCP, WLS), de forma que se les dé mayor ponderacit a las observaciones más precisas (es decir, aquéllas con menos variabilidad) al determinar los coeficienti de regresión. El procedimiento Estimación ponderada contrasta un rango de transformaciones c ponderación e indica cuál se ajustará mejor a los datos. Mínimos cuadrados en dos fases: Los modelos de regresión lineal típica asumen que los errores de la variable dependiente no esti correlacionados con la variable o variables independientes. Cuando éste no es el caso (por ejempl cuando las relaciones entre las variables son bidireccionales), la regresión lineal mediante mínimc cuadrados ordinarios (OLS) deja de proporcionar estimaciones óptimas del modelo.

La regresión por mínimos cuadrados en dos fases utiliza variables instrumentales que no est€ correlacionadas con los términos de error para calcular los valores estimados de los predictorc problemáticos (en la primera fase ) y después utiliza dichos valores calculados para estimar un mode de regresión lineal para la variable dependiente (la segunda fase). Dado que los valores calculados r basan en variables que no están correlacionadas con los errores, los resultados del modelo en dos fasc son óptimos. Escalamiento óptimo: Cuantifica los datos categóricos mediante la asignación devalores numéricos a lascategorías, obteniéndo! una ecuación de regresión lineal óptima para las variables transformadas. El análisis de regresión line ordinario implica minimizar las diferencias de la suma de los cuadrados entre una variable de respuer (la dependiente) y una combinación ponderada de las variables predictoras (las independientes). L; variables son normalmente cuantitativas, con los datos categóricos (nominales) recodificados corr variables binarias o de contraste. Como resultado, las variables categóricas sirven para separar grupc de casos y la técnica estima conjuntos separados de parámetros para cada grupo. Los coeficientes estimados reflejan cómo los cambios en los predictores afectan a la respuest El pronóstico de la respuesta es posible para cualquier combinación de los valores predictores. Ur aproximación alternativa incluye la regresión de la respuesta respecto a los propios valores predictorc categóricos. Como consefüencia, se estima un coeficiente para cada variable. Sin embargo, pa las variables categóricas, los valores categóricos son arbitrarios. La codificación de las categorías c diferentes maneras proporciona diferentes coeficientes, dificultando las comparaciones entre los análic de las mismas variables. CATREG (regresión categórica mediante ek~alamientoóptimo) amplía la aproximación típica median un escalamiento de las variables nominales, ordinales y numéricas simultáneamente.

El procedimiento cuantifica las variables categóricas de manera que las cuantificaciones reflejen l. características de las categorías originales. Además, trata a las variables categóricas cuantificadas con si fueran variables numéricas. La utilización de transformaciones no lineales permite a las variables s analizadas en varios niveles para encontrar el modelo que más se ajusta.

Estadistica con SPSS 16

.# PESO (Y) I ~ e c o l

2 un,

1 l

. varlame Lrirerio: de ordenadas (Y)

. a - .

I I -

Y

i Labd casas W.

Variable ~redictora/ eje de abscisas (X)

I

l

Con esta definición se obtiene el siguiente diagrama de dispersión simple en el visor de resultados:

EDAD (X)

Como se observa, este diagrama. Su forma indica que los puntos en el diagrama no están perfectamente alineados pero se acercan a una hipotética línea recta. Ecuación de regresión:

Podrían trazarse diferentes rectas para realizar pronósticos de una variable a partir de la otra (por ejemplo de Y a partir de X en una regresión de Y sobre X). Las rectas de regresión tienen una fórmula muy simple:

Y'¡= Ayx + ByxX,

El objetivo es encontrar aquella recta que minimice la distancia entre lo encontrado (Y) y lo pronosticadc (Y'). Es decir, que minimice la expresión:

n Para ello calculamos los coeficientes del modelo mediante:

Capitulo 5: Análisis: Regresión, Loglineal, Clasificar, Reducción de Datos y Escalas

c

. :,.

Ahora veamos cómo se procede en el SPSS para calcular dichos coeficientes, obtener la recta de regresión y valorar la bondad del modelo. Se selecciona el menú Analimr -> Regresión -> Lineal: como se observa en la figura siguiente.

k Palllal L*

CLFl(lr6S..

,E sswy Logistk.. 5, ~

.R

~ I n lLc+k a I

...

or~~...

iII, ~ - ~ i s Lmst g e SCWWUS... M m a i Scnü-g."

El cuadro de diálogo correspondiente al procedimiento Regresión lineal aparece en la figura siguiente.

Como en otros cuadros de diálogo del SPSS, lo primero es seleccionar las variables. En este caso hay que distinguir entre "Dependiente" e "Independiente" (o independientes si se trata de una regresión múltiple). Dentro de este menú hay otras opciones. Por el momento, la que nos interesa es la que se encuentra en el botón 'Estadisticos', cuyo cuadro de diálogo aparece en la figura.

Estadistica con SPSS 16 Desde aquí podemos solicitar que se ofrezcan las estimaciones de la pendiente y el origen de la recta de regresión (según el criterio de mínimos cuadrados), la matriz de covarianzas para las variables, el ajuste del modelo (coeficiente de Pearson al cuadrado o coeficiente de determinación) y los estadísticos descriptivos (media y varianza): Otra opción relevante del menú regresión lineal es la de "Guardar". Desde su correspondiente cuadro de diálogo es posible indicar que se guarden los valores pronosticados por el modelo (las Yi) y los residuos (las Yi - Yi) en el editor de datos:

Seleccionar si se desea guardar los valores pronosticados por el modelo (las Y'i) para cada uno de los sujetos.

; '

Seleccionar si se desea guardar lo no explicado por el modelo (las Yi-Y'i) "los residuos" para cada uno de los sujetos.

/

Wu*ed

USE.of mean

/ /1 mdions

OW*~& ODeWed

O or@eta(s) Sianda&zed DfBsta(s) D!FR

'

PredidíonI~itennils Mean i

SiandardEzedDfFn

q[ndiwdual

Qnitience lrrtervai:

: rcoeffícient

arlance railo

951

%

statislics

1

Veamos cuál es el resultado para el ejemplo. Si indicamos todas estas instrucciones, el resultado que ofrece el SPSS es el siguiente (nótese que se ofrecen muchas tablas de resultados. Aquí explicaremos sólo las más importantes.

Regression

Descrlptlve Statistlcs

PESO (Y) EDAD (X)

Mean 63.4000 46.6000

Std. w

. .

o n 6.6558 12.3612

N

Correlations

Sig. (1-tailed)

PESO (Y) EDAD (X) PESO (Y) EDAD (X)

.O10

Variables ~ n t e r e d l ~ e m o v e a

a. Al1 requested variables entered. b. Dependen! Variable: PESO (Y)

5 5

Capitulo 5: Análisis: Regresión, Loglineal, Clasificar, Reducción de Datos y Escalas Model Surnrnary

I coeficiente de determinación, r2XY o la proporción de varianza en común entre X e Y.

-

ANO& Surn d 1

Regression Residual Total

155.008 22.192 177.200

1 3 4

155.008 7.397

20.954

Sia. ,020.

a. Prediciors: (Conslanl). EDAD (X) b. Dependen1Variable: PESO (Y)

a. DependentVariable: PESO (Y)

En la Columna B. Los coeficientes o y b del modelo pronosticado en directas se ven en esta columna: siendo o = 39,932 y b = 0,504. Luego: Y' 39.932 + 0,504 X En la columna Beta. Aparece el modelo en típicas: q.=,r Zx (en el ejemplo: Z., = 0.504 Z,) Como se observa, el SPSS ofrece muchas tablas de datos como resultado de la regresión. Por el momento solamente nos fijaremos en dos: La primera se refiere a los coeficientes del modelo y la segunda a su bondad. En cuanto a la primera, se toman los coeficientes no estandarizados. En este caso el mejor modelo para pronosticar Yi a partir de Xi es V i = 39.932 + 0,504 Xi

Bondad de ajuste del modelo: Además de la fórmula de la recta de regresión, resulta necesario disponer de información sobre el grado en que el modelo se ajusta a los datos observados (nube de puntos). Una primera aproximación es la interpretación gráfica del problema. Para elaborar la gráfica del ajuste de la recta a los datos observados se pulsa el menú Gráficos -> lnteractivos -> Diagramas de dispersión. Luego el cuadro de diálogo de Diagramas de dispersión interactivos es el siguiente.

Estadistica con SPSS 16 Lo primero es definir la variable del criterio (en el eje de ordenadas) y la variable predictora (en el eje de abscisas) desde la solapa "Asignar variables". A continuación se selecciona el método "regresión" desde la solapa "Ajuste"(Fit). El cuadro de diálogo desde el que se hacen estas selecciones tiene el siguiente aspecto: A s ~ V s r r s l ? l a, F t

;

Spikes 1 Ttles

i

--- '

Opiions

-

4

.

-

.

-

A

I

&",d.&

rFit lmas fw

I

gráfico obtenido es el siguiente:

EDAD (X)

Como se observa, los puntos no se alejan bastante de la recta, luego el ajuste es aceptable. Además de la interpretación gráfica del problema, la forma de cuantificar la bondad del modelo es mediante el coeficiente de determinación, r2, Se trata de una medida estandarizada que toma valores entre O y 1 y cuya interpretación es muy sencilla: representa la proporción de varianza explicada de la variable del criterio a partir de la predictora. En nuestro ejemplo, r2, = 0,875 por lo que el modelo S1 es adecuado para hacer pronósticos de Y a partir de X. La bondad del modelo también puede valorarse a partir del análisis de los errores en los pronósticos, frecuentemente llamados residuos (Yi - Y'i). Nótese que ejecutando las órdenes indicadas en el anterior apartado han resultado dos nuevas variables en el editor de datos (la variable 'pre-1' que se corresponde con las Y'i y lleva la etiqueta 'Unstandardized predicted value' y la variable 'res-1' que se refiere a las K - Y'i y lleva la etiqueta 'Unstandardized residual').

Capitulo 5: Análisis: Regresión, Loglineal, Clasificar, Reducción de Datos y Escalas Teniendo los datos para Yi, Y'i e (Yi -Y'¡) podemos evaluar la bondad del modelo a partir de la descomposición de la varianza del criterio (S2, = S2y,+ SZW).Para ello entramos en el menú Analizar -> Estadísticosdescriptivos -> Descriptivos: Opciones e indicamos en el cuadro de diálogo que se calcule la varianza para estas tres variables (Y, pre-1 y res-1). Los resultados obtenidos en el visor son los siguientes: Descriptive Statistlcs

PESO (Y) Predicted Value UnstandardizedResidual Valid N (listwise)

5.548

Como se comprueba, la varianza del criterio (S2, = 44.3) se descompone en la varianza de los pronósticos (S2,. = 38.752) y la de los errores (S2,.= 5.548). Veamos ahora un ejemplo a partir de los datos de la encuesta. Supóngase que queremos predecir la variable "Venta de verduras (V)" a partir de la variable "Venta de abarrotes (A) ". Para ello construimos la recta de regresión Vi = a + b A La definición del modelo en el SPSS es la siguiente.

Los resultados obtenidos para el modelo planteado son los siguientes. Variables Entered/Rernove&

a. All requested variables entered. b. Dependent Variable: Venia de Verdi Model Surnrnary Adjusted

a. Predictors: (Constant). Venta de Abarrotes

a. Predictors: (Constant). Venta de Abarrotes b. Dependen1Variable: Venta de Verduras

Std. Error of

Estadistica con SPSS 16

a. De~endentVariable: Venta de Verduras

El modelo resultante es: Vi = 28.599 - 0.465Ai. Como se observa, el coeficiente de determinación ( al cuadrado) es 0,035 por lo que el modelo no se adecuado para explicar la relación entre la variabl "Venta de Verduras" y la variable "Venta de Abarrotes". Es decir, la variable "Venta de Abarrotes" N tiene una capacidad predictiva para explicar la variable del criterio (Venta de Verduras).

El gráfico obtenido definiendo las opciones del diagrama de dispersión interactivo de la figura es c siguiente: A

... .. -. .. . - ~-~ . .

~

A

Linear Regression

!

-- - - . -. --.. -*._ A

A A A

A

1A

A

A

1\

. . --. ,

Venta de Verduras = 28 &O + $47 ' abamle

/-

Venta de Abarrotes

Análisis de Regresión Lineal Múltiple Una alternativa a esta situación de poco ajuste es incluir una variable predictora adicional (o más d una) y observar si su inclusión produce algún cambio en R cuadrado. Si consideramos dos variablr predictoras estamos planteando el siguiente modelo: Y'i = a + b,X,,

+ b,X,

Retomemos el ejemplo de la "Venta de Abarrotes" y "Venta de Verduras", considerando ahora la "Ven de Bebidas (B)" como segunda variable predictora. El modelo planteado es: V,=a+b,A,.+b,B,

La primera aproximación al problema puede hacerse a partir del gráfico de dispersión. En este caa puede elaborarse el gráfico simple para observar la relación entre la edad y el peso y también un gráfia 3-D para observar la relación entre las dos predict0ras.y el criterio. El resultado obtenido es:

Capitulo 5: Análisis: Regresión, Loglineal, Clasificar, Reducción de Datos y Escalas

Venta de Abarrotes

Venta de

Para obtener los coeficientes del modelo y valorar el ajuste del modelo se selecciona el menú Analizar ->Regresión -> Lineal. Lo primero es trasladar las variables "Venta de Abarrotes" y la "Venta de Bebidas a la casilla Independientes y la variable "Venta de Verduras", a la casilla Dependiente. Los resultados encontrados son muy similares a los de la regresión simple, aunque ahora hay un coeficiente más que interpretar: Variables ~ n t e r e d l ~ e m o v e &

a. All requested variables entered. Dependent Variable Venta de Verdi Model Summary

M e 1 1

R ,226'

Adjusted RSauare -.O19

R SpUare .O51

Std. Error of the F m 5.7761

a. Predictors: (Constant).Venta de Bebidas. Venta de Abarrotes

.

a. Predictors: (Constant), Venta de Bebidas Ventade Abarmtes b. Dependent Variable: Venta de Verduras

Estadistica con CPCC 16

a. Dependent Variable: Venta de Verduras

Como se observa, el modelo resultante Vi = 22.926 - 0.354 A ¡. + 0.439 B no aporta casi nada a Ii explicación de la variable del criterio. El modelo simple explicaba un 3,s % de varianza de la variable de criterio y el modelo múltiple también explica el 5,l %.

Ejercicio Práctico No2 El presente ejercicio se trabaja con la siguiente información. Los datos aparecen recopilados en las variables Díal, Día2, Día3 que indican él número de hora trabajadas en los tres días. Además se han recopilado la variable Sexo que toma valores O para mujere y 1 para hombres. Edad, 1para Adolescentes, 2 para Jóvenes y 3 para Adultos.

Finalmente se incluye tres datos relacionados con las terapias que a recibido el sujeto. Todas ella toman 1, si el sujeto ha recibido la terapia y O en caso contrario las variables son Estrés, Ansiedad 1 Fobia.

Regresia,, El procedimiento Analizar > Regresión lineal permite obtener la regresión lineal simple y múltiple. Pc ejemplo, para estimar los parámetros del modelo: Día2#= a + b Día3¡ +El Se indica:

Capítulo 5: Análisis: Regresión, Loglineal, Clasificar, Reducción de Datos y Escalas

Los resultados muestran el coeficiente de determinación (R cuadrado) en la tabla Resumen del modelo. Se observa que el modelo estimado para dia 2 explica el 89.50% de la varianza. La tabla de regresión en formato ANOVA muestra la descomposición de la suma de cuadrados total en la parte debida a la regresión y el error: Model Summary

del

1

R .946a

1

R Sauare ,895

1

Adjusied R Souare ,882

1

Std. Error of the -F .4602

a. Predictors: (Conslant), Día 3

-lbodel

Regression Residual Total

Sum of Sauares 14.475 1.694 16.169

df

1 8 9

MeaaSouare 14.475 ,212

F 68.349

Sio. ,0008

a. Predictors: (Constant). Dia 3 b. Dependent Variable: Dia 2

En el ejemplo, el nivel crítico asociado a la F del ANOVA permite rechazar la hipótesis nula de que no existe relación lineal entre las variables (H, : P = 0). A continuación aparecen los valores estimados para los parámetros:

La tabla de coeficientes muestra los términos de la ecuación de regresión. El término denominado Constante es el origen A de la ecuación (estimador de a). La pendiente B (estimador de P) aparece en la fila de la tabla indicada por día 3 Los valores de'a y b se muestran en la primera columna (Día2 = 0.965 + 0.805 Día3), a continuación el error típico de estimación y los valores de a y b en caso de que se utilicen puntuaciones típicas. Por último, aparece el valor del estadístico "t" de contraste de las hipótesis nulas P = O y a = O. La última columna contiene el nivel crítico.

Estadística con SPSS 16

Ejercicios Propuestos: 1. ¿Existe relación entre el promedio de horas trabajas durante las tres primeras días y las horas dormidas un mes después de la terapia?

2. Calcular la regresión de la variable horas trabajadas transcurrido un mes después de la terapia sobre la variable horas trabajadas durante la tercera noche.

a) ¿Cuál es la proporción de varianza en común entre las variables? b) Representa gráficamente la relación entre variables

L

Capitulo 5: Análisis: Regresión, Loglineal, Clasificar, Reducción de Datos y Escalas

Loglineal: El Modelo Loglineal, permite resolver el problema que se enfrenta cotidianamente el investigación en el análisis de Variables Cualitativas (No Numéricas). Debido a que las Variables Cualitativas no presentan un comportamiento lineal (ni reducible a lineal); al aplicar las técnicas convencionales de regresión, pueden generar modelos irreales o simplemente no convergen a ningún valor. Regresión Loglineal, es un método estadístico cuyo objetivo consiste en estudiar la "Clasificación" de las Variables ~ualitatilas.Es esencialmente un Modelo de Regresión Lineal Múltiple entre las Variables Cualitativas y el Logaritmo Neperiano de la Frecuencia de los datos (referenciales), de la forma:

El Paquete Estadístico SPSS, permite mediante un algoritmo, determinar el Modelo Saturado y el Modelo Jerárquico mas adecuado. De esta manera obtenemos un Modelo cuya Variable de Respuesta sea el Logaritmo Neperiano de la Frecuencia ("Conteo") de los datos (referenciales) y las Variables de Diseño aquellas variables cualitativas seleccionadas para la determinación de Valor de un Inmueble. Las principales funciones se definen a continuación: General: Analiza las frecuencias de las observaciones incluidas en cada categoría de la clasificación cruzada de una tabla de contingencia. Cada una de las clasificaciones cruzadas de la tabla constituye una casilla y cada variable categórica se denomina factor.

La variable dependiente es el número de casos (la frecuencia) en una casilla de la tabla de contingencia, y las variables explicativas son los factores y las covariables. Este procedimiento estima los parámetros de máxima verosimilitud de modelos loglineales jerárquicos y no jerárquicos utilizando el método de Newton-Raphson. Es posible analizar una distribución multinomial o de Poisson. Se pueden seleccionar hasta 10 factores para definir las casillas de una tabla. Una variable de estructura de casilla permite definir ceros estructurales para tablas incompletas, incluir en el modelo un término de desplazamiento, ajustar un modelo log-tasa o implementarel método de corrección de las tablas marginales. Las variables de contraste permiten el cálculo del logaritmo de la razón de ventajas generalizadas (GLOR). SPSS muestra automáticamente información sobre el modelo y estadísticos de bondad de ajuste. Además es posible mostrar una variedad de estadísticos y gráficos, o guardar los valores pronosticados y los residuos en el archivo de datos de trabajo. Logit: Analiza la relación entre variables dependientes (o de respuesta) y variables independientes (o explicativas). Las variables dependientes siempre son categóricas, mientras que las variables independientes pueden ser categóricas (factores). Otras variables independientes, las covariables de casilla, pueden ser continuas pero no se aplican en forma de caso por caso. A una casilla dada se le áplica la media ponderada de la covariable para los casos de esa casilla.

El logaritmo de las ventajas de las variables dependientes se expresa como una combinación lineal de parámetros. Se supone automáticamente una distribución multinomial; estos modelos se denorriinan a veces modelos logit multinomiales. Este procedimiento estima los parámetros de los modelos loglineales logit utilizando el algoritmo de Newton-Raphson. Selección de modelo: Analiza tablas de contingencia de varios factores. Ajusta modelos loglineales jerárquicos a las tablas de contingencia multidimensionales utilizando un algoritmo de ajuste proporcional. Ayuda a encontrar cuáles de las variables categóricas están asociadas. Para construir los modelos se encuentran disponibles métodos de entrada forzada y de eliminación hacia atrás. Para los modelos saturados, es posible solicitar estimaciones de los parámetros y pruebas de asociación parcial. Un modelo saturado añade 0,sa todas las casillas.

.:

. Loglineal. Dentro del módulo Loglineal, se encuentran los Submenús: General ,Logit y Model Selection

...

...

...

Si seleccionamos las Variables Categóricas Edad, Estado Civil, Grado de instrucción, Turno: y utilizando el procedimiento Analyze-> Loglinea1.-> Model Selection se tiene el cuadro de dialogo siguiente:

...

Capítulo 5: Análisis: Regresión, Loglineal, Clasificar, Reducción de Datos y Escalas

,

m

2,Estado Cwi [ M ] &turno

&'

[turno] Venia de Artkubs de As Verda de Verduras [vsrd

&'

V H ~de Aúarrdes [absr

m e r OICMS

&' v m a de m a s IDeW &' VEAR. ml puiodc

o

@ MONTH,pernd 12 -

1

Mlodal Building

@Use bsdmad eRham:

W~stcp~

i

De la lista de variables del cuadro de la izquierda se selecciona las variables edad, Grado de Instrucción Estado Civil, Turno. Luego se pasa al cuadro del lado derecho como se observa en el siguiente grafico.

insirucc(7 7)

I Model Bulliling

BcdmiSiy lu ranoMt

l

.

1

Enseguida presionar definir rango (Define Range...) donde tiene que escribir el rango mínimo y rangc máximo para cada variable por ejemplo Edad tiene rango mínimo igual Cero y rango máximo igual Dos Grado de instrucción tiene rango mínimo igual 1 y rango máximo igual 4,, Estado Civil tiene rango mínimc igual 1 y rango máximo igual 4 y Turno tiene rango mínimo igual O y rango máximo igual 2. Como sc muestra en el grafico siguiente.

Estadistica con SPSS 16 En el cuadro de definir rangos presionar el botón continuar y luego aceptar (OK), se obtiene los siguientes resultados. * * * * * * * * DATA

H I E R A R C H I C A L

L O G

L I N E A R

* * * * * * * *

Information 30 O O 30

unweighted cases accepted. cases rejected because of out-of-range factor values. cases rejected because of missing data. weighted cases will be used in the analysis.

FACTOR Information Factor Leve1 EDAD 3 INSTRUCC 4 CIVIL 4 3 TURNO

* * * * * * * *

Label Edad Grado de Instrucción Estado Civil turno

H I E R A R C H I C A L

L O G

L I N E A R

* * * * * * * *

DESIGN 1 has generating class

. 5 0 0 has been added to al1 observed cells. Note: For saturated models This value may be changed by using the CRITERIA = DELTA subcommand.

The Iterative Proportional Fit algorithm converged at iteration 1. The maximum difference between observed and fitted marginal totals is and the convergence criterion is .250

.O00

Observed, Expected Frequencies and Residuals. Factor EDAD INSTRUCC CIVIL TURNO TURNO TURNO CIVIL TURNO TURNO TURNO CIVIL TURNO TURNO TURNO CIVIL TURNO TURNO TURNO INSTRUCC CIVIL TURNO . 1 1 {AFREQ } {LIHIT(n)} {DFREQ [/UISSING-INCLUDE] [/BARCHART-[HIll(n)][UAX(n)][{FREQ( {PERCE [/PIECHART-[UIN(n)][#AX(n)][{FREQ {PERCE [{HISSING )11 {NONHISSING) [/HISTOGRIH=[HIN(n)][HAX(n)][{FREQ IPERC

r {I~ONORUAL,i r I N C R E H ~ H ~

{NORMAL ) [/HTILW-n] [/PEKENTILES=value list] [/STATISTICS-[DEFAULT][HEAII][STDDE [UINIMUH][UAXIHUU][RA [SEHEAN][VARIAWCE][SK [HODE][KURTOSIS][SEKU [ALL][NONE]] [/GROUPED-varlist [ { ( y l d t ? ) ,,

.

El Botón Ejecutar Programa: Al presionar este botón podemos ejecutar los comandos especificados en la ventaba de sintaxis. Para ejecutar un comando especifico basta con posicionar el curos delante del nombre del comando. ' S i por el contrario, deseamos ejecutar más de un comando tenemos que seleccionar, sombreando las zonas de sintaxis simplemente arrastrando el mouse manteniendo presionada la tecla izquierda hasta incluir el punto final de los diferentes comandos del programa.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF