Manual1 Sas

December 21, 2016 | Author: lcoaguilap | Category: N/A
Share Embed Donate


Short Description

xx...

Description

Software de Análisis Estadístico SAS

Jessica Paola Vargas Castro1 Luis Felipe Patiño Oquendo2 Cindy Carolina Lugo Rozo3 Viviana Oquendo julio de 2013 Resumen: El uso de los software econométricos en la última década han trascendido para los profesionales como una herramienta útil para el análisis estadístico y económico, así, tareas que tomaban horas se trabajan en segundos y el profesional en su disciplina puede emitir un análisis más rápidamente y con una clara visión de lo que ocurre con los datos que trabaja. Este documento pretende guiar en el manejo del software SAS (Statistical Analysis Software) tanto en la parte técnica como en la parte aplicativa. Palabras Clave: Software, econometría, series de tiempo, análisis gráfico, pronóstico, datos panel, regresión. JEL: Statistical Analysis Software SAS Abstract: The use of econometric software in the last decade have transcended for professionals as a useful tool for statistical analysis and economic, as well, tasks that took hours are worked in seconds and the professional in their 1 Estudiante

de economía de la Facultad de Ciencias Económicas de la Universidad Nacional de Colombia, y monitor junior del grupo capacitaciones de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias Económicas durante. Correo Electrónico: [email protected] 2 Estudiante de ingeniería eléctrica de la Facultad de Ingeniería de la Universidad Nacional de Colombia, y monitor junior del grupo capacitaciones de la unidad de informática y comunicaciones de la Facultad de Ciencias Económicas durante. Correo Electrónico: [email protected] 3 Estudiante de economía de la Facultad de Ciencias Económicas de la Universidad Nacional de Colombia, y monitor junior del grupo mejor gestión de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias Económicas durante. Correo Electrónico: [email protected]

INV- Software de Análisis Estadístico SAS /2013-I discipline can issue further analysis quickly and a clear vision of what happens to the data that works. This document is intended to guide the management of SAS software (Statistic Analysis Software) in both the technical and on the applicative. Keywords: Software, econometrics, time series, graphic analysis, quality control, forecast

2

INV- Software de Análisis Estadístico SAS /2013-I

Estudiantes Auxiliares: Ahumada Avendaño Fredy Esteban Alvarado Castillo Paola Alejandra Alzate Gaitán Paola Andrea Andrade Martínez David Ricardo Calderón Espitia Walter Helberth Cano Díaz Alberto Ávila Ibáñez Diego Fernando Enciso Castaño Julián David González Mayorga Cesar Felipe Güisa Díaz Carlos Eduardo Hernández Carvajal Miguel Ángel Hurtado Casas Andrés Felipe Leyva Díaz Daniel Felipe Lugo Rozo Cindy Carolina Malangón Carvajal Laura Juliana Martínez Cortes Nicolás Miranda Hernández Nícolas Montes Parra Mayerli Andrea Moreno Urián Germán Yesid Oquendo Patiño Viviana María Patiño Oquendo Luis Felipe Pineda Estupiñan Andrés Javier Rojas Martín Daniel Francisco Rubiano Rojas Mario Andrés Vargas Castro Jessica Paola

Director Unidad Informática: Henry Martínez Sarmiento Tutor Investigación: Viviana María Patiño Oquendo Coordinadores: Jasmin Guerra Cárdenas Juan Carlos Tarapuez Roa Coordinador Servicios Web: John Jairo Vargas Analista de Infraestructura y Comunicaciones: Diego Alejandro Jiménez Arévalo Analista de Sistemas de Información: Víctor Hugo Ramos Ramos

Este documento es resultado de un trabajo conjunto y coordinado de los integrantes de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias Económicas de la Universidad Nacional de Colombia.

Esta obra está bajo una licencia reconocimiento no comercial 2.5 Colombia de CreativeCommons. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/2.5/co/ o envíe una carta a CreativeCommons, 171second street, suite 30 San Francisco, California 94105, USA.

3

INV- Software de Análisis Estadístico SAS /2013-I Software de Análisis Estadístico SAS

1. 2.

Contenido

Introducción............................................................................................................... 6 2.1.

Características generales del software .............................................................. 6

2.1.1. Requerimientos del sistema para Linux(Official Page, Statistical Analysis Software SAS, 2013) .................................................................................................. 6 2.1.2. Requerimientos del sistema para Windows(Official Page, Statistical Analysis Software SAS, 2013) ................................................................................... 6 2.1.3.

Comparación del software con otros software estadísticos ........................ 7

2.1.4. Listado de funciones del programa SAS(Universidad Complutense de Madrid, 2013) ............................................................................................................ 7 2.1.5. 2.2.

Aplicabilidad de SAS ................................................................................... 8

Lenguaje de programación ................................................................................. 8

2.2.1.

Acerca del lenguaje de programación(N/A, 2013) ....................................... 8

2.2.2. Uso del software según la página oficial de SAS(Official Page, Statistical Analysis Software, 2013) ........................................................................................... 8 2.3.

Manual SAS ....................................................................................................... 9

2.3.1.

Crear una librería ....................................................................................... 9

2.3.2.

Leer data sets de SAS ............................................................................... 13

2.3.3.

Leer archivos de bases de datos para pc ................................................... 15

2.3.4.

Presentar programas de sas para hosts remotos...................................... 18

2.3.5.

Crear y definir variables ........................................................................... 21

2.3.6.

Usar declaraciones condicionales ............................................................. 21

2.3.7.

Subconjunto de datos ................................................................................ 22

2.3.8.

Trabajo con Fechas y Horas de SAS ......................................................... 23

2.3.9.

Impresión de Datos ................................................................................... 24

2.3.10.

Conteo de datos ...................................................................................... 24

2.3.11.

Tabular datos ......................................................................................... 25

2.3.12.

Consulta de datos .................................................................................. 26

2.3.13.

Unir tablas ............................................................................................. 27

2.3.14.

Crear gráficos......................................................................................... 28

2.3.15.

Crear gráficos (2) ................................................................................... 29 4

INV- Software de Análisis Estadístico SAS /2013-I 2.3.16.

Regresión simple y múltiple .................................................................. 31

2.3.17.

ARIMA ................................................................................................... 36

2.3.18.

Datos Panel ............................................................................................ 44

2.3.19.

ODS Graphics Designer......................................................................... 65

2.4.

Clases ............................................................................................................... 71

2.4.1.

Primera Clase............................................................................................ 71

2.4.2.

Segunda clase – Definiciones básicas para la inserción de variables ...... 72

2.4.3.

Tercera Clase – Lógica condicional, fechas y horas, subconjuntos .......... 77

2.4.3.1.

Lógica condicional.................................................................................. 77

2.4.3.2.

Subconjuntos de datos ........................................................................... 81

2.4.3.3.

Fechas y horas con SAS ......................................................................... 83

2.4.3.6.

SAS DATATIME VALUE ...................................................................... 84

2.4.4.

Cuarta clase – Regresión simple............................................................... 86

2.4.5.

Quinta Clase – Regresión multiple ........................................................... 90

2.4.6.

Sexta clase - Modelos ARIMA ................................................................. 103

2.4.7.

Séptima clase – Datos Panel ................................................................... 119

2.4.8.

Octava clase – ODS Graphics Designer.................................................. 140

3.

Conclusiones .......................................................................................................... 155

4.

Referencias ............................................................................................................ 157

5

INV- Software de Análisis Estadístico SAS /2013-I 2.

Introducción

La empresa SAS® crea el Statistical Analysis Software (SAS) principalmente como un método para la organización y control de grandes bases de datos. SAS fue diseñado de manera tal que respondiera a una recolección, transformación, análisis y reporte de datos; de manera adecuada y eficiente para la organización que disponga del software. Sin embargo, pronto el software comenzó a formarse como uno de los paquetes econométricos más poderosos del mercado. Además, el software puede generar muchas soluciones de negocio que permiten soluciones de software a gran escala para áreas como administración, gestión de recursos humanos, gestión financiera, inteligencia de negocios y más. La última versión de SAS fue SAS 9.3 y salió al mercado en diciembre de 2011.

2.1. Características generales del software 2.1.1. Requerimientos del sistema para Linux(Official Page, Statistical Analysis Software SAS, 2013) Sistemas operativos de LINUX: Red Hat Enterprise Linux 4 y 5 SuSE Linux Enterprise Server 9 y 10 Linux x 64 (siempre y cuando sea por la vía de compatibilidad de 32 bits. Para esta versión de SAS, los requerimientos del hardware son: Intel Pentium 4 o superior o Procesadores XeonClass 64 Mb de memoria Soporte de pantalla de mínimo 256 colores

2.1.2. Requerimientos del sistema para Windows(Official Page, Statistical Analysis Software SAS, 2013) SAS 9.1 se puede instalar en prácticamente cualquier sistema operativo de Windows: Windows 7, Windows Vista, Windows XP, Windows 2000, Windows NT Family. Requerimientos mínimos del Hardware

6

INV- Software de Análisis Estadístico SAS /2013-I Intel Pentium II Memoria de 256 Mb Resolución de pantalla de 800 * 600 o superior Acceso a internet

2.1.3. Comparación del software con otros software estadísticos En la siguiente página se muestra unas amplias tablas de comparación de gran cantidad de Software de análisis estadístico: http://en.wikipedia.org/wiki/Comparison_of_statistical_packages Las características de SAS muestran que el software no es Libre y es de licencia propietaria, además de usar una interfaz gráfica CLI/GUI. El software como ya se mencionó trabaja en los sistemas operativos de Linux y Windows, además de UNIX. No trabaja en BSD y en Mac OS fue terminado. En las diferentes tablas también aparecen los programas que utilizan varios métodos ANOVA (ANOVA son los diferentes modelos estadísticos que existen) en el cual SAS maneja todos los métodos: One way, Two Way, MANOVA, GLM, Mixed Model, Post-host, Latin squares. También muestra los diferentes modelos de regresión que existen y los software que los manejan. De nuevo SAS es capaz de aplicar todos los métodos: OLS, WLS, 2SLS, NLLS, Logistic, GLM, LAD, Stepwise, Quantitle, Probit, Cox, Poisson, MLR. La siguiente tabla en la página muestra los software que utilizan diferentes análisis de series temporales. SAS maneja todos: ARIMA, GARCH, Unit root test, Cointegration test, VAR, Multivariable GARCH SAS emplea todos los gráficos y diagramas que manejan los software estadísticos. En estas diferentes tablas se puede concluir que SAS es uno de los programas más completos en el mercado.

2.1.4. Listado de funciones del programa SAS(Universidad Complutense de Madrid, 2013) SAS®Analytics es la marca registrada que maneja la empresa para integrar todo lo que involucra el modelado predictivo y analítico. Entre las funciones del programa SAS encontramos: Las utilidades de entorno gráfico:   

Creación y manipulación de librerías de datos SAS (llamados SAS-FILES) Importación/exportación de datos externos en ficheros ASCII Importación/exportación de datos externos en ficheros en otros formatos, por ejemplo, EXCEL.

7

INV- Software de Análisis Estadístico SAS /2013-I 

Exportación de gráficos a otros formatos.

Para estadística y econometría encontramos:          

Estadística descriptiva simple Regresión y análisis de varianza y covarianza Análisis de datos cualitativos Análisis discriminante Análisis cluster Análisis de supervivencia Scoring (estandarización y construcción de variables) Imputación de datos perdidos Análisis de potencia Cálculo de medidas de distancia

2.1.5. Aplicabilidad de SAS El programa SAS está pensado como un software para el análisis y manejo de datos que busca mejorar la gestión empresarial, por su capacidad de organización y análisis. SAS® desea que los usuarios del software puedan facilitar su proceso de toma de decisiones utilizando modelos predictivos, descriptivos, de simulación y optimización. Con ello se busca llegar a la solución de los problemas cotidianos del entorno económico y fomentar el desarrollo interno de los agentes que usen el software. En esa medida, en la Universidad Nacional, son las carreras afines al entorno económico y en general carreras que trabajan con bases de datos, las que pueden aprovechar las opciones que ofrece SAS; especialmente las carreras de la Facultad de Ciencias Económicas.

2.2. Lenguaje de programación 2.2.1. Acerca del lenguaje de programación(N/A, 2013) El lenguaje de programación que utiliza SAS fue diseñado por el mismo SAS. Su sintaxis está inspirada en la de PL/I (lenguaje propuesto por IBM en 1970), este opera en primera instancia sobre tablas de datos. Estas tablas de datos las puede leer, transformarlas, combinarlas, resumirlas, crear informes, entre otras cosas. El núcleo del lenguaje incluye Pasos data que permiten realizar operaciones sobre las filas de un conjunto de datos, procedimientos de manipulación de datos que permiten ordenar tablas, enlazarlas, etc., un intérprete de SQL, un superlenguaje de macros.

2.2.2. Uso del software según la página oficial de SAS(Official Page, Statistical Analysis Software, 2013)

8

INV- Software de Análisis Estadístico SAS /2013-I Cualquier software informático que pueda descargarse o que de cualquier otra forma esté disponible en esta página Web se encuentra sujeto a una licencia que puede ser la del contrato escrito de licencia suscrito entre usted y SAS o la licencia “click-on” que usted acepta en el momento de descarga o uso. El software al que cualquiera de estas dos licencias le sea de aplicación se encuentra, salvo pacto en contrario, sujeto únicamente a los términos de su contrato de licencia asociado. En cualquier caso, si ni una licencia escrita o una “click-on” están disponibles, el uso que usted haga del software se encontrará sujeto a las siguientes condiciones: 1) No podrá usar, reproducir, grabar, modificar, publicar, comunicar públicamente o distribuir ningún software disponible a través de esta página Web sin el previo consentimiento expreso y por escrito de SAS 2) Se le reconoce una licencia personal, no exclusiva, para usar dicho software sujeto a las restricciones indicadas más arriba 3) Dicho software se encuentra sujeto a todas las Garantías y Limitaciones de responsabilidad que se establecen a continuación 4) Salvo expresamente garantizado en otro lugar, SAS Institute Inc. y sus otorgantes de licencias se reservan todos los derechos, títulos e intereses en relación a dicho software.

2.3. Manual SAS

Como método de autoexploración del software SAS se estableció que a partir del software y su respectivo manual, se irían encontrando las diferentes funciones del programa y con base en estas se realizaría la estructura del curso de acuerdo a los diferentes ítems encontrados y a la experiencia en la unidad sobre estos tipos de software y el mejor procedimiento para dictar un curso libre. A continuación se presenta la primera parte del manual de SAS con los siguientes ítems: o o o o

Crear una Librería Leer data sets de SAS Leer archives de bases de datos para PC Presentar programas de SAS para host remotos.

2.3.1. Crear una librería Antes de iniciar con SAS file, generalmente se debe definir primero una librería de SAS, esto con el fin de mostrarle a SAS donde se encuentra el archivo. Usted ha creado ya una biblioteca SAS interactivamente mediante la ventana de la nueva biblioteca. Otra forma de definir una biblioteca SAS es utilizando una instrucción LIBNAME. Esta declaración LIBNAME permite 4 cosas:

9

INV- Software de Análisis Estadístico SAS /2013-I Identifica una Librería SAS a SAS. Asocia un ‘motor’ con la librería Permite asociar especificaciones con la librería Asigna un libref (nombre de referencia de la librería) a ella misma. A gran ventaja del comando LIBNAME es que puede almacenarla en un programa de SAS, así, se puede referenciar la librería automáticamente cuando se envíe el programa. Una vez que se asigna a la libref, usted puede leer, crear o actualizar archivos en una biblioteca SAS:

libref.filename En el nombre de dos niveles, libref es el nombre de la biblioteca SAS que contiene el archivo y nombre_de_archivo es el nombre del mismo archivo. Un período separa la libref y el nombre de archivo. En el nombre de dos niveles, libref es el nombre de la biblioteca SAS que contiene el archivo y filename es el nombre del mismo archivo. Un período separa la libref y el filename.

Si se tienen las licencias de 1 o más productos de SAS diferentes, es posible crear una librería SAS que referencie relaciones de DBMS database, schema, server, o grupos de tablas y vistas. Método de Point and Click Se puede crear una librería mediante: 1. 2.

Clic en View > Explorer. Clic en File > New.

10

INV- Software de Análisis Estadístico SAS /2013-I 3. En la ventana de New Library, especifique la información para la nueva librería. Si usted quiere sea creada en el comienzo de cualquier sesión de SAS, haga clic en Enable at startup. 4. Clic OK.

EJEMPLO 1 Asignación de un libref a archivos de referencia SAS Suponga que usted quiere definir una librería SAS para referenciar una carpeta en el entorno operativo de Windows que contiene algunos SAS data sets. Luego usted quiere crear un nuevo data set, imprimirlo e imprimir un data set existente en la misma librería. El siguiente programa define la librería Sales y referencia los archivos SAS con esta librería.  Usted puede copiar y enviar este programa en SAS. Sin embargo, es necesario editar el directorio en el estado LIBNAME (está en rojo) para referenciar un directorio existente en su entorno operativo. /*************************************/ /* define SAS library */ /*************************************/ libname sales 'c:\salesdata\sas\2002'; /*************************************/ /* create new data set from raw data */ /*************************************/ data sales.quarter1; length Department $ 7 Site $ 8; input Department Site Quarter Sales; datalines; Parts Sydney 1 4043.97 Parts Atlanta 1 6225.26 Parts Paris 1 3543.97 Repairs Sydney 1 5592.82 Repairs Atlanta 1 9210.21 Repairs Paris 1 8591.98 Tools Sydney 1 1775.74 Tools Atlanta 1 2424.19 Tools Paris 1 5914.25 ; run; /*************************************/ /* print new data set */ /*************************************/ proc print data=sales.quarter1; run; /*************************************/ /* print existing data set */ /*************************************/ proc print data=mylib.productsales; run;

11

INV- Software de Análisis Estadístico SAS /2013-I

EJEMPLO 2 Ahora suponga que usted quiere imprimir también una tabla Oracle y una tabla DB2. El siguiente programa muestra cómo puede especificar declaraciones LIBNAME con los motores de SAS/ACESS y opciones apropiadas. Después de asignar un libref a DBMS, es posible referenciar estas tablas y vistas como SAS data sets, usando los nombres estándar two-level SAS. Mientras usted pueda definir cualquier número de librefs in SAS, usted puede procesar datos desde múltiples recursos DBMS en el mismo programa de SAS. Debido a que esta es una guía rápida para principiantes, no es posible copiar y correr este programa como se muestra. Sin embargo es posible modificarlo para trabajar con tablas DBMS que usted pueda acceder. /*************************************/ /* define SAS library for Oracle */ /*************************************/ libname myorlib oracle user=scott password=tiger path="blunzer:v7" schema=hrdept; /*************************************/ /* define SAS library for DB2 */ /*************************************/ libname mydblib db2 noprompt="user=testuser; password=testpass;database=testdb"; /*************************************/ /* print Oracle table */ /*************************************/ proc print data=myorlib.all_employees; where state='CA'; run; /*************************************/ /* print DB2 table */ /*************************************/ proc print data=mydblib.customers; where state='CA'; run; /*************************************/ /* clear librefs */ /*************************************/ libname myorlib clear; libname mydblib clear;

12

INV- Software de Análisis Estadístico SAS /2013-I

REFERENCIAS Acá puede encontrar más información acerca de crear librerías. Documentación en Help SAS: 1. En SAS, click Help SAS Help and Documentation. 2. Expanda SAS Products Base SAS. 3. Expanda SAS Language Concepts SAS Files Concepts SAS Data Libraries y mire los tópicos de interés 4. Expand SAS Language Dictionary Dictionary of Language Elements Statements y click LIBNAME statement y LIBNAME Statement, SAS/ACCESS. 5. Expanda Using SAS Software in Your Operating Environment, luego en la sección de su entorno operativo. Expanda Using SAS Files y vea los tópicos relacionados con las librerías de SAS Preguntas en el soporte técnico Frequently Asked Questions Programas in SAS help: 1. 2. 3.

2.3.2.

En SAS, click Help SAS Help and Documentation. Expand Learning to Use SAS y click Sample SAS Programs. Clic Base SAS y mire los programas de interés

Leer data sets de SAS

Tal vez quiera crear un nuevo data set desde un data set existente. En Create an run SAS programas, haya visto ejemplos de DATA step que lee existiendo data sets usando una declaración SET. Leyendo un data set en un DATA step es más simple que leyendo los datos en bruto debido a que el trabajo de describir y convertir los datos ya se han hecho. Ahora, cuando usted usa un data sets existente o subsets creados desde SAS data sets, usted puede hacer más eficiente el uso de los recursos del computador que si usara los datos en bruto (raw data) o si está trabajando con data sets largos. Leer menos variables significa que SAS crea un program data vector más pequeño, y leyendo menos observaciones significa que existen menos iteraciones para el DATA step que se crean. Usted puede leer desde uno o más data set, combinar y modificar datos en diferentes maneras, por ejemplo usted puede:  Combinar 2 o más input data sets para crear un output data ser  Fusionar datos desde 2 o más data sets para crear un output data set  Actualizar un archivo master basado en las grabaciones de transacción. En el caso más simple usted lee datos desde un solo SAS data set:

13

INV- Software de Análisis Estadístico SAS /2013-I

Como las principales herramientas para leer, combinar y modificar data sets, usted puede usar cuatro declaraciones: SET, MERGE, MODIFICY y UPDATE. Para procesar los datos y crear un data set de salida, puede usar una programación adicional de declaraciones SAS en el paso DATA. Esta tarea se centra en la lectura de un único conjunto de datos SAS utilizando la sentencia SET.

EJEMPLO Cuando usted lee data sets de SAS, el gran poder del paso de programación DATA está disponible para usted. Los siguientes ejemplos muestran algunos caminos fáciles para usar la declaración SET para leer una existente data set.  Usted puede copiar y enviar estos programas en SAS. En los datos de Mylib.ProductSales fue creado por Work with SAS data sets . Si no se creó, vuelva a la tarea definir la librería y crear un data set antes de cargar estos programas que aparecen a continuación /*************************************/ /* read a data set and subset */ /*************************************/ data canada; set mylib.productsales; if country='CANADA'; run; /*************************************/ /* read a data set, subset, and */ /* create new variables */ /*************************************/

14

INV- Software de Análisis Estadístico SAS /2013-I data canada2; set mylib.productsales; if country='CANADA'; Total_Variance=actual-predict; Forecast=actual*1.15; run; /*************************************/ /* read a subset using direct access */ /*************************************/ data product_sample; do obsnum=1 to 100 by 2; set mylib.productsales point=obsnum; if _error_ then abort; output; end; stop; run;

REFERENCIAS Documentation, publications, and FAQs

 Documentación en SAS help: 1. En SAS, click Help< SAS Help and Documentation. 2. Expanda SAS Products< Base SAS< SAS Language Concepts. 3. Expand DATA Step Concepts< Reading, Combining, and Modifying SAS Data Sets y mire los tópicos de interes 4. Expand SAS System Concepts< Rules for Words and Names in the SAS Language y mire los tópicos de interes. 5. Expand SAS Products< Base SAS< SAS Language Dictionary< Dictionary of Language Elements< SAS Data Set Options y mire los topicos de interes  Preguntas en working with SAS data sets en SAS Technical Support's Frequently Asked Questions

Ejemplos de programas

 programs in SAS help: 1. 2. 3.

2.3.3.

En SAS, click Help< SAS Help and Documentation. Expand Learning to Use SAS y click Sample SAS Programs. Click Base SAS y vea Starting with SAS Data Sets, Chapter 4.

Leer archivos de bases de datos para pc

15

INV- Software de Análisis Estadístico SAS /2013-I Si usted tiene un archivo de base de datos ya sea en hojas de cálculo de Microsoft Excel, Lotus o archivos de Microsoft Access, puede usar SAS para importar estos archivos y crear data sets de SAS. Una vez haya obtenido el archivo en SAS, es posible procesarlos como usted lo necesite en SAS. También es posible exportar archivos de SAS a un número de formatos diferentes para PC. Para leer bases de datos de PC, puede usar el procedimiento IMPORT. PROC IMPORT lee el archivo de entrada y los convierte a un data set de SAS, con las variables SAS definidas en base a los registros de entrada. Usted puede controlar los resultados con opciones y declaraciones que están especificadas en el recurso de entrada de datos (input data).  PROC IMPORT sólo está disponible en Windows, OS/2, OpenVMS, and UNIX  Usted debe tener la interfaz SAS/ACCESS para archivos de PC licenciados para leer archivos de datos de la PC. Sin embargo, aún sin la interfaz SAS/ACCESS para archivos de PC puede importar y exportar archivos externos limitados (archivos que contienen columnas de valores de datos que están separados por un delimitador como un espacio en blanco o una coma). Método de Click and Point Si usted tiene la interfaz SAS/ACCESS para archives de PC licensiados, puede importar bases de datos usando Import Wizard: 1. 2.

En SAS, click File< Import Data. Cuando el Import Wizard se abre, siga las instrucciones para importar datos.

Usted puede ver y salvar el código PROC IMPORT que el Import Wizard genera

EJEMPLO Suponga que usted quiere importar 2 archivos, a ua hoja de cálculo de Microsoft Excel y a una tabla de Access. El siguiente programa le muestra cómo leer datos usando opciones específicas para el archivo dado, crea data sets e imprime el nuevo data sets.  Debido a que esta es una guía rápida para principiantes, no es posible copiar y correr este programa como se muestra. Sin embargo usted puede modificarlo para trabajar con bases de datos de PC a las que pueda acceder. /*************************************/ /* import the Excel file */ /*************************************/ proc import datafile="c:\myfiles\Accounts.xls" out=sasuser.accounts sheet="Prices"; getnames=no; run; /*************************************/

16

INV- Software de Análisis Estadístico SAS /2013-I /* print part of the new data set */ /*************************************/ proc print data=sasuser.accounts(obs=10); run; /*************************************/ /* import the Access file */ /*************************************/ proc import table="customers" out=sasuser.cust dbms=access; uid="userid"; pwd="mypassword"; database="c:\myfiles\east.mdb"; wgdb="c:\winnt\system32\security.mdb"; run; /*************************************/ /* print part of the new data set */ /*************************************/ proc print data=sasuser.cust(obs=5); run;

REFERENCIAS

Mire estos recursos online para aprender más a cerca de como leer bases de datos de PC. Documentación, publicaciones y FAQs

 Documentación en SAS help 1. En SAS, click Help< SAS Help and Documentation. 2. ExpandA SAS Products< Base SAS< SAS Procedures< Procedures. 3. Click The IMPORT Procedure y vea los tópicos de interes 4. Si usted está interesado en exporter datos a bases de datos de PC, click The EXPORT Procedure.  PROC IMPORT documents desde SAS Technical Support Documents  product-specific documentación para PC File Formats en SAS Online Product Documentation  Otras publicaciones en SAS Documentation, incluyendo Your SAS Technology Report  Preguntas sobre on PROC IMPORT en SAS Technical Support's Frequently Asked Questions

Ejemplos de programas

17

INV- Software de Análisis Estadístico SAS /2013-I  programs in SAS help: 1. 2. 3. 4.

2.3.4.

En SAS, click Help< SAS Help and Documentation. Expanda SAS Products< Base SAS< SAS Procedures. Clic The IMPORT Procedure. Clic Examples: IMPORT Procedure.

Presentar programas de sas para hosts remotos

El servicio de cómputo de SAS le da un fácil acceso a muchas de los recursos remotos en su red desde una sola sesión local de SAS. SAS/CONNECT ofrece acceso a recursos remotos en 2 formas, sincrónicos y asincrónicos. Con el proceso sincrónico, usted espera los resultados del proceso remoto antes de estar disponibles para continuar el proceso local. Con el proceso asincrónico, usted inmediatamente recupera el control para continuar el proceso local mientras el trabajo remoto se ejecuta, y usted puede obtener los resultados después. El acceso remoto le ayuda eficazmente usando todos los recursos informáticos de la organización. Los servicios informáticos también le permiten tener ventaja en el Output Delivery System (ODS) en SAS para cambiar el formato y la apariencia en la salida de SAS que es generada en un host remoto. Las declaraciones de SAS/CONNECT GIGNON, SIGNOGG, RSUBMIT, y ENDRSUBMIT lo conectan para presentar declaraciones a un host remoto desde una sesión en un host local. Usted puede incluir estas declaraciones en un programa de SAS y hacer al mismo tiempo los procesos locales y remotos en un solo programa de SAS.  Usted debe tener la licencia de SAS/CONNECT para presentar programas de SAS en host remotos.

18

INV- Software de Análisis Estadístico SAS /2013-I

EJEMPLO Suponga que usted quiere llevar a cabo algún tipo de procesamiento en un host remoto, descargue lo resultante del data set, cree un data set permanente en el host local, e imprima un reporte sobre el host local. El siguiente ejemplo ilustra cómo poner todas estas características en un solo programa.  Debido a que esta es una guía rápida para principiantes, no es posible copiar y correr este programa como se muestra. Sin embargo usted puede modificarlo para trabajar con archivos remotos a los cuales pueda acceder  /*************************************/  /* prepare to sign on */  /*************************************/  options comamid=netbios remote=netpc;  libname lhost 'c:\sales\reg1';  /*************************************/  /* sign on and download data set */  /*************************************/  signon;  rsubmit;  libname rhost 'd:\dept12';  proc sort data=rhost.master  out=rhost.sales;  where gross > 5000;  by lastname dept;  run;  proc download data=rhost.sales  out=lhost.sales;  run;  endrsubmit;  /*************************************/  /* print data set in local session */  /*************************************/  proc print data=lhost.sales;  run;

REFERENCIAS Vea estor recursos online para aprender más acerca de cómo presentar programas remotos de SAS Documentación, publicaciones y FAQs

 Documentación en SAS help: 1. 2. 3.

En SAS, click Help< SAS Help and Documentation. Expand SAS Products< SAS/CONNECT< Communications Access Methods. Expanda los tópicos de interes en SAS/CONNECT.

19

INV- Software de Análisis Estadístico SAS /2013-I  SAS/CONNECT and SAS/SHARE documents desde SAS Technical Support Documents  product-specific documentation SAS/CONNECT in SAS Online Product Documentation  Otras publicaciones en SAS para Documentation, incluyendo Your SAS Technology Report  Preguntas sobre SAS/CONNECT wn SAS Technical Support's Frequently Asked Questions

Ejemplos de programas

  programas en SAS help: 1. 2. 3.

En SAS, click Help< SAS Help and Documentation. Expand Learning to Use SAS< Sample SAS Programs. Click SAS/CONNECT y mire los programas de interes  Programas en SAS Online Samples:

SAS/CONNECT Software: Usage and Reference, Version 6, Second Edition Siguiendo lo estipulado, se continuó con el método de autoexploración del software SAS. Se estableció que a partir del software y su respectivo manual, se irían encontrando las diferentes funciones del programa y con base en estas se realizaría la estructura del curso de acuerdo a los diferentes ítems encontrados y a la experiencia en la unidad sobre estos tipos de software y el mejor procedimiento para dictar un curso libre. A continuación se encuentra la última parte de este manual introductorio de SAS. o o o o o o o o o o o

Crear y Definir variables Usar declaraciones condicionales Subconjunto de Datos Trabajo con Fechas y Horas de SAS Impresión de datos Conteo de Datos Tabular Datos Consulta de Datos Unir Tablas Crear Gráficos Crear Gráficos (2)

Adjunto a este informe se encuentra el manual completo. No se archiva acá debido a que es muy extenso, simplemente se pondrá la explicación de cada tema omitiendo los ejemplos y sus respectivas referencias

20

INV- Software de Análisis Estadístico SAS /2013-I 2.3.5. Crear y definir variables A menudo, cuando usted trabaja con data sets, es muy útil crear nuevas variables o variables que están basadas en los valores de otras variables existentes. Estas nuevas variables pueden contener los resultados de las funciones de SAS, valores condicionalmente asignados, o valores totales de valores de otra variable.

Usted puede crear variables en un paso DATA mediante las siguientes maneras:     

Usando una declaración asignada Leyendo datos con la declaración INPUT en un paso DATA Especificando una nueva variable en una declaración FORMAT ONFORMAT Especificando una nueva variable en una declaración LENGHT Especificando una nueva variable en una declaración ATTRIB

o

Cuando usted crea variables usando declaraciones asignada, usted puede tomar ventaja de SAS functions y SAS expressions.

2.3.6. Usar declaraciones condicionales En los pasos DATA de los programas, usted probablemente querrá usar lógica condicional para procesar algunas observaciones pero otras no.

21

INV- Software de Análisis Estadístico SAS /2013-I Para ejecutar una declaración SAS para observaciones que cumplan condiciones especificas, usted puede usar:   

Declaraciones IF-THEN/ELSE para programas con algunas declaraciones condicionales Un grupo SELECT cuando usted tiene una serie larga de condiciones que son mutuamente exclusivas Subconjuntos de declaraciones IF, sin una clausula THEN, para continuar el procesamiento solo de las observaciones o registros que cumplan la condición que es especificada en la clausula IF.

Para construir expresiones en declaraciones, usted puede utilizar los siguientes operadores comparativos:

También puede utilizar estos operadores lógicos

2.3.7. Subconjunto de datos A menudo usted necesita trabajar sólo con subconjuntos de un data set de SAS. Por lo que necesita seleccionar observaciones, variables o inclusive ambas.

En el paso DATA, usted tiene un número de herramientas para subconjuntos de datos. Usted puede usar:

22

INV- Software de Análisis Estadístico SAS /2013-I  

 

Subconjuntos de declaraciones IF para seleccionar sólo aquellas observaciones que cumplan una condición específica Construcciones IF-THEN/ELSE con declaraciones DELETE y OUTPUT para borrar o seleccionar observaciones que permitan una condición, respectivamente DROP= y KEEP= opciones de data set y DROP y KEEp declaraciones para bajar o mantener determinadas variables Declaraciones WHERE para seleccionar sólo las observaciones que cumplan una condición específica (en determinadas condiciones).

EN los pasos PROC, las declaraciones WHERE son la herramienta más común para seleccionar observaciones que cumplan una condición específica. Ésta tarea se enfoca en la escritura de los pasos DATA usando subconjuntos de declaraciones IF, las opciones DROP= y KEEP= de data set y las declaraciones DROP y KEEP.

2.3.8.

Trabajo con Fechas y Horas de SAS

SAS almacena las fechas y horas como números únicos, exclusivos para que pueda utilizarlas en programas como cualquier otra variable numérica: Un SAS date value es un valor que representa el número de días entre enero 1 de 1960 y una fecha especificada. SAS puede realizar cálculos con fechas que van desde el año 1582 a 19.900 AD. Fechas antes de Enero 1 de 1960, son números negativos, después de las fechas son números positivos.

Un SAS time value es un valor que representa el número de segundos transcurridos desde la medianoche del día actual. Los valores SAS time value son entre 0 y 86400.

Un SAS datetime value es un valor que representa el número de segundos entre enero 1 de 1960 y una hora / minuto / segundo dentro de un plazo determinado.

23

INV- Software de Análisis Estadístico SAS /2013-I Para trabajar con valores date, time y datetime usted puede utilizar las siguientes herramientas: 

Informats lee un valor, tal como un reloj de tiempo o un calendaro, el cual puede ser de varias longitudes, y luego convierte los datos o un valor data, time ó datetime.



Formats presenta un valor reconocido por SAS, tal como un valor time o date, como un dato del calendario o un tiempo de reloj de varias longitudes.



Functions realize operaciones sobre valores date, time, y datetime de SAS.

2.3.9.

Impresión de Datos

Para listar la información en un data set, usted puede crear un reporte usando el procedimiento PRINT. Luego, usted puede mejorar el reporte con declaraciones adicionales y opciones para crear reportes como se muestra más abajo. Usted puede crear una variedad de reportes que van desde una simple lista a un gran reporte de datos completamente personalizado además de cálculos totales y subtotales de una variable numérica.

Metodo Point-and-Click Si usted tiene licensia de SAS/STAT, usted puede crear listas de reportes usando una interfaz point-and-click. Usted puede ver y guardar el código PROC PRINT que genera Analyst.

2.3.10.

Conteo de datos

Cuando usted analiza sus datos, es posible que usted necesite determinar qué valores de una variable están distribuidos a través de los datos. Para ello, usted puede crear tablas de frecuencia, la cual muestra la distribución de los valores de la variable, tanto con los porcentajes de un total como el conteo de data.

24

INV- Software de Análisis Estadístico SAS /2013-I El procedimiento FREQ en Base SAS crea un solo sentido de la tabla de frecuencias, dos sentidos y n sentidos de tablas de contingencia. También puede calcular medidas de asociación y de acuerdo, organiza la salida por variables de estratificación.

Esta tarea estará enfocada en usar PROC FREQ para realizar análisis básicos de datos. Método de Point-and-Click Si usted tiene licencia de SAS/STAT, usted puede crear tablas de frecuencias usando una interfaz point-and-click. 1. En SAS, click Solutions< Analysis< Analyst. 2. Cuando Analyst se abra, click File< Open by SAS Name para agregar al proyecto 3. Luego click Statistics< Descriptive< Frequency Counts para crear tablas de frecuencias. Usted puede ver y salvar el código PROC FREQ que genera Analyst.

2.3.11.

Tabular datos

El procedimiento TABULATE le da el poder y la flexibilidad para resumir los datos en forma de tabla. Usted puede crear una variedad de tablas que van desde simples a muy personalizados, incluyendo tablas de una, dos, y tres dimensiones que muestran cualquier de los números de una estadística descriptiva. Usted puede:

25

INV- Software de Análisis Estadístico SAS /2013-I     

Modificar virtualmente cualquier característica de una tabla Calcular porcentajes Producir reportes integrados sin clasificar datos Resumir datos y producir un reporte en un paso Generar tablas múltiples en un paso

PROC TABULATE calcula muchas de las mismas estadísticas que son calculadas por otros procedimientos estadísticos descriptivos tales como MEANS, FREQ, y REPORT

Método de Click-and-Point Si usted tiene licencia de SAS/STAT, usted puede crear reportes tabulares usando una interfaz point-and-click. 1. En SAS, click Solutions< Analysis< Analyst. 2. Cuando Analyst se abre, click File< Open by SAS Name para agregar datos al proyecto. 3. Luego click Reports< Tables para crear un reporte tabular Usted puede ver y salvar el código PROC TABULATE que genera Analyst.

2.3.12.

Consulta de datos

Structured Query Language (SQL) o Lenguaje de Consulta Estructurado es un lenguaje estandarizado, ampliamente utilizado que recupera y actaliza datos en tablas y gráficas basadas en estas tablas. Si usted está familiarizado con SQL, usted puede crear rápidamente consultas en SAS usando el procedimiento SQL en Base SAS. PROC SQL es la implementación SAS de SQL. Cuando usted quiere examinar relaciones entre valores de datos, un subconjunto de datos o calcular valores el procedimiento SQL provee un camino fácil flexible para analizar sus datos. Usando PROC SQL, usted puede:   

Recuperar y manipular datos que están almacenados en tablas o gráficas. Crear tablas, vistas e índices en las columnas de las tablas. Crear variables macro de SAS que contienen valores de las filas de los resultados de una consulta

26

INV- Software de Análisis Estadístico SAS /2013-I 



Agregar o modificar los valores de datos en la columna de una tabla o instertas y borrar filas. Usted también puede modificar la tabla misma añadiendo, modificando o degradando columnas. Mandar declaraciones DBMS-SQL a un sistema de administración de base de datos (DBMS) y recuperar datos DBMS

Usted puede usar elementos del lenguaje SAS como declaraciones globales, opciones del data set, funciones, y formatos con PROC SQL sólo si usted puede con otros procedimientos SAS. De todas maneras, ya que PROC AQL implementa Lenguaje de consulta estructurado, funciona de forma diferente a otros procedimientos BASE SAS. Esta tarea se enfoca en recuperar datos desde una sola tabla (data set). Método de Point-and-Click Usted puede unir tablas usando una interfaz point-and-click. 1. En SAS, click Tools< Query. 2. Use la ventana SQL Query para realizar uniones. Usted puede ver y salvar el código PROC SQL que la ventana de Consulta SQL genera Método Point-and-Click Usted puede crear consultas SQL usando una interfaz point-and-click 1. En SAS, click Tools< Query. 2. Use la ventana SQL Query para crear consultas. Usted puede ver y salvar el código PROC SQL que la ventana SQL Query genera

2.3.13.

Unir tablas

Si usted leyó CONSULTA DE DATOS, usted observó maneras para consultar una sola tabla usando PROC SQL. Sin embargo, usted necesita datos a menudo desde tablas separadas. Cuando usted especifica múltiples tablas, vistas, o expresiones de consulta en la clausula FROM, PROC SQL, las procesa para formar una tabla. La tabla resultante contiene datos de cada una de las tablas contribuyentes. Estas consultas se les llaman como JOINS. Conceptualmente, cuando usted especifica dos tablas, PROC SQL compara cada fila de la tabla A con todas las filas de la tabla B para producir una tabla interna o intermedia conocida como el CARTESIAN PRODUCT. El producto cartesiano (CARTESIAN PRODUCT) de tablas largas puede ser enrome, por lo que usted quiere enviar datos declarando el tipo de unión. A continuación se muestran dos tipos de uniones.

27

INV- Software de Análisis Estadístico SAS /2013-I 

Inner joins retorna una tabla resultante por todas las filas en una tabla que tiene una o mas filas que coincidan en la otra tabla o las otras tablas.



Outer Joins son inner joins que son aumentadas con filas que no

coinciden con cualquier fila de la otra tabla en la unión. ExistenEst 3 tipos de outer joins: left, right, and full.

Esta tarea se enfoca principalmente en unir tablas.

2.3.14.

Crear gráficos

Una manera efectiva para examinar las relaciones entre variables es graficando sus valores. Para producir gráficos únicos o superpuestos, usted puede usar:  

El procedimiento PLOT en Base SAS para visualizar datos rápidamente El procedimiento GPLOT en el software SAS/GRAPH para producir con calidad gráficos de presentación que incluyen colores y varias fuentes.

En adición, usted puede crear una salida PROC GPLOT usando el SAS/GRAPH Control for ActiveX, el cual que le permite incrustar gráficos interactivos en páginas web y documentos OLE. La sintaxis para los dos procedimientos es muy similar, aunque PROC GPLOT ofrece un número adicional de funciones de formato. Esta tarea le muestra ambos caminos para crear varios tipos de gráficos. 

Usted debe tener la licencia de SAS/GRAPH para crear gráficos usando PROC GPLOT.

28

INV- Software de Análisis Estadístico SAS /2013-I

Método de Point-and-Click a) Si usted tiene licenciado SAS/GRAPH, puede crear gráficos con calidad de presentación usando una interfaz point-and-click 1. En SAS, click Solutions< Reporting< Graph-N-Go. 2. Click en el icono New SAS Data Set y seleccione datos para el gráfico 3. Haga clic en el ícono para escoger el gráfico que desee y colóquelo en el área de trabajo. Luego haga docle clic en el objeto del gráfico, seleccione los datos y especifique las variables y las opciones del gráfico. Usted puede ver y salvar el código de PROC GPLOT que genera Graph-N-Go b) Si usted tiene licenciado SAS/GRAPH y SAS/GRAPH, también puede crear gráficos usando Analyst Application 1. En SAS, click Solutions< Analysis< Analyst. 2. Cuando Analyst se abra, click File< Open by SAS Name para agregar los datos al proyecto. 3. Luego haga clic en Graphs y escoja el tipo de gráfico que quiere crear Usted puede ver y salvar el código PROC GPLOT que Analyst genera

2.3.15.

Crear gráficos (2)

Usted puede usar el procedimiento CHART en Base SAS para producir    

Barras gráficas horizontales y verticales Gráficos de bloques Gráficos circulares Mapas estelares

Estos tipos de graficos muestran valores de una variable ó estadística asociada con sus valores. La variable graficada puede ser numerada o caracterizada.

29

INV- Software de Análisis Estadístico SAS /2013-I PROC CHART es una buena herramienta para visualizar datos rápidamente, pero si usted necesita producir gráficos de presentación con calidad que incluyan varios colores y fuentes, usted puede usar el software SAS/GRAPH. El procedimiento GCHART en SAS/GRAPH produce los mismos tipos de gráficos que PROC CHART hace, Así como un gráfico de dona. En adición, usted puede crear salidas PROC GCHART usando el SAS/GRAPH Control for ActiveX, el cual lo conecta con gráficos interactivos en páginas web y documentos OLE. Como usted puede ver, la sintaxis para PROC CHART y PROC GCHART es muy similar. Esta tarea le muestra ambos caminos para crear varios tipos de gráficos. 

Usted debe tener la licencia de SAS/GRAPH para crear gráficos usando PROC GCHART.

Método de Click-and-Point Si usted tiene licenciado SAS/GRAPH, usted puede crear gráficos de presentación con calidad usando una interfaz point-and-click. 1. En SAS, click Solutions< Reporting< Graph-N-Go. 2. Click en el ícono New SAS Data Set o en New MDDB y seleccione los datos para el gráfico. 3. Haga clic en el ícono del gráfico que desee y colóquelo en el área de trabajo. Luego haga clic en el objeto del gráfico, seleccione los datos y especifique las variables y las opciones del gráfico.. Usted puede ver y salvar el código PROC GCHART que genera Graph-N-Gos.

Si usted tiene licenciado SAS/GRAPH y SAS/STAT, tambien puede crear gráficos ustando Analys Application

30

INV- Software de Análisis Estadístico SAS /2013-I 1. En SAS, click Solutions< Analysis< Analyst. 2. Cuando Analyst se abra, click File< Open by SAS Name para agregar datos al proyecto 3. Luego haga clic en Graphs< Bar Chart o Graphs< Pie Chart para crear un gráfico Usted puede ver y salvar el código PROC GCHART que genera Analyst. Siguiendo lo estipulado, se continuó con el método de autoexploración del software SAS. Ya que en este punto ya no era muy útil seguir el manual de SAS (que es bastante extenso) se decidió proseguir con regresiones simples, múltiples y series de tiempo. Con respecto a series de tiempo, aun no se ha completado la revisión de literatura puesto que es muy extensa e inclusive posee más de un capítulo dedicado a esto. A continuación se encuentra lo referente a Regresión (Declaración REG) y lo encontrado de series de tiempo (Declaración ARIMA

2.3.16.

Regresión simple y múltiple

Considere una variable respuesta Y que puede ser predicha por una función polinomial de una variable regresiva X. Usted puede estimarB0, el intercepto B1, la pendiente debida a X y X2, la pendiente debida a X2 en:

Esto para las observaciones Considere el siguiente ejemplo de las tendencias de crecimiento de la población. La población de USA desde 1970 a 2000 se ajusta a funciones de tiempo lineales y cuadráticas. Debe tener en cuenta que el término cuadrático YearSq es creado en el paso DATA, esto se debe hacer ya que los efectos polinómicos como Year*Year no pueden ser especificados en la declaración MODEL en PROC REG. Los datos son los siguientes: dataUSPopulation; inputPopulation @@; retainYear 1780; Year = Year+10; YearSq = Year*Year; Population = Population/1000; datalines; 3929 5308 7239 9638 12866 17069 23191 31443 39818 50155 62947 75994 91972 105710 122775 131669 151325 179323 203211 226542 248710 281422 ; ods graphics on; procreg data=USPopulation plots=ResidualByPredicted; varYearSq; model Population=Year / r clm cli; run;

31

INV- Software de Análisis Estadístico SAS /2013-I

La opción de datos garantiza que el procedimiento utiliza el conjunto de datos deseado. Cualquier variable que se puede agregar al modelo pero que no está incluido en el primer modelo de declaración debe aparecer en la declaración VAR. A continuación se muestra el análisis de varianza y los parámetros estimados:

El modelo estadístico F es significante (F=228.92, p= 9 then do; VarCS = . ; VarTS = . ; end; keep _MODEL_ _METHOD_ VarCS VarTS VarErr Int lQ2 lPF2 lF2; run; Los parámetros estimados y los componentes de varianza para ambos modelos son reportados en las siguientes salidas.

61

INV- Software de Análisis Estadístico SAS /2013-I Estimaciones de Parámetros

Estimación de componentes de Varianza

En el modelo de efectos Random, Los términos constantes individuales son vistos como distribuidos al azar en todas las unidades de corte transversal y no como cambios paramétricos de la función de regresión, como en los modelos de efectos mixtos. Esta es apropiada cuando las unidades de secciones transversales de la muestra son estiradas por una población grande. Claramente, en este ejemplo, seis Aerolíneas son una muestra de todas las aerolíneas en la industria y no una exhaustiva lista. Hay 4 maneras de calcular los componentes de varianza en el modelo de efectos random de ‘one-way’. El método de Fuller y Battese (1974), usa un método de ‘constantes ajustadas’para estimar los componentes. El método de Wansbeek y Kapteyn (1989)

62

INV- Software de Análisis Estadístico SAS /2013-I (WK) usa los verdaderos disturbios, mientras que el método de Wallace y Hussain (WH) utiliza residuos mínimos cuadrados ordinarios. En cuanto a las estimaciones de los componentes de la varianza de la sección transversal y el error en la salida anterior, se puede ver que los componentes de varianza igual para el error son calculados ambos FB y WK, mientras WH y NL son necesariamente iguales. Las cuatro técnicas producen diferentes componentes devarianzas para las secciones cruzadas. Estas estimaciones son luego usadas para estimar los valores de los parámetros en la penúltima salida anterior. Todos los parámetros aparentar tener estimaciones similares e igualmente pausibles. Tanto el índice de la producción en millas-pasajero (CL) como el precio del combustible (LPF) tienen efectos pequeños y positivos en los costos totales que se pueden esperar. El factor de carga (LF) tiene un efecto algo más grande y negativo en los costos totales, lo que sugiere que a medida que aumenta la utilización, los costos disminuyen. Al igual que en modelo de efectos random de un camino, los componentes de varianza de error producidos por los métodos FB y WK son iguales. De igual manera, en este caso, Los métodos WH y NL producen estimaciones de varianza que son diferentes. Las estimaciones de los componentes de varianza para las secciones cruzadas son todas diferentes, pero en un rango más cerrado. El mismo no puede decirse para los componentes de varianza de las series de tiempo. Por diferentes que sean cada una de las estimaciones que la varianza pueda ser, producen estimaciones de parámetros que son similares y plausibles. Así con las estimaciones de un camino son todas negativas y, con la excepción de las estimaciones producidas por el método WH, algunas son más pequeñas que las estimaciones producidas en el modelo de un camino. Durante el tiempo los datos fueron recolectados, La tabla de Aeronáutica Civil se disolvió, entonces es posible que las variables Dummy son dominadas por esta disolución. Esto puede conducir a la decaída de los efectos de tiempo y una estimación imprecisa de los efectos de los factores de cargar, a pesar de que las estimaciones son estadísticamente significativas. Las estimaciones agrupadas dieron algo para comparar las estimaciones de efectos random. Se puede ver que los signos y las magnitudes de salida y el precio del combustible son similares, pero con la magnitud del coeficiente de factor de carga es un poco más grande debajo de la agrupación. Mientras el modelo aparece para tener efectos de tiempo y efectos de secciones cruzadas, los modelos agrupados no deberían ser usados. Finalmente, se examina entre los estimadores de grupos. Para la estimación entre grupos, usted está buscando en los datos de cada aerolínea promedio a través del tiempo. En la salida de los parámetros de estimaciones (penúltima salida) puede ver que los estimados de los parámetros entre los grupos son radicalmente diferentes de todas las otras estimaciones de parámetros. Esto puede indicar que el componente de tiempo no está siendo utilizado adecuadamente en esta técnica. Para la estimación entre tiempo, usted está buscando en la media de todas las compañías aéreas en cada

63

INV- Software de Análisis Estadístico SAS /2013-I período de tiempo. En este caso, la estimación de parámetros son del mismo signo y cercanos en la magnitud en comparación con las previas estimaciones calculadas. Tanto la producción como los efectos de los factores de carga parecen tener más que ver con los costos totales.

EJEMPLO 5. Usando la declaración FLATDATA Algunas veces los datos pueden se encuentran en una forma comprimida, donde cada línea tiene todas las observaciones para las variables dependientes e independientes de la sección cruzada. Para ilustrar esto, suponga que usted tiene un data set con 20 secciones cruzadas sonde cada sección consiste en observaciones de tiempo de 6 periodos. Cada periodo de tiempo tiene valores para cada variable dependiente e independiente y . Las variables cs y num representan otras variables de caracteres y numéricas que son constantes en cada sección cruzada. Las observaciones las primeras 5 secciones cruzadas a lo largo de de otras variables se muestran el siguiente salida. En este ejemplo, i representa la sección cruzada. El periodo de tiempo es identificado por el subíndice de las variables Y y X; con rangos desde el 1 al 6. Data Set comprimido

Mientras el proceso PANEL no puede trabajar directamente con datos en forma comprimida, la declaración FLATDATA puede ser usada para trasformar los datos. La opción OUT=option puede ser usada para las salida transformada del data set. proc panel data=flattest; flatdata indid=i tsname="t" base=(X Y) keep=( cs num seed ) / out=flat_out; id i t; model y = x / fixone noint; run;

64

INV- Software de Análisis Estadístico SAS /2013-I Primero, las 6 observaciones del data set descomprimido y los resultados del modelo de efectos mixtos de un camino ajustados se muestran en la segunda salida. Data Set descomprimido

Estimación con la declaración FLATDATA

2.3.19.

ODS Graphics Designer

INTERFAZ SAS ODS A continuación se muestra la interfaz del diseñador de gráficos ODS de SAS. Para acceder al diseñador de gráficos en SAS se dirige a herramientas y dar clic en ODS Graphics Designer:

65

INV- Software de Análisis Estadístico SAS /2013-I

Al abrir el programa aparece la siguiente interfaz:

Como se puede ver la interfaz está divida en dos partes: EL gráfico los Elementos. Existe una parte adicional que se llama Código que genera el gráfico, sin embargo esta no es tan importante como las demás. A continuación se muestra un ejemplo de un gráfico con su código.

66

INV- Software de Análisis Estadístico SAS /2013-I

A continuación se indicara una función abreviada de cada pestaña del software Fichero: Se pueden encontrar las funciones básicas de todo software como Nuevo, Abrir, Guardar, Imprimir, etc.

Editar: Al igual que fichero, esta pestaña contiene las funciones básicas de edición de cualquier software: Deshacer, Rehacer, Seleccionar todo

67

INV- Software de Análisis Estadístico SAS /2013-I

Ver: permite las opciones de ver o no la galería de gráficos, los elementos y el código

Insertar: Permite insertar en un gráfico un título, una nota a pie, una leyenda. Además de insertar filas y columnas

Formato: En esta pestaña se permite editar cualquier propiedad de cada elemento del gráfico. También se permite cambiar el estilo del gráfico

68

INV- Software de Análisis Estadístico SAS /2013-I

Herramientas: en esta pestaña se puede editar el estilo gráfico

y ver las preferencias del

Ayuda: Muestra la información sobre el diseñador de gráficos ODS de SAS

Por último se indicaran en el orden que aparecen en la barra de los botones del diseñador de gráficos ODS:

Nuevo gráfico en blanco: crea un gráfico completamente en blanco Ver galería de Gráficos: muestra toda la galería de gráficos que posee ODS

69

INV- Software de Análisis Estadístico SAS /2013-I

Abrir Guardar Guardar como Imprimir Vista preliminar Deshacer y Rehacer Copiar en portapapeles: copia lo seleccionado del programa al portapapeles de Windows Título: inserta un título nuevo al gráfico Nota a pie: Inserta una nota al pie del gráfico Leyenda global: inserta una leyenda global:

Añadir una fila: añade una nueva fila de gráficos

Añadir una nueva columna de gráficos

70

INV- Software de Análisis Estadístico SAS /2013-I

2.4. Clases A continuación se muestran los documentos escritos relacionados con cada clase preparada para el curso libre de SAS.

2.4.1. Primera Clase En la primera clase de un curso libre dictado por la Unidad de Informática y Comunicaciones (UIFCE) es importante el contacto con los asistentes y la evaluación de las competencias de los estudiantes (por ejemplo, si están en condiciones de tratar los temas que aborda el software, si han tenido contacto con programa similares en otra oportunidad, etcétera), es por esto que la primera clase del curso se enfoca en un primer acercamiento al software a trabajar. Presentación a) Se da la bienvenida a los asistentes al curso de SAS, presentándose primero el conferencista. Se realiza la aclaración que es preferible que los asistentes hayan tomado cursos de estadística y/o tenido contacto con software que manejen lenguaje de programación. b) Se explica el reglamento de los cursos libres de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias Económicas (UIFCE) de la Universidad Nacional de Colombia. c) Se realiza la charla acerca de software libre como opción para la comunidad informática, esto hace parte de la misión de la UIFCE en su labor. 2.4.2 ¿Qué es SAS? (Official Page, Statistical Analysis Software SAS, 2013) SAS (Statistical Analysis System) es un software estadístico usado principalmente como un método para la organización y control de grandes bases de datos. SAS fue diseñado de manera tal que respondiera a una recolección, transformación, análisis y reporte de datos; de manera adecuada y eficiente para la organización que disponga del software. Este software es de carácter privativo. El lenguaje de programación que utiliza SAS fue diseñado por el mismo SAS. Su sintaxis está inspirada en la de PL/I (lenguaje propuesto por IBM en 1970), este opera en primera instancia sobre tablas de datos. Estas tablas de datos las puede leer, transformarlas, combinarlas, resumirlas, crear informes, entre otras cosas. El núcleo del lenguaje incluye Pasos data que permiten realizar operaciones sobre las filas de un conjunto de datos, procedimientos de manipulación de datos que permiten ordenar tablas, enlazarlas, etc., un intérprete de SQL, un superlenguaje de macros.(Official Page, Statistical Analysis Software, 2013) -

Se explican además los requerimientos para el uso del software en Linux y Windows Se fomenta el uso del software libre como política de la UIFCE

SAS vs. Otros software

71

INV- Software de Análisis Estadístico SAS /2013-I SAS como software, a pesar de su carácter privativo, cuenta con muchas más opciones en comparación con los software estadísticos más utilizados, y que son enunciados a continuación en la tabla 1:

Tabla 1: Cuadro comparativo de los software estadísticos de uso más común. Aspectos Generales.3 (N/A, 2013)

Finalmente se hace una explicación básica de la interfaz de SAS siguiendo el orden explicado en el ítem 2.2.3 de ésta investigación. Que incluye un primer panorama del menú y las ventanas que ofrece SAS y los principales botones de ejecución.

2.4.2. Segunda clase – Definiciones básicas para la inserción de variables Con ayuda de las diapositivas localizadas en el repositorio, se inicia con explicaciones de conceptos como: -

¿Qué es una variable?: Un patrón que nombra una serie de observaciones que representan una característica en común. Variables cuantitativas: Representan valores numéricos (IPC, PIB, ingreso, edad, etc.) Variables cualitativas: Representan una característica en particular (sexo, género, estrato, etc.)

Elaboración propia. Tomado de http://en.wikipedia.org/wiki/Comparison_of_statistical_packages 3

72

INV- Software de Análisis Estadístico SAS /2013-I -

Variables endógenas: Variables que dependen del cambio de otra u otras variables. Variables exógenas: Variables “independientes” que al cambiar generan una variación en la variable endógena. 45

Luego de ello, se continúa con el primer ejemplo enunciado para la inserción de variables directamente en el Editor de SAS, hay que aclarar que estas bases de datos deben ser pequeñas, y que toda línea de comandos debe terminarse con un punto y coma (;) para que corra adecuadamente ya que este es uno de los errores más comunes a la hora de programar en SAS.

Ejemplo: Suponga usted que desea comenzar a trabajar con una base de datos de 10 observaciones que contempla el sexo de la persona, el ingreso que recibe mensualmente en miles de pesos, la edad, y el estrato. Programación: /*INSERCION DE VARIABLES*/ DATA variables; /*NOMBRE DE LA NUEVA BASE DE DATOS SAS*/ INPUT sexo $ ingreso edad estrato; /*VARIABLES*/ CARDS; /*COMANDO PARA INSERTAR DATOS*/ H 1500 20 3 H 3000 40 4 M 2000 30 4 H 800 25 2 M 500 18 3 H 9000 45 6 M 4000 30 3 M 5000 32 4 H 700 18 3 H 1000 23 3 ; RUN; /*CORRER PROCEDIMIENTO*/ En cuanto a la programación se hace la claridad que los comentarios están en rojo y separados por /* (…) */ como se había explicado en la clase anterior, y que el comando INPUT es el que nos permite insertar el nombre de las variables y en ese orden debemos insertar los datos. Así, la primera columna pertenece a sexo, la segunda a ingreso, etc. También se aclara que el símbolo $ define cuando una variable es cualitativa (en este caso es sexo).

4Hacer

la claridad de que existen más tipos de variables (dummys, dicotómicas, etc.) que se tratarán más adelante. 5 “Exógenas” lleva comillas porque hay variables que si bien son exógenas en un modelo, dependen de otras variables en otro modelo.

73

INV- Software de Análisis Estadístico SAS /2013-I Finalmente se observa que en la ventana LOG hay una confirmación donde nos muestra que efectivamente se ha creado un archivo SAS de 10 observaciones y 4 variables que se llama “variables” y está dentro de la librería “WORK”.

-

Debe aclararse que si se desea cambiar el nombre de la librería se añade en la primera parte de la programación “DATA nombredelalibrería.variables” Si se desea ver los datos, en el explorador de SAS se dirige a Librerías > Work (por defecto) > Variables, y se abre una ventana adicional con una tabla que presenta los datos.

El segundo ejemplo consiste en añadir un archivo externo, para ello SAS admite: -

Archivos ASCII de texto Bases de datos de Access Archivos delimitados por comas (.csv los que comúnmente usamos para trabajar con R) Archivos de dBase JMT Lotus Archivos de Excel de diferentes versiones

El conferencista apoyado por las diapositivas del repositorio (si así lo desea) sigue el procedimiento ahí descrito y crea una nueva librería con un archivo (en el manual de SAS y el ejemplo de Power Point se usa un archivo llamado “Libro2” ubicado en el repositorio). Estadística descriptiva Ahora se enfoca la clase en dos procedimientos que generan estadística descriptiva “MEAN” y “FREQ”: Programación:

74

INV- Software de Análisis Estadístico SAS /2013-I

“MEANS” incluye observar la media muestral, la desviación estándar, el mínimo y el máximo. En éste caso este procedimiento se le aplica solo a las variables “ingreso” y “edad”, la orden se da por medio del comando “Var”. Finalmente se ejecuta “RUN”. 1. Si es necesario apóyese de las siguientes definiciones para explicar lo que se está haciendo: Media muestral (Universidad, 2013): Esun estimador centrado del valor medio μ de una variable aleatoria X, cuya varianza decrece a medida de que se disponga de "mayor información" de la población. Desviación estándar (Eduteka, 2013): La desviación estándar nos dice qué tanto se apartan los números del promedio, y se calcula tomando la raíz cuadrada del promedio aritmético de los cuadrados de las desviaciones con respecto a la media en una distribución de frecuencia. Mínimo: Dato más pequeño de la variable. Máximo: Dato más grande de la variable. 2. Aclare que este procedimiento es para realizar con variables cuantitativas, pues es ilógico hacerlo con variables cualitativas. Se muestran los siguientes resultados, se hace un breve análisis de lo arrojado en Output:

Observamos que en el caso de la variable “sexo” hay 6 observaciones que corresponden a hombres que representan el 60% de la muestra, y 4 observaciones que representan el 40% de la muestra. Para la variable “estrato” encontramos que hay 1 observación que corresponde al estrato 2, 5 que corresponden al estrato 3, 3 que corresponden al estrato 4 y 1 que corresponde al estrato 6; en términos

75

INV- Software de Análisis Estadístico SAS /2013-I porcentuales el estrato 2 representa el 10% de la muestra, el estrato 3 el 50%, el estrato 4 el 30% y el estrato 6 el 10%. “FREQ” ofrece una tabla de frecuencias que incluye la frecuencia de la variable, el porcentaje que representa esa frecuencia, la frecuencia acumulada y el porcentaje de la frecuencia acumulada. De la misma forma con el comando “Var” se le indica a SAS que se realice el procedimiento para “sexo” y “estrato”, ejecutamos “RUN”. 1. Si es necesario, apóyese de las siguientes definiciones para explicar lo que se está haciendo: Frecuencia (absoluta) (Vitutor, 2013): La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Frecuencia acumulada (Vitutor, 2013): La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. 2. Aclare que este procedimiento puede realizarse tanto para las variables cuantitativas como las cualitativas y que en el caso del ejemplo se realiza para las variables cualitativas del ejemplo. Se muestran los siguientes resu ltados y se realiza un breve análisis de lo encontrado:

Observamos que en el caso de la variable “sexo” hay 6 observaciones que corresponden a hombres que representan el 60% de la muestra, y 4 observaciones que representan el 40% de la muestra. Para la variable “estrato” encontramos que hay 1 observación que corresponde al estrato 2, 5 que corresponden al estrato 3, 3 que corresponden al estrato 4 y 1 que corresponde al estrato 6; en términos porcentuales el estrato 2 representa el 10% de la muestra, el estrato 3 el 50%, el estrato 4 el 30% y el estrato 6 el 10%.

76

INV- Software de Análisis Estadístico SAS /2013-I 2.4.3. Tercera Clase – Lógica condicional, fechas y horas, subconjuntos 2.4.3.1.

Lógica condicional

La clase inicia con un breve repaso de qué es la lógica condicional y en qué ámbitos hemos tenido contacto con el mismo (recuerde por ejemplo clases de deducción de filosofía, clases de estadística funamental, etc.) Recuerde que básicamente, son una serie de condiciones impuestas sobre una base de datos para que se realice un procedimiento solamente sobre los datos que cumplan dicha condición. En Excel observamos estos condicionales en fórmulas propias del programa o con el análisis “Y si….” Luego, se muestran las siguientes tablas con los principales operadores lógicos, todos manejados por SAS:

Tabla 1. Operadores de SAS

Tabla 2. Condicionales de SAS por símbolos

Es importante resaltar que los procedimientos sobre los que se programa la lógica condicional en SAS, son los mismos usados cuando comúnmente se impone una condición (si esto ocurre y además esto ocurre entonces pasará esto…) es importante inculcar en los estudiantes que SAS aunque tenga lenguaje de programación, no es más que un software con un método de redacción. Condicionales:

77

INV- Software de Análisis Estadístico SAS /2013-I   

IF: Comando para iniciar, que en español significa “si” condicional, no afirmativo. ELSE: Es el comando usado para imponer varias condiciones, en español significa “además”. THEN: Es el comando que explica que ocurre cuando se cumple la condición impuesta por IF, se encuentra en todas las condiciones.

Luego de ello se pasa al ejemplo, es importante aclarar que éste será el último ejercicio realizado con importación directa de datos pues los próximos ejercicios deben contener una base de datos amplia, si el conferencista lo desea en la evaluación de los estudiantes puede incluir más ejercicios de importación directa de datos. Ejemplo:

Suponga usted que cuenta con una base de datos de 10 observaciones que contempla una nómina de trabajadores del Aeropuerto Internacional ElDorado. La base contiene la identificación del trabajador, el sexo, el cargo, el nombre, el salario (en miles de pesos) y la fecha de nacimiento. Sin embargo se desea clasificar los trabajadores según el cargo en grupos, así que según el código del cargo que maneja el Aeropuerto, los trabajadores pueden clasificarse en “Mecánicos”, “Pilotos”, “Técnicos de aviación”, “Tecnólogos de aviación” y “Contadores”. Ahora haciendo uso de SAS se crearán estos grupos. Programación6: data nomina; input Identificacion $ 1-4 Sexo $ 6 Cargo $ 8-10 Nombre $ 12-20 Salario 22-26 7 @28 Cumple date7. ; if cargo='ME2'then Grupo='Mecanicos'; elseif cargo='PT1'then Grupo='Pilotos'; elseif cargo='TA1'then Grupo='Tecnicos de aviación'; elseif cargo='TA3'then Grupo='Tecnólogos de aviación'; elseif cargo='CON'then Grupo='Contadores'; format cumple mmddyy8.; CARDS; 1009 F TA1 AndreaVar 01000 12JUL59 1017 F TA3 DanielaMu 00800 23JAN57 1036 F TA3 Alejandra 05000 27MAY65 1037 M TA1 Jhonathan 07000 27AUG64 1038 M TA1 DavidAndr 08000 28DEC69 1050 M ME2 RicardoCa 01000 20FEB63 Debe mencionar que todas las condiciones deben importarse antes de importar los datos para así los resultados sean efectivos. 7 Si resultan dudas respecto a estos formatos anuncie que durante la clase se solucionará la duda, ya que este formato corresponde a la sección fecha/hora SAS. 6

78

INV- Software de Análisis Estadístico SAS /2013-I 1065 1076 1094 1100 ; run;

F M M F

ME2 PT1 PT1 CON

CamilaFra CarlosDía OrlandoNu JohannaGa

04000 15000 00900 01300

29JAN44 14OCT55 02APR70 05MAR60

Antes de correr la programación se aclarar los nuevos elementos de la programación: 





Identificacion $ 1-4 por ejemplo, tiene después del signo $ (que identifica a la variable como una característica) la indicación 1-4, esto se puede interpretar como una especie de organización de la tabla que se pretende introducir con los datos, la primera variable es “Identificación” que es un número de 4 dígitos para cada trabajador, es decir cada carácter ocupa desde la columna 1 hasta la columna 4 de la tabla que formaremos con los datos. Asimismo, por ejemplo, Sexo $ 6 ocupa solo la columna 6 de la futura tabla (el 5 no se cuenta porque es el espacio que divide la tabla).8

Algunos nombres tienen caracteres adicionales, y ahora hay ceros a la izquierda de los salarios. Esto tiene que ver con el ítem anterior para la organización de los datos, como

todos los espacios que se establezcan deben ser ocupados, para que los salarios se ajusten se colocan uno o dos ceros a la izquierda, y los nombres simplemente se complementan con los caracteres del apellido, hasta que se ajusten al nombre más largo de la base de datos (en este caso “Alejandra” o “Jhonathan” que tienen 8 caracteres) @28 Cumple date7. es un comando de indicación nuevo, el @ indica que es la última variable de la base de datos y el 28 indica la columna en la que inician, “Cumple” es el nombre de la variable (no se puede poner cumpleaños ya que la letra ñ no es leída por SAS) y date7. es el formato que se desea para la fecha, éste comando debe ser completado con el comandoformat cumple mmddyy8. al final de las indicaciones de los condicionales, de lo contrario la fecha no será leída.

Se muestra entonces la confirmación de la ventana LOG que muestra que los datos han sido subidos correctamente:

8

Pueden insertarse hasta 322 caracteres de forma manual.

79

INV- Software de Análisis Estadístico SAS /2013-I Y los resultados, para ello nos dirigimos al explorador, buscamos la librería WORK y abrimos la database “nomina” donde los datos ya están organizados por grupos:

Continúa el ejemplo:

…el Aeropuerto desea analizar si sus trabajadores ganan un sueldo “Alto”, “Medio” o “Bajo”, para ello establecen unos rangos de salario: Si el empleado gana igual o más de 6’000.000 de pesos mensuales entonces tiene un salario alto, si gana entre 1’500.000 pesos y 5’999.999 pesos entonces tiene un salario “Medio” y si gana menos o igual de 1.499.999 pesos, entonces el empleado tiene un salario “Bajo” usando los condicionales para las variables numéricas programamos adicionalmente: Programación: data salarios; set nomina (drop=Identificacion Sexo Cargo Cumple); if salario>=06000then Categoria="Alto"; elseif salario=01500then Categoria="Medio"; elseif salario=333371937902.966&Tasa>=3.75; keep Pais Codigo PIB Tasa; run; Resultados WORK.subconjunto1

Continúa el ejemplo:

Suponga ahora que no desea ser tan estricto y solo quiere separar de la lista los países con una tasa de interés estrictamente mayor a Colombia (3,75%), además, ya no le interesa observar el código del país.

82

INV- Software de Análisis Estadístico SAS /2013-I Programación: data subconjunto2; set interes (drop= Codigo); if Tasa>3.75; keep Pais PIB; 9 run; Resultados:

Luego de esto es importante otorgarle una interpretación económica al ejercicio, ya que el objetivo del curso es encaminar el uso de SAS a las ciencias económicas. Este es un ejemplo de un rápido análisis económico dispuesto en el Manual de SAS:

… por ejemplo la ausencia de los países europeos y de Estados Unidos debido a la crisis financiera de 2008, pues los países que se muestran son de América Latina y África, también se puede observar la notoria diferencia del PIB de Brasil respecto a los otros países, posicionando a éste país como uno de los países emergentes del siglo XXI.

2.4.3.3.

Fechas y horas con SAS

Fechar los documentos que se trabajen con SAS puede llegar a ser sumamente importante en toda base de datos. Recuerde mencionar en primera medida que SAS inicia su fecha y hora en enero 1 de 1960 a las 00:00:00 a.m. lo cual numéricamente corresponde al número cero; esto no quiere decir que no se puedan programar fechas anteriores, si desea hacerlo solo debe insertar números negativos. Esto se puede explicar más profundamente mencionando los tres tipos de procedimientos con datos de fecha: 2.4.3.4.

SAS DATA VALUE

“Tasa” no se incluye en el comando DROP ya que es necesario usarla para imponer la condición. 9

83

INV- Software de Análisis Estadístico SAS /2013-I Un SAS date value es un valor que representa el número de días entre enero 1 de 1960 y una fecha especificada. SAS puede realizar cálculos con fechas que van desde el año 1582 a 19.900 AD. Fechas antes de enero 1 de 1960, son números negativos, después de las fechas son números positivos.

2.4.3.5.

SAS TIME VALUE Un SAS time value es un valor que representa el número de segundos transcurridos desde la medianoche del día actual. Los valores SAS time value son entre 0 y 86400.

2.4.3.6.

SAS DATATIME VALUE Un SAS datetime value es un valor que representa el número de segundos entre enero 1 de 1960 y una hora / minuto / segundo dentro de un plazo determinado.

Se mencionan además las herramientas que tiene SAS en sus formatos de fecha y hora. Formatos como mmddyy8. date9. y otros que se han presentado a menudo en las programaciones anteriores, sirven para mostrar la fecha como se desee, si se muestran ciertos dígitos del año, en que orden se muestra la fecha, etcétera.   

Informats lee un valor, tal como un reloj de tiempo o un calendario, el cual puede ser de varias longitudes, y luego convierte los datos o un valor data, time ó datetime. Formats presenta un valor reconocido por SAS, tal como un valor time o date, como un dato del calendario o un tiempo de reloj de varias longitudes. Functions realize operaciones sobre valores date, time, y datetime de SAS.

Los ejemplos son realmente sencillos y pueden ser bastante improvisados: Ejemplo:

Suponga primero que usted quiere probar los formatos de fecha en SAS y elige una serie de números aleatorios para distintos formatos de SAS, así que programa lo siguiente en la ventana “Editor”: Programación:

84

INV- Software de Análisis Estadístico SAS /2013-I data test; Time1=80009; format Time1 datetime.; Date1=86399; format Date1 date.; Time2=1500; format Time2 timeampm.; Date1Month=month(Date1); run; /*************************************/ /* Pie de pagina */ /*************************************/ procprintdata=test noobs; title'Same Number, Different SAS Values'; footnote1'Time1 is a SAS DATETIME value.'; footnote2'Date1 is a SAS DATE value.'; footnote3'Time2 is a SAS TIME value.'; footnote4'Date1Month is the numeric month for Date1.'; run; /*************************************/ /* mostrar titulo y pie de pagina */ /*************************************/ title; footnote; Note por ejemplo que a cada número se le ha asignado un ejemplo para observar rápidamente los casos, también que se ha incluído un nuevo comando “footnote” para insertar notas al pie de página, los resultados en el output son: Same Number, Different SAS Values Time1

Date1

Time2

Date1Month

01JAN60:22:13:29

20JUL96

12:25:00 AM

7

Time1 is a SAS DATETIME value. Date1 is a SAS DATE value. Time2 is a SAS TIME value. Date1Month is the numeric month for Date1. Ejemplo 2:

Suponemos que tenemos una serie de países que de acuerdo a la fecha en que enviaron unos documentos, se les enviará la respuesta. Tenemos entonces en la base de datos, el código del país, la fecha del envío y la que sería la fecha de respuesta (que por políticas de la organización será 30 días después de la fecha del envío del correo. Programación:

/*************************************/ /* Opciones de reporte */ /*************************************/ 85

INV- Software de Análisis Estadístico SAS /2013-I options nodate nonumber; /*************************************/ /* Crear Data Set */ /*************************************/ data correos; input codigo $ fecha : mmddyy10.; respuesta=fecha+30; datalines; N 11-24-10 S 12-28-11 E 12-03-12 W 10-04-12 ; run; /*************************************/ /* print data set */ /*************************************/ proc print data=correos noobs; format fecha respuesta date9.; title 'Programa fechas de respuesta'; run; title; Los resultados finalmente son: Programa fechas de respuesta codigo N S E W

fecha 24NOV2010 28DEC2011 03DEC2012 04OCT2012

respuesta 24DEC2010 27JAN2012 02JAN2013 03NOV2012

2.4.4. Cuarta clase – Regresión simple La regresión constituye uno de las principales herramientas de la economía para la explicación de modelos por medio de la estadística. El programa SAS, al ser econométrico, aborda especialmente este tipo de herramientas para el uso del profesional, se comenzará con la noción más básica, la regresión simple. Comandos: 

PROC: Comando que llama a un procedimiento.

86

INV- Software de Análisis Estadístico SAS /2013-I   

REG: Comando que llama la regresión. MODEL: Comando que indica cuál es la variable endógena del modelo y cual(es) la(s) exógena(s). Noint: Comando usado para eliminar el término de intercepto de la regresión.

Ejemplo Suponga usted que desea crear un modelo de regresión simple en el cual que explica el Producto Interno Bruto (PIB) de Colombia a través del cambio en su Gasto Público en el período de 1970-2009. ¿Ante el aumento de una unidad en el Gasto Público como cambian las unidades del PIB? Luego de importar los datos 10 por medio de importación externa, se incluye la programación solicitada: PROC PRINT DATA=regresion; TITLE1 ' RECTA DE REGRESION ENTRE LAS VARIABLES:'; TITLE2 ' PIB y GASTO PUBLICO; RUN; PROC REG DATA=regresion; MODEL PIB=Gasto; RUN; Los resultados arrojados por la ventana output son:

Se puede observar que SAS ha asignado al modelo de regresión el nombre de MODEL1 y que, como se ha especificado, la variable dependiente es el PIB, se han 10

Ver datos en Anexo 1.

87

INV- Software de Análisis Estadístico SAS /2013-I usado 40 observaciones para el modelo. Primero se observa un análisis de varianza simple que nos muestra los grados de libertad del modelo, de los errores, y el total corregido. Luego nos muestra la suma de cuadrados y la media cuadrada (dos elementos de la ecuación para las varianzas), también se muestra el valor de la Prueba F y el p-valor de la misma11; esta prueba al tener un valor de 3772,22 con un nivel de significancia menor al 0,0001 nos permite determinar que el modelo en su totalidad logra ser significativo al momento de explicar el PIB. Luego se encuentra la media de los errores al cuadrado que nos permite estimar que tan grandes son los errores dentro del modelo, se observa que son bastante grandes, esto debido a que el comportamiento del gasto por sí solo no logra explicar el comportamiento del PIB; encontramos además la media de la variable dependiente (en este caso del PIB) y el coeficiente de varianza que es 14,36, lo que indica que tanto varían los datos con respecto a la media. Una varianza baja como ésta nos indica que aunque tiene grandes errores hay una predicción cercana del valor real. Los siguientes indicadores son el R-cuadrado y el R-cuadrado ajustado, los cuales indican que tanto el modelo responde a la explicación del comportamiento de la variable endógena. El R-cuadrado ajustado es usado cuando hay un gran número de variables, sin embargo, como este es un modelo de regresión simple se usará para la interpretación el R-cuadrado. Con un R-cuadrado de 0,99 SAS nos indica que el modelo logra explicar en un 99% el comportamiento del PIB. Un segundo recuadro aparece en la ventana “Output” y es la estimación de los parámetros, en éste encontramos la variable intercepto (que corresponde a ) y la variable Gasto; igualmente encontramos los grados de libertad y el valor de estimación del parámetro, que para el intercepto corresponde a -3,4291E11 y para el Gasto a 6,22089, así mismo muestra el error de estándar y el valor de la prueba t de significancia individual junto con su p-valor: para el intercepto tenemos un valor de t de -0,11 con un p-valor de 0,9091, mientras que para el gasto un valor calculado de 61,42 con un p-valor menor al 0,001. Sin embargo, según la prueba de significancia individual el intercepto no es significativo, ya que el p-valor de una variable debe ser menor o igual a 0,05, éste es un criterio usado en econometría, teniendo en cuenta lo anterior debemos eliminar el término de intercepto del modelo para lo cual usaremos el comando “noint”. Programamos nuevamente: PROC REG DATA=regresion; MODEL pib=gasto / noint; RUN; Y se obtienen los siguientes resultados en la ventana “Output”:

Más abajo se encuentra que significa la prueba F y el p-valor, el conferencista si desea puede explicarlo en el momento o seguir el orden de la clase aquí expuesta. 11

88

INV- Software de Análisis Estadístico SAS /2013-I

Aparecen diferencias en lo estimado, por ejemplo el aumento de errores en el modelo, dado que ahora este modelo está siendo explicado por solo una variable independiente, el R-cuadrado y el R-cuadrado ajustado también han aumentado lo cual indica que el modelo explica mejor que antes el comportamiento del PIB y finalmente la estimación del parámetro del gasto con un coeficiente de 6,21409 y un nivel de significancia menor al 0,0001. Teniendo esto, ya se tiene el modelo definitivo con los parámetros estimados: ̂

̂

El modelo nos indica entonces que ante un cambio de una unidad en el Gasto Público de la nación, habrá un aumento de 6,21409 unidades en el PIB , interpretaciones de este tipo sugieren que aumentar el gasto público a largo plazo implica una mayor acumulación de riqueza para la nación lo cual es bastante positivo. Hay que resaltar también que si se ha puesto desde el principio una relación positiva del gasto público con el PIB en el modelo, es porque para plantear un modelo es necesario tener un soporte teórico. En el caso del ejemplo, la ecuación keynesiana del ingreso a nivel macroeconómico es un soporte para plantear una forma funcional para el modelo en el que el aumento del gasto público evidentemente aumentará el PIB.

Donde Y es el ingreso nacional, C es el consumo de la sociedad

89

INV- Software de Análisis Estadístico SAS /2013-I I es la inversión y G el gasto público Así mismo se realiza el análisis estadístico: Observando los resultados entonces tenemos, que por una unidad que aumente el gasto público el PIB aumentará 6,21 pesos como lo indica el parámetro beta. Analizando este resultado brevemente puede decirse que desde la década de los ’70 hasta los años recientes, un aumento del gasto público puede potenciar hasta 6 veces el crecimiento del PIB, y así mismo reducirlo puede contraer el PIB a mediano y largo plazo; esto se debe a que el gasto público tiene la función de incentivar a la economía y sostener el sector público sobre el que producen muchos colombianos, así que puede pensarse que el gasto público es una inversión que resulta con más producción y mayor riqueza para la nación.

2.4.5. Quinta Clase – Regresión multiple La regresión múltiple nos permite ampliar los análisis realizados en regresión simple, entendiendo que un modelo de regresión múltiple es simplemente una ampliación del modelo simple, con la inclusión de más variables exógenas y más parámetros. Algunos comandos nuevos surgen para poder hacer la regresión:    

ODSGRAPHICS: Comando para la activación de gráficos de análisis de residuales y variables. AUTOREG: Procedimiento que nos permite incluir diferentes pruebas a la regresión. ARCHTEST: Test de autocorrelación. DWPROB: Comando para arrojar el estadístico Durbin Watson de correlación

Ejemplo: Suponga usted que desea predecir el comportamiento del PIB de Brasil por medio del consumo, las exportaciones, la Inversión Extranjera Directa (IED) neta, importaciones e impuestos de bienes y servicios. Los datos se han tomado con periodicidad anual de 1975 al 2011. Primero, establecemos la estructura del modelo y se explica que dado que el gasto y el PIB están expresados en pesos, es decir unidades monetarias, por eso los cambios que los parámetros reflejarán serán interpretados en pesos también. ̂

̂

̂

̂

̂

̂

̂

Acto seguido insertamos las variables en SAS mediante el procedimiento de inserción desde el ordenador e insertamos la programación en la ventana “Log”: odsgraphicson; procregdata=regmul; model PIB = Consumo XporIEDMporImpu; run;

90

INV- Software de Análisis Estadístico SAS /2013-I Los resultados del procedimiento se muestran, no en la ventana output, sino en una ventana adicional arrojada por el procedimiento ODS:

Observamos entonces, que tenemos 37 observaciones, donde el F-value nos arroja un índice de 9177.28 con un p-value menor al 0.0001 lo que indica que globalmente, las variables exógenas explican el comportamiento de la variable endógena. En cuanto a la estimación de parámetros encontramos que el p-value nos muestra que el intercepto, las importaciones y los impuestos no son significativos, pero dado que no es conveniente retirar todas las variables al mismo tiempo del modelo (porque puede que solo una variable esté causando este sesgo), entonces intentaremos formular modelos alternos retirando una variable a la vez para corregir el modelo como tal. Gráficamente, el procedimiento ODS nos arroja un análisis de los residuales, en cuanto a las oscilaciones, los cuantiles, los valores predichos, la distribución y las observaciones en general; además agrega un análisis gráfico de los residuales por variable:

91

INV- Software de Análisis Estadístico SAS /2013-I

12

Es bueno que el conferencista aclare que estos gráficos sirven para el análisis visual. Por ejemplo que los residuales por variable nos permiten observar sobre qué valores oscila más una variable. 12

92

INV- Software de Análisis Estadístico SAS /2013-I

Primero se retirarán las exportaciones del modelo, así que eliminaremos el “Mpor” de la programación: model PIB = Consumo XporIEDImpu; run; Los resultados que arroja el programa son:

El F-value con un p-value menor a 0.0001 nos permite afirmar que las variables exógenas en su conjunto logran explicar el comportamiento de la variable endógena, además el R-cuadrado es bastante alto, por lo que podríamos decir que es un buen modelo.

93

INV- Software de Análisis Estadístico SAS /2013-I

En cuanto a la estimación por parámetros SAS nos muestra que el intercepto, la inversión extranjera directa (IED) y los impuestos no son significativos para el modelo. Gráficamente de nuevo se muestra el comportamiento de los residuales que esta vez se alejan un poco más de la media que en la ocasión anterior.

94

INV- Software de Análisis Estadístico SAS /2013-I

Dado que al retirar las importaciones del modelo, éste no siguió respondiendo como nosotros deseamos, retiraremos esta vez los impuestos que era la otra variable no significativa, sin antes incorporar de nuevo “Mpor”, ya que puede que solo sean los impuestos los causantes del problema: model PIB = Consumo XporIEDMpor; run; Los resultados que arroja el procedimiento son:

95

INV- Software de Análisis Estadístico SAS /2013-I

El F-value con un p-value menor a 0.0001 nos permite afirmar que las variables exógenas en su conjunto logran explicar el comportamiento de la variable endógena, además el R-cuadrado es bastante alto, por lo que podríamos decir que es un buen modelo.

En cuanto a la estimación por parámetros SAS nos muestra que las importaciones y las exportaciones no son significativas para el modelo. Gráficamente de nuevo se muestra el comportamiento de los residuales que esta vez son más cercanos a la media, según el gráfico de distribución.

96

INV- Software de Análisis Estadístico SAS /2013-I

97

INV- Software de Análisis Estadístico SAS /2013-I

Ya que al eliminar las variables por separado no se llegó a ninguna solución del modelo, se retirarán las importaciones y los impuestos, acto seguido se correrá la regresión nuevamente: model PIB = Consumo XporIED; run; Los resultados que arroja el programa son:

98

INV- Software de Análisis Estadístico SAS /2013-I

Observamos por ejemplo, que el modelo (según la prueba F) sigue siento estadísticamente significativo en su conjunto, el R-cuadrado oscila alrededor del 0,99 y un coeficiente de varianza de 2,432 muy similar al que tenemos con los anteriores modelos.

Luego de eliminar las dos variables, encontramos que la significancia individual de los parámetros ha sido corregida, aunque el intercepto tiene un p-value de 0,0496 no seremos tan estrictos y aceptaremos este parámetro. Económicamente esto implica que:   

Al aumentar un peso el consumo en Brasil, el PIB aumentará 1,15513 pesos Al aumentar un peso las exportaciones, el PIB aumentará 0,60249 Al aumentar un peso la IED en Brasil, su PIB disminuirá 0,66374

Gráficamente los residuales muestran un comportamiento más regular y próximo a la media:

99

INV- Software de Análisis Estadístico SAS /2013-I

Ya que este es el modelo escogido, se pasarán a comprobar algunos supuestos, para comprobar que el modelo es correcto, para ello ejecutaremos dos nuevos comandos. Insertamos la programación en la ventana “Log” de nuevo repitiendo el procedimiento “AUTOREG” e incluyendo luego del modelo los comandos “archtest” y “dwprob”: procautoregdata = regmul; model PIB = ConsumoXporIED /archtestdwprob; run; A partir de esta regresión se obtienen los siguientes datos:

100

INV- Software de Análisis Estadístico SAS /2013-I

Además de los estadísticos que ya hemos visto con anterioridad, aparecen otros nuevo que sirven para la comparación de modelos, pero dado que en esta clase se trabaja con un solo modelo, no se usarán. Estos estadísticos tienen el mismo criterio. Sí al comparar el estadístico que se arroja en un modelo con el que se arroja en otro existe una diferencia menor a uno, no hay gran diferencia entre los modelos, caso contrario hay que evaluar cual de los dos modelos es el mejor. Los estadísticos son:    

AIC: Akaiked Information Criterion AICC: The corrected Akaiked’s information Criterion HQC: Hannah-Quinn Information Criterion SBC: Schwarz’s Bayesian Information Criterion

Por otro lado, las siglas MAE y MAPE corresponden a “media absoluta de los errores” y “porcentaje de la media absoluta de los errores” que son dos criterios que igualmente nos permiten evaluar que tanto los errores se alejan de la media, es decir, tienen una mayor varianza. Puede notar que aquí aparece ya el coeficiente del estadístico Durbin Watson, sin embargo se ejecutó el comando de dicha prueba en la programación para tener información más detallada al respecto.

101

INV- Software de Análisis Estadístico SAS /2013-I

Aparecen nuevos gráficos también, por ejemplo los gráficos “ACF” y “PACF” que corresponden a los gráficos de correlación simple y parcial de los órdenes MA y AR respectivamente, estos gráficon surgen en el caso que estemos trabajando con series de tiempo, tema que se verá más adelante; pero como no es el caso no serán tomados en cuenta.

102

INV- Software de Análisis Estadístico SAS /2013-I

El procedimiento “dwprob” vuelve a arrojar la tabla de los estadísticos que ya observamos con anterioridad y además arroja otra tabla especialmente para el estadístico Durbin Watson que permite detectar la autocorrelación de primer orden AR(1). Si el estadístico Durbin Watson se encuentra entre -1,96 y 1,96 podemos aceptar la hipótesis nula y concluir que no hay autocorrelación de primer orden, para nuestro caso el DW= 0,8314, luego concluímos que no hay autocorrelación de primer orden y el modelo es adecuado.

2.4.6. Sexta clase - Modelos ARIMA Se tienen los datos de la población total de Colombia desde enero del 2001 hasta abril del 2008 en una periodicidad mensual. Se quiere analizar el comportamiento de la variable en estas fechas. Se procede a insertar los datos que usted encuentra en el repositorio (recuerde que SAS admite formatos de Excel solo hasta .xls) por el método de importación y llamaremos a los datos “pob”. Se procede a insertar la programación:

103

INV- Software de Análisis Estadístico SAS /2013-I

proc sgplot data=pob; scatter y=poblacion x=fecha; run; A continuación aparece el siguiente gráfico que presenta, en primera medida, el crecimiento de la población colombiana del 2001 al primer trimestre del 2008.

Se puede observar que la población a lo largo del tiempo ha aumentado de forma lineal del 2001 al 2008 y no hay mayor variación. Después de esto se inserta la programación correspondiente para calcular el modelo ARIMA de la serie: proc arima data=pob ; identify var=poblacion nlag=24; run; Se obtendrá la siguiente información:

104

INV- Software de Análisis Estadístico SAS /2013-I

En esta primera parte se puede ver la autocorrelación en el ruido blanco, primero se realiza una introducción que indica la media, desviación estándar y número de observaciones de la serie. Se puede observar que para cada retardo, la autocorrelación del ruido blanco es contrastada con una prueba Chi-cuadrado, donde la hipótesis nula es que no existe autocorrelación; con un p-valor < 0,001 en todos los retardos podemos rechazar la hipótesis nula y concluir que existe autocorrelación del ruido blanco, luego la serie de la Población no es estacionaria. Gráficamente se observa:

105

INV- Software de Análisis Estadístico SAS /2013-I Es decir que, gráficamente, se corrobora que la serie de la población no es estacionaria, el primer gráfico representa nuevamente la serie graficada contra el tiempo y observamos que efectivamente la media no es constante en el tiempo. El segundo gráfico corresponde al gráfico de autocorrelación simple que corresponde a la parte MA del modelo, se puede observar que las barras del gráfico caen suavemente lo que indica que existe autocorrelación en los errores también. El tercer gráfico muestra la autocorrelación parcial (es decir la parte AR) y éste no presenta ningún inconveniente; el cuarto y último gráfico representa el coeficiente de cointegración de la serie de tiempo, que para este caso será igual a 1. Dado que la serie no es estacionaria, se debe aplicar una diferencia para que esta se vuelva estacionaria. La razón de la caminata aleatoria de la variable es porque esta es una variable en constante crecimiento que jamás logrará mantener su media constante, por ello hay que diferenciarla. Se aplica la siguiente programación: proc arima data=pob ; identify var=poblacion(1); run; Los resultados que muestra SAS ahora son:

106

INV- Software de Análisis Estadístico SAS /2013-I

Al diferenciar la serie (es decir, al incluir (1) en la programación) se encuentra que gráficamente la serie tiene una media constante, sin embargo por los picos que se observan no se puede afirmar que se tenga una varianza constante, es decir, se deben agregar órdenes AR y MA para solucionar el problema, para ello se usan los gráficos de ACF (para MA) y PACF (para AR). Teniendo en cuenta lo anterior, por el método gráfico (es decir, observando las columnas azules que salen del intervalo de confianza que está en azul claro) se determina qué órdenes de AR y MA son convenientes y modelarlos. Se puede observar que basta con agregar un orden en MA y uno en AR para corregir la serie, así que la programación se plantea: proc arima data=pob; identify var=poblacion(1); estimate q=(1) noint method=ml; estimate p=(1) noint method=ml; forecast id=fecha interval=month printall out=b; run; Los resultados son:

107

INV- Software de Análisis Estadístico SAS /2013-I

Se observan, en primera medida, algunos datos como el método de estimación, la cantidad de estimadores, algunos valores máximos y coeficientes que no tocaremos en este curso, note, por ejemplo, que el cuadro inicial avisa que las estimaciones no han convergido a un valor.

108

INV- Software de Análisis Estadístico SAS /2013-I

Se observa que las correlaciones para el orden MA aún son altas y efectivamente el problema no se ha corregido como se puede observar gráficamente.

109

INV- Software de Análisis Estadístico SAS /2013-I

Sin embargo puede notarse que los residuos siguen una distribución normal y los residuales oscilan alrededor de la media.

110

INV- Software de Análisis Estadístico SAS /2013-I

En cambio AR muestra bajas correlaciones al aplicar estos rezagos, lo cual quiere decir que se está solucionando el problema.

111

INV- Software de Análisis Estadístico SAS /2013-I

Observe entonces que se hacen necesarios otros órdenes de AR y MA para modelar la serie de tiempo.

112

INV- Software de Análisis Estadístico SAS /2013-I

En cuanto a los residuales, se observa que estos tienden más a la media igual a cero, sin embargo se desvían más de la media de los datos. En cuanto al procedimiento FORECAST que se observa en la programación que se insertó, encontramos que se encarga de realizar el pronóstico de los datos hasta 112 pasos adelante (es decir, más de 11 años de pronóstico para la periodicidad que se está manejando. Primero se visualiza la tabla de datos del pronóstico. El gráfico del pronóstico en cambio muestra grandes intervalos de confianza lo que muestra que el modelo no es confiable para la predicción, éste es un grave error ya que el principal objetivo de una serie de tiempo es la predicción:

Para corregir esto entonces, existe la opción de diferenciar de nuevo la variable aún arriesgando la estabilidad de la media y varianza de los datos, sin embargo se realiza y se incluyen los órdenes de AR y MA que se consideran pertinentes: proc arima data=pob; identify var=poblacion(2); estimate q=(1,2,12) noint method=ml; estimate p=(1,3,7,8) noint method=ml; forecast id=fecha interval=month printall out=b; run;

113

INV- Software de Análisis Estadístico SAS /2013-I

Los resultados son los siguientes:

Note, entonces, que aún se necesitan más órdenes que ya fueron agregados a la programación con anterioridad, a nivel general parece que el problema se ha solucionado, observamos entonces lo que ocurrió con los grados AR y MA:

114

INV- Software de Análisis Estadístico SAS /2013-I

Observe que las correlaciones han bajado un poco, aunque se siguen manteniendo altas, en comparación, por ejemplo, con las correlaciones que muestra la parte autorregresiva del modelo.

115

INV- Software de Análisis Estadístico SAS /2013-I

Como se puede ver, gráficos nos sugieren por ejemplo agregar el orden 2 a MA, cuando éste ya está agregado, así que este tipo de avisos del modelo no son tenidos en cuenta.

116

INV- Software de Análisis Estadístico SAS /2013-I En cuanto a los residuos, éstos se han ajustado más a la prueba de normalidad y cada vez oscilan más cerca de la media, por lo cual podemos concluir que es el órden adecuado para el modelo. Ahora observamos la parte AR:

Vease que el grado de autocorrelación ha disminuído en una gran cantidad frente a los rezagos.

117

INV- Software de Análisis Estadístico SAS /2013-I

Como se puede observar, al ejecutar el grado MA y AR el problema se ha solucionado y se han agregado los órdenes pertinentes.

En cuanto a los residuales, observe que siguen una distribución normal y que el 75% de los datos oscila alrededor de la media.

118

INV- Software de Análisis Estadístico SAS /2013-I

Finalmente, el procedimiento FORECAST nos arroja la senda de pronótico para la variable que es eminentemente lineal, sin embargo, a diferencia de lo anterior, tiene unos intervalos de confianza más bajos, lo que le da mayor credibilidad al modelo.

2.4.7. Séptima clase – Datos Panel 2.4.7.1.

Definición:

Los Datos Panel son un método de estimación econométrica que recopilan las series de tiempo con una combinación de datos de corte transversal, es decir, permite analizar el comportamiento de diferentes variables exógenas en diferentes períodos de tiempo.

Ejemplo Se tienen datos de diferentes indicadores para los años 1990-1997 en periodicidad anual. Los datos son: PIB per cápita en pesos colombianos, número de habitantes en millones, porcentaje de inflación e índice de alfabetización (índice que va de cero a uno, donde cero es población analfabeta y uno población completamente alfabetizada). El estudio se realizó para los siguientes países: Colombia, Brasil, Ecuador, Venezuela, Argentina, Bolivia, Perú, Uruguay, Paraguay y Chile. Se desea simplemente realizar una visión conjunta de estos indicadores en estos países de Latinoamérica para así mismo observar factores comunes a lo largo del tiempo, teniendo en cuenta que se supone que el PIB pér capita es explicado por el número de habitantes, la inflación y el índice de alfabetización.13 Programación Proc panel data=datos; Id c y; Model PIBper= NumHab Infl Alfab / fixonefixtworanonerantwo pooled; Run;

Estos datos, a diferencia de las demás clases, son datos aleatorios creados por los desarrolladores de ésta investigación, y no corresponden a los datos reales de los países. 13

119

INV- Software de Análisis Estadístico SAS /2013-I

120

INV- Software de Análisis Estadístico SAS /2013-I Se encontrarán los resultados en el siguiente orden: Método de efectos fijos de una diferencia

En el primer cuadro se muestra el método de estimación usado, el número de secciones cruzadas (que corresponde al número de países dentro de la muestra en nuestro caso) y el número de series temporales que corresponde al número de años en la muestra. En el segundo cuadro se muestran los estadísticos de ajuste que corresponde a la varianza (SSE), la media de los errores (MSE), los grados de libertad (DFE), la raíz de la media de los errores (Raíz MSE) y el R cuadrado, que nos muestra que las variables exógenas logran explicar en un 87% el comportamiento de la variable endógena. En cuanto a la significancia global de parámetros (test de F para efectos no fijos), el modelo se contrasta con una prueba F que nos muestra que los parámetros incluidos tienen un grado de importancia sobre el modelo globalmente; en la estimación por parámetros observamos que si bien todos los interceptos tienen significancia dentro del modelo, sólo el índice de alfabetización resulta significativo para el modelo. Por tanto se deciden explorar los otros métodos de estimación.

121

INV- Software de Análisis Estadístico SAS /2013-I

En cuanto a la interpretación de los gráficos, se observa un comportamiento normal donde los errores no se desvían mucho de la media, y siguen una distribución normal de los mismos.

Se puede apreciar un comportamiento aleatorio de los errores, es decir que no sigue ningún tipo de forma, se observa, además, que el valor predicho por el modelo no coincide con el comportamiento real de las variables lo cual es otro motivo para descartar el método.

122

INV- Software de Análisis Estadístico SAS /2013-I

Método de efectos aleatorios de dos diferencias:

Teniendo en cuenta las descripciones de los cuadros anteriores se observa que el R cuadrado es apenas de 5,26%, lo cual nos dice que las variables no logran explicar el comportamiento de la variable endógena.

Aparecen dos cuadros adicionales para el método de efectos aleatorios, uno que nos indica la varianza de las variables cruzadas, temporales (es decir las dummys que representan cada país y cada año) y la varianza de los errores de estas variables; y otro que nos arroja el Test de Hausman. Contrastado con una prueba , el Test de Hausman arroja un nivel de significancia de 0.0138 lo cual rechaza la hipótesis nula, es decir, existe correlación entre los efectos aleatorios y las variables regresoras, luego no es recomendable hacer uso del método de efectos aleatorios para estimar el modelo. En cuanto a la significancia individual de los parámetros ahora todas las variables resultan insignificantes, a un nivel de significancia del 10% el número de habitantes resultaría significativo.

123

INV- Software de Análisis Estadístico SAS /2013-I

En cuanto a la parte gráfica observamos que los errores no tienen un comportamiento normal, su varianza sobrepasa los límites de la distribución normal y en definitiva no tienden a la media.

En cuanto a los gráficos de la variable endógena encontramos que los valores predichos rondan el valor real de la variable y esta vez sí se notó el punto de quiebre en 1994.

124

INV- Software de Análisis Estadístico SAS /2013-I

Método de efectos aleatorios de una diferencia:

La presentación del cuadro es idéntica a la presentada anteriormente, salvo que en este caso tenemos el método de efectos aleatorios de una diferencia. Observamos entonces por ejemplo que el R cuadrado nos muestra que el modelo sólo logra explicar el 26% de la variable endógena, solo el índice de alfabetización es significativo para el modelo, y el Test de Hausman esta vez nos arroja un p-valor de 0.72 al 5% de significancia, lo cual nos indica que no hay gran diferencia entre escoger métodos fijos o aleatorios para realizar la estimación.

125

INV- Software de Análisis Estadístico SAS /2013-I

En los gráficos se observa nuevamente una gran variabilidad de los errores, esta vez un poco menos que en el método de estimación aleatoria con dos diferencias.

En cuanto a los gráficos de la variable endógena se observa que se logró captar el punto de quiebre de 1994 y el aumento a partir de 1996.

126

INV- Software de Análisis Estadístico SAS /2013-I Método de efectos fijos de 2 diferencias:

En éste método observamos por ejemplo que el R cuadrado nos indica que las variables exógenas logran explicar en un 93% el comportamiento de la variable endógena, esto se complementa con el resultado de la prueba F que nos indica que el modelo es globalmente significativo. Sin embargo en la estimación de parámetros individual encontramos que si bien casi todas las dummys que corresponden a las series cruzadas y temporales son significativas, nuevamente los parámetros del modelo no lo son, en este caso solo el intercepto es significativo.

127

INV- Software de Análisis Estadístico SAS /2013-I

Gráficamente observamos que aunque los errores sobrepasan los límites de la distribución normal, si se logra observar una tendencia de los mismos.

En cuanto a la variable endógena se observa de una forma mucho más clara que se logró predecir la caída de 1994 y el crecimiento sostenido a partir de 1996, finalmente los residuales presentan un comportamiento aleatorio.

128

INV- Software de Análisis Estadístico SAS /2013-I

Método Pooled:

El método Pooled nos muestra una desviación de la media menos a los anteriores métodos utilizados, un R cuadrado de 0.42 que implica que las variables endógenas explican en un 42% el comportamiento de la variable exógena. En cuanto a la estimación individual de los parámetros encontramos que ésta vez es solo el intercepto la variable poco significativa en el modelo.

129

INV- Software de Análisis Estadístico SAS /2013-I

La gráfica nos permite observar que los errores tienen una gran variabilidad y aunque siguen una distribución normal, superan los lineamientos de la misma.

En cuanto a la gráfica de predicción del PIB per cápita, no se predice el punto de quiebre ya mencionado anteriormente, y el crecimiento no logra ser tan grande como el real.

130

INV- Software de Análisis Estadístico SAS /2013-I Se ha observado hasta el momento que ningún método ha logrado reunir todas las características propias para ser el método escogido, el principal problema observado es la estimación individual de parámetros, así que como primera medida se retirará el intercepto del modelo, buscando que éste se ajuste más y podamos elegir algún método, teniendo en cuenta que no podemos determinar entre todos los métodos cual es la peor variable exógena para retirar, ya que los resultados son muy variables.

Método de efectos fijos de una diferencia sin intercepto:

Sin el intercepto observamos entonces que según el R cuadrado las variables exógenas explican en un 87% el comportamiento de la endógena y se corrobora con la significancia de la prueba F. Sin embargo esta vez las dummys que los efectos fijos agregan para las series cruzadas y las series temporales no resultan significativas en su mayoría, así mismo solo el índice de alfabetización resulta significativo en este caso.

131

INV- Software de Análisis Estadístico SAS /2013-I

En cuanto a los gráficos de los errores, se muestra una distribución normal de los errores que rondan alrededor de la media.

En cuanto a los gráficos del PIB per cápita si bien se acerca más el crecimiento predicho al real, no se muestra el punto de quiebre de 1994.

132

INV- Software de Análisis Estadístico SAS /2013-I Método de efectos aleatorios con una diferencia sin intercepto:

Al usar el método de efectos fijos, observamos que según el R cuadrado las variables exógenas explican en un 53,86% el comportamiento de la variable endógena, el Test de Hausman, a un nivel de significancia del 5% nos arroja un p-valor de 0.30 con lo que podemos asumir que elegir entre efectos fijos y aleatorios no representa una mayor diferencia. En cuanto a la significancia individual de los parámetros encontramos que aunque ahora son un poco más significativos no se encuentran dentro del nivel de aceptación, salvo nuevamente por el índice de alfabetización.

133

INV- Software de Análisis Estadístico SAS /2013-I

Respecto a los gráficos de los errores, observamos que los errores tienen una gran variabilidad respecto a la observación de la variable, y aunque sobrepasan un poco los límites de la distribución, ésta es normal.

En cuanto a los gráficos que corresponden a la variable endógena, se encuentra que se identifica el punto de quiebre, sin embargo no se alcanza el máximo crecimiento que alcanza la variable realmente.

134

INV- Software de Análisis Estadístico SAS /2013-I Método de efectos fijos de dos diferencias sin intercepto:

Al realizar el método de efectos fijos con dos diferencias se tiene que el modelo explica en un 93% el comportamiento de la variable endógena, adicional a ello para corroborarlo se observa con la prueba F que el modelo es globalmente significativo. En cuanto a la estimación de parámetros individual observamos que todas las series cruzadas y casi todas las series temporales son significativas, aun así las variables no resultan ser significativas.

135

INV- Software de Análisis Estadístico SAS /2013-I

Observando los gráficos de los errores se tiene que estos no se desvían mucho de lo observado con el PIB per cápita y aunque sobrepasan un poco los límites de la distribución que siguen, estos se comportan de forma normal.

Observando los gráficos que corresponden a lo estimado sobre la variable endógena, se encuentra que los residuales del modelo presentan un comportamiento aleatorio, y lo predicho a partir del modelo logra asimilarse a lo real en la economía.

136

INV- Software de Análisis Estadístico SAS /2013-I

Método de efectos aleatorios de dos diferencias sin intercepto:

Bajo este método, se observa que las variables endógenas del modelo logran explicar en un 40% el comportamiento de la variable endógena según el R cuadrado, además de ello el Test de Hausman arroja un p-valor de 0,03 al 5% de significancia con lo que no se rechaza la hipótesis nula y se tiene que estimar el modelo por efectos fijos o por efectos aleatorios de dos diferencias no afecta mucho la estimación como tal. En la significancia individual se observa que el índice de alfabetización es la única variable significativa, ya que el número de habitantes apenas alcanza un nivel de aceptación.

137

INV- Software de Análisis Estadístico SAS /2013-I

En cuanto a los residuales se observa una gran variabilidad alrededor de lo observado del PIB per cápita y un comportamiento normal de los errores en cuanto a la distribución.

Respecto a los gráficos del PIB per cápita sí se observa que los residuales siguen el comportamiento de la variable, aunque no se logró percatar completamente el punto de quiebre que hay en el modelo.

138

INV- Software de Análisis Estadístico SAS /2013-I

Método Pooled sin intercepto:

En cuanto a este método se observa que la desviación de los errores de la media es mucho menor que en otros modelos, el R cuadrado nos indica que las variables exógenas explican en un 88,7% el comportamiento de la variable endógena, y además es el único modelo donde individualmente los parámetros han resultado significativos (es decir, todos tienen un p-valor menor al 0,0001).

139

INV- Software de Análisis Estadístico SAS /2013-I Gráficamente se observa que los residuos no oscilan alrededor de la media, aunque siguen una distribución normal.

En cuanto a los gráficos que le corresponden al PIB per cápita, se observa que los residuales logran seguir el mismo patrón que los datos observados, en el valor predicho de la variable se tiene que se reconoce el punto del ’94, pero no se reconoce el crecimiento que en realidad presentan los países. A modo de conclusión, el mejor método para estimar este modelo es el método Pooled sin intercepto, pues el modelo logró reunir todas las características para estimar datos panel como la base de datos del ejemplo, aunque según lo visto en la última gráfica, el modelo no es muy adecuado para la predicción; sin embargo, si se fuera un poco más flexible con el nivel de aceptación, al 10% de significancia puede escogerse además de los Datos Pooled, el método de efectos aleatorios en dos diferencias.

2.4.8. Octava clase – ODS Graphics Designer Ejercicio 1

Se tienen datos aleatorios de dos variables X y Y. Se desea observar la relación entre las dos variables. En primera medida, se importa el archivo por medio del asistente de importación, observamos que la ventana LOG indica que los datos han sido subidos:

140

INV- Software de Análisis Estadístico SAS /2013-I

En el panel izquierdo del programa, se busca la librería WORK y el nombre de los datos que en este caso es “grafico1”, haciendo doble clic sobre él se desplegará una ventana aparte que permitirá observar los datos del archivo de Excel, es recomendable hacer esto para saber qué tipo de gráfico usar.

Luego de ver los datos, se hace clic en “Herramientas” y vamos a ODS Graphics Designer:

141

INV- Software de Análisis Estadístico SAS /2013-I Esta es la interfaz inicial del diseñador de gráficos, dado que queremos realizar un gráfico comparativo entre dos variables, se optó por usar el gráfico de “Trazado de dispersión”.

Luego de ello aparece la ventana que permite asignar los datos y las variables para graficar:

142

INV- Software de Análisis Estadístico SAS /2013-I

Se selecciona la librería de los datos (en este caso WORK), el conjunto de datos a utilizar (GRAFICO1) y las variables a utilizar, en este caso como los títulos de cada conjunto de datos son X y Y, las seleccionaremos así. Los demás parámetros ya están seleccionados por defecto para el propósito de este primer ejercicio sencillo, así que finalmente se hace clic en Aceptar.

143

INV- Software de Análisis Estadístico SAS /2013-I El gráfico fácilmente fue realizado por el diseñador, en el panel izquierdo se encuentran las opciones para insertar un nuevo gráfico o combinarlos, además opciones de diseño adicional. Estas opciones pueden colocarse sobre el gráfico arrastrándolas con el mouse sobre el gráfico. Por ejemplo, al arrastrar la opción “Leyenda gradiente” aparecerá un recuadro como el de la imagen anterior que nos permitirá poner una nota a pie, esto es útil para establecer la fuente de la que provienen los datos del gráfico por ejemplo. Con “Leyenda discreta” aparecerá una pequeña leyenda sobre el eje X, se aplica si se quiere hacer un comentario sobre el gráfico.

En cabecera celda se habilitan los contenidos para agregar título y subtítulo:

144

INV- Software de Análisis Estadístico SAS /2013-I

Si se desea cambiar el estilo del gráfico, se hace clic en Formato > Estilo > Más estilos... Con esto aparecerá la ventana que se observa en el gráfico de abajo, existen diferentes estilos personalizados, en este caso se elegirá “Science” para este primer gráfico.

Si se desea editar los estilos predeterminados del paquete, se hace clic en Herramientas > Editor de Estilos, así al hacer clic sobre el gráfico que se encuentra en la parte derecha del editor se mostrarán las opciones para cada componente de los gráficos:

145

INV- Software de Análisis Estadístico SAS /2013-I

Luego de hacer los ajustes que el conferencista desee en la clase, en este caso no se realizaron cambios en los colores, así que el gráfico finalmente queda:

Ejemplo 2:

Se tienen datos de una regresión múltiple, donde el empleo (Emp) busca ser explicado por el PIB (GNP), el PIB per cápita (GNPdf), el índice de desempleo (Unemp), cantidad de fuerzas armadas disponibles (ArmFor) y Población en miles (Pop).

146

INV- Software de Análisis Estadístico SAS /2013-I Nuevamente importamos los datos que llamaremos “GRAFICO2” y observaremos los datos para saber qué tipo de gráficos usar para el análisis.

Dado que el Diseñador de Gráficos ODS ya se encuentra abierto, minimizaremos la pestaña y nos dirigiremos a Fichero > Nuevo > Nuevo gráfico en blanco.

147

INV- Software de Análisis Estadístico SAS /2013-I

Luego de ello fácilmente puede arrastrarse del panel izquierdo el gráfico que necesitemos para comenzar a trabajar, en este caso se dividirá el panel de gráficos en 4 con los botones “Añadir Fila” y “Añadir columna, señalados en el siguiente recuadro con los círculos rojo y azul. En el primer gráfico, se usó el gráfico de barras y el gráfico de series para contrastar el Empleo contra el PIB per cápita, para combinar gráficos simplemente se arrastra un gráfico sobre otro, o al hacer clic derecho se selecciona “Añadir un elemento...”, asimismo para agregar un gráfico sobre un recuadro que no tenga un cuadro previo se puede usar ésta opción.

148

INV- Software de Análisis Estadístico SAS /2013-I

Así, se realizó el mismo procedimiento por cada cuadro, en el recuadro 2 se usó el gráfico de agujas, en el recuadro 3 el de regresión con las opciones que por defecto tiene este gráfico, y para el cuadro 4 se usó el gráfico PBSpline que permite suavizar la tendencia de la variable endógena.

149

INV- Software de Análisis Estadístico SAS /2013-I Ejemplo 3:

Se desea desarrollar un modelo básico de Solow, teniendo en cuenta los datos de Luxemburgo, pero primero se observará gráficamente el comportamiento de los mismos. En el modelo planteado se supone que el logaritmo natural del ingreso es igual al logaritmo natural del capital más el logaritmo natural del empleo. Nuevamente se importan los datos y la ventana LOG nos indica que se han cargado correctamente:

Y estos son los datos desde el Visor de Tablas de SAS:

Se siguen los pasos anteriores, y se arrastra un gráfico de pasos, que aunque no es el correcto para analizar este tipo de variables, observaremos su forma, como eje X se tendrá la variable dependiente LnY y como variable independiente LnK: Se le aplica el estilo “Money” y hacemos clic en “Agregar un elemento...” para agregar otro gráfico sobre él, usaremos el gráfico de Regresión que es el más apropiado para estos datos:

150

INV- Software de Análisis Estadístico SAS /2013-I

151

INV- Software de Análisis Estadístico SAS /2013-I Además de la opción para escoger variables se observan dos cuadros “CLM” que permite visualizar la línea de trazado, y “CLI” que permite visualizar las bandas, en este caso seleccionaremos los dos para observar el gráfico completo. Luego se agregará otra fila y se hará un gráfico de regresión para contrastar LnY contra LnL, esta vez no seleccionaremos ninguna de las dos casillas.

Se observa entonces en la siguiente imagen que aunque no se seleccionó ninguna de las dos casillas se observan un poco degradadas la línea de trazado y las bandas.

152

INV- Software de Análisis Estadístico SAS /2013-I

Como aparece también en esta imagen, al pasar el mouse sobre la línea nos encontraremos con que esta se resalta un poco y arroja el valor de los ejes en el punto sobre el que está el mouse. Se observa que esto pasa con las dos líneas:

153

INV- Software de Análisis Estadístico SAS /2013-I

Al hacer clic derecho sobre uno de los gráficos, seleccionamos “Asignar datos” para modificar en cualquier momento nuestro gráfico, se observa por ejemplo que para el gráfico de arriba que tiene aplicado el gráfico de regresión 2 “regression2” se retirarán las bandas para poder apreciar mejor este gráfico combinado.

154

INV- Software de Análisis Estadístico SAS /2013-I Al pasar el mouse sobre las líneas también se observan los valores en el punto en que nos ubiquemos. Se puede observar gracias a esto que por ejemplo, el ingreso aumenta en una mayor proporción cuando aumenta el empleo que cuando aumenta la inversión del capital, esto se observa porque la pendiente de la recta con LnL es más inclinada que la recta que corresponde a LnK. Finalmente este es el gráfico resultante, luego de agregar títulos:

3.

Conclusiones

El software estadístico SAS es un potente programa el cual abarca la mayoría de aplicaciones que reúnen todas las características de un software estadístico, por lo tanto, sería muy enriquecedor para toda la unidad de informática establecer un curso libre sobre SAS. La principal desventaja de este programa es que su licencia es costosa, sin embargo la Unidad de informática de la facultad de Economía posee esta licencia lo cual facilita en gran medida su aprendizaje y la posterior ejecución del curso libre. A medida que vamos avanzando en el programa, nos damos cuenta que este se vuelve cada vez más completo y más complejo, sin embargo, sus resultados son mejores cada vez por lo que es muy importante continuar con el proceso de búsqueda de manuales nuevos vía internet.

155

INV- Software de Análisis Estadístico SAS /2013-I El método de trabajo en un principio funcionó bien, sin embargo al encontrar los nuevos temas del software, este método no funcionó por lo que ahora se trabajará esta investigación de otra forma, la cual es una reunión semanal entre los investigadores con el fin de aprender uno del otro lo que se encuentra en la semana y poder realizar el material de clase del software. Debido a que existieron numerosos problemas con la licencia del software de SAS en la Universidad, no fue posible avanzar como se tenía planeado en la investigación, de hecho, hasta hace un par de semanas se logró probar algunos códigos de programas de SAS para regresiones simples y múltiples. Esperamos que se pueda trabajar en la investigación y en el software en la Universidad de aquí en adelante con mayor facilidad que antes. De acuerdo a lo encontrado en la revisión de literatura de SAS, las regresiones y las series de tiempo son modelos bastantes completos el cual el sistema logra modelar muy bien. Es de gran importancia enfocarse más en estos temas en especial series de tiempo que es un modelo aún más complejo. ANEXOS Anexo 1. PIB y Gasto Público en Colombia desde 1970 hasta 2009 Año

14

PIB

Gasto

1970

1,3277E+11

1,2E+10

1971

1,5589E+11

1,7E+10

1972

1,8961E+11

1,8E+10

1973

2,4316E+11

2,3E+10

1974

3,2238E+11

2,8E+10

1975

4,0511E+11

3,6E+10

1976

5,3227E+11

4,4E+10

1977

7,1603E+11

5,5E+10

1978

9,0949E+11

7,8E+10

1979

1,1888E+12

1,11E+11

1980

1,5791E+12

1,59E+11

1981

1,9828E+12

2,07E+11

1982

2,4973E+12

2,73E+11

1983

3,0541E+12

3,35E+11

1984

3,8566E+12

4,26E+11

1985

4,9659E+12

5,31E+11

1986

6,788E+12

6,6581E+11

1987

8,8244E+12

7,68E+11

1988

1,1731E+13

1,013E+12

1989

1,5127E+13

1,396E+12

1990

2,0228E+13

1,9E+12

Fuente: Banco Mundial.

156

14

INV- Software de Análisis Estadístico SAS /2013-I

4.

1991

2,6107E+13

2,414E+12

1992

3,3515E+13

3,2E+12

1993

4,3898E+13

4,424E+12

1994

6,7533E+13

9,9379E+12

1995

8,4439E+13

1,2866E+13

1996

1,0071E+14

1,8596E+13

1997

1,2171E+14

2,4842E+13

1998

1,4048E+14

2,9271E+13

1999

1,5157E+14

3,4457E+13

2000

2,095E+14

3,5E+13

2001

2,2709E+14

3,7791E+13

2002

2,4635E+14

3,9701E+13

2003

2,7312E+14

4,305E+13

2004

3,0776E+14

4,8478E+13

2005

3,4016E+14

5,4427E+13

2006

3,839E+14

6,0145E+13

2007

4,3107E+14

6,6983E+13

2008

4,8104E+14

7,3459E+13

2009

5,0853E+14

8,0486E+13

Referencias

N/A.

(19 de Febrero de 2013). Wikipedia, enciclopedia libre. http://es.wikipedia.org/wiki/SAS_%28lenguaje_de_programaci%C3%B3n%29

Obtenido

de

N/A.

(20 de Febrero de 2013). Wikipedia, la enciclopedia http://en.wikipedia.org/wiki/Comparison_of_statistical_packages

Obtenido

de

Official

Page, S. (18 de Febrero de 2013). Statistical http://www.sas.com/offices/europe/spain/copyright.html

Analysis

libre.

Software.

Obtenido

de

Official Page, S. (18 de Febrero de 2013). Statistical Analysis Software SAS. Obtenido de http://support.sas.com/documentation/installcenter/92/sasinstall/9.2/unx/lnx/sreq.pdf Official Page, S. (18 de Febrero de 2013). Statistical Analysis Software SAS. Obtenido de http://www.sas.com/offices/latinamerica/mexico/technologies/analytics/forecasting/ets/index.html Universidad Complutense de Madrid. (19 de Febrero de 2013). Servicios Informático de Apoyo a Docencia e Investigación. Obtenido de http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/Categor/CursoSAS9.pdf Universidad Nacional de Colombia, sede Medellín (28 de Febrero de 2013). Breve Manual de Inducción al SAS, uso de la parte interactiva ANALYST. Obtenido de http://www.unalmed.edu.co/~estadist/INDUCCION%20SAS.pdf

157

INV- Software de Análisis Estadístico SAS /2013-I Eduteka.

(3 de Marzo de 2013). Obtenido de index.php?page=Desviaci%C3%B3n+est%C3%A1ndar+(tipo)

U.

(3 de Marzo de 2013). Aula virtual de Bioestadística. stadistica.bio.ucm.es/glosario2/def_media_muestral.html

C.

Vitutor.

(3 de Marzo de 2013). Vitutor http://www.vitutor.com/estadistica/descriptiva/a_3.html

de

http://www.eduteka.org/glosario/tiki-

Obtenido

estadística.

de

Obtenido

Gujarati, D. Econometría. 5° Edición McGraw Hill. 2010. http://onlinelibrary.wiley.com/doi/10.1111/j.1540-6261.1964.tb00754.x/abstract (2013)

158

http://e-

de

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF