Unidad 5 Series de Tiempo
Short Description
Download Unidad 5 Series de Tiempo...
Description
Unidad 5 series de tiempo 5.1 modelo clásico de serires de tiempo 5.2 analisis de fluctuaciones 5.3 analisis de tendencia 5.4 analisis de variaciones cíclicas 5.5 medicion de variaciones estacionales e irregulares 5.6 aplicación de ajustes estacionales 5.7 pronosticos basados en factores de tendencia y estacionales
Resumen El análisis de series de tiempo desempeña un papel importante en el análisis requerido para el pronóstico de eventos futuros. Existen varias formas ométodos de calcular cual va a ser la tendencia del comportamiento del proceso en estudio. En el presente documento se procede a aplicar el análisis de series de tiempo aplicado al estudio del comportamiento en la forma de acceso a Internet, considerando básicamente el factor ancho de banda. Hoy en día las aplicaciones y mayores avances en cuanto a uso de Internet se dan con aplicaciones que requieren un gran ancho de banda. Latelemedicina, por ejemplo no se podría dar si es que no estamos en capacidad de poder comunicarnos a un ancho de banda que nos asegura una inmediata comunicación tanto en envió como respuesta de señal. Un país va midiendo su avance tecnológico, también en función de que forma y con que características accede a Internet, cuales son las velocidades decomunicación, cuantos usuarios hay en las diferente modalidades y también a que nivel de penetración se llega en el uso de Internet. El análisis estadístico hoy en día se ve facilitado en gran medida por herramientas de software que permiten una rapidez en el procesamiento para posterior análisis así como su amplia capacidad gráfica, en este documento se muestran reportes y cálculos obtenidos con una de ellas, trabajada dentro de su período de evaluación libre. 1.
El análisis de ocurrencias a través de series de tiempo para estudios relativos a procesos de ventas, variaciones en comportamiento respecto aconsumo, variación de índices de inflación o como es el caso presente, formas de acceso a Internet considerando diversas velocidades de comunicación o también capacidad del ancho de banda es decir banda ancha (mayores a 1Mbps) o menores a ella llamándole banda angosta, nos permitirá analizar de manera sencilla el pronóstico de resultados futuros y dependiendo de la técnica de análisis de tendencia nos aproximaremos con mayor o menor precisión a los valores que van a suceder. Cualquier análisis tiene que considerar además, que los factores que han venido ocurriendo en el período a evaluar seguirán influenciado del mismo modo en nuestro
escenario futuro. Cualquier cambio fuerte o inesperado en alguno de los factores podrá traer el no cumplimiento de las tendencia calculadas. 2. Introducción Una serie de tiempo es un conjunto de datos numéricos que se obtienen en períodos regulares a través del tiempo [1]. Estos datos pueden ser muy variados, generalmente son usados para evaluar el comportamiento de las ventas de una empresa, o para evaluar el comportamiento de los índices de precio de un país o de un tipo de producto pero en general pueden aplicarse a cualquier negocio y /o área. Este comportamiento puede tener características de tipo estacional, o cíclico o siguen alguna tendencia ya sea a la baja, de subida o sin variación. Las organizaciones en general evalúan periódicamente el comportamiento de su actividad y/o productos a fin de pronosticar que va a suceder en el futuro en base a lo que ha venido ocurriendo en el pasado, esta sucediendo en el presente y tiene la tendencia a comportarse de la misma manera en el futuro. El comportamiento de las series de tiempo, se debe a 4 componentes: la tendencia, la variación cíclica, la variación estacional y la variación irregular [2]. La tendencia o tendencia secular, es aquella tendencia a largo plazo sin alteraciones de una serie de tiempo. Esta tendencia pudiera ser de tipo lineal o no lineal, así como también creciente o decreciente y también como una combinación de alguna de las anteriores. Muchos productos,servicios e indicadores económicos siguen un comportamiento de este tipo, y su análisis más generalizado es a través de varios años, teniendo en cuenta los períodos que más se ajustan a cada negocio, pudiendo ser semestrales, trimestrales, mensuales, semanales, etc. La segunda componente es la variación cíclica en la que a través del período de tiempo analizado se producen ascensos y descensos en varias oportunidades. Este tipo de comportamiento es muy asociado a variaciones de carácter económico. La tercera componente es la variación estacional, que tiene como característica de variación regular dentro de un año y que a su vez se repite cada año, casos típicos son la producción de algunas frutas y/o comestibles o ventas asociadas a productos como ropa de temporada. La última componente es la componente irregular que adiciona las características anteriores pero además tiene comportamiento extraños imprevisibles que se dan generalmente en el corto plazo. Para poder pronosticar cual es el comportamiento futuro de una variable en función a estas características de comportamiento es necesario poder representarlo matemáticamente. Existen métodos llamados métodos de suavizamiento [3] porque su objetivo es suavizar la variación causada por el componente irregular de la serie de tiempo, estos métodos son: el de promedios móviles, promedios móviles ponderados y suavizamiento exponencial. La tendencia lineal es la mas sencilla de representar, y utilizar sí es ése el comportamiento de nuestra variable analizada. 3. Series de Tiempo El uso de Internet, y las características de acceso a éste, nos permiten hoy en día tener una idea de en que grado se esta usando las Tecnologías deInformación y Comunicaciones en general. Podemos analizar y comparar personas, miembros de una institución y hasta países enteros., es más se utiliza mucho de esa
manera para ver que grado de desarrollo y avance están teniendo los países o regiones. 4.
Comportamiento de Acceso a Internet considerando diferentes velocidades de comunicación o acceso. Por ejemplo la Oficina de la Autoridad de Telecomunicaciones de Hong Kong, [4], nos señala algunas características de estos servicios, por ejemplo nos dice que a Agosto de 2005 se tenían 986, 852 usuarios que se conectan a través e comunicación no dedicada o conmutada a velocidades menores a 1Mbps, y 1’618,975 usuarios se conectan a velocidades mayores a 1Mbps es decir banda ancha. Así mismo cuenta con 187proveedores e servicio de Internet (ISP). Tanto Hong Kong como Perú pertenecen al Foro Económico Asia Pacífico que agrupa a 21 miembros, y observando algunos índices vemos que estamos muy atrasados al respecto. Velocidades mayores a 1Mbps a nivel usuario individual particular son bastante caras y no tiene un número elevado de usuarios, es más la mayoría de cabinas públicas hasta con 10 máquinas utiliza como ancho de banda 512 Kbps. Del 29 de mayo al 3 de Junio del 2005 se celebró en nuestra capital la 6ta Reunión Ministerial sobre la Industria de las Telecomunicaciones e Información [5] y en ella se dieron diversas exposiciones de los avances logrados en cada uno de los miembros, siendo muy escasos los logros sostenidos por Perú, talvez los más saltantes son los de acceso rural satelital para las comunidades mas alejadas [6], pero características de avance en cuanto velocidades de acceso y nivel de penetración del Internet, no se han logrado grandes avances. Cabe remarcar que este foro comprende una de las regiones demás dinamismo y desafíos en el mundo, pertenecen a ella grandes potencias como China, EEUU, Canadá, Corea y también Perú. Comprende alrededor del 60% del Producto Interno Bruto mundial y un 47% del comercio global, representa la región económicamente más activa habiendo generado cerca del 70% del crecimiento económico global. Ha invertido 632 billones de dólares enTecnología de Información y Comunicaciones (TICs), para el año 2007 se espera que la cifra se eleve a 822 billones de dólares. Es claro pues la importancia que se le da a las TICs e Internet para el desarrollo de esta área.
5. Antecedentes Teniendo en cuenta que en las páginas mencionadas anteriormente se ha encontrado información estadística respecto al número de usuarios y/oclientes de acceso a Internet diferenciados por la velocidad de acceso a la que tienen el servicio, menores o mayores a 1 Mbps [7], se procederá a analizar a través de series de tiempo la tendencia de crecimiento o decrecimiento en número de usuarios de estos servicios. En dicho informe se tiene información para acceso a banda angosta o menor a 1Mbps desde marzo de 1999, y solo a partir de febrero del 2000 se tiene la información correspondiente a acceso mayores a 1 Mbps.. Para efectos e nuestro an{alisis solo tomaremos la información recogida para los períodos de enero del 2002 hasta agosto del 2005. Esta información fue proporcionada a la OFTA por los proveedores de servicios de Internet (ISPs ) de la ciudad de Hong Kong. No se ha hecho un estudio sobre la base de nuestro país, porque simplemente no se dispone de ella. 6. Planteamiento Determinar la tendencia en la cantidad de usuarios con conexiones a Internet en las dos modalidades: menores a 1Mbps y también de las iguales o superiores a 1Mbps
considerada de banda ancha. Se encontrará tanto gráfica como matemáticamente las ecuaciones que representen esta tendencia, para los próximos 6 meses. Para poder lograr nuestro objetivo utilizaremos el software estadístico MINITAB ® Release 14.13 (MINITAB ® es marca registrada de Minitab Inc.) 7.
Objetivos Para el Caso 1: Clientes que acceden a Internet a través de Banda angosta, se estima seguirá una tendencia decreciente. Para el Caso 2: Clientes que acceden a Internet a través de Banda ancha, se estima que irán aumentando.
8. Hipótesis El análisis realizado tomó en cuenta dos tipos de clientes o cuentas de acceso a Internet, dependiendo de la velocidad de acceso hacia la red, menores a 1 Mbps. (banda angosta) e iguales o mayores a 1 Mbps.(banda ancha) 1.
Caso 1: Clientes que acceden a Internet a través de Banda angosta
2. Para este primer caso se analizó el comportamiento de clientes con un tipo de acceso a través de líneas no dedicadas o también conocido como acceso conmutado o dial-up que son realizado a través de un modem, y son de banda angosta (velocidades de acceso menores a 1 Mbps). En la Figura 1 se presenta un gráfico con los valores obtenidos de la serie de tiempo, de Enero del 2002 a Agosto del 2005. Se puede observar que en los primeros 18 meses el descenso fue mas pronunciado que en los últimos doce meses de análisis.
Luego lo que se obtuvo fue el análisis de tendencia siguiendo el método lineal, la ecuación que representa esta tendencia esta dada por la expresión: Yt = 1801091 - 23085.4*t
y como se aprecia en la figura 2 se muestra la tendencia el valor proyectado para los próximos 6 meses. Para los análisis de tendencias consideraremos el valor para el factor MAD, (Mean Absolute Deviation – Desviación Absoluta Media que es igual a [la suma del valor absoluto de (valor actual- valor predicho)] / número de observaciones) Para este caso el MAD = 1.00E+05. El siguiente análisis es usando el modelo de tendencia cuadrática, obteniéndose como ecuación: Yt = 2060597 - 56933.9*t + 752.190*t**2 En la figura 3 se aprecia la tendencia y el valor MAD = 34506.
El siguiente análisis es usando el modelo de la curva creciente, obteniéndose como ecuación: Yt = 1837199 * (0.982902**t) En la figura 4 se aprecia la tendencia y el valor MAD = 82922.
Finalmente el último análisis es el de tendencia de la Curva-S, obteniéndose como ecuación: Yt = (10**7) / (11.3571 - 7.60101*(0.954664**t)) En la figura 5 se aprecia la tendencia y el valor MAD = 6.16E+04. De los 4 análisis hechos observamos: Modelo de Tendencia Lineal : MAD = 1.00E+05 Modelo de Tendencia Cuadrática: MAD = 34506 Modelo de Curva Creciente: MAD = 82922 Modelo de Tendencia de la Curva-S: MAD = 6.16E+04 De todos ellos se escoge el de menor valor MAD, seria el Modelo de Tendencia Cuadrático, seguido por el la Curva-S, pero el efecto real as probable para este tipo de conexión es que siga la tendencia propuesta por el modelo Curva-S, es decir el número de usuarios conectados a velocidades menores a 1Mbps seguirá esta tendencia.
3. Caso 2: Clientes que acceden a Internet a través de Banda ancha. Para el segundo caso se analizó el comportamiento de clientes con un tipo de acceso a través de líneas dedicadas de banda ancha (velocidades de acceso a partir de 1 Mbps o mayores). Los datos considerados tienen en cuenta el acceso de hogares, oficinas y otros pero excluye las redesestablecidas en los campus universitarios. Este tipo de acceso se logra a través de diversos tipos de comunicación, como son: el cable modem, ATM (asynchronus transfer mode),ADSL(asymmetric digital subscriber line), DSL(digital subscriber line) y otras tecnologías. En la Figura 6 se presenta un gráfico con los valores obtenidos de la serie de tiempo, de Enero del 2002 a Agosto del 2005. Se puede observar que hay una orientación clara de crecimiento sostenido en el número de usuarios, aunque este no es perfectamente regular.
Luego lo que se obtuvo fue el análisis de tendencia siguiendo el método lineal, la ecuación que representa esta tendencia esta dada por la expresión: Yt = 696314 + 21519.8*t y como se aprecia en la figura 7 se muestra la tendencia el valor proyectado para los próximos 6 meses. De igual modo que el caso anterior consideraremos el factor MAD. Para este caso el MAD = 22249. El siguiente análisis es usando el modelo de tendencia cuadrática, obteniéndose como ecuación: Yt = 655895 + 26791.9*t - 117.159*t**2
En la figura 8
se aprecia la tendencia y el valor MAD = 15670.
El siguiente análisis es usando el modelo de la curva creciente, obteniéndose como ecuación: Yt = 743915 * (1.01940**t) En la figura 9 se aprecia la tendencia y el valor MAD = 43460.
Finalmente el último análisis es el de tendencia de la Curva-S, obteniéndose como ecuación: Yt = (10**7) / (4.60237 + 9.53967*(0.959983**t)) En la figura 10 se aprecia la tendencia y el valor MAD = 20555. De los 4 análisis hechos observamos: Modelo de Tendencia Lineal: MAD = 22249
Modelo de Tendencia Cuadrática: MAD = 15670 Modelo de Curva Creciente: MAD = 43460 Modelo de Tendencia de la Curva-S: MAD = 20555 De todos ellos se escoge el de menor valor MAD, seria el Modelo de Tendencia Cuadrático, MAD = 15670, seguido del modelo de la Curva-S, es decir el número de usuarios conectados a velocidades mayores a 1Mbps seguirá la tendencia establecida en el modelo cuadrático. 9. Análisis e interpretación de resultados El número de usuarios con velocidad menor a 1Mbps, para los próximos 6 meses ira decreciendo según el comportamiento dado por el modelo de tendencia curva- S que seguirá la ecuación: Yt = (10**7) / (11.3571 - 7.60101*(0.954664**t)). El número de usuarios con velocidad mayor a 1Mbps, para los próximos 6 meses ira creciendo según el comportamiento dado por el modelo de tendencia cuadrático que seguirá la ecuación: Yt = 655895 + 26791.9*t - 117.159*t**2. 10. Conclusiones El análisis de series de tiempo según la tendencia es valido si es que no se dan otros factores que puedan influenciar de manera significativa la tendencia de ocurrencia de los datos, en nuestro caso un avance tecnológico inesperado podría alterar considerablemente el comportamiento de la tendencia.
modelo clásico de serires de tiempo Los modelos de series de tiempo son las técnicas de pronósticos que se basan únicamente en la historia de la demanda del ítem que se esta pronosticando. Trabajan capturando los patrones en los datos históricos extrapolándolos en el futuro. Los Modelos de series de tiempo son adecuados cuando se puede asumir una cantidad razonable de datos y una continuidad en el futuro próximo de las condiciones que se presentaron en el pasado. Estos modelos se adaptan mejor al corto plazo del pronóstico. Esto se debe a la hipótesis de que los patrones pasados y las tendencias actuales se asemejan a los patrones y tendencias que se van a presentar en el futuro. Esto es una suposición razonable en el corto plazo, pero va perdiendo validez en el largo plazo.
Modelos muy Simples: Promedios móviles, ¨Igual al año anterior¨, incrementos porcentuales y ajustes a la curva son los modelos de series de tiempo más sencillos los cuales pueden ser utilizados para generar pronósticos. Estos modelos pueden ser implementados a través de hojas de cálculo rápidamente y no requieren un conocimiento experto en estadística por parte del pronosticador, usualmente estos modelos son muy simples y para tener mayor exactitud en el pronóstico las compañías casi siempre deben acudir a modelos alternativos de series de tiempo.
Modelos de suavización exponencial: suavización exponencial es el método seleccionado por la mayoría de empresas. Estos modelos se desempeñan bien en términos de exactitud, son fáciles de aplicar y pueden ser automatizados, permitiendo ser utilizados a gran escala. Los modelos de suavización exponencial capturan y pronostican el nivel de los datos con los diferentes tipos de
tendencias y patrones estaciónales. Los modelos son adaptativos y pronostican dando mayor importancia a los datos mas recientes sobre los datos más distantes en el pasado.
Box-Jenkins (modelos ARIMA): Los modelos de Box-Jenkins son similares a los modelos de suavización exponencial en que ambos son adatativos, pueden capturar tendencia y patrones estaciónales y son automatizables, se diferencia en que los modelos Box-Jenkins son basados en autocorrelaciones en lugar de una vista estructural de nivel, tendencia y estacionalidad. Los modelos de Box-Jenkins tienden a obtener mejores resultados que los modelos de suavización exponencial para series de tiempo mas largas y estables no son buenos para datos con ruido y alta volatilidad.
Modelo de demanda intermitente de Croston: El modelo de croston esta específicamente diseñado para series de datos donde la demanda para un periodo determinado a menudo es cero y el calendario exacto de la siguiente orden no se conoce. Los datos se caracterizan por un bajo volumen, productos fabricados especialmente para un cliente específico o piezas de repuesto a menudo presentan este tipo de patrón de la demanda. El pronostico no es milagroso (no van a indicarle cuando se pondrá la próxima orden) sin embargo a menudo producen un mejor pronostico que otros enfoques de series de tiempo. Seleccionar el modelo de serie de tiempo adecuado para un determinado grupo de datos puede realizarse de varias maneras. Por ejemplo, el pronosticador puede aplicar el modelo adecuado de acuerdo al conocimiento que posee de los datos. Otra alternativa es probar diferentes modelos y seleccionar aquel que dentro o fuera de la muestra minimiza el error. El algoritmo de selección experta de forecast pro selecciona el modelo adecuado a la serie de tiempo usando una lógica basada en reglas y evaluando el pronóstico generado con modelos diferentes partiendo de una muestra de los datos. Los modelos de series de tiempo considerados en selección experta incluyen las diferentes modelos de suavización exponencial, los modelos de Box/Jenkins, el modelo de demanda intermitente de croston, modelos discretos y promedios móviles.
Modelo clásico de series de tiempo Una serie de tiempo es un conjunto de valores observados, como datos de producción o ventas, durante una serie de periodos temporales secuenciales ordenada. Ejemplo de estos datos son las ventas de un producto en particular durante una serie de meses y el número de trabajadores empleados en una industria en particular durante una serie de anos. Una serie de tiempo se representa gráficamente por medio de una grafica de líneas, sobre cuyo eje horizontal se representan los periodos y en cuyo eje vertical de representan los valores de la serie de tiempo. El análisis de series de tiempo es el procedimiento por el cual se identifican y aíslan los factores relacionados con el tiempo que influyen en los valores observados en las series de tiempo. Una vez identificados, estos factores pueden contribuir a la interpretación de valores históricos de series de tiempo y a pronosticar valores futuros de series de tiempo. El método clásico para el análisis de serie de tiempo identifica cuatro de estas influencias o componentes.
Tendencia (T): el movimiento general a largo plazo de los de la serie de tiempo (Y) sobre un extenso periodo de anos. Fluctuaciones cíclicas ©: movimientos ascendentes y descendentes recurrentes respecto de la tendencia con una duración de varios anos. Variaciones estaciónales (E): movimientos ascendentes y descendentes respecto de la tendencia que se consuman en el termino de un ano y se repiten anualmente. Estas variaciones suelen identificarse con base en datos mensuales o trimestrales. Variaciones irregulares (I): las variaciones erráticas respecto de la tendencia que no pueden atribuirse a las influencias cíclicas o estaciónales. Este modelo en que se apoya el análisis clásico de serie de tiempo se basa en el supuesto de que, el valor de la variable esta determinado por los cuatro componentes tiene una relación multiplicativa. Así donde representa el valor de serie de tiempo observado. Y= T X C X E X I Estadística II 8. ANÁLISIS DE SERIES DE TIEMPO Una serie de tiempo muestra el comportamiento de una variable en el tiempo. Las entidades económicas, usualmente toman decisiones administrativas basándose en los registros de la vida activa de la empresa, o bien, del ramo en que se desenvuelve. El gobierno también toma decisiones y desarrolla nuevas políticas públicas y programas de gobierno, después de estudiar el comportamiento de diferentes variables a lo largo del tiempo. Tanto la toma de decisiones como la planeación, siempre requieren del pronóstico estadístico que se basa en el estudio del comportamiento de una variable y en la suposición de que ese comportamiento puede prolongarse a un futuro. El comportamiento de la variable estudiada, puede ser causado por diversos factores, algunos de naturaleza económica, otros referentes al clima, unos más por razones de modas, otros más por razones financieras; y así podrían enunciarse infinidad de factores que pueden producir fluctuaciones de tipo cíclico, estacional, aleatorias, etc. Una serie de tiempo es una secuencia de los valores que asume una determinada variable o conjunto de variables, dispuestas en un orden
cronológico. Estas variables pueden ser relativas a unidades monetarias, el número de artículos vendidos o comprados, etc. En general, cualquier variable cuantitativa puede ser estudiada de esta manera, siempre y cuando se conozcan los valores que asumió en intervalos regulares de tiempo. Cuando una serie muestra un determinado patrón de comportamiento, por un período largo; es posible esperar que ese mismo patrón continúe en el futuro, y así, esta posibilidad puede darnos una base razonable para establecer pronósticos a un plazo corto. Cuando una variable fluctúa en función del tiempo, generalmente está respondiendo a cuatro componentes: la tendencia (T), el ciclo ©, la variación estacional (S) y la variación aleatoria o irregular (I). Estos componentes actúan según dos modelos, el aditivo y el multiplicativo. El modelo aditivo asume que el valor de la serie original (Y) proviene de la suma de los cuatro componentes: Y=T+S+C+I El modelo multiplicativo asume que el valor de la serie original es el producto de los cuatro componentes: Y=TxSxCxI El modelo aditivo supone que los cuatro componentes son independientes entre sí. Esto supone que, por ejemplo, cuando la tendencia tenga un valor alto, esto no afecte al comportamiento cíclico o estacional. El modelo multiplicativo asume que los componentes sí tienen relación entre sí. El modelo mutiplicativo es que ha sido considerado como modelo clásico. 8.1. Tendencia secular (T) De manera convencional, se utiliza este componente con fines predictivos; es decir para la elaboración de proyecciones o pronósticos. Las tendencias seculares reflejan el continuo crecimiento o decrecimiento a largo plazo de las series de tiempo. El concepto largo plazo ha sido estudiado como de al menos dos periodos anuales en adelante, para que sea posible la caracterización del comportamiento de una variable, que generalmente se describe por medio de una recta o de alguna curva que se ajuste al comportamiento de los datos. Curva de primer grado y = β0 + β1X
Curva de segundo grado y = β0 + β1X + β2X2 Curva de tercer grado y = β0 + β1X1 + β2X2 + β3X3 Curva exponencial y = β0 + β1x Curva recíproca 1 / y = β0 + β1X Curva exponencial logística y = 1 / β0 + β1β2x Es posible ajustar la tendencia de los datos de las series de tiempo, por varios métodos, como el de los mínimos cuadrados, el de la doble suavización y el de la triple suavización. Sin embargo, en este curso utilizaremos el de los mínimos cuadrados para curvas de primer grado. FORMA GENERAL DE LA ECUACIÓN DE LA REGRESIÓN LINEAL Y ’ = a + bX Donde: Y ‘ = Se lee Y prima, es el valor predictorio de la variable Y para un valor seleccionado de X. a = Es la intersección con el eje Y. Es el valor estimado de Y cuando X = 0. b = Es la pendiente de la línea, o el cambio promedio en Y’ por cada cambio en una unidad de la variable independiente X. X = Es el valor que se escoge para la variable independiente. Esta relación lineal es utilizada para representar una tendencia secular que cambia a una tasa constante. Si las series se incrementan con el tiempo, pueden ser representadas con una línea con pendiente positiva; si por el contrario, decrecen con el tiempo, pueden representarse por una línea con pendiente negativa. Como ya se dijo en el tema anterior, para conocer los valores de a y b, es necesario resolver las ecuaciones siguientes: PENDIENTE DE LA LÍNEA DE REGRESIÓN b = n ( Σ XY ) – ( Σ X ) ( Σ Y ) n ( Σ X2 ) – ( Σ X ) 2 INTERSECCIÓN CON EL EJE Y a = Σ Y – b Σ X n N Donde:
X = es un valor de la variable independiente Y = es un valor de la variable dependiente n = es el número de elementos en la muestra Cuando se conocen los valores de x e y, se sabe que los de x se refieren al tiempo, dado en intervalos regulares, en el que se desarrolla el comportamiento de y; por esta razón, en el tiempo es posible definir si estamos en presencia de periodos y así codificarlos. Cuando se trata de un número par de periodos, se codifican asignando el valor cero al primer periodo, al segundo el uno y así sucesivamente. Cuando se trata de un número impar de periodos se fija el origen en la mitad de la sucesión, a los años anteriores se les asignan valores negativos y a los posteriores positivos. Serie de número de periodos par (n = 6 ) Año Código 2001 0 2002 1 2003 2 2004 3 2005 4 2006 5 Serie de número de períodos impar ( n = 7 ) Año Código 2001 −3 2002 −2 2003 −1 2004 0 2005 1 2006 2 2007 3 Ejercicio (para una serie de número de periodos par) En la siguiente tabla aparecen los valores correspondientes al INPC del periodo comprendido entre 1962 y 1971. Supón que se quiere realizar un pronóstico del INPC para 1972. Año Período de codificación (X) 1962 0 1963 1 1964 2 1965 3 1966 4 1967 5 1968 6 1969 7 1970 8 1971 9 45.0 Lo primero que se tiene que hacer es sustituir las fórmulas mencionadas anteriormente para ajustar una línea de tendencia, de este modo: Año Períodod de codificación (X) INPC (Y) XY X2 1962 0 26.5440 0.0000 0 1963 1 26.6376 26.6376 1 1964 2 28.1153 56.2306 4 1965 3 28.1714 84.5142 9 1966 4 28.9758 115.9032 16 1967 5 29.4809 147.4045 25 1968 6 30.0794 180.4764 36 1969 7 31.5411 220.7877 49 1970 8 33.0211 264.1688 64 1971 9 34.6596 311.9364 81 45 297.2262 1408.0594 285
PENDIENTE DE LA LÍNEA DE REGRESIÓN b = n ( Σ XY ) – ( Σ X ) ( Σ Y ) n ( Σ X2 ) – ( Σ X ) 2 PENDIENTE DE LA LÍNEA DE REGRESIÓN b = 10 ( 1408.0594 ) – ( 45 ) ( 297.2262 ) 10 ( 285 ) – ( 45 ) 2 b = 0.855048485 INTERSECCIÓN CON EL EJE Y a = Σ Y – b Σ X N N INTERSECCIÓN CON EL EJE Y a = 297.2262 – (0.85504) 45 10 10 a = 25.87490182 FORMA GENERAL DE LA ECUACIÓN DE LA REGRESIÓN LINEAL Y ’ = a + bX FORMA GENERAL DE LA ECUACIÓN DE LA REGRESIÓN LINEAL Y ’ = 25.8749 + 0.8550X FORMA GENERAL DE LA ECUACIÓN DE LA REGRESIÓN LINEAL Y ’ = 25.8749 + 0.8550 (10) Y ’ = 34.4254 Luego entonces, se podría esperar que para 1972 el INPC fuera de 34.4254 Cabe mencionar que el INPC real a diciembre de 1972 fue de 36.5858, valor superior en más de 2 puntos del estimado. Gráficamente se podría esperar una figura como la siguiente. Ejercicio (para una serie de número de periodos impar) Cuando los datos se presentan con un número impar de períodos, al codificar, como ya mencionó, el valor cero en el centro de la serie, la sumatoria de los valores de X serían siempre cero, por lo tanto las fórmulas cambian. PENDIENTE DE LA LÍNEA DE REGRESIÓN b = Σ XY Σ X 2 INTERSECCIÓN CON EL EJE Y a = Σ Y n
En el siguiente cuadro aparecen los valores del INPC correspondientes a los años comprendidos entre 1984 y 1992. Supón que deseas saber cuál sería el INPC en 1983. Año Período de codificación (X) INPC (Y) XY X2 1984 −4 1219.3764 −4877.5056 16 1985 −3 1996.7229 −5990.1687 9 1986 −2 4108.2000 −8216.4000 4 1987 −1 10647.2000 −10647.2000 1 1988 0 16147.3000 0.0000 0 1989 1 19327.9000 19327.9000 1 1990 2 25112.7000 50225.4000 4 1991 3 29832.5000 89497.5000 9 1992 4 33393.9000 133575.6000 16 0 141785.7993 262895.1257 60 Luego entonces: b = 4381.585428 a = 15753.9777 Y ’ = 15753.9777 + 4381.5854 X Y ’ = 15753.9777 + 4381.5854 (5) Y ’ = 37661.90484
Fluctuaciones cíclicas
Ciclo solar1 de 11 años en promedio: laradiación electromagnética que emite el sol, lasmanchas solares y en general la actividad solar fluctúa cíclicamente.
Las fluctuaciones cíclicas son movimientos oscilatorios alrededor de una tendencia, caracterizados por diferentes fases sucesivas recurrentes, de expansión y contracción, de mayor o menor amplitud, que no se encuentran ceñidas a lapsos fijos y que son susceptibles de medición. Las fluctuaciones cíclicas han sido registradas y estudiadas por ciencias tan diferentes como la astronomía,1 la geología,2 la meteorología,3 la biología,4 5 6 o la economía.7 Ya en 1922 científicos de diferentes disciplinas realizaron una Conferencia sobre el Ciclo en la Carnegie Institution for Science, en la cual se presentaron investigaciones sobre fluctuaciones cíclicas tan diversas como las manchas solares, las glaciaciones o el ciclo económico.8
[editar]Medición Dado que las series cronológicas o temporales se componen de movimientos seculares a largo plazo o tendencias, fluctuaciones cíclicas, fluctuaciones estacionales y fluctuaciones accidentales, irregulares o casuales,9 la existencia de determinadas fluctuaciones cíclicas se establece mediante diferentes métodos de análisis de las series temporales,10 mediante los cuales es posible aislarlas de las fluctuaciones estacionales y de las tendencias. Una vez eliminada la estacionalidad y hecho el ajuste de tendencia se obtienen los ciclos, no es necesario eliminar los movimientos casuales.9 Los métodos básicos utilizados son los mínimos cuadrados y los promedios móviles, pero actualmente existen diferentes procedimientos y técnicas estadísticos para efectuar análisis específicos, tales como los correlogramas,11 12 el Filtro de Hodrick-Prescott o el programa de computador BV4.1.13 Aunque los estudios a largo plazo pueden encontrar la duración promedio de determinada fluctuación cíclica, es imposible predecir su duración exacta, la cual no puede deducirse del promedio, ni de la duración del ciclo anterior ni de la de algún grupo de ciclos precedentes. En cambio sí es posible determinar el carácter necesario de determinadas fluctuaciones cíclicas, cuyo desenvolvimiento concreto resulta de una compleja interrelación de múltiples variables, de manera que se une la determinación con la probabilidad.14
Análisis de tendencia para series de tiempo 1) INTRODUCCIÓN Las series de tiempo llamadas también series cronológicas o series históricas son un conjunto de datos numéricos que se obtienen en períodos regulares y específicos a través del tiempo, los tiempos pueden ser en años, meses, semanas, días o otra unidad adecuada al problema que se esté trabajando. Ejemplos de series de tiempo son: Ventas mensuales de un producto en una empresa, producción total anual de petróleo en Ecuador durante un cierto número años o las temperaturas anunciadas cada hora por el meteorólogo para un aeropuerto. Matemáticamente, una serie de tiempo se define por los valores Y1, Y2, Y3,…….de una variable Y (ventas mensuales, producción total, etc.) en tiempos t1, t3, t3……….. Si se reemplaza a X por la variable tiempo, estas series se definen como distribuciones de pares ordenados (X,Y) en el plano cartesiano, siendo Y una función de X; esto se denota por:
El principal objetivo de las series de tiempo es hacer proyecciones o pronósticos sobre una actividad futura, suponiendo estables las condiciones y variaciones registradas hasta la fecha, lo cual permite planear y tomar decisiones a corto o largo plazo. Después, con base en esa situación ideal, que supone que los factores que influyeron en la serie en el pasado lo continuarán haciendo en el futuro, se analizan las tendencias pasadas y elcomportamiento de las actividades bajo la influencia de ellas; por ejemplo, en la proyección de ventas de un producto o de un servicio de una empresase calculan los posibles precios, la reacción del consumidor, la influencia de la competencia, etc.
Es necesario describir la tendencia ascendente o descendente a largo plazo de una serie cronológica por medio de alguna línea, y la más adecuada será la que mejor represente los datos y sea útil para desarrollar pronósticos. Para lograr la estimación de la tendencia se utilizan con más frecuencia los siguientes métodos:
2) MÉTODO DE LOS MÍNIMOS CUADRADOS Este método ya se estudió en el capítulo anterior, en el que se indicó las formas para hallar la ecuación de una recta de mínimos cuadrados. Con esta recta se obtendrán los valores de tendencia. Ejemplo ilustrativo: Con los siguientes datos acerca de las ventas en millones de dólares de la Empresa M & M: Año (X)
Ventas (Y)
1995
3,4
1996
3,1
1997
3,9
1998
3,3
1999
3,2
2000
4,3
2001
3,9
2002
3,5
2003
3,6
2004
3,7
2005
4
2006
3,6
2007
4,1
2008
4,7
2009
4,2
2010
4,5
1) Hallar la ecuación de tendencia por el método de los mínimos cuadrados. 2) Pronosticar la tendencia de exportación para el 2011. 3) Elaborar la gráfica para los datos y la recta de tendencia. Solución: 1) Para hallar la ecuación de tendencia por el método de los mínimos cuadrados se llena la siguiente tabla, codificando la numeración de los años 1995 como 1, 1996 como 2, y así consecutivamente para facilitar los cálculos. Año (X)
X
Y
XY
X2
Y2
1995
1
3,4
3,40
1
11,56
1996
2
3,1
6,20
4
9,61
1997
3
3,9
11,70
9
15,21
1998
4
3,3
13,20
16
10,89
1999
5
3,2
16,00
25
10,24
2000
6
4,3
25,80
36
18,49
2001
7
3,9
27,30
49
15,21
2002
8
3,5
28,00
64
12,25
2003
9
3,6
32,40
81
12,96
2004
10
3,7
37,00
100
13,69
2005
11
4
44,00
121
16,00
2006
12
3,6
43,20
144
12,96
2007
13
4,1
53,30
169
16,81
2008
14
4,7
65,80
196
22,09
2009
15
4,2
63,00
225
17,64
2010
16
4,5
72,00
256
20,25
Total
136
61
542,3
1496
235,86
Reemplazando valores en las siguientes fórmulas se obtiene los valores de a0 y a1:
Interpretación: - El valor al ser positiva indica que existe una tendencia ascendente de las exportaciones aumentando a un cambio o razón promedio de 0,07 millones de dólares por cada año. - El valor de indica el punto en donde la recta interseca al eje Y cuando X = 0, es decir indica las exportaciones estimadas para el año 1996 igual a 3,22. Reemplazado los valores anteriores en la recta de tendencia se obtiene:
Y = 3,22 + 0,07X 2) Para pronosticar la tendencia de exportación para el 2011 se reemplaza X = 17 en la recta de tendencia, obteniendo el siguiente resultado: Y = 3,22 + 0,07X Y = 3,22 + 0,07·17 = 4,41 Los cálculos en Excel se muestran en la siguiente figura:
3) La gráfica de los datos y la recta de tendencia elaborada en Excel se muestran en la siguiente figura:
3) MÉTODO DE LOS SEMIPROMEDIOS Este método se aplica con el objeto de simplificar los cálculos y consiste en: a) Agrupar los datos en dos grupos iguales b) Obtener el valor central (mediana) de los tiempos y la media aritmética de los datos de cada grupo, consiguiéndose así dos puntos de la recta de tendencia c) Estos valores se reemplazan en el siguiente sistema:
y
d) Resolviendo el sistema se encuentran los valores de la ecuación de la recta de tendencia, la cual es:
y
los cuales se reemplazan en
Con esta recta de tendencia se puede realizar pronósticos, los cuales son menos exactos que los obtenidos con el método de los mínimos cuadrados, sin embargo, su diferencia es mínima. Ejemplo ilustrativo Con los siguientes datos sobre las ventas en millones de dólares de la Empresa D & M
Año (X)
Ventas (Y)
2000
1,5
2001
1,8
2002
2
2003
1,5
2004
2,2
2005
2
2006
3
2007
2,8
2008
2,4
2009
2,9
2010
3
1) Hallar la ecuación de tendencia por el método de los semipromedios. 2) Pronosticar la tendencia de ventas para el 2011. 3) Elaborar la gráfica para los datos y la recta de tendencia. Solución: 1) Se codifica la numeración de los años 2000 como 1, 2001 como 2, y así consecutivamente para facilitar los cálculos. Se agrupa en dos grupos iguales.
El año 2005 se dejó por fuera para tener grupos con el mismo número de años. El valor central de 3 corresponde a la mediana del primer grupo 1, 2, 3, 4 y 5. El valor central de 9 corresponde a la mediana del segundo grupo 7, 8, 9, 10 y 11. El semipromedio 1,8 corresponden a la media aritmética del primer grupo. El semipromedio 2,82 corresponden a la media aritmética del segundo grupo. De esta manera se obtienen dos puntos (3, 1.8) y (9, 2.82) de la recta de tendencia. Reemplazando los puntos en el siguiente sistema se obtiene:
Resolviendo el sistema empleando la regla de Cramer se obtiene:
Como
es positiva, la recta tiene una tendencia ascendente (pendiente positiva).
Reemplazando los valores calculados se tiene la recta de tendencia, la cual es:
2) Para pronosticar la tendencia de exportación para el 2011 se reemplaza X = 12 en la recta de tendencia, obteniendo el siguiente resultado: Y = 1,29 + 0,17X Y = 1,29 + 0,17·12 = 3,33 Interpretación: Existe una tendencia ascendente a un cambio promedio de 0,17 millones de dólares por cada año, por lo que el Gerente de ventas de la empresa debe seguir aplicando las políticas necesarias para mantener la tendencia ascendente y mejorar la tasa de crecimiento. Los cálculos realizados en Excel se muestran en la siguiente figura:
3) La gráfica de los datos y la recta de tendencia elaborada en Graph se muestran en la siguiente figura:
INTRODUCCIÓN
Toda institución, ya sea la familia, la empresa o el gobierno, tiene que hacer planes para el futuro si ha de sobrevivir y progresar. Hoy en día diversasinstituciones requieren conocer el comportamiento futuro de ciertos fenómenos con el fin de planificar, prever o prevenir. La planificación racional exige prever los sucesos del futuro que probablemente vayan a ocurrir. La previsión, a su vez, se suele basar en lo que ha ocurrido en el pasado En adelante se estudiará como construir un modelo para explicar la estructura y prever la evolución de una variable que observamos a lo largo deltiempo. Son innumerables las aplicaciones que se pueden citar, en distintas áreas del conocimiento, tales como, en economía, física, geofísica, química,electricidad, en demografía, en marketing, en telecomunicaciones, en transporte, etc. Uno de los problemas que intenta resolver las series de tiempo es el de predicción. En adelante se estudiará como construir un modelo para explicar la estructura y preveer la evolución de una variable que observamos a lo largo del tiempo. La variables de interés puede ser macroeconómica (índice de precios al consumo, demanda de electricidad, series de exportaciones o importaciones, etc.), microeconómica (ventas de una empresa, existencias en un almacén, gastos en publicidad de un sector), física (velocidad del viento en una central eólica, temperatura en un proceso, caudal de un río, concentración en la atmósfera de un agente contaminante), o social (número de nacimientos, matrimonios, defunciones, o votos a un partido político). Resumen El objetivo de este trabajo es estudiar la evolución del incremento anual de software ilegales en Perú, durante el período comprendido entre 1993 y 2005, a través de la metodología de Hamilton (1989) y segundo presentar algunos conceptos relacionados con dicha metodología, la cual introduce cambios de régimen en el análisis convencional de series de tiempo. En este caso, tales cambios en el modelo de la inflación se suponen asociados a posibles regímenes distintos donde la inflación presenta cambios en su nivel o en su variabilidad. Esta modelación posibilita el reconocimiento de los distintos regímenes a través del tiempo, en lo referente a su tiempo promedio de duración y a laprobabilidad asociada a cada uno de ellos, es decir, la probabilidad de estar en un régimen particular en un momento dado del tiempo. La aplicación de la metodología de Hamilton esta motivada por los resultados encontrados a través de diferentes pruebas econométricas que permiten inferir la existencia de distintos comportamientos de la inflación trimestral en Colombia en el período de análisis. Así también daremos a conocer los conceptos principales de la tendencia, los componente cíclico, la variación estacional, variación irregular. Aplicaremos un caso real demostrando un tipo de variación cíclica. MARCO TEORICO ESTADÍSTICA Es la Ciencia que se ocupa de Recolectar, Organizar, Presentar, analizar e interpretar datos para ayudar a una toma de decisiones mas efectiva. * Existen dos clases de Estadística:
A.- Estadística Descriptiva, que incluye los procedimientos para organizar y resumir datos. B.- Estadística Inferencial, que comprende la toma de una muestra de una población o de una realización de estimaciones acerca de esa población, con base en los resultados para la muestra .Una Población es el conjunto total de los individuos u objetos de interés. Una Muestra es una parte de la Población. * Existen dos tipos de variables : A. Una variable cualitativa es no numérica .Generalmente nos interesa el numero o porcentaje de las observaciones en cada categoría .Los datos Cualitativos normalmente se resumen en cuadros o graficas de barras. B. Hay dos tipos de variales cuantitativas, y generalmente se reportan de manera Numérica.Las variables discretas que solo pueden asumir ciertos valores y normalmente existen huecos y brechas entre esos valores. Una variable continua que puede asumir cualquier valor dentro de un intervalo específico. SERIES DE TIEMPO Y PRONOSTICOS Con frecuencia se realizan observaciones de datos a través del tiempo. Cualquier variable que conste de datos reunidos, registrados u observados sobre incrementos sucesivos de tiempo se denomina serie de tiempo. Una serie de tiempo es un conjunto de observaciones producidas en determinados momentos durante un periodo, semanal, mensual, trimestral o anual, generalmente a intervalos iguales. Si bien el comportamiento de cualquier serie de tiempo puede observarse gráficamente, no en todos los casos es posible distinguir las particularidades que cada una puede contener. La experiencia basada en muchos ejemplos se series de tiempo, sin embargo, ha revelado que existen ciertos movimientos o variaciones características que pueden medirse y observarse por separado. Estos movimientos, llamados a menudo componentes, de una serie de tiempo y que se supone son causados por fenómenos distintos. El primer paso para analizar una serie de tiempo es graficarla, esto permite: identificar la tendencia, la estacionalidad, las variaciones irregulares (componente aleatoria). Un modelo clásico para una serie de tiempo, puede ser expresada como suma o producto de tres componentes: tendencia, estacional y un término de error aleatorio. Son innumerables las aplicaciones que se pueden citar, en distintas áreas del conocimiento, tales como, en economía, física, geofísica, química, electricidad, en demografía, en marketing, en telecomunicaciones, en transporte, etc. Series De Tiempo
Ejemplos - Precios de un artículo - Tasas de desempleo
1. Series económicas:
- Tasa de inflación - Índice de precios, etc.
- Meteorología - Cantidad de agua caída 2. Series Físicas:
- Temperatura máxima diaria - Velocidad del viento (energía eólica) - Energía solar, etc.
3. Geofísica:
- Series sismologías - Tasas de crecimiento de la población
4. Series demográficas:
- Tasa de natalidad, mortalidad - Resultados de censos poblacionales
5. Series de marketing:
- Series de demanda, gastos, ofertas
6. Series de telecomunicación: - Análisis de señales 7. Series de transporte:
- Series de tráfico
En el análisis de series de tiempo de datos, una tentación inmediata consiste en intentar explicar o contabilizar el comportamiento de las series. La descomposición clásica es un método que se basa en la suposición de que se pueden descomponer en componentes como tendencia, ciclo, estacionalidad e irregularidad. Una predicción se hace mediante la combinación de las proyecciones de cada componente individual. COMPONENTES DE UNA SERIE DE TIEMPO Existen 4 componentes de una serie de Tiempo : La Tendencia, La Variación Cíclica, Variación Estacional, y la Variación Irregular. TENDENCIA SECULAR Las tendencias a largo plazo (sin alteraciones de una serie de tiempo) de las ventas, el empleo, los precios de las acciones, y otras series económicas y comerciales . Muchas variables macroeconómicas, como el Producto Nacional Bruto (PNB), el empleo y la producción industrial están dominadas por una fuerte tendencia. La tendencia de una serie de tiempo es el componente de largo plazo que representa el crecimiento o disminución en la serie sobre un periodo amplio. Las fuerzas básicas que ayudan a explicar la tendencia de una serie son el crecimiento de la población, la inflación de precios, el cambio tecnológico y los incrementos en la productividad. La figura 2.3 muestra gráficamente la recta de tendencia ajustada a los datos trimestrales . La recta de trazos después de 1972 representa proyecciones (ver sección 3 Predicciones).
Figura 2.3 Es decir, Movimientos seculares contienen los movimientos suaves de largo plazo, los cuales están dominados fundamentalmente por factores de tipo económico.
VARIACIÓN CÍCLICA Es la segunda componente de un serie de Tiempo es la Variación Cíclica; ascenso y descenso de una serie de Tiempo en periodos mayores de un año. El componente cíclico es la fluctuación en forma de onda alrededor de la tendencia, afecta por lo regular por las condiciones económicas generales. Los patrones cíclicos tienden a repetirse en los datos aproximadamente cada dos tres o más años. Es común que las fluctuaciones cíclicas estén influidas por cambios de expansión y contracción económicas, a los que comúnmente se hace referencia como el ciclo de los negocios. Movimientos cíclicos o variaciones cíclicas o ciclo. Se refieren a las oscilaciones de larga duración alrededor de la curva de tendencia, los cuales pueden o no ser periódicos, es decir, pueden o no seguir caminos análogos en intervalos de tiempo iguales. Se caracterizan por tener lapsos de expansión y contracción. En general, los movimientos se consideran cíclicos solo si se produce en un intervalo de tiempo superior al año(3). En el Gráfico los movimientos cíclicos alrededor de la curva de tendencia están trazados en negrita.
VARIACIÓN ESTACIONAL
Patrones de cambio en una serie de tiempos en una año. Tales patrones tienden a repetirse cada año. El componente estacional se refiere a un patrón de cambio que se repite a si mismo año tras año. En el caso de las series mensuales, el componente estacional mide la variabilidad de las series de enero, febrero, etc. En las series trimestrales hay cuatro elementos estaciónales, uno para cada trimestre. La variación estacional puede reflejar condiciones de clima, días festivos o la longitud de los meses del calendario. Movimientos estacionales o variaciones estacionales. Se refieren a las fluctuaciones periódicas que se observan en series de tiempo cuya frecuencia es menor a un año (trimestral, mensual, diaria, etc.), aproximadamente en las mismas fechas y casi con la misma intensidad. Por ejemplo, el mayor monto de recaudación del Impuesto a la Renta se observa en el mes de marzo de todos los años o la mayor brecha entre el tipo de cambio de compra y venta se produce los días viernes década semana o la mayor cotización de los títulos que se mueven en la Bolsa de Valores de Lima se observa diariamente entre las 11 a.m. y 12 m. Las variaciones estacionales, como veremos, responden fundamentalmente a factores relacionados al clima, lo institucional o las expectativas y no a factores de tipo económico. En el Gráfico no se observa ningún movimiento estacional, puesto que se trata de una serie anual. Las principales fuerzas que causan una variación estacional son las condiciones del tiempo, como por ejemplo: 1) En invierno las ventas de helado 2) En verano la venta de lana 3) Exportación de fruta en marzo. Todos estos fenómenos presentan un comportamiento estacional (anual, semanal, etc.)
Figura 1.3 VARIACIÓN IRREGULAR El componente aleatorio mide la variabilidad de las series de tiempo después de que se retiran los otros componentes. Contabiliza la variabilidad aleatoria en una serie de tiempo ocasionada por factores imprevistos y no ocurrentes. La mayoría de los componentes irregulares se conforman de variabilidad aleatoria. Sin embargo ciertos sucesos a veces impredecibles como huelgas, cambios de clima (sequías, inundaciones o terremotos),
elecciones, conflictos armados o la aprobación de asuntos legislativos, pueden causar irregularidad en una variable. Movimientos irregulares o al azar o ruido estadístico. Si bien pueden ser generados por factores de tipo económico, generalmente sus efectos producen variaciones que solo duran un corto intervalo de tiempo. Aunque debe reconocerse que en ocasiones sus efectos sobre el comportamiento de una serie pueden ser tan intensos que fácilmente podrían dar lugar a un nuevo ciclo o a otros movimientos. Un claro ejemplo de esto es el efecto del shock de precios de agosto de 1990 sobre el comportamiento de la inflación. Al analizar una serie de tiempo es necesario, entonces, tener en consideración el comportamiento de cada uno de estos componentes. Para ello el criterio mas lógico a seguir es aislarlos secuencialmente partiendo de la serie original para luego analizarlos de manera individual. Si bien esto supone la utilización de m‚todos estadísticos adecuados, que mas adelante veremos, la mejor forma de apreciarlos es a través de su observación visual. a) Detectar Outlier: se refiere a puntos de la serie que se escapan de lo normal. Un outliers es una observación de la serie que corresponde a un comportamiento anormal del fenómeno (sin incidencias futuras) o a un error de medición. Se debe determinar desde fuera si un punto dado es outlier o no. Si se concluye que lo es, se debe omitir o reemplazar por otro valor antes de analizar la serie. Por ejemplo, en un estudio de la producción diaria en una fabrica se presentó la siguiente situación ver figura 1.1:
Figura 1.1 Los dos puntos enmarcados en un círculo parecen corresponder a un comportamiento anormal de la serie. Al investigar estos dos puntos se vio que correspondían a dos días de paro, lo que naturalmente afectó la producción en esos días. El problema fue solucionado eliminando las observaciones e interpolando. CASO La piratería sigue creciendo La tasa de piratería en el Perú fue del 73% en el 2004, cinco puntos porcentuales más que en el 2003, y las pérdidas por piratería de software ascendieron a 39 millones de dólares. Estos son algunos de los hallazgos de un estudio de piratería mundial de software publicado por la Business Software Alliance (BSA), asociación internacional de desarrolladores de software. El estudio independiente -que indica que la piratería de software continúa representando un gran desafío en todo el mundo- fue realizado por la consultora, Internacional Data Corporación (IDC).
El informe indicó que el Perú está entre los cinco países con tasas de piratería mayores a la tasa latinoamericana, fijada en 66% por el estudio de IDC, que generó pérdidas por 1.546 millones de dólares. "En el Perú, siete de cada diez copias de software en uso hoy en día han sido obtenidas ilegalmente", dijo el presidente y CEO de Business Software Alliance, Robert Holleyman. "Las pérdidas por piratería de software ocasionan un gran impacto económico en los países de la región y en todo el mundo. Cada copia de software utilizada sin la licencia apropiada cuesta ingresos fiscales, empleos y oportunidades de crecimiento para mercados de software que están en desarrollo". La tasa de piratería de América Latina (66%) fue significativamente más alta que la tasa mundial, de 35%. De las seis regiones incluidas en el estudio,Latinoamérica fue la que registró la mayor tasa de piratería, seguida por la región identificada como "Resto de Europa" en el reporte (países que no son parte de la Unión Europea), con un 61%, Medio Oriente y África (58%), Asia-Pacífico (53%), la Unión Europea (35%) y Norteamérica (22%). La piratería todavía es mucho más fuerte en países y regiones donde el mercado de software está en crecimiento, a medida que la computación se integra más al trabajo y a la vida diaria", dijo John Gantz, el oficial principal de investigación en IDC. "La piratería sube o baja como consecuencia de una compleja ecuación que incluye, por un lado, la educación y el cumplimiento de las leyes; y, por otro, el ingreso de nuevos usuarios al mercado, la simplificación del acceso a software pirateado y/o nuevos factores externos, como el cambio en las condiciones políticas". Por su lado, Holleyman indicó que "los programas educativos, el fomento de políticas públicas y los esfuerzos de aplicación y ejecución de la ley de BSA alrededor del mundo continúan teniendo un impacto sobre el problema de la piratería. Pero la afluencia continua de nuevos usuarios en mercados emergentes y la creciente disponibilidad de software pirateado, principalmente a través de la Internet y redes P2P, demuestra que la educaciónpermanente es esencial". A nivel mundial, el 35% del software instalado en computadoras personales en el 2004 era pirateado, una baja de un punto porcentual del 36% en el 2003. No obstante, las pérdidas a raíz de la piratería incrementaron de 29 mil millones de dólares estadounidenses a 33 mil millones de dólares. En el 2004, en el mundo se gastaron más de 59 mil millones de dólares en software comercial empaquetado para PC, una cifra mayor a los 51 mil millones de dólares gastados en el 2003. Pero, en realidad, fue instalado software por más de 90 mil millones de dólares, un incremento de los 80 mil millones de dólares instalados el año anterior. El alza a 33 mil millones de dólares en pérdidas fue, en parte, producto de que el mercado de software para PC haya crecido en más de un 6%, y que el dólar estadounidense se haya debilitado en comparación con muchas de las divisas del mundo. Para este estudio, IDC utilizó estadísticas propias de envíos de software y hardware, realizó más de siete mil entrevistas en 23 países para confirmar las tendencias en piratería de software, y contó con analistas en más de 50 países para estudiar las condiciones de los mercados locales. El siguiente grafico muestra la cantidad en soles perdidos en el Perú durante los últimos 11 años en software piratas . Se presenta como Tendencia Secular se presenta como una tendencia decreciente a largo plazo.
BIBLIOGRAFÍAS http://www.contracopia.org.pe/Prensa/2002/Notas/NotasPrensaEner.html http://www.uap.edu.pe/Fac/02/trabajos/02206/isi%2032/go7/pirateria.htm http://ciberconta.unizar.es/LECCION/seriest/000F2.HTM http://apuntes.rincondelvago.com/series-de-tiempo_1.html Estadísticas para Administración y Economía ("Lind – Marchal – Mason")
MARITZA SANTOS Yaurivilca UNIVERSIDAD : INCA GRACILAZO DE LA VEGA MAESTRIA : INGENIERIA DE SISTEMAS con mención en Tecnologías de Información ASIGNATURA : MODELOS ESTADISTICOS CICLO : PRIMER (1er modulo)
View more...
Comments