Técnicas Cuantitativas de Predicción

May 3, 2019 | Author: Bertha Maria Hume Zapata | Category: Regression Analysis, Statistical Dispersion, Statistics, Prediction, Linear Regression
Share Embed Donate


Short Description

3...

Description

Capítulo

3

Técnicas de  predicción  pr edicción

 L

a predicción de los comportamientos de las variables económicas constituye, sin duda, una de las mayores dificultades en el estudio de propuestas de inversión. Sin embargo, su realización es ineludible por cuanto la esencia de la evaluación de proyectos es comparar una inversión o una desinversión actual con el flujo de caja que es posible esperar en el futuro, si se opta por tomar la decisión. Las condiciones que imperarán en los próximos años difícilmente coincidirán con aquellas observadas en proyectos similares en el pasado. Por ello, el resultado de una predicción se debe considerar solo como una medición de evidencias incompletas, basadas en comportamientos empíricos de situaciones parcialmente similares o en inferencias de datos estadísticos disponibles. Los diversos métodos para hacer pronósticos deben ser considerados, muchas veces, como complementarios. Difícilmente los resultados de uno coincidan con los de otros. De la misma forma, posiblemente unos sirvan más en un periodo de tiempo que otros, es decir, mientras unos puedan ser recomendables para proyectar los primeros años de la demanda, otros serán los más adecuados para el largo plazo.

El estudio del comportamiento histórico de la demanda que ha tenido la competencia ya establecida es fundamental para elegir la técnica de pronóstico a

87 www.FreeLibros.me

Proyectos de inversión. Formulación y evaluación

emplear, tanto en lo que se refiere a su tendencia, estacionalidad, impacto de variables externas y comportamiento frente a los cambios en los ciclos económicos como a sus reacciones (positivas y negativas) a campañas promocionales, cambios de precios o readecuación de las características del producto, etcétera. En proyectos innovativos se debe tener muy en cuenta el ciclo de vida de productos similares. Es posible que en una etapa inicial de su desarrollo sea una función exponencial la que mejor explique el comportamiento de la demanda en el periodo introductorio (crece muy lentamente al principio mientras el producto se conoce, para luego aumentar fuertemente); que en una segunda etapa, de crecimiento, sea una función lineal con tendencia positiva la que mejor explique el desarrollo del mercado; y que, en la etapa de madurez, se opte también por una función lineal creciente a tasas sustancialmente menores. Incluso puede haber una etapa de saturación, donde la demanda llegue a 0, como por ejemplo los derivados de la obsolescencia por los continuos cambios tecnológicos (regla de cálculo, telégrafo y, pronto, el fax). El Gráfico 3.1 muestra estas situaciones. Gráfico 3.1 Ciclo de vida de un producto Ventas

Tiempo Introducción

Crecimiento

Madurez

Obsolescencia

Como se señaló en el Capítulo 2, en estos casos será necesario separar la proyección de la demanda de flujo de la de  stock . Desde otro punto de vista, el comportamiento histórico de la demanda de la competencia requiere una desagregación mayor. En la fabricación de calzado, por ejemplo, entre masculino y femenino, entre adultos y niños, por modelo, color o tamaño del pie. Las técnicas de pronóstico se clasifican de diversas formas en la literatura económica. En este texto se usarán dos grandes categorías: las cuantitativas y las cualitativas. Cuando se dispone de datos históricos suficientes, es posible utilizar los modelos cuantitativos de proyección. Si estos no existen o son insuficientes, lo mejor es recurrir a los métodos cualitativos.

88   www.FreeLibros.me

 Nassir Sapag Chain

 3.1 Técnicas cuantitativas de predicción

Las técnicas cuantitativas de predicción poseen la ventaja de que, al estar expresadas matemáticamente, su procedimiento de cálculo y los supuestos empleados carecen de toda ambigüedad. Dos grupos se identifican en esta categoría: los modelos causales y los modelos de series de tiempo. Un tercero, el de datos de panel, es solo una combinación de los dos anteriores. Por ejemplo, en un proyecto de atenciones pediátricas, un modelo causal vincularía el número de prestaciones médicas con la cantidad de niños de cada zona geográfica; uno de series de tiempo analizaría la evolución en el tiempo del número de prestaciones; y uno de datos de panel relacionaría la evolución de la población inf antil con el número de atenciones pediátricas a través del tiempo. 3.1.1 Modelos causales

Los modelos causales requieren que exista una relación entre los valores de ambas variables y que los de la variable independiente sean conocidos o que su estimación otorgue una mayor confianza. La forma más común de hacer proyección causal es el ajuste de curvas, el cual se puede realizar aplicando el método de regresión, que predice el comportamiento de la variable dependiente a partir de una línea recta, exponencial u otra formada por los datos de la variable independiente. Se denomina regresión simple a la que emplea una sola variable independiente y regresión múltiple a la que recurre a varias. Los modelos causales relacionan muchas veces la demanda con el número de habitantes, con su ingreso per cápita, con la participación de la mujer en el mercado laboral o con la cantidad de empresas, entre otras variables. Por ejemplo, la demanda por lavavajillas está directamente relacionada con los tres primeros factores mencionados. En las grandes ciudades, donde el poder adquisitivo es mayor y un gran número de mujeres trabaja, las compras de lavavajillas son sin duda mayores que en pueblos pequeños con escasos ingresos y donde pocas mujeres trabajan. Lo mismo pasa con la demanda de líneas telefónicas, donde la existencia de factores como la población, el número de empresas, el producto interno bruto (PIB), la actividad industrial o los índices de construcción, entre otros, puede correlacionarse fácilmente con su demanda. El método de los mínimos cuadrados o regresión lineal busca determinar la recta que represente de mejor manera la tendencia de las relaciones observadas entre dos vari ables, para usarlas como base de la proyección de la tendencia futura, calculando en la Ecuación 3.1 los valores de a y b que definan la función Y  que minimice las desviaciones, los datos observados y la ecuación. Y  = a + bx 

 

(3.1)

Donde Y  es la función de proyección o línea de tendencia; a, el comportamiento no explicado por la variable  x ; b, el comportamiento explicado por la variable  x  que indica en cuánto cambia el valor de Y  por cada unidad que cambie  x .

Capítulo 3

  www.FreeLibros.me

Técnicas de predicción

89

Proyectos de inversión. Formulación y evaluación

El Gráfico 3.2 muestra estas relaciones, donde los datos observados se representan con puntos y la función de estimación, con la línea recta. Gráfico 3.2 Línea de tendencia Y  Y = a + bx  b

1

a

 X 

Existen diversas formas de calcular el valor de las variables a y b. A continuación, se explican los procedimientos para hacer el cálculo mediante los más utilizados: el uso de fórmulas y el de los facilitadores de Excel, a saber, Análisis de datos y el ajuste de la línea de tendencia al gráfico de dispersión. En todos los métodos se usará la información base que se exhibe en la Tabla 3.1.  Tabla 3.1 Datos recolectados de población infantil y demanda por comuna Comuna

Población infanl ( x )

Ventas en unidades (Y )

1

14.680

3.845

2

22.930

5.450

3

16.650

5.099

4

35.990

8.890

5

32.480

6.681

6

38.770

9.678

7

10.030

4.542

8

24.260

4.557

9

52.460

13.289

10

36.800

10.506

11

17.340

5.134

12

43.690

9.066

90   www.FreeLibros.me

 Nassir Sapag Chain

En la Tabla 3.1 se puede observar que, aunque exista una relación entre la cantidad de niños y las ventas (a mayor población, mayores ventas), estas pueden tener comportamientos erráticos. Por ejemplo, la comuna más pequeña tiene 10.030 niños y se venden 4.542 unidades, mientras que la que le sigue en tamaño (la número 1), teniendo un 40% más de población, vende menos unidades. Obviamente, una de las dos es menos representativa que la otra con respecto al comportamiento entre demanda y población. La regresión reúne todos los datos históricos disponibles y estima el mejor promedio entre todos ellos, separando la cantidad (a) de unidades vendidas que no son explicadas por la población (accesos, lejanía de las viviendas a los centros de venta, etc.) de aquellas ( b) que sí son explicadas por ella. a. Uso de fórmulas El primer procedimiento para determinar la línea de tendencia recurre a las ecuaciones siguientes para definir los valores de a y de b.

b  =

nΣ xy  − ( Σ y ) nΣ x 2 − ( Σ x )2

a = y – bx 

 

(3.2)

 

(3.3)

Donde n es el número de observaciones;  y , el valor promedio de la variable  y , y  x , el valor promedio de la variable x . Reemplazando los valores obtenidos en las dos ecuaciones anteriores, se obtiene: b  =

12(2.903.465.410) − ( 346.080) ( 86.737 ) = 0,212028 12(11.876.785.000) − 119.771.366.400 a = 7.228 – (0,212028)(28.840) = 1.113,1958

La línea de tendencia queda, entonces, como sigue. Y  = 1.113,1985 + 0,212028 x 

Para pronosticar las ventas en una nueva comuna, se reemplaza  x  por la población infantil.

Capítulo 3

  www.FreeLibros.me

Técnicas de predicción

91

Proyectos de inversión. Formulación y evaluación

Ejemplo 3.1 La Tabla 3.2 muestra los valores de cada componente para calcular las ecuaciones anteriores.  Tabla 3.2 Cálculo de variables de la ecuación Comuna

Población infanl ( x )

Ventas en unidades (Y )

xy

x 2

1

14.680

3.845

56.444.600

215.502.400

2

22.930

5.450

124.968.500

525.784.900

3

16.650

5.099

84.898.350

277.222.500

4

35.990

8.890

319.951.100

1.295.280.100

5

32.480

6.681

216.998.880

1.054.950.400

6

38.770

9.678

375.216.060

1.503.112.900

7

10.030

4.542

45.556.260

100.600.900

8

24.260

4.557

110.552.820

588.547.600

9

52.460

13.289

697.140.940

2.752.051.600

10

36.800

10.506

386.620.800

1.354.240.000

11

17.340

5.134

89.023.560

300.675.600

12

43.690

9.066

396.093.540

1.908.816.100

∑ xy  ∑ x 

   

∑y   x  y 

346.080  

 

2.903.465.410

86.737

28.840  

7.228

∑ x 2 (∑ x )2

11.876.785.000 119.771.366.400

b. Uso del comando Análisis de datos de Excel La primera vez que se vaya a utilizar este comando, será necesario activarlo. Para ello, debe hacer clic en el Botón de Office  (círculo que aparece en el extremo superior izquierdo de la pantalla) y seleccionar Opciones de Excel. Al desplegarse el cuadro de diálogo correspondiente, debe seleccionar Complementos; elija el comando Herramientas para análisis y marque Ir… Al desplegarse el cuadro de diálogo Comandos, active la casilla Herramientas para análisis.

92   www.FreeLibros.me

 Nassir Sapag Chain

Ejemplo 3.2 Con los datos del ejemplo anterior traspasados a una hoja Excel, se debe seguir el siguiente procedimiento: 1. Seleccione Datos de la barra de opciones. 2. En Análisis, elija la opción Análisis de datos. 3. En el cuadro de diálogo que se abrirá, seleccione la opción Regresión  y elija Aceptar . 4. En el cuadro de diálogo Regresión, use el casillero Rango Y  de entrada para anotar la posición de los datos de la variable dependiente (Ventas). 5. Use el casillero de Rango X  de entrada para especificar la posición de los datos de la variable independiente (Población infantil). 6. Utilice las Opciones de salida  para especificar el lugar donde quiere ubicar los resultados. Si elige la opción En una hoja nueva, asígnele un nombre (Resultados regresión). La Figura 3.1 muestra el resultado que debería obtenerse. Figura 3.1 Opciones de regresión

Capítulo 3

  www.FreeLibros.me

Técnicas de predicción

93

Proyectos de inversión. Formulación y evaluación

7. Finalmente, elija Aceptar . Excel insertará una nueva hoja de cálculo con los resultados de la regresión, tal como se muestra en la Figura 3.2. Figura 3.2 Resultados de la regresión

Como se puede observar, en las celdas B17 y B18 de la Figura 3.2 aparecen directamente los valores de a y b, denominados como Intercepción y  Variable X 1, respectivamente, datos que son coincidentes con los obtenidos mediante el uso de las fórmulas. En el Resumen de los resultados de la regresión aparecen tres conceptos bajo el título de Análisis de varianza: Regresión, Residuos y Total. Los valores bajo la columna Suma de cuadrados se interpretan como sigue. y

y

y

Regresión:  variación que se puede explicar por los datos del modelo (dispersión en los valores estimados con respecto al promedio de los datos observados) y corresponde a la suma de los cuadrados de las diferencias entre cada valor estimado por el modelo y el promedio de los datos observados. Residuos:  suma de los cuadrados de las diferencias entre los datos observados y los determinados por el modelo.  Total: dispersión de los datos que se calcula como la diferencia entre el promedio de los datos observados y la suma de esos datos al cuadrado. Si se relativizan los valores de Regresión y Residuos respecto de Total, se tiene: Suma de cuadrados

%

Regresión

85228887,3

0,87150

Residuos

12566601,6

0,12850

Total

97795488,9

1,00

94   www.FreeLibros.me

 Nassir Sapag Chain

El valor relativo de Regresión (0,87150) es el mismo que en las Estadísticas de la regresión aparece con el nombre de Coeficiente de determinación R^2 (celda B5), y corresponde al porcentaje de la variación que puede ser explicado por el comportamiento de la variable independiente. Es decir, mientras más cercano a 1 sea este valor, mejor se considera el ajuste determinado. Si el coeficiente es positivo y elevado (muy cercano a 1), las variables  x  e  y  tienen comportamientos altamente relacionados. Si el coeficiente muestra valores negativos, el comportamiento de las variables es opuesto, es decir, mientras mayor sea el valor de  x , menor será el de  y . Si el coeficiente es 0, no existe correlación entre las variables, y la ecuación obtenida no sirve para estimar el valor de Y . Si el coeficiente es 1, no existe diferencia entre el valor estimado y los datos observados. El Error típico (que aparece en la celda B7) se calcula como la raíz cuadrada de los residuos y su número de grados de libertad ( n − 1): Residuos Grados de libertad

=

85.228.887,3 10

= 1.121,0085

A las desviaciones estándar de cada variable (la raíz cuadrada de su varianza) el Excel las muestra como Error típico (0,0257459 para b y 809,9666902 para a). Dado que estadísticamente los resultados varían según sea la composición de los datos, se hace necesario determinar si los valores de a y b son o no válidos realizando una prueba de hipótesis, puesto que las variaciones se pueden deber a las diferencias propias de los grupos (edad, sexo, etc.) o se explican por el azar. Cuando las diferencias no se deben al azar, se clasifican como estadísticamente significativas, aceptando que las diferencias se explican porque los grupos están compuestos por individuos de diversas características. El estadístico F  se utiliza para determinar si todas las variables de la función en su conjunto son o no significativas, y se calcula dividiendo el promedio de los cuadrados de la regresión por el promedio de los cuadrados de los residuos. Aunque para dos variables es suficiente el coeficiente R2 (o R cuadrado), se muestra el cálculo del estadístico F  para los datos del Excel que se observan en la Figura 3.2; se obtiene: F  =

8522887,3 = 67,82174682 1256660,161

Este valor es el que aparece en la celda E12. En una tabla de distribución de Fisher, este valor se encuentra en la intersección de 1 grado de libertad (Regresión) y 10 grados de libertad (Residuos), para una probabilidad predeterminada. Por ejemplo, para un nivel de significancia de 95% (5% del área), la tabla muestra el valor 4,96, y para 99% (1% del área), el valor sube a 10,00.

Capítulo 3

www.FreeLibros.me

Técnicas de predicción

95

Proyectos de inversión. Formulación y evaluación

Es decir, para 67,821746, el nivel de significancia es tan alto, que no aparece en la tabla de distribución de Fisher. La Figura 3.2 muestra estas relaciones. Excel, sin embargo, entrega directamente este valor en la celda F12, donde, como puede observarse, el valor 9,12548E-06 (o sea, 0,000912548%) indica que el nivel de significancia es de 99,999087452%. Para calcular si los coeficientes a y b de la función son significativos (individualmente) para hacer la estimación, se usa la distribución t  de Student. En la Figura 3.2, se observa que este estadístico es 1,3744 para a y 8,2354 para b  (celdas D17 y D18) y que sus probabilidades son de 19,9393% y 0,0009125%, respectivamente (celdas E17 y E18). Es decir, existe 19,9% de probabilidad de que a sea resultado del azar, mientras que, en el caso de b, es cercana a 0. De lo anterior se concluye que aunque el coeficiente a (Intercepción) no es estadísticamente significativo, la ecuación como un todo sí puede ser útil para hacer la proyección. Aun cuando todos los indicadores se consideren como válidos, podría darse el caso de que dos variables que no tengan ninguna relación entre sí sugieran la aceptación del modelo. Por ejemplo, el comportamiento observado en el consumo de cerdos con el crecimiento de los enfermos de sida. Aunque ambas variables se muestren muy correlacionadas y aunque a y b sean muy significativas, no cabe duda de que una no explica a la otra. Cuando se da una situación como esta, se la denomina relac ión espuria, y es el evaluador quien debe aplicar su sentido común para detectarla. c. Ajuste de líneas de tendencia a un gráfico de dispersión Este método aprovecha las posibilidades que proporciona Excel para ajustar una línea de tendencia de una serie de datos en un gráfico de dispersión ( XY ) y para visualizar la función R2 que define esta línea de tendencia. Para utilizar este método, se debe proceder como sigue. 1. Seleccione las series de datos  x  (Población infantil) e  y  (Ventas). Si las series de datos se encuentran en columnas no adyacentes, seleccione la primera serie normalmente y luego seleccione la segunda serie mientras mantiene presionada la tecla CTRL  (Control). 2. En la barra de opciones, seleccione Insertar   y luego, dentro de las opciones de Gráficos, elija Dispersión  y marque la opción Solo con marcadores, tal como se muestra en la Figura 3.3.

96   www.FreeLibros.me

 Nassir Sapag Chain

Figura 3.3 Construcción de un gráfico de dispersión

3. Un nuevo objeto flotante se mostrará sobre la hoja de cálculo, conteniendo el gráfico seleccionado. Haga clic, con el botón derecho del mouse, sobre cualquiera de los puntos de la serie en el gráfico, y elija la opción Agregar línea de tendencia…, como se muestra en la Figura 3.4. Figura 3.4  Agregar una línea de tendencia a un gráfico de dispersión

4. En el cuadro de diálogo Formato de línea de tendencia, seleccione el tipo Lineal, y active las casillas Presentar ecuación en el gráfico y Presentar el valor R cuadrado en el gráfico, tal como se indica en la Figura 3.5.

Capítulo 3

  www.FreeLibros.me

Técnicas de predicción

97

Proyectos de inversión. Formulación y evaluación

Figura 3.5 Cuadro de diálogo Formato de línea de tendencia

5. Eligiendo Cerrar , el gráfico se mostrará con la correspondiente línea de tendencia y los datos resultantes para hacer las estimaciones. Los valores que se muestran en la Figura 3.6 tampoco difieren de los obtenidos con los métodos anteriores. Figura 3.6 Resultados de la proyección

El criterio inicial para escoger el tipo de línea de tendencia es la forma que adoptan los puntos de la serie de datos. Por ejemplo, si se aprecia que la serie de datos muestra un crecimiento a tasas constantes, es probable que una tendencia lineal se ajuste mejor.

98 www.FreeLibros.me

 Nassir Sapag Chain

En cambio, si el crecimiento mostrado es a tasas crecientes o decrecientes, es probable que se logren mejores ajustes con una línea de tendencia exponencial o logarítmica, respectivamente. Como ya se explicó, el coeficiente R2 es un criterio para apreciar cuán correcta es la estimación. 3.1.2 Modelos de series de tiempo

Los modelos de series de tiempo pronostican el valor futuro de la variable que se desea estimar, extrapolando el comportamiento histórico de los valores observados para esa variable. Estos modelos asumen que la variable que explica la demanda futura es el paso del tiempo. Las fluctuaciones observadas en el pasado pueden diferenciarse en tres tipos: de tendencia, cíclica y estacional, cuyo comportamiento puede graficarse como sigue. Gráfico 3.3 Fluctuaciones de tendencias

De tendencia

Cíclica

Estacional

Las curvas que más se utilizan para describir una serie histórica y que no son excluyentes para predecir el comportamiento de la demanda a través del tiempo son la lineal (Y  = a + bx ), la parabólica o polinómica (Y  = a + bx  + cx 2) y la exponencial (Y  = aebx ). La definición de un comportamiento histórico no es una proyección en sí misma. La extrapolación de la información del pasado es solo un dato complementario que supone que las condiciones que lo explicaron en el pasado se mantendrán a futuro. La comprensión de qué determinó la tendencia pasada permite, con más facilidad, aplicar el criterio o el sentido común para introducir ajustes a futuro o definir posibles escenarios. Cuando no existen datos en la zona geográfica donde se considera instalar el proyecto, es posible recurrir al método analógico, el cual busca otro mercado que haya experimentado un desarrollo conocido y asimilar, por sus características similares, su comportamiento al que tendrá el propio mercado del proyecto. Para ello, se debe identificar el momento del tiempo en que el mercado desarrollado se encontraba en un

Capítulo 3

www.FreeLibros.me

Técnicas de predicción

99

Proyectos de inversión. Formulación y evaluación

estado similar al que se encuentra el del proyecto y tomarlo como punto de partida. Por ejemplo, cuando se introdujeron las zapatillas deportivas para uso diario en Chile, se tomó como referencia la tasa de adopción observada en Brasil. Aunque muchos evaluadores usan el método analógico como único predictor de la demanda para el proyecto, al considerar que las condiciones futuras no serán iguales a las observadas en otros mercados, será imprescindible incorporar los ajustes necesarios o realizar un análisis de escenarios. Existen ocho principales modelos de series de tiempo, que se pueden tipificar entre sin estacionalidad y con estacionalidad, y entre sin tendencia y con tendencia. y

Sin estacionalidad y sin tendencia: promedio móvil simple y suavizamiento exponencial.

y

Con estacionalidad y sin tendencia: aditivo estacional y multiplicativo estacional.

y

y

Sin estacionalidad y con tendencia: promedio móvil doble y suavizamiento exponencial doble. Con estacionalidad y con tendencia: aditivo Holt-Winter’s y multiplicativo Holt-Winter’s.

 Todos los modelos desagregan los datos históricos en función de tendencias y estacionalidades para luego replicarlos en la proyección futura. Para ello, asumen que los elementos que condicionaron en el pasado tanto el comportamiento de la tendencia como el de la estacionalidad se mantendrán durante todo el periodo de pronóstico. Aunque el Excel proporciona la posibilidad de efectuar muchos cálculos, el  software Risk Simulator está diseñado principalmente para hacer pronósticos estadísticos y, como se verá en el Capítulo 10, para medir el riesgo, entre otras funciones. Los ocho modelos anteriores están incluidos en el Risk Simulator, con la ventaja de que puede determinar cuál de ellos es el más adecuado en función de la información que se le proporciona 1.  3.2 Técnicas cualitativas de predicción

Las técnicas cuantitativas de estimación descritas anteriormente constituyen una fuente de información fundamental para apoyar el proceso de toma de decisiones de inversión en cualquier empresa. Sin embargo, como ya se mencionó, la esencia del proceso decisorio es la incertidumbre respecto del comportamiento que asumirá en el futuro el valor de una determinada variable. Esto explica la importancia que se otorga a las técnicas cualitativas de predicción como complemento de la información que deberá estar disponible antes de aprobar o rechazar un proyecto.

1

Escogiendo la función de Auto-Modelo, el software  itera los datos a través de los ocho modelos, optimiza los parámetros de proyección y selecciona aquel que mejor se ajusta con esos datos.

100   www.FreeLibros.me

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF