Investigación de operaciones II: LÍNEAS DE ESPERAS Y CADENAS DE MARKOV

April 5, 2017 | Author: Armando Perez Aguilar | Category: N/A
Share Embed Donate


Short Description

Download Investigación de operaciones II: LÍNEAS DE ESPERAS Y CADENAS DE MARKOV...

Description

Escuela Normal Rural “Justo Sierra Méndez” Hecelchakán, Campeche.

Materia: Investigación de operaciones II

Trabajo: Unidad IV y V

Maestra: Ing. Arturo I. García Delgado

Alumno: Jesús Armando Pérez Aguilar

Grado: Quinto semestre

Grupo: A “Único”.

Fecha: 25 de enero de 2012

Índice

TEMAS

PÁG.

LÍNEAS DE ESPERAS

3

INTRODUCCIÓN Y CASOS DE APLICACIÓN.

3

DEFINICIONES CARACTERÍSTICAS Y SUPOSICIONES.

3

TERMINOLOGÍA Y NOTACIÓN.

4

PROCESO DE NACIMIENTO Y MUERTE. MODELOS POISSON.

5

UN SERVIDOR, COLA INFINITA, FUENTE INFINITA.

6

SERVIDORES MÚLTIPLES, COLA INFINITA, FUENTE INFINITA.

8

UN SERVIDOR, FUENTE FINITA, COLA FINITA.

9

CADENAS DE MARKOV

11

INTRODUCCIÓN.

11

CASOS DE APLICACIÓN

11

FORMULACIÓN DE LAS CADENAS DE MARKOV.

13

PROCESOS ESTOCÁSTICOS.

14

PROGRAMACIÓN DINÁMICA CARACTERÍSTICAS DE LOS PROBLEMAS DE PROGRAMACIÓN DINÁMICA: ETAPAS, ESTADOS, FÓRMULA RECURSIVA, PROGRAMACIÓN EN AVANCE Y EN RETROCESO

15 15

Líneas de esperas INTRODUCCIÓN Y CASOS DE APLICACIÓN.

Las líneas de espera, filas de espera o colas, son realidades cotidianas: Personas esperando para realizar sus transacciones ante una caja en un banco, Estudiantes esperando por obtener copias en la fotocopiadora, vehículos esperando pagar ante una estación de peaje o continuar su camino, ante un semáforo en rojo, Máquinas dañadas a la espera de ser rehabilitadas. Los análisis de colas ayudan a entender el comportamiento de estos sistemas de servicio (la atención de las cajeras de un banco, actividades de mantenimiento y reparación de maquinaria, el control de las operaciones en planta, etc.). Desde la perspectiva de la Investigación de Operaciones, los pacientes que esperan ser atendidos por el odontólogo o las prensas dañadas esperando reparación, tienen mucho en común. Ambos (gente y máquinas) requieren de recursos humanos y recursos materiales como equipos para que se los cure o se los haga funcionar nuevamente. DEFINICIONES CARACTERÍSTICAS Y SUPOSICIONES.

Una cola es una línea de espera y la teoría de colas es una colección de modelos matemáticos que describen sistemas de línea de espera particulares o sistemas de colas. Los modelos sirven para encontrar un buen compromiso entre costes del sistema y los tiempos promedio de la línea de espera para un sistema dado. Los sistemas de colas son modelos de sistemas que proporcionan servicio. Como modelo, pueden representar cualquier sistema en donde los trabajos o clientes llegan buscando un servicio de algún tipo y salen después de que dicho servicio haya sido atendido. Podemos modelar los sistemas de este tipo tanto como colas sencillas o como un sistema de colas interconectadas formando una red de colas La teoría de colas es el estudio matemático del comportamiento de líneas de espera. Esta se presenta, cuando los “clientes” llegan a un “lugar” demandando un servicio a un “servidor”, el cual tiene una cierta capacidad de atención. Si el servidor no está disponible inmediatamente y el cliente decide esperar, entonces se forma la línea de espera. A lo largo del tiempo se producen llegadas de clientes a la cola de un sistema desde una determinada fuente demandando un servicio. Los servidores del sistema seleccionan miembros de la cola según una regla predefinida denominada disciplina de la cola. Cuando un cliente seleccionado termina de recibir su servicio (tras un tiempo de servicio) abandona el sistema, pudiendo o no unirse de nuevo a la fuente de llegadas. Fuente Recibe el nombre de fuente el dispositivo del que emanan las unidades que piden un servicio. Si el número de unidades potenciales es finito, se dice que la fuente es finita; en caso contrario se dice que es infinita. Cuando la fuente es finita se suele asumir que la probabilidad de que se produzca una llegada en un intervalo de tiempo es proporcional al tamaño de la fuente en ese instante. En general, nos restringiremos al estudio de sistemas de colas con fuentes infinitas.

Tiempo entre llegadas Existen dos clases básicas de tiempo entre llegadas: Determinístico, en el cual clientes sucesivos llegan en un mismo intervalo de tiempo, fijo y conocido. Un ejemplo clásico es el de una línea de ensamble, en donde los artículos llegan a una estación en intervalos invariables de tiempo. Probabilístico, en el cual el tiempo entre llegadas sucesivas es incierto y variable. Los tiempos entre llegadas probabilísticos se describen mediante una distribución de probabilidad. Mecanismos de servicio Se llama capacidad del servicio al número de clientes que pueden ser servidos simultáneamente. Si la capacidad es uno, se dice que hay un solo servidor (o que el sistema es monocanal) y si hay más de un servidor, multicanal. El tiempo que el servidor necesita para atender la demanda de un cliente (tiempo de servicio) puede ser constante o aleatorio. Disciplina de la cola En sistemas monocanal, el servidor suele seleccionar al cliente de acuerdo con uno de los siguientes criterios (prioridades):    

El que llegó antes. El que llegó el último. El que menos tiempo de servicio requiere. El que más requiere. Supuestos El modelo simple de teoría de colas que se ha definido, se basa en las siguientes suposiciones: a) Un solo prestador del servicio y una sola fase. b) Distribución de llegadas de poisson donde l = tasa de promedio de llegadas. c) Tiempo de servicio exponencial en donde m = tasa de promedio del servicio. d) Disciplina de colas de servicio primero a quien llega primero; todas las llegadas esperan en línea hasta que se les da servicio y existe la posibilidad de una longitud infinita en la cola.

TERMINOLOGÍA Y NOTACIÓN.

Características operativas.- Medidas de desempeño para una línea de espera que incluyen la probabilidad de que no haya unidades en el sistema, la cantidad promedio en la línea, el tiempo de espera promedio, etc.

Operación de estado estable.- Operación normal de la línea de espera después de que ha pasado por un periodo inicial o transitorio. Las características operativas de las líneas de espera se calculan para condiciones de estado estable. Tasa media de llegada.- Cantidad promedio de clientes o unidades que llegan en un periodo dado. Tasa media de servicio.- Cantidad promedio de clientes o unidades que puede atender una instalación de servicio en un periodo dado. Línea de espera de canales múltiples.- Línea de espera con dos o más instalaciones de servicio paralelas. Bloqueado.- Cuando las unidades que llegan no pueden entrar a la línea de espera debido a que el sistema está lleno. Las unidades bloqueadas pueden ocurrir cuando no se permiten las líneas de espera o cuando las líneas de espera tienen una capacidad finita. Población infinita.- Población de clientes o unidades que pueden buscar servicio, no tiene un límite superior especificado. Población finita.- Población de clientes o unidades que pueden buscar servicio, tiene un valor fijo y finito.

Usualmente siempre es común utilizar la siguiente terminología estándar: P0= Probabilidad de que no haya clientes en el sistema Lq= Número de clientes promedio en una línea de espera L= Número de clientes promedio en el sistema (Clientes en cola y clientes que están siendo atendidos). Wq= Tiempo promedio que un cliente pasa en la línea de espera. W= Tiempo total promedio que un cliente pasa en el sistema. Pn= Probabilidad de que haya n clientes en el sistema. Pw= Probabilidad de que un cliente que llega tenga que esperar por el servicio. Todas estas características operativas de estado estable se obtienen mediante formulas que dependen del tipo de modelo de línea de espera que se esté manejando. Para calcular éstas, se necesitan los siguientes datos: λ= la cantidad promedio de llegadas por periodo (la tasa media de llegadas) μ= la cantidad promedio de servicios por periodo (la tasa media de servicio). PROCESO DE NACIMIENTO Y MUERTE. MODELOS POISSON.

La mayor parte de los modelos elementales de colas suponen que las entradas (llegada de clientes) y las salidas (clientes que se van) del sistema ocurren de acuerdo al proceso de nacimiento y muerte. Este importante proceso de teoría de probabilidad tiene aplicaciones en

varias áreas. Sin embrago en el contexto de la teoría de colas, el término nacimiento se refiere a llegada de un nuevo cliente al sistema de colas y el término muerte se refiere a la salida del cliente servido. El estado del sistema en el tiempo t (t 0), denotado por N (t), es el número de clientes que hay en el sistema de colas en el tiempo t. El proceso de nacimiento y muerte describe en términos probabilísticos cómo cambia N (t) al aumentar t. En general, dice que los nacimientos y muertes individuales ocurren aleatoriamente, en donde sus tasas medias de ocurrencia dependen del estado actual del sistema. De manera más precisa, las suposiciones del proceso de nacimiento y muerte son las siguientes: SUPOSICIÓN 1. Dado N (t) = n, la distribución de probabilidad actual del tiempo que falta para el próximo nacimiento (llegada) es exponencial con parámetro (n=0,1,2,….). SUPOSICIÓN 2. Dado N (t) = n, la distribución de probabilidad actual del tiempo que falta para la próxima muerte (terminación de servicio) es exponencial con parámetro (n=1,2,….). SUPOSICIÓN 3. La variable aleatoria de la suposición 1 (el tiempo que falta hasta el próximo nacimiento) y la variable aleatoria de la suposición 2 (el tiempo que falta hasta la siguiente muerte) son mutuamente independientes. Excepto por algunos casos especiales, el análisis del proceso de nacimiento y muerte es complicado cuando el sistema se encuentra en condición transitoria. Se han obtenido algunos resultados sobre esta distribución de probabilidad de N (t) pero son muy complicados para tener un buen uso práctico. Por otro lado, es bastante directo derivar esta distribución después de que el sistema ha alcanzado la condición de estado estable (en caso de que pueda alcanzarla). Distribución de llegadas. Definir el proceso de llegada para una línea de espera implica determinar la distribución de probabilidad para la cantidad de llegadas en un periodo dado. Para muchas situaciones de línea de espera, cada llegada ocurre aleatoria e independientemente de otras llegadas y no podemos predecir cuándo ocurrirá. En tales casos, los analistas cuantitativos has encontrado que la distribución de probabilidad de Poisson proporciona una buena descripción del patrón de llegadas. La función de probabilidad de Poisson proporciona la probabilidad de x llegadas en un periodo específico. La función de probabilidad es como sigue: P(x)= μxe-λ x! para x= 0,1,2,… UN SERVIDOR, COLA INFINITA, FUENTE INFINITA.

Las fórmulas que pueden usarse para determinar las características operativas de estado estable para una línea de espera de un solo canal se citarán más adelante. Las fórmulas son aplicables si las llegadas siguen una distribución de probabilidad de Poisson y los tiempos de servicio siguen una distribución de probabilidad exponencial. Mostramos cómo pueden usarse las fórmulas para determinar las características de operación de un sistema de un servidor, cola infinita y fuente infinita, y por tanto, proporcionarle a la administración información útil para la toma de decisiones. La metodología matemática usada para derivar las fórmulas para las características operativas de las líneas de espera es bastante compleja. Sin embargo, el propósito no es

proporcionar el desarrollo teórico de estos modelos, sino mostrar cómo las fórmulas que se han elaborado pueden dar información acerca de las características operativas de la línea de espera. Características operativas. Las fórmulas siguientes pueden usarse para calcular las características operativas de estado estable para una línea de espera de un solo canal con llegadas de Poisson y tiempos de servicio exponenciales, donde: λ= la cantidad promedio de llegadas por periodo (la tasa media de llegada). μ= la cantidad promedio de servicios por periodo (la tasa media de servicio).

P0= Probabilidad de que no haya clientes en el sistema:

Lq= Número de clientes promedio en una línea de espera:

L= Número de clientes promedio en el sistema (Clientes en cola y clientes que están siendo atendidos):

Wq= Tiempo promedio que un cliente pasa en la línea de espera:

W= Tiempo total promedio que un cliente pasa en el sistema.

Pn= Probabilidad de que haya n clientes en el sistema.

Pw= Probabilidad de que un cliente que llega tenga que esperar por el servicio.

SERVIDORES MÚLTIPLES, COLA INFINITA, FUENTE INFINITA.

Una línea de espera con canales múltiples consiste en dos o más canales de servicio que se supone son idénticos desde el punto de vista de su capacidad. En el sistema de canales múltiples, las unidades que llegan esperan en una sola línea y luego pasan al primer canal disponible para ser servidas. La operación de un solo canal de Burger Dome puede expandirse a un sistema de dos canales al abrir un segundo canal de servicio. La siguiente figura muestra un diagrama de la línea de espera de dos canales de Burger Dome. En esta sección presentamos fórmulas que pueden usarse para determinar las características operativas de estado estable para una línea de espera de varios canales. Estas fórmulas son aplicables si existen las siguientes condiciones. 1.-Las llegadas siguen una distribución de probabilidad de Poisson. 2.-Tiempo de servicio para cada canal sigue una distribución de probabilidad exponencial. 3.- La tasa media de servicio μ es la misma para cada canal. 4.- Las llegadas esperan en una sola línea de espera y luego pasan al primer canal disponible para el servicio.

Características Operativas Pueden usarse las siguientes fórmulas para calcular las características operativas de estado estable para líneas de espera con canales múltiples, donde: λ.- la tasa media de llegada para el sistema. μ.- la tasa media de servicio para cada canal. k.- la cantidad de canales.

P0= Probabilidad de que no haya clientes en el sistema

Lq= Número de clientes promedio en una línea de espera

L= Número de clientes promedio en el sistema (Clientes en cola y clientes que están siendo atendidos).

Wq= Tiempo promedio que un cliente pasa en la línea de espera.

W= Tiempo total promedio que un cliente pasa en el sistema.

Pn= Probabilidad de que haya n clientes en el sistema.

Pw= Probabilidad de que un cliente que llega tenga que esperar por el servicio:

Debido a que μ es la tasa media de servicio para cada canal, kμ es la tasa media de servicio para el sistema de canales múltiples. Como sucedió con el modelo de línea de espera de un solo canal, las fórmulas para las características operativas de las líneas de espera con múltiples canales sólo pueden aplicarse en situaciones donde la tasa media de servicio para el sistema es mayor que la tasa media de llegadas; en otras palabras, las fórmulas son aplicables sólo si kμ es mayor que λ.

UN SERVIDOR, FUENTE FINITA, COLA FINITA.

Para los modelos de línea de espera introducidos hasta ahora, la población de unidades o clientes que llegan para servicio se han considerado ilimitadas. En términos técnicos, cuando no se pone límite respecto a cuántas unidades pueden buscar servicio, se dice que el modelo tiene una población infinita. Bajo esta suposición, la tasa media de llegada λ permanece constante sin importar cuántas unidades hay en el sistema de línea de espera. Esta suposición de una

población infinita se hace en la mayoría de los modelos de línea de espera. En otros casos, se asume que la cantidad máxima de unidades o clientes que pueden buscar servicio es finita. En esta situación, la tasa media de llegada para el sistema cambia, dependiendo de la cantidad de unidades en la línea de espera y se dice que el modelo de línea de espera tiene una población finita. Las fórmulas para las características operativas de los modelos de línea de espera anteriores deben modificarse para explicar el efecto de la población finita. El modelo de población finita que se expone en esta sección se basa en las siguientes suposiciones. 1. 2. 3.

Las llegadas para cada unidad siguen una distribución de probabilidad de Poisson, con una tasa media de llegada λ. Los tiempos de servicio siguen una distribución de probabilidad exponencial, con una tasa media de servicio μ. La población de unidades que pueden buscar servicio es finita. Con un solo canal, el modelo de línea de espera se conoce como modelo M/M/1 con una población finita.

La tasa de llegada media para el modelo M/M/1 con una población finita se define en función de cuán a menudo llega o busca servicio cada unidad. Esta situación difiere de la de modelos de línea de espera anteriores en los que λ denotaba la tasa media de llegada para el sistema. Con una población finita, la tasa media de llegada para el sistema varía, dependiendo de la cantidad de unidades en el sistema. En lugar de ajustar para la tasa de llegada del sistema cambiante, en el modelo de población finita λ indica la tasa media de llegada para cada unidad.

Características operativas para, el modelo M/M/1 con una población finita de demandantes. Las siguientes formulas se usan para determinar las características operativas de estado estable para el modelo M/M/1 con una población finita donde: λ = la tasa media de llegada para cada unidad μ= la tasa media de servicio N = el tamaño de la población 1. Probabilidad de que no haya unidades en el sistema:

2. Cantidad de unidades promedio en la línea de espera:

3. Cantidad promedio de unidades en el sistema:

4. Tiempo promedio que pasa una unidad en la línea de espera:

5. Tiempo promedio que pasa una unidad en el sistema:

6. Probabilidad de que una unidad que llega tenga que esperar por el servicio:

7. Probabilidad de n unidades en el

sistema:

CADENAS DE MARKOV INTRODUCCIÓN.

En los problemas de toma de decisiones, con frecuencia surge la necesidad de tomar decisiones basadas en fenómenos que tienen incertidumbre asociada a ellos. Esta incertidumbre proviene de la variación inherente a las fuentes de esa variación que eluden el control o proviene de la inconsistencia de los fenómenos naturales. En lugar de manejar esta variabilidad como cualitativa puede incorporarse al modelo matemático y manejarse en forma cuantitativa. Por lo general este tratamiento se puede lograr si el fenómeno natural muestra un cierto grado de regularidad de manera que sea posible describir la variación mediante un modelo probabilístico. Este capítulo presenta modelos de probabilidad para procesos que evolucionan en el tiempo de una manera probabilística. Tales procesos se llaman procesos estocásticos. El capítulo está dedicado a un tipo especial llamado cadena de Markov. Las cadenas de Markov tienen la propiedad particular de que las probabilidades que describen la forma en que el proceso evolucionará en el futuro dependen sólo del estado actual en que se encuentra el proceso y, por tanto son independientes de los eventos ocurridos en el pasado. Muchos procesos se ajustan a esta descripción por lo que las cadenas de Markov constituyen una clase de modelos probabilísticos de gran importancia. CASOS DE APLICACIÓN

los casos de aplicación mayormente están en la decisiones de muchas empresas hoy en día este es un ejemplo de donde se puede aplicar las cadenas de Markov. Los administradores de la empresa New Fangled Sofdrink Company consideran que la probabilidad de que un cliente compre la bebida Red – Rot Pop, o el principal producto de competencia, Súper Cola, se basan en la compra más reciente del cliente. Supóngase que son apropiadas las siguientes probabilidades de transición:

Red Rot Pop Súper Cola

Red Rot Pop Super Cola 0.9 0.1 0.1 0.9

a) Trace el diagrama de árbol de dos periodos para un cliente que compro la ultima vez Red Rot Pop. ¿Cuál es la probabilidad de que este cliente compre Red Rot Pop en una segunda compra? b) ¿Cuál es la participación de mercado a largo plazo para cada uno de estos dos productos? c) Se está planeando una importante campaña de publicidad para aumentar la probabilidad de atraer a los clientes de Súper Cola. Los administradores consideran que la nueva compañía aumentaría a 0.15 la probabilidad de que un cliente cambie de Súper Cola a Red Rot Pop. ¿Cuál es el efecto proyectado de la campaña de publicidad sobre las participaciones del mercado?

a) Primera Segunda compra compra Red Rot Pop

= 0.81

0.9

0.9

0.1 1

Red Rot Pop

0.1

Red Rot Pop = 0.01

0.9 Súper Cola

Súper Cola = 0.09

0.9

0.1

0 Súper Cola

Súper Cola = 0.09

Red Rot Pop 0.1

0.1 Red Rot Pop 0.1

Red Rot Pop = 0

Súper Cola = 0 Red Rot Pop = 0

0.9

Súper Cola 0.9

Súper Cola = 0

[0.82, 0.18] La probabilidad de que un cliente compre dos veces consecutivas la marca de refresco Red Rod Pop es de 0.82.

b) =

0.9 x + 0.1 y = x 0.1 x + 0.9 y = y -0.1 x + 0.1y = 0 0.1x – 0.1y = 0 x+ y= 1

0.1(1 – y) – 0.1y = 0 0.1 – 0.1y – 0.1y = 0 0.1 – 0.2y = 0 - 0.2y = -0.1 y = -0.1/-0.2 y = 0.5

x=1–y x = 1 – 0.5 x = 0.5

x=1–y La participación en el mercado a largo plazo de ambas marcas es de 0.5 para cada una de ellas. c)

= 0.1(1 – y) – 0.15y = 0 0.1 – 0.1y – 0.15y = 0 0.1 – 0.25y = 0 -0.25y = -0.1 y = -0.1 / -0.25 y = 0.4

0.9x + 0.15y = x 0.1x + 0.85y = y x+y=1 -0.1x + 0.15y = 0 0.1x – 0.15y = 0 x+ y=1 x=1–y

x=1–y x = 1 – 0.4 x = 0.6

Se espera que con la publicidad realizada, el mercado para Red Rot Pop aumente a 0.6, mientras que la fidelidad de la marca Súper Cola caerá a 0.40.

FORMULACIÓN DE LAS CADENAS DE MARKOV.

Una cadena de Markov es una serie de eventos, en la cual la probabilidad de que ocurra un evento depende del evento inmediato anterior. En efecto, las cadenas de este tipo tienen memoria. "Recuerdan" el último evento y esto condiciona las posibilidades de los eventos futuros. Esta dependencia del evento anterior distingue a las cadenas de Markov de las series de eventos independientes, como tirar una moneda al aire o un dado. En la figura se muestra el proceso para formular una cadena de Markov; el generador de Markov produce uno de n eventos posibles. E j. donde j = 1, 2, . . . , n, a intervalos discretos de tiempo (que no tiene que ser iguales ). Las probabilidades de ocurrencia para cada uno de estos eventos dependen del estado del generador. Este estado se describe por el último evento generado. En la figura 4.1.1, el último evento generado fue E j. de manera que el generador se encuentra en el estado Mj .

La probabilidad de que Ek sea el siguiente evento generado es una probabilidad condicional: P ( Ek / Mj ). Esto se llama probabilidad de transición del estado Mj al estado Ek. Para describir completamente una cadena de Markov es necesario saber el estado actual y todas las probabilidades de transición.

Probabilidades

de

Una forma de un diagrama de figura de abajo. En cuatro estados probabilidad

transición. describir una cadena de Markov es con estados, como el que se muestra en la ésta se ilustra un sistema de Markov con posibles : M1, M2 , M3 y M4 . La condicional o de transición de moverse

de un estado a otro se indica en el diagrama:

Otro método para exhibir las probabilidades de transición es usar una matriz de transición. . La matriz de transición para el ejemplo del diagrama de estados se muestra en la tabla siguiente .

Otro método para exhibir las probabilidades de transición es usar una matriz de transición. . Para n = 0, 1, 2, ....

El superíndice n no se escribe cuando n = 1. PROCESOS ESTOCÁSTICOS.

Un proceso estocástico se define sencillamente como una colección indexada de variables aleatorias { X1 }, donde el subíndice t toma valores de un conjunto T dado. Con frecuencia T se toma como el conjunto de enteros no negativos y X, representa una característica de interés medible en el tiempo t. Por ejemplo, el proceso estocástico, X 1 , X2 , X3, .., Puede representar la colección de niveles de inventario semanales (o mensuales) de un producto dado, o puede representar la colección de demandas semanales (o mensuales) de este producto. Un estudio del comportamiento de un sistema de operación durante algún periodo suele llevar al análisis de un proceso estocástico con la siguiente estructura. En puntos específicos del tiempo t , el sistema se encuentra exactamente en una de un número finito de estados mutuamente excluyentes y exhaustivos, etiquetados 0, 1, . . , S. Los periodos en el tiempo pueden encontrarse a intervalos iguales o su esparcimiento puede depender del comportamiento general del sistema en el que se encuentra sumergido el proceso estocástico. Aunque los estados pueden constituir una caracterización tanto cualitativa como cuantitativa del sistema, no hay pérdida de generalidad con las etiquetas numéricas 0, 1, . . , M , que se usarán en adelante para denotar los estados posibles del sistema. Así la representación matemática del sistema físico es la de un proceso estocástico {Xi}, en donde las variables aleatorias se observan en t = 0, 1, 2,. . ., y en donde cada variable aleatoria puede tomar el valor de cualquiera de los M + 1 enteros 0, 1, .. , M . Estos enteros son una caracterización de los M + 1 estados del proceso.

PROGRAMACIÓN DINÁMICA CARACTERÍSTICAS DE LOS PROBLEMAS DE PROGRAMACIÓN DINÁMICA: ETAPAS, ESTADOS, FÓRMULA RECURSIVA, PROGRAMACIÓN EN AVANCE Y EN RETROCESO

La programación dinámica es una técnica matemática que se utiliza para la solución de problemas matemáticos seleccionados, en los cuales se toma una serie de decisiones en forma secuencial. Proporciona un procedimiento sistemático para encontrar la combinación de decisiones que maximice la efectividad total, al descomponer el problema en etapas, las que pueden ser completadas por una o más formas (estados), y enlazando cada etapa a través de cálculos recursivos. La programación dinámica es un enfoque general para la solución de problemas en los que es necesario tomar decisiones en etapas sucesivas. Las decisiones tomadas en una etapa condicionan la evolución futura del sistema, afectando a las situaciones en las que el sistema se encontrará en el futuro (denominadas estados), y a las decisiones que se plantearán en el futuro. La programación dinámica parte de una pequeña porción del problema y llega a la solución óptima para esa pequeña parte del problema, entonces gradualmente se agranda el problema hallando la solución óptima en curso a partir de la anterior. Este proceso se repite hasta obtener la solución óptima del problema original. El problema de la diligencia es un prototipo literal de los problemas de programación dinámica. Por tanto una manera de reconocer una situación que se puede formular como un problema de programación dinámica es poder identificar una estructura análoga a la del problema de la diligencia.

Características básicas. 1.- El problema se puede dividir en etapas que requieren una política de decisión en cada una de ellas. 2.- Cada etapa tiene cierto número de estados asociados con su inicio. Los estados son las distintas condiciones posibles en las que se puede encontrar el sistema en cada etapa del problema. 3.- El efecto de la política de decisión en cada etapa es transformar el estado actual en un estado asociado con el inicio de la siguiente etapa. 4.- El procedimiento de solución está diseñado para encontrar una política óptima para el problema completo. 5.- Dado el estado actual, una política óptima para las etapas restantes es independiente de la política adoptada en etapas anteriores. Este es el principio de optimalidad para programación dinámica. 6.- El procedimiento de solución se inicia al encontrar la política óptima para la última etapa.

7.- Se dispone de una relación recursiva que identifica la política óptima para la etapa n, dada la política óptima para la etapa n+1. La forma precisa de relación recursiva difiere de un problema a otro de programación dinámica, pero usaremos una notación análoga a la siguiente: N = número de etapas. n = etiqueta para la etapa actual ( n = 1,2,...,N) sn = estado actual para la etapa n xn = variable de decisión para la etapa n xn* = valor óptimo de xn (dado sn) fn(sn,xn) = contribución a la función objetivo de las etapas n, n+1,...,N, si el sistema se encuentra en el estado sn en la etapa n, la decisión inmediata es xn y en adelante se toman decisiones óptimas. fn*(sn) = fn(sn,xn*) La relación recursiva siempre tendrá la forma: fn*(sn) = mín fn(sn,xn) ó fn*(sn) = max fn(sn,xn) 8.- Cuando se usa esta relación recursiva, el procedimiento de solución comienza al final y se mueve hacia atrás etapa por etapa, hasta que encuentra la política óptima desde la etapa inicial.

Procedimiento de solución. 1. Se construye una relación recursiva que identifica la política óptima para cada estado en la etapa n, dada la solución óptima para cada estado en la etapa n + l. 2. Se encuentra la decisión óptima en la última etapa de acuerdo a la política de decisión establecida. Comúnmente la solución de esta última etapa es trivial, es decir, sin ningún método establecido, tomando en cuenta solamente la "contribución" de la última etapa. 3. La idea básica detrás de la relación recursiva es trabajar "hacia atrás", preguntándose en cada etapa: ¿qué efecto total tendría en el problema si tomo una decisión particular en esta etapa y actúo óptimamente en todas las etapas siguientes? Si se resolviera el problema "hacia adelante", es decir, de la primera etapa hacia la sería necesario realizar una enumeración exhaustiva de todas las alternativas, que resolviéndolo "hacia atrás" reducimos el número de alternativas a analizar, simplificando la solución del problema. Cuando se llega a la etapa inicial se encuentra la solución óptima.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF