Glosario de Programación Dinámica

February 1, 2023 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Glosario de Programación Dinámica...

Description

 

 

UNIVERSIDAD DE LIMA ESCUELA DE INGENIERIA

 ASIGNATURA : INVESTIGACIÓN DE OPERACIONES II PER. ACADEMICO ACADEMICO : 2011-0

GLOSARIO DE PROGRAMACION DINAMICA Condiciones de contorno  : Son los valores de la función de valor óptimo f

correspondientes a los estados de contorno. Por lo general son valores de f que son obvios o que no requieren cálculo. cálculo. Conjunto de decisiones, D(S) : Es el conjunto de todas las alternativas de decisión

que se pueden tomar en el estado S. Ecuación recursiva : Es la ecuación que calcula el valor de la función de valor óptimo

para cada estado estado S, f(S) . Dicha ecua ecuación ción es recursiva por porque que para calcu calcular lar f(S) se debe previamente calcular otros valores de f.  f ( S ) = min { R(S,d) } ó f ( S ) = max { R(S,d) } d∈D(S)

d∈D(S)

Enumeración Exhaustiva : Es un procedimiento de optimización que consiste en la

enumeración de todas las soluciones posibles, identificando de esta manera a la mejor de las soluciones. Estado S : Es un resumen de la historia del proceso que es suficientemente detallada

para poder tomar una decisión. Los estados son entonces los puntos donde se toman las decisiones. Estado inicial  : Es el estado formado por los valores iniciales de las variables de

estado. Estados de contorno  : Son los estados a partir de los cuales ya no se pueden

generar nuevos estados. Función de política óptima, P(S)  : Es la regla que asigna al estado S la mejor

decisión que se puede tomar en ese estado. Esa mejor decisión se refiere a la primera mejor decisión para el subproblema asociado al estado S. Función de retorno, R(S,d) : Es la regla que asigna al estado S y a la decisión d el

valor óptimo de la función objetivo del subproblema asociado a él cuando la decisión que se toma en el estado S es d. Es expresado como la combinación de dos términos, uno de ellos es aD(s), denominado el valor asociado a la decisión (ó retorno inmediato ) y el otro término es f(Sn). Con frecuencia esa combinación es una suma. Función de transición  : Es la función T que define el nuevo estado cuando en el

estado actual S se toma la decisión d. Sn = T( d, S )

, donde Sn es el nuevo estado.

1

 

 

Función de valor óptimo, f(S)  : Es la regla que que asigna al es estado tado S el valor óptimo de

la función objetivo del subproblema asociado a él. Nuevo estado Sn : Es el estado que se genera cuando en el estado actual S se toma

le decisión d. Principio de optimalidad de Bellman : Principio que se debe cumplir en un problema

para que pueda ser resuelto por Programación Dinámica. Puede ser enunciado en diferentes formas,: “ Dada una secuencia óptima de decisiones, toda subsecuencia de ella es, a su vez, óptima”. “ La mejor ruta desde cualquier nodo z al nodo final depende solo del nodo z y no de la ruta usada para llllegar egar a z ”. “ Una ruta óptima tiene la propiedad de que cualquiera sea el nodo inicial y arco inicial, los arcos restantes deben constituir una ruta óptima con respecto al primer nodo alcanzado después del nodo inicial “. Problema de la dimensionalidad : El rápido aumento de los cálculos que requiere la

solución de los modelos de Programación Dinámica cuando el número de variables de estado aumenta. Subproblema asociado al estado S : Es un problema del mismo tipo del problema

original, que resulta cuando al haber tomado las primeras decisiones en el problema original se alcanza el estado S desde el estado inicial. Variables de estado : Son las componen componentes tes de un (vector de) estado.

Si : i-ésima variable de estado.

Términos adicionales Función objetivo del problema de optimización Problema de la alforja Problema de carga de bultos Problema de asignación Problema de produc producción ción e inventario Problema del agente viajero Problema PD probabilístico Notación aD(S) : valor asociado a la decisión d (ó retorno inmediato) en el estado S. d : decisión D(S) : conjunto de decisiones en el estado S. f(S) : función de valor óptimo en el estado S. P(S) : valor de la función de política óptima en el estado S. R(S,d) : valor de la función de retorno en el estado S y cuando la primera decisión es d. S : estado actual. s1, s2,.. : componente componentess del estado actual S. Sn : nuevo estado generado a partir del estado actual S. sn1, sn2,…: componentes del nuevo estado Sn.

2

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF