Glosario de Programación Dinámica
February 1, 2023 | Author: Anonymous | Category: N/A
Short Description
Download Glosario de Programación Dinámica...
Description
UNIVERSIDAD DE LIMA ESCUELA DE INGENIERIA
ASIGNATURA : INVESTIGACIÓN DE OPERACIONES II PER. ACADEMICO ACADEMICO : 2011-0
GLOSARIO DE PROGRAMACION DINAMICA Condiciones de contorno : Son los valores de la función de valor óptimo f
correspondientes a los estados de contorno. Por lo general son valores de f que son obvios o que no requieren cálculo. cálculo. Conjunto de decisiones, D(S) : Es el conjunto de todas las alternativas de decisión
que se pueden tomar en el estado S. Ecuación recursiva : Es la ecuación que calcula el valor de la función de valor óptimo
para cada estado estado S, f(S) . Dicha ecua ecuación ción es recursiva por porque que para calcu calcular lar f(S) se debe previamente calcular otros valores de f. f ( S ) = min { R(S,d) } ó f ( S ) = max { R(S,d) } d∈D(S)
d∈D(S)
Enumeración Exhaustiva : Es un procedimiento de optimización que consiste en la
enumeración de todas las soluciones posibles, identificando de esta manera a la mejor de las soluciones. Estado S : Es un resumen de la historia del proceso que es suficientemente detallada
para poder tomar una decisión. Los estados son entonces los puntos donde se toman las decisiones. Estado inicial : Es el estado formado por los valores iniciales de las variables de
estado. Estados de contorno : Son los estados a partir de los cuales ya no se pueden
generar nuevos estados. Función de política óptima, P(S) : Es la regla que asigna al estado S la mejor
decisión que se puede tomar en ese estado. Esa mejor decisión se refiere a la primera mejor decisión para el subproblema asociado al estado S. Función de retorno, R(S,d) : Es la regla que asigna al estado S y a la decisión d el
valor óptimo de la función objetivo del subproblema asociado a él cuando la decisión que se toma en el estado S es d. Es expresado como la combinación de dos términos, uno de ellos es aD(s), denominado el valor asociado a la decisión (ó retorno inmediato ) y el otro término es f(Sn). Con frecuencia esa combinación es una suma. Función de transición : Es la función T que define el nuevo estado cuando en el
estado actual S se toma la decisión d. Sn = T( d, S )
, donde Sn es el nuevo estado.
1
Función de valor óptimo, f(S) : Es la regla que que asigna al es estado tado S el valor óptimo de
la función objetivo del subproblema asociado a él. Nuevo estado Sn : Es el estado que se genera cuando en el estado actual S se toma
le decisión d. Principio de optimalidad de Bellman : Principio que se debe cumplir en un problema
para que pueda ser resuelto por Programación Dinámica. Puede ser enunciado en diferentes formas,: “ Dada una secuencia óptima de decisiones, toda subsecuencia de ella es, a su vez, óptima”. “ La mejor ruta desde cualquier nodo z al nodo final depende solo del nodo z y no de la ruta usada para llllegar egar a z ”. “ Una ruta óptima tiene la propiedad de que cualquiera sea el nodo inicial y arco inicial, los arcos restantes deben constituir una ruta óptima con respecto al primer nodo alcanzado después del nodo inicial “. Problema de la dimensionalidad : El rápido aumento de los cálculos que requiere la
solución de los modelos de Programación Dinámica cuando el número de variables de estado aumenta. Subproblema asociado al estado S : Es un problema del mismo tipo del problema
original, que resulta cuando al haber tomado las primeras decisiones en el problema original se alcanza el estado S desde el estado inicial. Variables de estado : Son las componen componentes tes de un (vector de) estado.
Si : i-ésima variable de estado.
Términos adicionales Función objetivo del problema de optimización Problema de la alforja Problema de carga de bultos Problema de asignación Problema de produc producción ción e inventario Problema del agente viajero Problema PD probabilístico Notación aD(S) : valor asociado a la decisión d (ó retorno inmediato) en el estado S. d : decisión D(S) : conjunto de decisiones en el estado S. f(S) : función de valor óptimo en el estado S. P(S) : valor de la función de política óptima en el estado S. R(S,d) : valor de la función de retorno en el estado S y cuando la primera decisión es d. S : estado actual. s1, s2,.. : componente componentess del estado actual S. Sn : nuevo estado generado a partir del estado actual S. sn1, sn2,…: componentes del nuevo estado Sn.
2
View more...
Comments