14408911121
May 4, 2017 | Author: Drizz Yosser House Rousseau | Category: N/A
Short Description
Descripción: d...
Description
Clase 2: Programaci´ on din´ amica
Clase 2: Programaci´ on din´ amica Matem´ atica avanzada para macroeconom´ıa
Hamilton Galindo
Junio - Agosto 2015
Clase 2: Programaci´ on din´ amica
Contenido
1
Problema de optimizaci´ on din´ amica
2
Programaci´ on din´ amica: panorama Funci´ on valor Ecuaci´ on de Bellman Problema funcional Del PS al PF
3
Programaci´ on din´ amica: detalles Principio de optimalidad M´etodo para solucionar el PF M´etodo de c´ alculo diferencial para solucionar el PF
Clase 2: Programaci´ on din´ amica Problema de optimizaci´ on din´ amica
1
Problema de optimizaci´ on din´ amica
2
Programaci´ on din´ amica: panorama Funci´ on valor Ecuaci´ on de Bellman Problema funcional Del PS al PF
3
Programaci´ on din´ amica: detalles Principio de optimalidad M´etodo para solucionar el PF M´etodo de c´alculo diferencial para solucionar el PF
Clase 2: Programaci´ on din´ amica Problema de optimizaci´ on din´ amica
¿Qu´ e tipo de problema queremos resolver? I Queremos resolver un problema de “optimizaci´ on din´amica”, al cual llamaremos Problema Secuencial (PS): Problema secuencial (PS) sup
∞ X
β t r (xt , ut )
{ut } t=0
s.a xt+1
: = g (xt , ut )
ut
∈
Γ(xt ),
x0
∈
X
t = 0, 1, 2, ...
dado
Donde: 1
r(xt , ut ) : funci´ on de retorno (instant´aneo) r (xt , ut ) : XxRm → R
(1)
Clase 2: Programaci´ on din´ amica Problema de optimizaci´ on din´ amica
¿Qu´ e tipo de problema queremos resolver? II 2
β : factor de descuento, β ∈ [0, ∞)
3
xt : vector de variables de estado (xt ∈ Rn )
4
ut : vector de variables de control (ut ∈ Rm )
5
g(xt , ut ) : funci´ on que describe la evoluci´ on de la variables de estado (funci´ on de transici´ on o ley de movimiento): g (xt , ut ) : XxRm → X
6
Γ(xt ) : es una correspondencia que describe las posibilidades de la variable de control cuando la econom´ıa se encuentra en el estado “xt ”. Γ : X ⇒ Rm
7
X : es el espacio de los valores que puede tomar la variable de estado (X ⊂ Rn )
8
x0 : el valor inicial de la variable de estado (estado inicial)
Clase 2: Programaci´ on din´ amica Problema de optimizaci´ on din´ amica
Ejemplo: crecimiento o ´ptimo (Brock y Mirman, 1972) I
El modelo b´asico de crecimiento est´a descrito por el siguiente problema (en t´erminos generales): Max ∞
{ct ,kt+1 }t=0
∞ X
β t lnct
t=0
s.a: kt+1 = (1 − δ)kt + it ct + it = f (kt ) ct , kt ≥ 0∀t A este problema lo llamamos problema secuencial (PS). Considerando las α siguientes forma funcionales u(c )lnc , f (k ) = k , y supuestos α ∈ t t t t (0, 1), δ = 1 y k0 dado se tiene:
Clase 2: Programaci´ on din´ amica Problema de optimizaci´ on din´ amica
Ejemplo: crecimiento o ´ptimo (Brock y Mirman, 1972) II
Problema secuencial: Brock y Mirman (1972) Max ∞
{ct ,kt+1 }t=0
∞ X
β t lnct
t=0
s.a: kt+1 = ktα − ct c t , kt ≥ 0
Clase 2: Programaci´ on din´ amica Problema de optimizaci´ on din´ amica
Formas de resolver un problema de optimizaci´ on din´ amica
Tres formas de resolver este tipo de problemas: 1
M´etodo de apr´ oximaciones sucesivas
2
Programaci´ on din´amica Es el estudio de problemas de optimizaci´ on din´ amica a trav´es del an´ alisis de ecuaciones funcionales.
3
M´etodo de Lagrange
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: panorama
1
Problema de optimizaci´ on din´ amica
2
Programaci´ on din´ amica: panorama Funci´ on valor Ecuaci´ on de Bellman Problema funcional Del PS al PF
3
Programaci´ on din´ amica: detalles Principio de optimalidad M´etodo para solucionar el PF M´etodo de c´alculo diferencial para solucionar el PF
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: panorama Funci´ on valor
Funci´ on valor
Bellman (1974) indica que el PS tiene una propiedad recursiva. Esto permite transformar el PS en un Problema Funcional (PF). Funci´ on valor 1
Se define una “funci´ on valor V (x0 )” que indica el valor m´aximo de la funci´ on objetivo para cada x0 > 0. X ∞ V (x0 ) = max β t r (xt , ut ) {ut }
2
(2)
t=0
Por ejemplo: en t = 1 se tiene x1 X ∞ t−1 V (x1 ) = max β r (xt , ut ) {ut }
t=1
(3)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: panorama Ecuaci´ on de Bellman
Ecuaci´ on de Bellman I
Ecuaci´ on de Bellman Bellman (1974) transform´ o la funci´ on objetivo del PS en una ecuaci´on funcional: X ∞ V (x0 ) = max β t r (xt , ut ) {ut }
t=0
max r (x0 , u0 ) + βr (x1 , u1 ) + β 2 r (x2 , u2 )... {ut } = max r (x0 , u0 ) + β r (x1 , u1 ) + β 2 r (x2 , u2 )... {z } | {ut } =
V (x1 )
V (x0 ) = max r (x0 , u0 ) + βV (x1 ) {ut }
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: panorama Ecuaci´ on de Bellman
Ecuaci´ on de Bellman II
A esta u ´ltima ecuaci´ on se le conoce como ecuaci´ on de Bellman. Esta ecuaci´ on es una ecuaci´ on funcional; es decir, es una ecuaci´on cuya soluci´ on es una funci´ on (funci´ on valor).
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: panorama Problema funcional
Problema funcional I Al reemplazar la ecuaci´ on de Bellman en el PS se obtiene el PF (para t): Problema funcional V (xt ) = max r (x0 , u0 ) + βV (g (xt , ut )) {ut }
s.a ut x0
: ∈ Γ(xt ), ∈ X
(4)
t = 0, 1, 2, ...
dado
1
El problema de infinitos periodos (PS) se ha convertido en un problema de dos periodos.
2
Se est´a utilizando (explotando) la recursividad del PS.
3
Ahora el problema consiste en encontrar la funci´ on que resuelve el PF; es decir, la funci´ on valor.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: panorama Del PS al PF
Proceso de transformaci´ on del PS al PF 2
1
Problema Secuencial (PS)
Problema Funcional (PF)
Se transforma
6
3 Se transforma
4
5
Solución PS
Teorema de Equivalencia
(valor supremo)
Problema punto fijo
Solución PF
Es…
Por el teorema del punto fijo para contracciones
Solución Encontrar el punto fijo del operador T en Ca(X): T[V](x) = V(x) Se encuentra la función valor (V) Resolviendo paso a paso el problema de maximización del PF
Se encuentra la función de política: h(x)
Ca(X): conjunto de todas las funciones acotadas
Se encuentra el plan óptimo: {(xt, ut)}
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: panorama Del PS al PF
Principales hip´ otesis, proposiciones y teoremas Hipótesis
Proposiciones
Teoremas
Función objetivo
H1 al H3
P1: ῦ resuelve el PF P2: ῦ resuelve el PS P3: din. fac. en el PF P4: din. fac. en el PS
T1 (teorema de equivalencia) Principio de optimalidad
Supremo
H4 y H5
Monotonicidad
H4 al H7
P5: función valor estrictamente monótona
Concavidad
H4, H5 y H7 al H10
P6: función valor estrictamente cóncava
PS
PF
Diferenciabilidad 3 propiedades de la función valor
H4, H5 y H7 al H12
T2 (punto fijo para contracciones)
T3 (teorema de diferenciabilidad de la función valor) Teorema de BenvenisteScheinkman
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles
1
Problema de optimizaci´ on din´ amica
2
Programaci´ on din´ amica: panorama Funci´ on valor Ecuaci´ on de Bellman Problema funcional Del PS al PF
3
Programaci´ on din´ amica: detalles Principio de optimalidad M´etodo para solucionar el PF M´etodo de c´alculo diferencial para solucionar el PF
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
1
Problema de optimizaci´ on din´ amica
2
Programaci´ on din´ amica: panorama Funci´ on valor Ecuaci´ on de Bellman Problema funcional Del PS al PF
3
Programaci´ on din´ amica: detalles Principio de optimalidad M´etodo para solucionar el PF M´etodo de c´alculo diferencial para solucionar el PF
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Principio de optimalidad I
Bellman (1974) propuso un principio el cual permit´ıa encontrar una relaci´on entre la soluci´ on del PS y el PF. A este principio se le conoce como el “Principio de optimalidad”. Teorema 1 (Principio de optimalidad) ´ n V del PF, evaluado en x0 , brinda el valor del supremo La solucio ´ s, una secuencia en el PS cuando el estado inicial es x0 . Adema {ut }∞ alcanza el supremo si y solo si esta secuencia satisface [5]: t=0
V (xt ) = r (xt , ut ) + βV (xt+1 )
(5)
La pregunta que surge es: ¿Bajo qu´e condiciones el principio de optimalidad se mantiene?
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
¿Bajo qu´ e condiciones el principio de optimalidad se mantiene? I Cuatro proposiciones juntas establecen condiciones bajo las cuales la soluci´ on del PS y del PF coinciden exactamente, y que la pol´ıticas ´optimas son aquellas que satifacen [5]: 1 Proposici´ on 1: establece que la funci´ on del supremo Ve para el PS satisface el PF (del PS al PF). No obstante, la ecuaci´on funcional (adem´as de Ve ) puede tener otras soluciones. 2
3
Proposici´ on 2: establece lo inverso de manera parcial (del PF al PS). Es parcial porque se impone una condici´ on de acotamiento. Esta proposici´ on impide que la ecuaci´ on funcional tenga otras soluciones porque no cumplen la condici´ on de transversalidad fuerte. La u ´nica soluci´ on que cumple dicha condici´ on es Ve . Proposici´ on 3: Muestra que si {ut }∞ t=0 es una secuencia que alcanza el supremo en el PS, entonces este satisface [5] para: V |{z}
sol. del PF
=
Ve |{z}
sol. del PS
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
¿Bajo qu´ e condiciones el principio de optimalidad se mantiene? II
4
Proposici´ on 4: Establece que cualquier secuencia {ut }∞ t=0 que satisface [5] para V = Ve y que tambi´en satisface una condici´on de acotamiento, entonces tambi´en alcanza el supremo en el PS.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Definiciones Antes de ver las hip´ otesis que sustentan las cuatro proposiciones es importante mencionar algunas definiciones: 1 Din´amica factible desde x0 : es una sucesi´ on de estados y controles m {(xt , ut )}∞ t=0 en XxR para el PS si: ut ∈ Γ(xt ) y xt+1 = g (xt , ut ) para todo t = 0, 1, 2... 2
3 4
5
Π(x0 ): conjunto de todas las din´amicas factibles desde x0 . Π(x0 ) : {(xt , ut )}∞ tal que u ∈ Γ(x ), ∀t = 0, 1, 2... t t t=0 Plan factible desde x0 : es una sucesi´ on de controles {(ut )}∞ t=0 Plan ´ optimo desde x0 : es un plan factible {(ut∗ )}∞ t=0 que permite alcanzar el supremo del PS. Cabe mencionar que un plan factible determina un´ıvocamente una din´amica factible. Por tanto, un plan ´ optimo {(ut )}∞ t=0 determina ∗ ∗ ∞ una din´amica ´ optima {(xt , ut )}t=0 .
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Hip´ otesis que sustentan las proposiciones I
Las cuatro proposiciones anteriores est´an basadas en tres hip´otesis: Hip´ otesis 1: Γ(x) Γ(x) 6= φ para todo x ∈ X . La hip´ otesis 1 asegura que Π(x0 ) (conjunto de din´amicas factibles desde x0 ) no sea vac´ıo ∀x0 ∈ X . Esto indica que todos los planes factibles pueden ser evaluados usando r (x, u) y β. P∞ En el PS, t=0 β t r (xt , ut ) podr´ıa tomar tres valores: un n´ umero finito, +∞ o −∞. Deseamos que esta funci´ on objetivo est´e acotada: es decir que la sumatoria infinita tenga un valor finito. P∞ La hip´ otesis 2 elimina la posibilidad que t=0 β t r (xt , ut ) sea +∞. Para ello se restringe el conjunto de din´amicas factibles de tal forma que dicha sumatoria est´e acotada (superiormente).
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Hip´ otesis que sustentan las proposiciones II
Hip´ otesis 2: funci´ on objetivo P∞ t Para todo x0 ∈ X , ∃Mx0 ∈ R, tal que t=0 β r (xt , ut ) ≤ Mx0 para toda din´amica factible {(xt , ut )}t=0,1,2... desde x0 . No obstante, la funci´ on objetivo (suma infinita) a´ un puede tomar, para ciertas din´amicas factibles, el valor de −∞. La hip´otesis 3 busca acotar dicha din´amicas. Hip´ otesis 3: funci´ on objetivo Para todo x0 ∈ X , ∃ una din´amica factible {(xt , ut )}t=0,1,2... desde x0 y un R, tal que la sucesi´ on de sumas parciales {Sn }t=0,1,2... Sn = Pnmx0 ∈ t β r (x , u ) satisface m ≤ Sn . t t x 0 t=0
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Hip´ otesis que sustentan las proposiciones III
Por tanto, las hip´ otesis 2 y 3 tienen como u ´nico fin garantizar la existencia de un valor finito para el supremo del PS; es decir, que la funci´ on objetivo est´e bien definida para cada din´amica factible {(xt , ut )} ∈ Γ(x0 ). Seg´ un las condiciones anteriores podemos definir la “funci´on supremo” Ve : X → R que sea el valor supremo del PS: Ve (x0 ) =
sup
∞ X
β t r (xt , ut )
(6)
{(xt ,ut )}∈Π(x0 ) t=0
Donde Ve (x0 ) es el valor supremo del PS. A esta funci´on Ve se le llama “funci´ on valor”.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Funci´ on supremo
Nota: Por definici´ on, la funci´ on supremo Ve : X → R es u ´nica y satisface tres condiciones (condiderando una funci´ on objetivo gen´erica µ(x)): Ve (x0 ) = sup µ(x) x∈Π(x0 ) 1
Si |Ve (x0 )| < ∞, entonces: Ve (x0 ) ≥ µ(x), ∀(para todo) x ∈ Π(x0 ) Para cualquier > 0: Ve (x0 ) ≤ µ(x) + , para alg´ un x ∈ Π(x0 )
2
Si |Ve (x0 )| = +∞, entonces existe una secuencia {x k } en Π(x0 ) tal que: Lim µ(x k ) = +∞ k→∞
3
Si |Ve (x0 )| = −∞, entonces µ(x) = −∞, para todo x ∈ Π(x0 )
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad I
Proposici´ on 1 (del PS al PF) ´ tesis 1, 2 y 3, Ve resuelve el PF. Bajo las hipo
Demostraci´ on (proposici´ on 1): La estrategia de demostraci´ on tiene dos pasos: el primero es encontrar la relaci´ on entre la funci´ on supremo Ve y la ecuaci´ on funcional para dos valores iniciales distintos x1 y x0 . El segundo consiste en unir el resultado del paso 1 para x1 y x0 . 1
Evaluando en x1 : Sea > 0, u0 ∈ Γ(x0 ) y x1 = g (x0 , u0 ) Como Ve (x1 ) es el valor supremo del PS con valor inicial x1 (t = 1), entonces ∃ una din´ amica factible desde x1 , {(x1 , u1 ), (x2 , u2 ), ...} tal que (por la propiedad del supremo): ∞ X t=1
β t−1 r (xt , ut ) ≥ Ve (x1 ) −
(7)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad II
Se sabe que {(x0 , u0 ), (x1 , u1 ), ...} ∈ Π(x0 ) y que por la propiedad del supremo: Ve (x0 )
≥
∞ X
β t r (xt , ut )
t=0 ∞ X
β t−1 r (xt , ut )
≥
r (x0 , u0 ) + β
≥
r (x0 , u0 ) + β Ve (x1 ) − β r (x0 , u0 ) + β Ve (g (x0 , u0 )) − β
t=1
Ve (x0 )
≥
Para pasar de la segunda a la tercera l´ınea se utiliza la ecuaci´ on [7]. Como la u ´ltima ecuaci´ on es verdad para todo > 0 y u0 es cualquier elemento de Γ(x0 ), entonces tenemos que: Ve (x0 ) ≥ r (x0 , u0 ) + β Ve (g (x0 , u0 )),
∀u0 ∈ Γ(x0 )
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad III Como la ecuaci´ on anterior se cumple para todo u0 , entonces: Ve (x0 ) ≥ sup r (x0 , u0 ) + β Ve (g (x0 , u0 )) u0 ∈Γ(x0 )
Generalizando para todo “t”: Ve (x) ≥ sup r (x, u) + β Ve (g (x, u))
(8)
u∈Γ(x) 2
Evaluando en x0 : Sea > 0, entonces por definici´on del supremo, ∃ una din´amica factible desde x0 {(x0 , u0 ), (x1 , u1 ), ...} tal que: Ve (x0 ) ≤
∞ X
β t r (xt , ut ) +
t=0
Ve (x0 ) ≤ r (x0 , u0 ) + β Ve (x1 ) +
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad IV
Como es arbitrario, entonces: Ve (x0 )
≤
Ve (x0 )
≤
r (x0 , u0 ) + β Ve (g (x0 , u0 )) sup r (x0 , u0 ) + β Ve (g (x0 , u0 )) u0 ∈Γ(x0 )
Generalizando para todo “t”: Ve (x) ≤ sup r (x, u) + β Ve (g (x, u))
(9)
u∈Γ(x) 3
Uniendo resultados: uniendo las dos ecuaciones [8] y [9] se tiene: sup u∈Γ(x)
r (x, u)+β Ve (g (x, u))
≤ Ve (x) ≤ sup u∈Γ(x)
r (x, u)+β Ve (g (x, u))
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad V
4
Por tanto: Ve (x) = sup
r (x, u) + β Ve (g (x, u))
(10)
u∈Γ(x)
5
Lo cual indica que la funci´ on supremo (o funci´ on valor) es una soluci´on de la ecuaci´ on funcional (PF). La proposici´ on 1 indica que Ve es una soluci´ on del PF, pero no indica que sea la u ´nica. Con el fin de asegurar que esta sea la u ´nica soluci´ on del PF se impone una restricci´ on adicional: “condici´on de transversalidad fuerte”. La proposici´ on 2 asegura lo anterior.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad I
Proposici´ on 2 (del PF al PS) ´ n las hipo ´ tesis 1, 2 y 3, V resuelve el PF, y si adema ´ s se Segu ´ n de transversalidad fuerte: cumple la condicio Lim β t V (xt ) = 0
t→∞
´ mica factible {(xt , ut )} desde x0 , entonces para todo x0 ∈ X y dina Ve = V (es decir, V resuelve el PS).
Demostraci´ on (proposici´ on 2): En este caso hay que demostrar que V es la funci´ on supremo Ve . La estrategia de demostraci´ on tiene dos pasos: el primero es demostrar que para toda din´ amica P t factible desde x0 se cumple que V (x0 ) ≥ ∞ t=0 β r (xt , ut ). El segundo es demostrar que para todo > 0, ∃ una din´ amica factible {(xt , ut )} desde x0 de modo que: P t V (x0 ) ≤ ∞ on supremo t=0 β r (xt , ut ) + . Ambos pasos aseguran que V es la funci´ (o funci´ on valor).
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad II
1
Paso 1a: Como V es soluci´ on del PF, entonces ∀ din´amica factible {(xt , ut )} ∈ Π(x0 ) tenemos: V (x0 ) ≥ r (x0 , u0 ) + βV (x1 )
(por propiedad del supremo)
V (x1 ) ≥ r (x1 , u1 ) + βV (x2 ) (para x1 ) r (x0 , u0 ) + βV (x1 ) ≥ r (x0 , u0 ) + βr (x1 , u1 ) + β βV (x2 ) por transitividad en la 1era inecuaci´ on:
V (x0 ) ≥ r (x0 , u0 ) + βr (x1 , u1 ) + β 2 V (x2 ) V (x0 ) ≥
1 X
β t r (xt , ut ) + β 2 V (x2 )
(en forma compacta)
t=0 Por inducci´ on (k pasos):
V (x0 ) ≥
k X t=0
β t r (xt , ut ) + β k+1 V (xk+1 )
(11)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad III
2
Paso 1b: Haciendo k → ∞ y usando la condici´ on de transversalidad fuerte: V (x0 ) ≥ V (x0 ) ≥
Lim
k→∞
Lim
k→∞
X k
t
β r (xt , ut ) + β
k+1
V (xk+1 )
t=0
X k
t
β r (xt , ut ) + Lim β
t=0
k→∞
k+1
V (xk+1 )
por condici´ on de transversalidad fuerte:
V (x0 ) ≥
∞ X
β t r (xt , ut ) + 0
t=0
V (x0 ) ≥
∞ X t=0
β t r (xt , ut )
(12)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad IV 3
Paso 2a: Sea > 0 y {δt }t=0,1,2... una sucesi´ on de n´ umeros reales positivos, tal que: ∞ X δt β t ≤ (13) t=0
4
Paso 2b: Como V resuelve el PF, entonces ∃u0 ∈ Γ(x0 ) de modo que: (por propiedad del supremo)
V (x0 )
≤
r (x0 , u0 ) + βV (x1 ) + δ0
V (x1 )
≤
r (x1 , u1 ) + βV (x2 ) + δ1
r (x0 , u0 ) + βV (x1 )
≤
r (x0 , u0 ) + βr (x1 , u1 ) + β βV (x2 ) + βδ1
V (x0 )
≤
r (x0 , u0 ) + βr (x1 , u1 ) + β 2 V (x2 ) + βδ1
tambi´ en existe u1 ∈ Γ(x1 ) tal que:
por transitividad en la 1era inecuaci´ on:
(en forma compacta)
V (x0 )
≤
1 X t=0
β t r (xt , ut ) + β 2 V (x2 ) +
1 X t=1
β t δt
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad V 5
Paso 2c: Por inducci´ on (k pasos): V (x0 ) ≤
k X
β t r (xt , ut ) + β k+1 V (xk+1 ) +
t=0 6
k X
β t δt
t=1
Paso 2d: Haciendo k → ∞ y usando la expresi´ on [13]: V (x0 )
V (x0 )
≤
≤
Lim
X k
k→∞
Lim
t=0
X k
k→∞
β t r (xt , ut ) + β k+1 V (xk+1 ) +
k X
β t δt
t=1
β t r (xt , ut )
t=0
X k + Lim β k+1 V (xk+1 ) + Lim β t δt k→∞
k→∞
t=1
por condici´ on de transversalidad fuerte y [13]:
V (x0 )
≤
∞ X
β t r (xt , ut ) + 0 +
t=0
V (x0 )
≤
∞ X t=0
β t r (xt , ut ) +
(14)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad VI
7
De las inecuaciones [12] y [14] se concluye que V es la funci´on supremo (funci´ on valor).
8
El PF puede tener muchas soluciones, pero la proposici´on 2 muestra que dichas soluciones (excepto Ve ) violan la condici´on de transversalidad fuerte y la u ´nica que satisface dicha condici´ on es Ve . Por tanto V = Ve
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad I
Proposici´ on 3 (dina´mica factible del PS al PF) ´ tesis 1,2 y 3: sea {(xt∗ , ut∗ )} una dina ´ mica factible Bajo las hipo ∗ desde x0 que permite alcanzar el supremo del PS, entonces dicha ´ mica factible cumple con [5]: dina ∗ Ve (xt∗ ) = r (xt∗ , ut∗ ) + β Ve (xt+1 )
(15)
Es decir, permite alcanzar el supremo en el PF.
Demostraci´ on (proposici´ on 3): La estrategia de demostraci´on tiene dos pasos: primero demostramos que la ecuaci´ on [15] se cumple para t = 0. El segundo es extender este resultado para todo t = 1, 2, 3 (por inducci´ on).
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad II 1
Paso 1a: debido a que {(xt∗ , ut∗ )} es una din´amica factible desde x0∗ que permite alcanzar el supremo del PS, entonces se cumple: Ve (x0∗ )
=
∞ X
β t r (xt∗ , ut∗ )
t=0 ∞ X
β
t
r (xt∗ , ut∗ )
=
r (x0∗ , u0∗ )
+β
t=0 2
∞ X
∗ ∗ β t r (xt+1 , ut+1 )
(16)
t=0
Paso 1b: para toda din´amica factible {(x1∗ , u1 ), (x2 , u2 ), (x3 , u3 ), ...} ∈ Π(x1∗ ), por la definici´ on del supremo se cumple: ∞ X
β t r (xt∗ , ut∗ ) ≥ r (x0∗ , u0∗ ) + β
t=0
∞ X
β t r (xt+1 , ut+1 )
(17)
t=0
Por tanto, de la expresi´ on [16] y [17] se tiene que: ∞ X t=0
∗ ∗ β t r (xt+1 , ut+1 )≥
∞ X t=0
β t r (xt+1 , ut+1 )
(18)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad III 3
Paso 1c: adem´as, como la din´amica factible {(x1∗ , u1∗ ), (x2∗ , u2∗ ), (x3∗ , u3∗ ), ...} ∈ P∞ ∗ ∗ ∗ ) tiene que ser el , ut+1 Π(x1 ), entonces se cumple que t=0 β t r (xt+1 ∗ valor supremo con valor inicial en x1 : Ve (x1∗ ) =
∞ X
∗ ∗ β t r (xt+1 , ut+1 )
(19)
t=0 4
Paso 1d: reemplazando la expresi´ on [19] en [16] se tiene: Ve (x0∗ ) = r (x0∗ , u0∗ ) + β Ve (x1∗ )
5
Paso 2a: se prob´ o que: Ve (x0∗ )
= r (x0∗ , u0∗ ) + β Ve (x1∗ ) ∞ X ∗ ∗ Ve (x1∗ ) = β t r (xt+1 , ut+1 ) t=0
(20)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad IV
6
Paso 2b: se propone una hip´ otesis inductiva: ∗ Ve (xk∗ ) = r (xk∗ , uk∗ ) + β Ve (xk+1 )
(21)
Donde Ve (xk∗ )∀k ∈ N se define como: Ve (xk∗ ) =
∞ X
∗ ∗ β t r (xt+k , ut+k )
(22)
t=0
Si la hip´ otesis (ecuaci´ on [21]) se cumple para “k + 1”, entonces la hipotesis es verdadera.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad V
7
Paso 2c: verificando para “k + 1”: de [21] y de [22]
∗ r (xk∗ , uk∗ ) + β Ve (xk+1 )
=
Ve (xk∗ ) =
∞ X
∗ ∗ β t r (xt+k , ut+k )
t=0 ∗ r (xk∗ , uk∗ ) + β Ve (xk+1 )
=
r (xk∗ , uk∗ ) + β
∞ X
∗ ∗ β t r (xt+(k+1) , ut+(k+1) )
t=0 ∗ Ve (xk+1 )
=
∞ X
∗ ∗ β t r (xt+(k+1) , ut+(k+1) )
t=0 ∗ ) Ve (xk+1
=
∗ ∗ r (xk+1 , uk+1 )+β
∞ X
∗ ∗ β t r (xt+(k+2) , ut+(k+2) )
t=0 ∗ Ve (xk+1 )
=
∗ ∗ ∗ r (xk+1 , uk+1 ) + β Ve (xk+2 )
(23)
Por tanto la hip´ otesis inductiva es verdadera y generalizable para todo “t=0, 1, 2, ...”
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad I
Proposici´ on 4 (dina´mica factible del PF al PS) ´ tesis 1,2 y 3: si {(xt∗ , ut∗ )} una dina ´ mica factible desde Bajo las hipo ∗ ´ n de transversalidad x0 que satisface [15] y se cumple la condicio ´bil: de Lim β t V (xt ) ≤ 0, t→∞
entonces {(xt∗ , ut∗ )} resuelve el PS.
Demostraci´ on (proposici´ on 4): La estrategia es la siguiente: que {(xt∗ , ut∗ )} resuelve el PS significa que permite al P∞ t P canzar el supremo: Ve (x0 ) = sup β r (xt , ut ) . Es decir, Ve (x ∗ ) = ∞ β t r (x ∗ , u ∗ ). {ut }
t=0
0
t=0
t
Esto u ´ltimo es lo que tenemos que demostrar. 1
Paso 1: Como {(xt∗ , ut∗ )} es una din´amica factible desde x0 , entonces: Ve (x0∗ ) ≥
∞ X t=0
β t r (xt∗ , ut∗ )
(24)
t
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad II
2
Paso 2: Adem´as, {(xt∗ , ut∗ )} satisface [15]; es decir, permite alcanzar el supremo en el PF: Ve (xt∗ )
=
∗ r (xt∗ , ut∗ ) + β Ve (xt+1 ) ∀t = 0, 1, 2, ... :
Ve (x0∗ ) = Ve (x1∗ ) = Ve (x ∗ ) = 2
r (x0∗ , u0∗ ) + β Ve (x1∗ ) r (x ∗ , u ∗ ) + β Ve (x ∗ ) 1
1
2
r (x2∗ , u2∗ ) + β Ve (x3∗ ) ...
Ve (xk∗ )
=
∗ r (xk∗ , uk∗ ) + β Ve (xk+1 )
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad III
3
Paso 3: reemplazando Ve (x2∗ ) en Ve (x1∗ ): Ve (x2∗ ) Ve (x1∗ )
= r (x2∗ , u2∗ ) + β Ve (x3∗ ) = r (x1∗ , u1∗ ) + β r (x2∗ , u2∗ ) + β Ve (x3∗ ) e (x ∗ ) en V e (x ∗ ): reemplazando V 1 0
Ve (x0∗ )
=
r (x0∗ , u0∗ )
∗ ∗ ∗ ∗ 2e ∗ + β r (x1 , u1 ) + βr (x2 , u2 ) + β V (x3 )
de forma compacta:
Ve (x0∗ )
=
2 X
β t r (xt∗ , ut∗ ) + β 3 Ve (x3∗ )
t=0 por inducci´ on (k pasos):
Ve (x0∗ )
=
k X t=0
∗ β t r (xt∗ , ut∗ ) + β k+1 Ve (xk+1 )
(25)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad IV
4
Paso 4: tomando k → ∞ en la ecuci´ on [25]: Ve (x0∗ ) Ve (x0∗ )
= =
Lim
X k
k→∞ ∞ X
β
∗ β t r (xt∗ , ut∗ ) + β k+1 Ve (xk+1 )
t=0 t
r (xt∗ , ut∗ )
t=0
k+1 e ∗ + Lim β V (xk+1 ) k→∞
por condici´ on de transversalidad d´ ebil:
Ve (x0∗ ) ≤
∞ X t=0
β t r (xt∗ , ut∗ )
t Lim β V (xt ) ≤ 0 t→∞
(26)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad V 5
Paso 5: de la inecuaci´ on [24] y [26] se tiene: ∞ X
β t r (xt∗ , ut∗ ) ≤ Ve (x0∗ ) ≤
t=0
∞ X
β t r (xt∗ , ut∗ )
(27)
t=0
Por tanto: Ve (x0∗ ) =
∞ X
β t r (xt∗ , ut∗ )
(28)
t=0
Lo cual indica que la din´amica factible {(xt∗ , ut∗ )} resuelve el PS. Conclusi´ on Las proposiciones 1 al 4 implican que (bajo las hip´ otesis 1, 2 y 3) la soluci´on a la ecuaci´ on [5]: V (xt ) = r (xt , ut )+βV (xt+1 ) (PF) coincide exactamente (en t´erminos de valores y planes ´ optimos) con la soluci´ on del PS. Es decir, el principio de optimalidad se mantiene.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
1
Problema de optimizaci´ on din´ amica
2
Programaci´ on din´ amica: panorama Funci´ on valor Ecuaci´ on de Bellman Problema funcional Del PS al PF
3
Programaci´ on din´ amica: detalles Principio de optimalidad M´etodo para solucionar el PF M´etodo de c´alculo diferencial para solucionar el PF
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
M´ etodo para solucionar el PF I
1
Hasta aqu´ı se ha estudiado la relaci´ on entre el PS y el PF, pero no se ha dado ning´ un m´etodo para solucionar el PF.
2
Lo interesante de la programaci´ on din´amica es que ofrece varios m´etodos de soluci´ on del PF: m´etodos te´ oricos y num´ericos.
3
El principal m´etodo es considerar al PF como un problema de punto fijo (PptoFijo). Para ello necesitamos dos hip´ otesis adicionales: sobre la correspondencia Γ(x) y la funci´ on de retorno r (x, u).
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Hip´ otesis que permiten considerar el PF como un PptoFijo I
Hip´ otesis 4: Γ(x) Γ : X ⇒ X es una correspondencia de valores compactos (i.e. Γ(x) es compacto para todo x), continua y Γ(x) 6= φ para todo x. Hip´ otesis 5: β y r (x, u) β ∈ (0, 1) y r (xt , ut ) es acotada y continua sobre el grafo de Γ. Donde: Grafo de Γ : (x, u) ∈ XxR m tal que u ∈ Γ(x) Las hip´ otesis 4 y 5 implican las hip´ otesis 1, 2 y 3. Por tanto, las proposiciones 1 al 4 se mantienen, y por ende el principio de optimalidad. Por la hip´ otesis 5, Ve (y por lo tanto “V” por el principio de optimalidad) que es una funci´ on real, tambi´en es a acotada y continua.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Hip´ otesis que permiten considerar el PF como un PptoFijo II Definamos Ca (X ) : Espacio de las funciones reales, continuas y acotadas. Entonces: Ve = V ∈ Ca (X ). Definimos un operador T: Ca (X ) → Ca (X ) del PF: T [V ](x) = sup r (x, u) + βV (g (x, u))
(29)
{u}∈Γ(x)
Del PF sabemos: V (x) =
sup
r (x, u) + βV (g (x, u))
(30)
{u}∈Γ(x)
De [29] y [30], el PF se convierte en un “Problema de punto fijo (PptoFijo)”: T [V ](x) = V (x) (31) Donde la funci´ on V es el punto fijo. Si encontramos la funci´on V que resuelve [31] (PptoFijo), entonces tendremos la soluci´on del PF y por el principio de optimalidad tendremos la soluci´ on del PS.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Hip´ otesis que permiten considerar el PF como un PptoFijo III
Debido a que se tiene la funci´ on valor, se puede encontrar el plan optimo: ´ Forma 1: resolviendo paso a paso el problema del m´ aximo que aparece en el PF (i.e. encontrar la funci´ on de pol´ıtica). Forma 2: resolviendo el sistema de ecuaciones: ∗ V (xt∗ ) = r (xt∗ , ut∗ ) + βV (xt+1 ),
t = 0, 1, 2, 3...
Necesitamos un teorema que asegure que el operador “T : Ca (X ) → Ca (X )” tiene un u ´nico punto fijo y por tanto una soluci´on al PptoFijo. El teorema del punto fijo para contracciones asegura lo anterior.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Teorema del punto fijo Teorema 2 (Punto fijo para contracciones) ´ tesis 4 y 5: sea Ca (X ) (espacio de las funciones reales, Bajo las hipo continuas y acotadas sobre X) con la norma del supremo k · k, ´ n de entonces el operador “T” definido en Ca (X ) es una aplicacio este espacio en s´ı mismo, T: Ca (X ) → Ca (X ) , definido como: T [V ](x) = sup r (xt , ut ) + βV (g (xt , ut )) (32) sujeto a: ut ∈ Γ(xt ), Satisface: 1
T [V ] ∈ Ca (X )
2
´ nico punto fijo “V”: T [V ] = V “T” tiene un u
3
Para cualquier V0 ∈ Ca (X ) se tiene: kT n (V0 ) − V k ≤ β n kV0 − V k En particular:
Lim T n (V0 ) = V
n→∞
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Teorema del punto fijo
Nota: la norma del supremo k · k est´a definido como: kf k = sup{|f (x)|}
(33)
El teorema del punto fijo ofrece un m´etodo de soluci´on del PF: “la convergencia de iteraciones sucesivas de una funci´on contractiva al punto fijo”, la cual consiste en: la sucesi´ on de funciones {Vn }∞ n=0 definida como: Vn = T [Vn−1 ], n ≥ 1 (34) converge al punto fijo (V) de la contracci´ on T; es decir: Lim Vn = V
n→∞
(35)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Teorema del punto fijo: demostraci´ on I Demostraci´ on (teorema 2): 1
Paso 1: bajo las hip´ otesis 4, 5 y 8 se tiene que para cada f ∈ Ca (X ) ∧ x ∈ X el problema del punto de fijo: (36) T [f ](x) = max r (xt , ut ) + βf (ut ) ut ∈Γ(X )
se reduce a maximizar la funci´ on continua: r (xt , ·) + βf (·)
(37)
sobre el conjunto compacto Γ(X ). Esto permite alcanzar el m´aximo. Una pregunta que tenemos que responder es: ¿T [f ] es acotada y continua? se sabe que su dominio lo es. 2
Paso 2a: debido a que r (xt , ut ) y f (ut ) son acotadas, entonces: T [f ], tambi´en es acotada.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Teorema del punto fijo: demostraci´ on II 3
Paso 2b: debido a que r (xt , ut ) y f (ut ) son continuas, y Γ(X ) es compacto, entonces: por el teorema del m´aximo se tiene que T [f ] es continua.
Por tanto, del paso 2a y 2b se tiene que: T [f ] es continua y acotada, y dado que T fue definido (dominio) en Ca (X ), entonces se obtiene que el operador T [f ] es: T [f ] : Ca (X ) → Ca (X ) 4
Paso 4: ¿T es una contracci´ on? S´ı. Esto se debe a que el operador T cumple con las condiciones de Blackwell.
5
Paso 5: ¿T tiene un u ´nico punto fijo? S´ı. Debido a que Ca (X ) es un espacio de Banach, entonces por el teorema de la “aplicaci´ on contractiva”, T tiene un u ´nico punto fijo V ∈ Ca (X ) y se cumple que: kT n (V0 ) − V k ≤ β n kV0 − V k
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) I
El modelo b´asico de crecimiento est´a descrito por el siguiente problema (en t´erminos generales): Max ∞
{ct ,kt+1 }t=0
∞ X
β t lnct
t=0
s.a: kt+1 = (1 − δ)kt + it ct + it = f (kt ) ct , kt ≥ 0∀t A este problema lo llamamos problema secuencial (PS). Considerando las α siguientes forma funcionales u(c )lnc , f (k ) = k , y supuestos α ∈ t t t t (0, 1), δ = 1 y k0 dado se tiene:
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) II
Problema secuencial: Brock y Mirman (1972) Max ∞
{ct ,kt+1 }t=0
∞ X
β t lnct
t=0
s.a: kt+1 = ktα − ct c t , kt ≥ 0 La ecuaci´ on funcional (o de Bellman) es: V (kt ) = Max ∞ lnct + βV (kt+1 ) {ct ,kt+1 }t=0
Al reemplazar la restricci´ on en la ecuaci´ on de Bellman kt+1 = ktα − ct , el problema funcional asociado queda descrito de la siguiente manera:
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) III
Problema funcional: Brock y Mirman (1972) V (kt ) = Max lnct + βV (ktα − ct ) ∞ {ct }t=0
0 ≤ ct ≤ ktα Encontrando la funci´ on valor 1
Para resolver el PF utilizaremos el m´etodo de iteraci´on de la funci´on valor (propuesto por el teorema del punto fijo para contracciones), la expresi´ on [34]: Vn = T [Vn−1 ], n ≥ 1 (38) Se inicia con la funci´ on m´as sencilla: V0 = 0
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) IV
2
Encontrando V1 V1
= = =
T [V0 ] ↓ Max lnct + β V0 (ktα − ct ) ∞ | {z } {ct }t=0 =0 Max lnct ∞ {ct }t=0
(39)
(a) En esta etapa se aplica la condici´ on de primer orden: ∂ funci´ on objetivo =0 ∂ct No obstante, en este caso, por ser “ln” mon´ otona entonces el valor m´ aximo se alcanza cuando ct = ktα (ver la restricci´ on del PF).
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) V
(b) Reemplazando ct que maximiza la funci´ on objetivo en [39] se obtiene T [V0 ] y por ende V1 : V1 = T [V0 ] = ln ktα V1 3
=
αlnkt
(40)
Encontrando V2 V2
=
T [V1 ]
=
↓ lnct + β V1 (ktα − ct ) Max ∞ | {z } {ct }t=0
=
Max lnct + βαln(ktα − ct ) ∞
=αln(ktα −ct )
{ct }t=0
(41)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) VI
(a) En esta etapa se aplica la condici´ on de primer orden: ∂ funci´ on objetivo =0 ∂ct ct =
ktα 1 + βα
(42)
(b) Reemplazando ct que maximiza la funci´ on objetivo en [41] se obtiene T [V1 ] y por ende V2 : βα − ln(1 + βα) V2 = T [V1 ] = α(1 + βα)lnkt + βαln 1 + βα βα V2 = α(1 + βα)lnkt + βαln − ln(1 + βα) (43) 1 + βα
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) VII 4
De igual forma podemos hacer para V3 y luego en forma general vemos que: X n−1 Vn (kt ) = An + α (βα)i lnkt (44) i=0
Donde hacemos que n → ∞ por la propiedad [35]: Lim Vn = V
n→∞
Lim Vn (kt )
n→∞
V
=
X n−1 Lim An + Lim α (βα)i lnkt
n→∞
n→∞
i=0
=
X ∞ i A+ α (βα) lnkt
=
α A+ lnkt 1 − βα
i=0
V
(45)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) VIII La constante “A” la podemos encontrar reemplazando “V” y la din´amica ´optima en la ecuaci´ on de Bellman. Encontrando la funci´ on de pol´ıtica Dado que ya conocemos la funci´ on valor (V ), la cual reemplazamos en la ecuaci´ on de Bellman del PF. 1
Reemplezando la funci´ on valor en el PF: V (kt ) = Max lnct + β ln(ktα − ct ) ∞ {ct }t=0
0 ≤ ct ≤ ktα El problema funcional se convierte en un problema de optimizaci´on est´andar (en “t”), a la cual se puede aplicar las condiciones de primer orden. Aplicando CPO: ∂ funci´ on objetivo =0 ∂ct
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) IX Encontramos la funci´ on de pol´ıtica: ct = h(kt ) ct = (1 − αβ)ktα 2
(46)
Encontrando la constante “A”: reemplazando la funci´on valor y la funci´ on de pol´ıtica en la ecuaci´ on de Bellman (el max desaparece porque la funci´ on de pol´ıtica permite alcanzar dicho m´aximo): A+
α lnkt = ln(h(kt )) + β ln(ktα − h(kt )) 1 − βα
Resolviendo e igualando los coeficientes de los t´erminos similares: 1 αβ A= (ln(1 − αβ) + lnαβ) 1−β 1 − αβ Encontrando la din´ amica ´ optima
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) X
1
La din´amica ´ optima: es la sucesi´ on {ct , kt }∞ t=0 descrita por este sistema de ecuaciones (con k0 dado):
´ n de la variable de estado Ec. de evolucio
kt+1
=
ktα − (1 − αβ)ktα = αβktα
(47)
´ n de pol´ıtica Funcio
ct
=
(1 − αβ)ktα
(48)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo para solucionar el PF
Ejemplo 2: modelo con h´ abitos de consumo
Max ∞
∞ X
{ct ,kt+1 }t=0
β t (lnct + γlnct−1 )
t=0
sujeto a: ct + kt+1 ≤ Aktα Donde: β ∈ (0, 1), γ < 0, A > 0 y α ∈ (0, 1). k0 y c−1 dado. 1 2
Escribir la ecuaci´ on de Bellman. Demuestre que la soluci´ on de dicha ecuaci´ on tiene la forma: v (kt , ct−1 ) = E + Flnkt + Glnct−1
3
Demostrar que la din´amica ´ optima del capital tiene la forma: lnkt+1 = I + Hlnkt Donde E,F,G,H,I son constantes. D´e f´ ormulas expl´ıcitas para estas constantes en t´erminos de los par´ametros del problema.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
1
Problema de optimizaci´ on din´ amica
2
Programaci´ on din´ amica: panorama Funci´ on valor Ecuaci´ on de Bellman Problema funcional Del PS al PF
3
Programaci´ on din´ amica: detalles Principio de optimalidad M´etodo para solucionar el PF M´etodo de c´alculo diferencial para solucionar el PF
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
M´ etodo de c´ alculo diferencial para solucionar el PF
Para aplicar los m´etodos de c´alculo diferencial en la soluci´on de problemas de optimizaci´ on din´amica se requiere que la funci´ on valor tenga tres propiedades importante: 1
Monotonicidad:
2
Concavidad:
3
Diferenciabilidad:
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Monotonicidad de V (xt )
Hip´ otesis 6: r (x, u) y g (x, u) Para cada u ∈ Rm , las funciones: r (xt , u)
: X → R es estrictamente creciente
g (xt , u)
: X → X es creciente
Hip´ otesis 7: Γ(x) Γ es mon´ otona (i.e. si x 0 > x → Γ(x 0 ) ⊇ Γ(x) )
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Monotonicidad de V (xt ) I Proposici´ on 5 (monotonicidad de V (x)) ´ tesis 4 al 7, entonces la funcio ´ n valor es Bajo las hipo estrictamente creciente.
Demostraci´ on (proposici´ on 5): La estrategia tiene dos pasos: el primero es demostrar que “T[f]” es una funci´ on estrictamente creciente; el segundo paso es considerar el “PptoFijo” y de all´ı derivar que “V” es tambi´ en estrictamente creciente. 1
Sabemos: Ca (X ) es el espacio de las funciones reales, continuas y acotadas con la norma del supremo. Cc (X ) ⊂ Ca (X ) es el espacio de las funciones reales, continuas, acotadas y crecientes. Se observa que Cc (X ) es un subespacio cerrado en Ca (X ), y por tanto es un espacio completo en la norma del supremo.
2
Paso 1: vamos a probar que “si f ∈ Ca (X ) es creciente, entonces T [f ] es una funci´ on estrictamente creciente”
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Monotonicidad de V (xt ) II 3
Paso 1a: por la hip´ otesis 6: si x 0 ≥ x entonces g (x 0 , u) ≥ g (x, u) ∀u. dado que f es creciente:
0
f (g (x , u)) ≥ f (g (x, u)) 0
r (x , u) + βf (g (x 0 , u)) ≥ r (x 0 , u) + βf (g (x, u)) por la hip´ otesis 6 r (x, u) es creciente: 0 r (x , u) ≥ r (x, u), entonces:
r (x 0 , u) + βf (g (x 0 , u)) > r (x, u) + βf (g (x, u)) 4
(49)
Paso 1b: Aplicando “max” en la relaci´ on [49]: max r (x 0 , u) + βf (g (x 0 , u)) > max r (x, u) + βf (g (x, u)) u∈Γ(x)
u∈Γ(x)
(50) 5
0
0
Paso 1c: por la hip´ otesis 7 se tiene que: “si x ≥ x ⇒ Γ(x ) ⊇ Γ(x)”
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Monotonicidad de V (xt ) III
Γ(X’)
Γ(X) u
Donde u ∈ Γ(x), entonces u ∈ Γ(x 0 ). Reemplazando este resultado en [50] se tiene: max0 r (x 0 , u) + βf (g (x 0 , u)) > max r (x, u) + βf (g (x, u)) u∈Γ(x )
u∈Γ(x)
(51)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Monotonicidad de V (xt ) IV 6
Paso 1d: por la definici´ on del operador “T” para una funci´on “f” cualquiera: T [f ](x) = sup r (x, u) + βf (g (x, u)) {u}∈Γ(x)
La expresi´ on [51] se convierte en: T [f ](x 0 ) > T [f ](x)
(52)
Es decir T [f ] es estrictamente creciente. Conclusi´ on 1 Por tanto se cumple lo que queriamos probar en el paso 1: “si f ∈ Ca (X ) es creciente, entonces T [f ] es una funci´on estrictamente creciente” 7
Paso 2: como Cc (X ) es un subespacio cerrado de Ca (X ), entonces la funci´ on valor “V” est´a en Cc (X ):
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Monotonicidad de V (xt ) V
Ca(X)
Cc(X) V
Adem´as, como T [V ] = V , y T es estrictamente creciente entonces “V” tambi´en es estrictamente creciente. Conclusi´ on 2 Por tanto la funci´ on valor (V) es estrictamente creciente.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Concavidad de V (xt ) I
Hip´ otesis 8: X X es un subconjunto convexo de R n . Definici´ on conjunto convexo: el conjunto “X ” es convexo si para dos elementos de dicho conjunto x e y , la combinaci´on lineal (con t ∈ [0, 1]) tambi´en se encuentra dentro de dicho conjunto. Es decir: ∀x ∧ y ∈ X y ∀t ∈ [0, 1] se cumple que [(1 − t)x + ty ] ∈ X
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Concavidad de V (xt ) II Hip´ otesis 9: r (x, u) y g (x, u) r (xt , ut ) es estrictamente c´ oncava y g (xt , ut ) es c´ oncava. Definici´ on funci´ on c´ oncava: una funci´ on real definida en un conjunto convexo (dominio) es c´ oncava, si para dos puntos x e y cualesquiera definidas en su dominio, y para cualquier t ∈ [0, 1] se cumple: f (tx + (1 − t)y ) ≥ tf (x) + (1 − t)f (y )
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Concavidad de V (xt ) III
Hip´ otesis 10: Γ(x) Γ(xt ) es convexa; es decir: 1 2
Γ(x) es un conjunto convexo para todo x ∈ X . Dado λ ∈ [0, 1], x, x 0 ∈ X y x 6= x 0 , entonces si u ∈ Γ(x) y u 0 ∈ Γ(x 0 ) implica que: λu + (1 − λ)u 0 ∈ Γ(λx + (1 − λ)x 0 )
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Concavidad de V (xt ) I
Proposici´ on 6 (concavidad de V (x)) ´ n las hipo ´ tesis 4,5,8,9 y 10, la funcio ´ n valor es estrictamente Segu ´ ncava y la correspondencia de pol´ıtica es una funcio ´n co continua.
Demostraci´ on (proposici´ on 6): La estrategia tiene dos pasos: el primero es demostrar que “T[f]” es una funci´ on creciente y estrictamente c´ oncava; el segundo paso es considerar el “PptoFijo” y de all´ı derivar que “V” tambi´ en es creciente y estrictamente c´ oncava. 1
2
Paso 1: vamos a probar que “si f ∈ Ca (X ) es creciente y c´oncava, entonces T [f ] es una funci´ on creciente y estrictamente c´oncava”. (que sea creciente lo sabemos de la proposici´ on 5). Paso 1a: dado λ ∈ [0, 1], x, x 0 ∈ X y x 6= x 0 , y sea u, u 0 tales que resuelven el problema del m´aximo definido por: T [f ](x) y T [f ](x 0 ) respectivamente.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Concavidad de V (xt ) II 3
Paso 1b: adem´as, por la hip´ otesis 10 se tiene que: λu + (1 − λ)u 0 ∈ Γ(λx + (1 − λ)x 0 ) entonces, tenemos que (por la definici´ on del supremo): T [f ](e x ) ≥ r (e x , ue) + βf (g (e x , ue))
(53)
Donde: xe = λx + (1 − λ)x 0 ue = u + (1 − λ)u 0 4
Paso 1c: pero r (·, ·) es estrictamente c´ oncava (hip´otesis 9), entonces para r (e x , ue) que es igual a r (λx + (1 − λ)x 0 , u + (1 − λ)u 0 ) se tiene que: r (λx + (1 − λ)x 0 , u + (1 − λ)u 0 ) > λr (x, u) + (1 − λ)r (x 0 , u 0 ) (54)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Concavidad de V (xt ) III
5
Paso 1d: adem´as, dado que g (·, ·) es c´ oncava (hip´otesis 9), entonces se tiene que: g (e x , ue) ≥ λg (x, u) + (1 − λ)g (x 0 , u 0 )
(55)
y dado que f es creciente, entonces aplicando “f” a la ecuaci´on anterior (ecu.55): f (g (e x , ue)) ≥ f (λg (x, u) + (1 − λ)g (x 0 , u 0 ))
(56)
y como f es c´ oncava: f (λg (x, u) + (1 − λ)g (x 0 , u 0 )) ≥ λf (g (x, u)) + (1 − λ)f (g (x 0 , u 0 )) (57)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Concavidad de V (xt ) IV 6
Paso 1e: introduciendo la expresi´ on [54] y [57] (multiplicada por β) en la expresi´ on inicial [53] se tiene: T [f ](e x)
≥ > > >
r (e x , ue) + βf (g (e x , ue))
λr (x, u) + (1 − λ)r (x 0 , u 0 ) + β[λf (g (x, u)) + (1 − λ)f (g (x 0 , u 0 ))] λr (x, u) + λβf (g (x, u)) + (1 − λ)r (x 0 , u 0 ) + (1 − λ)βf (g (x 0 , u 0 ) λ r (x, u) + βf (g (x, u)) + (1 − λ) r (x 0 , u 0 ) + βf (g (x 0 , u 0 )) | {z } | {z } T [f ](x)
T [f ](e x)
>
T [f ](x 0 )
λT [f ](x) + (1 − λ)T [f ](x 0 )
Conclusi´ on 1 Por tanto se cumple lo que queriamos probar en el paso 1: “si f ∈ Ca (X ) es creciente y c´ oncava, entonces T [f ] es una funci´on creciente y estrictamente c´ oncava”
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Concavidad de V (xt ) V 7
Paso 2: como Cc (X ) (acotado para las funciones estrictamente c´oncava) es un subespacio cerrado de Ca (X ), entonces la funci´on valor “V” est´a en Cc (X ) (acotado para las funciones estrictamente c´oncava): Ca(X) Cc(X) Estrictamente Cóncava V
Adem´as, como T [V ] = V , y T es estrictamente c´oncava entonces “V” tambi´en es estrictamente c´ oncava. Conclusi´ on 2 Por tanto la funci´ on valor (V) es estrictamente c´ oncava.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Diferenciabilidad de V (xt ) I
Hip´ otesis 11: r (x, u) y g (x, u) r (xt , ut ) y g (xt , ut ) son continuamente diferenciables en el interior del grafo de Γ(xt ). Hip´ otesis 12: diferenciabilidad Sea (x ∗ , u ∗ ) en el interior del grafo de Γ, tal que ∃ una funci´on diferenciable “τ ” definida en una vecindad abierta V de x ∗ tal que: τ :V →U y para todo x ∈ V : τ (x) ∈ Γ(x) y g (x, τ (x)) = g (x ∗ , u ∗ )
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Diferenciabilidad de V (xt ) II
´ n valor Teorema 3 (Diferenciabilidad de la funcio (Benveniste-Scheinkman 1)) ´ tesis 4, 5, 8, 9, 10, 11 y 12; si x0 ∈ Int(X ) y h(x0 ) ∈ Int(Γ(x0 )), enBajo las hipo ´ n valor es continuamente diferenciable en x0 y su derivada tonces la funcio ´ dada por: esta ∂V (x0 ) ∂r (x0 , h(x0 )) ∂V (g (x0 , h(x0 ))) = +β ∂x0 ∂x0 ∂x0 Esto es generalizado para todo t.
(58)
1
Este teorema es un paso previo para demostrar el teorema del envolvente.
2
Requiere que en la ecuaci´ on de Bellman se introduzca la funci´on de pol´ıtica h(x) (adem´as de la ecuaci´ on de movimiento de la variable de estado g (x, h(x))).
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Diferenciabilidad de V (xt ) III
3
Las hip´ otesis descritas aseguran que la funci´ on valor sea dos veces diferenciable (Stokey y Lucas, 1989. pag 84), la cual asegura que la funci´ on de pol´ıtica h(x) sea diferenciable. Esta propiedad es recogida en el teorema de BS (1 y 2).
Teorema 4 (Teorema de la envolvente (Benveniste-Scheinkman 2)) ´ tesis 4, 5, 8, 9, 10, 11 y 12; si x0 ∈ Int(X ) y h(x0 ) ∈ Int(Γ(x0 )), y Bajo las hipo cumpiendose el teorema BS 1, entonces para x, u se cumple: ∂V (x0 ) ∂r (x0 , u0 ) = ∂x0 ∂u0
(59)
Esto es generalizado para todo t. 1
Este teorema asegura una relaci´ on entre la funci´ on de valor y la funci´on de utilidad.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Pasos para utilizar el m´ etodo de BS
1
En la ecuaci´ on de Bellman aplicar las CPO. Es decir, derivar el lado derecho de dicha ecuaci´ on con respecto a la variable de control.
2
Aplicar el teorema del envolvente. Recordar que el teorema de la diferenciabilidad es solo para demostrar el teorema del envolvente.
Nota: Este m´etodo (teorema de BS) brinda explicitamente las CPO sin necesidad de conocer la funci´ on valor; no obstante, no brinda la soluci´on al problema; es decir, no especifica la funci´ on de pol´ıtica.
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Ejemplo: aplicaci´ on del teorema de la envolvente I Un ejemplo t´ıpico del consumidor: Problema de optimizaci´ on de un consumidor Max ∞
∞ X
{ct ,wt+1 }t=0
β t u(ct )
t=0
sujeto a: wt+1 = (1 + r )(wt + ct ) Donde: β ∈ (0, 1), wt es la riqueza del individuo y w0 dado. Soluci´ on: Ecuaci´ on de Bellman V (wt ) = Max ∞
{ct }t=0
u(ct ) + βV (wt+1 )
Introduciendo la ecuaci´ on de la variable de estado:
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Ejemplo: aplicaci´ on del teorema de la envolvente II
V (wt ) = Max ∞
{ct }t=0
u(ct ) + βV ((1 + r )(wt + ct ))
(60)
Condiciones de primer orden Derivamos el lado derecho de la ecuaci´ on de Bellman con respecto a la variable de control ct : ∂u(ct ) ∂V (wt+1 ) [(1 + r )(wt + ct )] +β = 0 ∂ct ∂wt+1 ∂ct ∂u(ct ) ∂V (wt+1 ) +β (−1)(1 + r ) = 0 ∂ct ∂wt+1 ∂u(ct ) ∂V (wt+1 ) = β(1 + r ) ∂ct ∂wt+1
(61)
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Ejemplo: aplicaci´ on del teorema de la envolvente III Teorema de la envolvente El teorema del envolvente indica: ∂V (wt ) ∂u(ct ) = ∂wt ∂ct
(62)
∂u(ct+1 ) ∂V (wt+1 ) = ∂wt+1 ∂ct+1
(63)
Un periodo hacia adelante:
Encontrando la ecuaci´ on de Euler Introduciendo la ecuaci´ on [63] (teorema de la envolvente) en la ecuaci´on [64] (CPO), se tiene la ecuaci´ on de Euler: ∂u(ct ) ∂V (wt+1 ) = β(1 + r ) ∂ct ∂wt+1
Clase 2: Programaci´ on din´ amica Programaci´ on din´ amica: detalles M´ etodo de c´ alculo diferencial para solucionar el PF
Ejemplo: aplicaci´ on del teorema de la envolvente IV
∂u(ct ) ∂u(ct+1 ) = β(1 + r ) ∂ct ∂ct+1
(64)
View more...
Comments