11trnt.f.vt! .s~~iD '. e 11:1. O:J1J
GO./lhJ.o
i
ROBERf GIBBONS Universidad
de Cornell
UN PRIMER CURSO
DE TEORÍA DE JUEGOS
t
I
I & ,~-
TraducCión de Paloma Calvo. y Xavier ViJa
.i
Universidad de Northwestern
Antoni
Bosch
O editor
I
.J
¡:¡',
'lb '1'(
I,
~/""
l.i5
CONTENIDO
"':'
,','
":.
Prefacio
Publicado por Antoni Bosch, editor !vIanuel Cimna, 61 - 08034 Barcelona T"i. (-134)93 206 0730 - Fax (+34) 93 206 0731 E-mai1:
[email protected] http://www.antonibosch.com Título original de la obra: A Primer in Game Theory @ 1992 by Robert Gibbons
R > P > I, para plasmar las ideas de ganancias de tentación, recompensa, penalización e ingenuidad. De forma más general: Definición. En el juego en forma normal G = {SI, ... ,Sn;Ul, ... ,lln}, sean s; y s;' posibles estrategias del jugador i (por ejemplo, s; y s;' son elementos de Si). La estrategia s; está estrictamente dominada por la estrategia s;' si para cada combinación posible de las estrategias de los restantes jugadores la ganancia de i por utilizar si es estrictamente menor que la ganancia de i por utilizar s;':
.. "::':.'
para cada (sIr' .. ,Si-l,Si+l,' .. ,sn) que puede ser construida a partir de los espacios de estrategias de los otros jugadores SI,'" ,Si~l,Si+l, ... ,Sn' Los jugadores racionales no utilizan estrategias estrictamente dominadas, puesto que bajo ninguna conjetura que un jugador pudiera formarse sobre las estrategias que elegirán los demás jugadores sería óptimo utilizar tales estrategias. 1. Así, en el dilema de los presos, un jugador racional elegirá confesar, por lo que (confesar, confesar) será el resultado alque lle-: gan dos jugadores racionales, incluso cuando (confesar, confesar) supone unas ganancias peores para ambos jugadores que (callar, callar). Como el dilema de los presos tiene múltiples aplicaciones (que incluyen la carrera de armamentos y el problema del polizón en la provisión de bienes públicos) trataremos variantes del juego en los capítulos 2 y 4. Por ahora nos centraremos más bien en si la idea de que jugadores racionales no utilizan estrategias estrictamente dominadas puede conducir a la solución de otros juegos. Consideremos el juego abstracto de la figura 1.1.1.2 El jugador 1 tiene dos estrategias y el jugador 2 tiene 3: Sr = {alta, baja} y S2 = {izquierda, centro, derecha}. Para el jugador 1, ni alta ni baja están estrictamente 1 Una cuestión complementaria también tiene interés: si no existe una conjetura que'el jugador i pueda formarse sobre las estrategias de los demás jugadores, que haga óptimo elegir la estrategia Si, ¿podemos concluir que debe existir otra estrategia que domine estrictamente a s.;? L;'respuésta es afirmativa, siempre que adoptemos definidones adecuadas de "conj~tura'; y de "otra estrategia", términos que incluyen la idea de estrategias mixtas que introduciremos en la secdón 1.3.A.
1:::.-
2 La mayor parte de este libro considera aplicaciones económicas más:que ejemplos abstractos, tanto porque las aplicaciones Son de interés por sí mismas como porque, pa~~.. múchos lectores, las aplicaciones son a menudo un modo útil de explicar la teoría subyacente:;', Sin embargo, cuando introduzcamos algunas ideas teóricas básicas, recurriremos a.eJe~p]' .. , abstractos sin una interpretación económica directa. ¡. ,".t,l"
:::--
1:
Teoría básica: fuegos en formal nonnal y equilibrio de Nas/¡ / 7
6 / JUEGOS ESTÁTICOS CON INFOR.MAClÓN COMPLETA (e. 1)
dominadas: alta es mejor que baja si 2 elige izquierda (porque 1 es mayor que O),pero baja es mejor que alta si 2 elige derecha (porque 2 es mayor que cero),
Jugador 2 Izquierda Centro Jugador 1
Jugador 2 Izquierda' Centro Derecha :¡Alta
"
1,0
12 ,
0,1
0,3
0,1
20
Figura Í.1.1
",
í'
\~,'
Sin embargo, para el jugador 2, derecha está estrictamente dominada por centro (porque 2 es mayo~ que 1 y 1 es mayor que O),por laque un jugador racional 2 n{) elégiiá,:derecJ:¡.a. Así, si el jugador 1 sabe que el jugador 2 es racionatjjúedeeliminar derecha del espacio de estrategias del jugador 2., Esto. es, si el jugador 1 sabe que el jugador 2 es ~~cional, puede comportarse en eLjuegode la figura 1.1.1 como si estuviera ell el juego de la figura 1.1.2.
..1l
']iigadór2 Izquierda Centro Aita
"'1,0
'1,2'
0,3
0,1
!~gador 1 ,"
Baja'
Figura 1.1.2
';":'~'.
'
,~,"'. '
En lafigur~ 1.1.2, baja está ahora estrictamente dominada: por alta BaJ;il,eljugadoiJ,.así que si el jugador 1 es rac,ional(y.eljugador lsabe que el jugador 2es racional, parlo que se aplica el juego de la figura 1:12) hóceIegfr~baja~ Por eso; si el jugador 2 sabe que el fugador1, es :aciortal; :y~'~]ug~5t?Fi sabe que el jugador 1 sabe qt]e. el jugador 2 es racional (pÓt'16~ueeí]tigador 2sabe que se aplica la figura 1.1.2),,el jugador 2 . p€eae:~~arl)aja delespacio de estrategias del jugador 1, quedando el .:.••...P.t~6"c8ffi'o'ii1dicálafigura 1.1:3:Péro ahora, izquüú\:la 'está estrictamente '::;.;;" :~,r,.\~:,;,:"=t:_(dr"!'i-'~~d'tlt-;N~;t':-/:¡;..¡:-__. ,." : ,:',' , , . "': .."";.;~£l~J?¿f¡;~~!Ip,.parael jugador 2, quedando (alta, centro) como el
,.ó"~';~;"~~V .. J~~r~~#ft."' :,f.~,•..
.
. -'~;. x"
,l'"
1_,0
1_,2_
Figura 1.1.3
Jugador1 Baja
Alta 1__
Este proceso se denomina eliminación iterativa de las estrategias estrictamente dominadas. Aunque está basado en la atractiva idea de que los jugadores racionales no, utilizan estrategias estrictamente dominadas, el proceso presenta dos inconvenientes. En primer lugar, cada paso requiere un supuesto adicional sobre lo que los jugadores saben acerca de la racionalidad del otro. Si queremos ser capaces de aplicar el proceso pata un ntÍmero arbitrario de pasos, neceSitamos suponer que es informació11 del dominio público que los jugadores son racionales. Esto es, necesitamos suponer no sólo que todos los jugadores son racionales, sino también que todos lbs jugadores saben que todos los jugadores son racionales, y que todos los jugadores saben que todos los jugadores saben que todos I~s jugadores son racionales, y así ad infil1itUt1l (véase la defihición fomiaI de información del dominio público en Aumaim [1976]). ; La segunda desventaja de la eliminación iterativa de estrategias estrictamente dominadas es que el proceso conduce a menudo a una prediCdó'ri imprecisa sobre el desarrollo del juego. Por ejemplo~ consideremos el juego de la figura 1.1.4. En-estejuego no hay estrategias estrictamente dominadas para ser eliminadas. (Puesto que no hemos fun'darnéltado esté juego en absoluto, al lector puede parecerle' arbitrario 'oinclusopafokígico. Para una aplicación económica en el mismo sentido, véase el caso de tres o más empresas en el modelo de Cournot incluido en la sección 1.2.A) Puesto que todas las estrategias en el juego sobreviven a la eliminación iterativa de las estrategias estrictamente dominadas, el proceso no permite ninguna predicción sobre el desarrollo del juego. ,I 'A
,':.~'
(j D
0.4. ,0 .~\3
M .1!i) 0,.4',5,3 B. 3,5 3,5
6.6
, 1-
Figura 1.1.4
¡ j
8/
jUECOS ESTATICOS CON INFORMACIÓN COMPLETA (e. 1)
Teoría básica: Juegos en formal nonnai y equilibrio de Nash / 9
A continuación abordamos el equilibrio de Nash, un concepto de solución que da lugar a predicciones mucho más precisas en una clase de juegos muy amplia. Demostramos que el equilibrio de Nash es un cOncepto ~iesoluc(ónmás poderoso que la_e.liminacióniterativa de las.estra~ tegias estrictamente.dominadas, en el sentido 'de que las estrategias de los jugadores en un equilibrio de Nash siempre sobreviven a la eliminación iterativa de las estrategias estrictamente domin''''fuíXta&:Yéasee! ejercido 1.10. :. ','. . '-';)';".;'
'.'
y equilibrio de Nas" / ]]
. s En inglés, los diminutivos Pat y Chris pueden referirse tanto a nombres masculinos (Patrick y Christopher) como femeninos (Patricia y Christinal. (N. de los T.)
12/
JUEGOS ESr,\rICOS
CON INFOIUvlACJÓN COMPLETA (e. 1)
Ópera Boxeo
?,l
Boxeo
0,01,~
y equilibrio de Nash / 13
Apéndice
Pat
Ópera
Teoría básica: fuegos en jonnalnol'mal
0,0
Chris
La batalla de los sexos Ambos, (ópera, ópera) y (boxeo, boxeo) son equilibrios de Nash: Hemos argumentado antes que"si la teorladejuegos ofrece una única solución a un juego, ésta debe ser un equilibiio de Nash. Este argumento ignora la posibilidad de juegos en los cuales la teoría de juegos no' ofrece una solución única. También hemos argumentado que si se llega a un ª 0, 'lri(qm,qj) > 'lri(qm + x,qj) para toda qj ~ o. Para comprobarlo, nótese que Q = qm + X + qj < a, por lo que
y del mismo modo, si q2 es menor que a. - c, la mejor respuesta de la empresa les -
y si Q = qm + X + qj ~ a, entonces P(q) = O, por lo que producir cantidad menor aumenta el beneficio. En segundo lugar, puesto las cantidades mayores que qm han sido eliminadas, la cantielad c)/4 domina estrictamente a cualquier cantidad más baja. Esto es, cualquier x entre cero y (a - c)/4,'lri [(a. - c)/4,qj] > 'lri[(o. - c)/4- x,qjJ cualquier qj entre cero y (a - c)/2. Para comprobarlo, nótese que
"', ",!
'
q,
..::;
'Ir- (~
(O, a - e)
,
4
,q]
_) _ a - e 4
)
=
[3(0_ -
4
c) _
una que (a -
para para
_] q]
y (O, (a - e)/2) 7fi
.•..
',-
x,qj
[a-c -4- - x ] [3(a-C) ---4-- + x
a. - e ='lri ( qm,qj ) - X [ -2-
.¡)~ .-
.• «a - c)/2, O)
.,):
o.-c ( -4- -
-; Figura 1.2.1
(a
e
c, O)'
q,
+x
- qj
- qj
]
]
-
Tras estos dos pasos, las cantidades que quedan en el espacio de estrategias de cada empresa sonlas contenidas en el intervalo entre (0.-c)/4 y (a-c) /2 . La repetición de estos argumentos conduce a intervalos cada vez menores
20/
JUECOS ESrÁrlCOS
CON INfORMACIÓN
Aplicaciones / 21
COMPLETA (e. 1)
de las cantidades que quedan. En el límite, estos intervalos convergen al único punto IJ.; = (a -c)/3. La eliminación iterativa de las estrategias estrictamente dominadas también se puede representar en forma gráfica utilizando la observación (incluida en la nota 1; véase también la discusión en la sección 1.3.A) de que una estrategia es estrictamente dominada si y sólo si no existe ninguna conjetura sobre las decisiones posibles de los demás jugadores para la cual sea la mejor respuesta. Puesto que sólo hay dos empresas en este modelo, podemos reformular esta observación del siguiente modo: una cantidad q¡ es estrictamente dominada si y sóJo si no hay ninguna conjetura sobreqj tal que q¡ sea la mejor respuesta de la en1presa i. Nuevamente"discutimos sólo los dos primeros pasos del pr,?ceso iterativo. En primer lugar,:n1¥1~a es una respuesta mejor para la empresa i producir más que la canti~~d de monopolio qm = (a - c)/2. Para comprobarlo, consideremos, por ejemplo, la función de mejor respuesta de la empresa 2: en la figura 1.2.1, R2(q¡) es igual a qm cuando q¡ = 0, y disminuye cuando q] aumenta. AsÍ, para cualquier qj 2: 0, si la empresa i cree que la empresa j elegirá qj, la mejor respuesta de la empresa .¡ es menor que o igual a qm. No existe qj tal que la mejor respuesta de la empresa i sea' mayor que qm. En segundo lugar, dada esta cota superior para la cantidad de la empresa j, podemos derivar una cota más baja a la mejor respuest~ de la empresa i: si qj ::; (a - e)/2, entonces R;(qj) 2: (a - c)/4, como mostramos para la mejor respuesta de la empresa 2 en la figura 1.2.2.9 q, (0, (a - e) /2)
R,(q)
(O, (a - e)/4)
Como en el caso anterior, la repetición de estos argumentos conduce a la cantidad qi = (a - c)/3. Concluimos esta sección cambiando el modelo de Coumot, de forma que la eliminación iterativa de las estrategias estrictamente dominadas no ofrezca una solución única. Para hacerlo, añadimos simplemente una o más empresas al duopolio existente, Vamos a comprobar que el primero de los dos pasos discutidos en el caso del duo polio continúa cumpliéndose, pero el proceso termina ahí. Por eso, cuando hay más de dos empresas, la eliminación iterativa de las estrategias estrictamente dominadas ofrece sólo la predicción imprecisa de que la cantidad de cada empresa no ex'cederá a la cantidad de monopolio(como enla figura 1.1.4, donde no se eliminaba ninguna ~strategia durante el proceso). Para ser más concretos, consideramos el caso de tres empresas. Sea elegidas por las empresas distintas de i, y sea 1ri(qúQ -i) = q.¡(a - qi - Q -i - e) siempre que qi + Q -i < a (mientras que 7fi(qi,Q-i) =-Cqi si qi + Q-i 2: a). Nuevamente es cierto que la cantidad de monopolio qm = (a - e)/2 domina estrictamente cualquier cantidad más alta. Es decir, para cualquier x > 0, 1ri(qm,Q-i) > 1ri(qm + ;,Q-D para todo Q-i 2: 0, C0Il10 en el prime~ paso delcaso de duopolio.'sik embargo, puesto que hay dos empresas además de la empresa i, lo único que podemos decir acerca de Q_; es que está entre cero y(a - e), porque q/ y qk están entre cero y (a - c)/2. Pero esto implica.que ninguna cantidad qi 2: es estrictamente dominada en el caso de la empresa i, porque para cada qi entrecero y (a -c)/2 existe un valor de Q-i entre cero y (a ~ e) (concretamente;Q_i= a - e - 2qi), tal que qi es lamejor respuesta de la emp;esa i a Q~i. Poi- ello, en lo sucesivo ya no se puede eliminar rtingUIl~' estrategia. . .'.
".
, .•....
:
Q-¡ la suma de las cantidades
(
\ ..
,o,.
°
1.2.BModelo de duopolio de Bertrand ", ... ((a - e) /2,0)
(a - e, O)
Figura 1.2.2
9 Estos dos argumentos son ligeramente incompletos, puesto que no hemos analizado la mejor respuesta de la empresa i cuando no tiene la certeza de cuál sea la cantidad qj' Supongamos que la empresai no está segura de qj pero cree que el valorespera i cuando eli~~';l precio Pi y su rival elige el precio O refleja hasta qué punto el producto de la empresa i es un sustituto del producto de laempresaj.(Ésta esuilafuiH:ión de demanda irreal, puesto que la cantidad demandada dei piodtict~ de la empresa i es positiva incluso cuando la empresa i fija un preció arbitrariamente alto, siempre que la empresa j también fije un precio suficientemente alto. Como se verá, el problema sólo tiene sentido si b < 2.) Como en la discusión del modelo de Cournot, suponemos que no existen costes fijos de producción y que los costes marginales son constantes e iguales a c, donde c < a y las empresas deciden (por ejemplo: eligen los precios) simultáneamente. Como antes, la primera tarea en el procéso de hallar el equilibrio de Nash es traducir el problema a un juego en forma norni.al. Tenemos dos jugadores nuevamente: Sin embargo, esta vez las estrategias de que dispone cada empre~ason los diferentes precios que' pueden fijar, en vez de las diferentes cantidades que pueden producir. Vamos a suponer que los precios negativos no son factibles, pero que cualquier precio no negativo lo es; por ejemplo, no existe ninguna restricCÍón a los precios expresados en céntimos. AsÍ, el espacio de estrategias de cada empresa puede ser nuevamente representado como Si.~[~ff,2),)?~ n.úmeros reales no negativos, y una estrategia típica Si es ahora Jil decisión de un precio .
pi es una solución de O::;Pi G**: en el equilibrio de Nash se crían demasiadas cabras comparado con el óptimo sociaL La condición de primer orden (1.2.5) refleja los incentivos que tiene un aldeano que Y'il está criando 9i eabr 1/2, como indican los dos segmentos horizontales de ,*('1) en la figura 1.3.3. Esta afirmación es más poderosa que la afirmación del párrafo anterior con la que está estrechamente relacionada: en aquélla considerábamos solamente estrategias puras y encontrábamos que si '1 < 1/2, cara era la mejor estrategia pura, y que si '1 > 1/2, cruz era la mejor estrategia pura. En ésta consideramos todas las estrategias, puras y mixtas, pero encontramos nuevamente que si r¡ < 1/2, cara es la mejor estrategia de todas (puras o mixtas), y que si '1 > 1/2, cruz es la mejor estrategia de todas.
, ,*('1) (Cara)
1
(Cruz)
1/2
.1
'1
(Cara)
(Cruz)
Figura 1.3.3 La naturaleza de la mejor respuesta del jugador 1 a ('1,1 - '1) cambia cuando '1 = 1/2. Como indicamos anteriormente, cuando r¡ == 1/2 el jugador 1 es indiferente entre las estrategias puras cara y cruz. Además, puesto que la ganancia esperada del jugador 1 en (1.3.1)es independiente ;';"",1;',"1",:
1, ,.1
15 Los sucesos A y B son indepimdientes'si rrob{A y B} =Prob{A}.Prob{B). Así, ,1 escribir rq como la probabilidad de que r elijá cara y 2 elija cara, estamos suponiendo que 1 y 2 toman sus decisiones de formá independjente, como corresponde a la deso"ipci611 que dimos de los juegos de decisión Sill:'.\!Jtá!\e.a.Consúltese Aumann (1974) para la d"finicióu de equilibrio correlacionado, que se'-!.tY~:;;T¡',it1:,gos en los cuales las decisiones de Jos jugadores pueden estar correlacionadas, puest?,;qtifó!js:rvan el resultado de un suceso ale"lorio. como el lanzamiento de una moneda, antes de elegIr sus respectivas estrategias.
36/
JuEGOS ESTÁTICOS CON INFORMACIÓN
COMPLETA (e. 1)
Teoría avanzada: Estrategias mixtas y existencia de equilibrio / 37
der cuando q := 1/2, el jugador 1 es también indiferente entre todas las estrategias mixtas (,.,1 - r). Es decir, cuando q := 1/2 la estrategia mixta (r,1 - T) es la mejor respuesta a (q,1 - q) para cualquier valor de T entre cero y uno. Así, r* O /2) es todo el intervalo [O,1L como indica el segmento vertical de r*(q) en la figura 1.3.3. En el análisis del modelo de Coumot en la sección 1.2.A, llamamos a Ri(q) la función de mejor respuesta de la empresa i. AqUÍ, puesto que existe un valor de q tal que r*(q) tiene más de un valor, llamamos a r*(q) la correspondencia de mejor respuesta del ~~dm1. J Para derivar de forma más general la mejor respu~sta del jugador i a la estrategia mixta del jugador j, así como para dar un enunciado formal de la definición ampliada del equilibrio de Nash, limitamos ahora nuestra atención al caso de dos jugadores, que permite presentar las ideas principales de modo más sencillo. Sea J el número de estrategias puras en .eh y J( el número de estrategias puras en S2. Vamos a escribir SI := { SI j, , , . ,S1] } y S2 := {S21, ... ,S2K }, y vamos a utilizar Slj y S2k para denotar las estrategias puras arbitrarias de SI y S2 respectivamente. Si el jugador 1 cree que el jugador 2 utilizará las estrategias (S21, ... ,S2K) con probabilidades (p21,' .. ,P2K), la ganancia esperada del jugador 1 por utilizar la estrategia pura Slj es
K
K
LP2k'Ul(Slj,S2k)
~ LP2kUl(S¡j~S2k)
k;l
k;1
para cada Slj' en SI' Esto es, para que una estrategia mixta sea una mejor respuesta a P2 debe asignar una probabilidad positiva a una estrategia pura concreta sólo si ésta es una mejor respuesta a P2. De forma inversa, si el jugador 1tiene varias estrategias puras que son mejores respuestas a P21 cualquier estrategia mixta que asigna toda su probabilidad a algunas o ~ todas estas mejores respuestas en estrategias puras (y probabilidad cero al resto de las estrategias puras) es también una mejor respuesta del jugador 1 a P2. Para dar un enunciado fonnal de la definición ampliada del equilibrio de Nash necesitamos calcular'la ganancia esperada del jugador 2 cuando los jugadores 1 y 21;1tilizanlas estrategias mixtas PI y P2. Si el jugador 2 cree que el jugad m 1 utilizará las estrategias (Sl1,' .. ,S1]) con probabilidades (p11,' .. ,PIJ), la ganancia esperada del jugador 2 por utilizar las estrategias (S21,' .. ,S2K) con probabilidades (p21," . ,P2K) es
c
K
V2(Pl,PÚ:=
[ J
f;P2k
]
~PljU2(S1j,S2k)
K
L
:=
y la ganancia esperada del jugador 1 por utilizar la estrategia mixta PI (Pll, ... ,Pu) es
VI (Pl,P2)
:=
:=
J
L j;l
Plj
J
K
L j;l
J
0,3.2)
P2kUI (Slj,S2k),
k;1
[ K c
L P2kU¡ (Slj,S2k) k;l
L
K L
Plj . P2k U2(Slj,S2k).
j;1 k;l :=
]
(1.3.3)
Dadas VI (Pl,P2) Y V2(Pl,PÚ podemos refommlar el requisito del equilibrio de Nash de que la estrategia mixta de cada jugador tenga que ser una mejor respuesta a la estrategia mixta de los demás jugadores: para que el par de estrategias mixtas (pi ,pi) forme un equilibrio de Nash, pi debe cumplir
L Plj . P2k'Ul Cslj,S2k), k;l
(1.3.4)
donde Plj . P2k es la probabilidad de que 1 utilice Slj y 2 utilice S2k. La ganancia esperada del jugador 1 con la estrategia mixta PI, dado en (1.3.3), es la Suma ponderada de las ganancias esperadas con cada ~~a de las estrategias puras {Sl1," . ,S1]} dada en (1.3.2), donde las ponderaciones son las probabilidades (Pll,'" ,PIJ)' AsÍ, para que la estratégia 'mixta (Pll, ... ,PI J) sea una mejor respuesta del jugador 1 a la estrategia mixta P2 del jugador 2, debe cumplirse que Plj > Osólo si
para cada distribución de probabilidad vhi,pi)
PI
sobre
SI,
0.3.5)
~ v2(pi,P2)
C
C
c'
y pi debe cumplir
";:,-
para cada distribución de probabilidad
P2 sobre
52.
Definición. En el juego en forma normal de dos jugadores G := {S¡,S2; 'Ul/U2} las estrategias mixtas (pi ,pi) fonnan un equilibrio de Nash si la estrategia r¡¡ixta
38/ JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. ])
Teoría avanzada:
de cada jugador es una mejor respuesta a la estrategia mixta del otro jugador: (1.3.4) y (1.3.5) deben cumplirse. q q*(r)
(Cara) 1
:'~:,
1/2
mixtas y existencia
de eqllilil".jrJ / 39
mejor respuesta del jugador.í a la estrategiamixla del jugador j presellt~Ja en la figura 1.3.3. Para complementar la figura 1.3.3 calculamos el(los) valor(es) de '1, denotado(s) por '1*(1'), tal(es) que ('1,1 - '1) es una mejor . respuesta del jugador 2 a (r,l - r) del jugador 1. Los resultados se recogen en la figura 1.3.4. Si r < 1/2, la mejor respuesta de 2 es cruz, de forma que q*(r) = O.Del mismo modo, si r > 1/2, la mejor respuesta de 2 es cara, de forma que q*(r) = 1. Si r = 1/2, el jugador es indiferente no sólo entre cara y cruz sino también entre todas las estrategias mixtas ('1,1 - '1), de forma que '1*0/2) es todo el intervalo [O,1]. Girando 90 grados la figura 1.3.4 y dándole la vuelta, obtenemos la . figura 1.3.5. Ésta es menos adecuada que la figura 1.3.4 como representación de la mejor respuesta del jugador 2 a la estrategia mixta del jugador 1, pero puede combinarse conla figura 1.3.3 para obtener la figura 1.3.6.
-------- ..-...'
(Cruz)
Estrategias
1
r
. (Cara)
(Cruz)
(Cara) 1
Figura 1.3.4 q*(r)
r 1/2
---_._---j ..... _------------------'
(Cara) 1
q*(r)
(Cruz) 1/2
1/2
1
q
(Cara)
(Cruz)
Figura 1.3.6 (Cruz)
q (Cara)
(Cruz)
Figura 1.3.5
A continuación, aplicamos esta definición al juego de las monedas y a la batalla de los sexos. Para ello, utilizamos la representación gráfica de la
La figura 1.3.6 es análoga a la figtira 1.2.1 del análisis de Cournot de la sección 1.2.A. Igual que la intersección de las funciones de mejor respuesta R2(ql) y RI ('12) dio el equilibiio de. Nash del juego de Cournol, la intersección de las correspond~ncia,s d~ mejor respuesta r*(q) y q*(r) nos da el equilibrio de Nash (ertestiategias mixtas) en el juego de las monedas: si un jugador i elige 0./2,1 /2), (1/2,1/2) es la mejor respuesta del jugador j, tal como lo exige eléquilibrio de Nash.
40
I
JUEGOS ESTÁTICOS CON INfORMACIÓN
COMPLETA (c. 1)
Conviene resaltar que el equilibrio de Nash en estrategias mixtas no se basa en que ningún jugador lance una moneda al aire, arroje unos dados o elija de forma aleatoria una estrategia. Más bien, interpretamos la estrategia mixta del jugador j como una representación de la incertidumbre del jugador i respecto a la decisión del jugador j sobre la estrategia (pura) que va a seguir. En béisbol, por ejemplo, el lanzador puede decidir si lanzar una bola rápida o una curva basándose en cómo le salieron los lanzamientos durante el entrenainiento. Si el bateador conoce el razonamiento del lanzador pero no sabe qué ocurrió durante su entrenamienfo, puede ser que crea que existen las mismas posibilidades de que el lanzador lance una bola rápida o Curva. Representaríamos entonces la conjetura del bateador como la estrategia mixta del lanzador (1/2,1/2), cuando en realidad el lanzador elige una estrategia pura basándose en la información que no dispone el bateador. Enunciado de un modo más general, la idea consiste en dotar al jugador j de una cierta información privada de manera que, dependiendo de cómo el jugador j entienda dicha información, se incline por una de las estrategias puras posibles. Sin eh1bargo, puesto que el jugador i no dispone de la información privada de j,i continúa con la incertidumbre de no saber cuál será la decisión de j, y representamos dicha incertidumbre de i como una estrategia mixta de j.' Ofrecemos un enunciado más formal de esta interpretación de las estrategias mixtas en la sección 3.2.A. Consideremos la batalla de los sexos, de la sección 1.1.c, como un segundo ejemplo de equilibrio de Nash con estrategias mixtas. Sea (q,1- q) la estrategia mixta en la cual Pat elige la ópera con probabilidad q y sea (1',1 - 1') la estrategia mixta en la cual Chris elige ópera con probabilidad 'r. Si Pat elige (l},l-q), 'las ganancias esperadas de Chris son q.2+(1-q)'0 = 2q al elegir ópera y q'O + (1 - q) . 1 = 1- q al elegir boxeo. AsÍ, si q > 1/3, la mejor respuesta de Chris es ópera (es decir, l' = 1); si q < 1/3 la mejor respuesta de Chris es boxeo (es decir, l' = O) y, si q = 1/3, cualquier valor de l' es una mejor respuesta. De modo similar, si Chris elige (1',1 - 1') las ganancias esperadas de Pat son l' . 1 + O - 'r) . O = l' al elegir ópera y 1'.0+(1 -1').2 = 20-r) al elegir boxeo. AsÍ, si l' > 2/3, la mejor respuesta de Pat es ópera (es decir, q = 1); si l' < 2/3 la mejor respuesta de Pat es boxeo (es decir, q = O) y, si r = 2/3 cualquier valor de q es una mejor respuesta. Como muestra la fig'ura 1.3.7, las estrategias mixtas (q,1 - q) = 0/3,2/3) de Pat y (-1',1 - 1') = (2/3,1/3) de Chris forman, por lo tanto, un equilibrio de Nash. Al contrario que en la figura 1.3.6, donde sólo existía una intersección
Teoría avanzada: Estrategias mixtas y existencia de equilibrio I 41
de las correspondencias de mejor respuesta de los jugadores, existen en la figura 1.3.7 tres intersecciones de r*(q) y q*(r): (q = 0,1' = O), (q = 1,r = 1) Y (q = 1/3,1' = 2/3). Las dos primeras intersecciones representan los equilibrios de Nash en estrategias puras (boxeo, boxeo) y (ópera, ópera) descritos en la sección 1.1.c. l'
r*(q)
(Ópera) 1 q*(r)
2/3
(Boxeo)
1/3
l:, .
(Boxeo)'
Figura 1.3.7 _.:,'
En cualquier juego, un equilibrio de Nash (que incluya estrategias puras o mixtas) aparece como una intersección:,dJUas:.c.QITespon.dencias,de mejor respuesta de los jugadores, induso cuando:háymás de dosjugádores y también cuando algunos o todos lósjugadores tienen más de dos estrategias puras. Por desgracia, los únicos juegos en los que las co~espondencias de mejor respuesta de los jugadores tienen representaciones' gráficas sencillas son los juegos de dos jugadores en:lasque cada jugador sólo tiene dos estrategias. Discutimos ahora con un argumento gráfico que cualquier juego de ese tipo tiene un equilibrio de Nash (que posiblemente incluya estrategias mixtas).
(
(
Consideremos las g¡mancias del jugador) representadas en la figura 1.3.8. Hay dos comparacionesfu:1portantes:' x con z e y con w. Basándonos en estas comparaciones, podemosdefi.iur cuatro casos principales: (i) x > z e y > w; (ii) :É < z e y < w; (iii) x > z e y < w, y (iv) x < z e y > w. Discutimos primero estos cuatro casos y luego abordamos los casos restantes en los qliex '=z' y
o =w, '
,~.
'i~i..
,----,
42/
JUEGOS ESTÁTICOS CON INFORMACIÓN
Teoría avanzada: Estrategias. mixtas y existencia de equilibrio / 43
COMPLETA (e. 1)
En los casos (iii) y (iv), ni alta ni baja son estrictamente dominadas. Así, alta debe ser óptima para algunos valores de q y baja óptima pilfa los demás. Sea ql = (w - y) /(x - Z + w - y). En el caso (iii) alta es óptima para q> q' y baja para g < ql, mientras que en el caso (iv) ocurre lo contrario. En ambos casos, cualquier valor de r es óptimo cuando q = q'. Estas correspondencias de mejor respuesta se representan en la figura 1.3.10.
Jugador 2 Izquierda Derecha Alta
x,--..:.
Baja
Z,-
,
y,-
.-
Jugador 1
10,-
(Alta)
.,', .. ,'
~
(Alta)
r*( q)
r*( q)
Figura 13.8 En el caso (i) para el jugador 1 alta,domi~a estrictamente a baja, y en el caso (ii) baja domina estrictamente a alta ...Recordemos de la sección previa que una estrategia es estrictamente dornin~da si y sólo si no existe una conjetura que el jugador i pudiera ~onrtaise(sobre las estrategias que elegirán los demás jugadores) tal quehicierá óptimo elegir Si. ASÍ, si (g,l - g) es una estrategia mixta del jugador 2, donde g es la probabilidad de que 2 elija izquierda, en el caso (i) no existe un valor de g tal que baja sea óptima para el jugador 1, y en el caso (ii)no existe un valor de g tal que alta sea óptima. Si (r,l- r) denota una estrategia mixta del jugador 1 en la que r es la probabilidad de que 1 elija alta, podemos representar las correspondencias de mejor respuesta para los casos (i) y (ii) como en la figura 1.3.9.(En estos dos casos las correspon: cada eIIlpresa tiene una estrategia estrictamente dominada, y ambas están peor en equilibrio que si cooperasen. En segundo lugar, supongamos que cada empresa puede elegir o qm/2 o qe, () una tercera cantid\idq' .. Hállese un valor de q' tal que el juego sea equivél.1ehteal modelo de Coumot de la sección 1.2.A, en el sentidq'de que (qe,qe) sea un equilibrio de Nash único y ambas empresas estén .pem; en equilibrio de lo que estarían si cooperasen, pero ninguna de ellas tiene una estrategia estrictamente dominada. 1.6 Considérese el modelo de duopolio de Coumot en el que la demanda inversa es P(Q) = a - Q pero las empresas tienen costes marginales asimétricos, Cl para la empresa 1 y C2para la empresa 2. ¿Cuál es el equiJibrio de Nash si O < e.; < a/2 para cada empresa? ¿Qué ocurre si el < C2< a pero 2C2 > a + Cl?
1,3 0,2 3,0
1.3 Los jugadores 1 y 2 están negociando cómo repartirse mí! pesetas. Ambos jugadores indican simultáneamente la parte de las mil pesetas que querrían conseguir, SI y s2,donde O ~ 81,S2 ~ 1. Si SI + S2 ~ 1, los jugadores ven cumplidos sus deseos; si SI + S2 > 1, ambos jugadores reciben cero pesetas. ¿Cuáles son 105 equilibrios de Nash con estrategias puras de este juego?
(.
..,;.
1.7 En la sección 1.2.Banalizamos el modelo de duopolio de Bertrand con productos diferenciados. En el caso de productos homogéneos se obtiene un resultado poderoso. Supongamos que la cantidad que demandan los consumidores a la empresa i esa - Pi cuando Pi < Pj, Ocuando Pi > Pj, y (a - Pi)/2 cuando Pi =Pj. Supongamos también que no hay costes fijos y que los costes marginales son constantes e iguales a c, donde c < a. Demuéstrese que si las empresas eligen precios simultáneamente, el único equilibrio de Nash consiste en que ambas empresas fijen un precio c. 1.8 Considérese una población votante uniformemente distribuida en el espectro ideológico que va de la izquierda (x = O)a la derecha (x = 1). Cada uno de los candidatos para un único puesto elige simultáneamente
SO/JUEGOS
.'/}
ESTÁTICOS CON INFORMACIÓN
Referellcins / 51
COMPLETA (c. 1)
un programa electoral (es decir, un punto eh la línea entre x = O Y x = 1). Los votantes observan el programa de los candidatos y luego cada votante vota por el candidato cuyo programa se acerque más a su posición en el espectro. Si, por ejemplo, hay dos cahdidatos y eligen programas x] = 0,3 Y X2 = 0,6, todos los votantes a la izquierda de x = 0,45 votan al candidato 1, y todos los que están a la derecha votan al candidato 2, y el candidato 2 gana la elección con un 55 por ciento de los votos. Supongamos que a los ~andidatos sólo les importa ser elegidos; en realidad, su progr?ma no les mteresa para nada. Si hay dos candidatos, ¿cúaJ es el equilibrio de Nash con estrategias puras? Si hay tres caIldidatos,indíquese un equilibrio de Nash con estrategias puras. (Supongamos qué cuarido vanos candidatos eligen el mismo programa, los votos obtenidos por ese programa se dividen apartes iguales, y quelos empates entré'l?sq¡je~onsiguen más votos se resuelven a cara o,cruz.) VéaseHotelling (1929)pa.ra un primer modelo similar. ... " "~o " '1,; .
J':
solicitar trabajo en una de las empresas. Los trabajadores deciden simultáneamente si solicitar el trabajo de la empresa 1 o de la empresa 2. Si sólo un trabajador solicita trabajo en una de las empresas, dicho trabajador obtiene el trabajo. Si ambos trabajadores solicitan trabajo en la misma empresa, la empresa contrata a uno de ellos aleatorialnente, y el otro queda desempleado (lo que significa una ganancia cero). Hállense los equilibrios de Nash del juego en forma normal. (Para más información sobre los salarios que fijarán las empresas, consúltese Montgomery [1991J.) Trabajador 2 Solicitar a Solicitar a empresa 1 empresa 2 Solicitar a empresa 1
2:7/11'2:W]
Solicitar a empresa 2
W2,1.v]
]
]
'UJl,W2
Trabajador 1
1.9¿Qué es una estrategia mixta en un juego enfórma normal? ¿Qué es Un equilibrio de Nash con estrategias mixtas en un juego en forma normal?
1
1
2: 'UJ2, 2: 'UJ2 Fecha 2
1.10 Demuéstrese que no existen equilibrios de Nash con estrategias mixtas en los tres juegos en forma normal analizados en la sección 1.1: El dilema de los presos, el de la figura 1.1.1 y,el de la figura 1.1.4. 1:11 ~állese el equilibrio de Nash con estrategias mixta~ del juego del eJerCICIO 1.2.
1.14 Demuéstrese que la proposición B en el apéndice a la sección 1.l.C se cumple tanto para equilibrios de Nash con estrategias puras como con estrategias mixtas: las estrategias utilizadas con probabilidad positiva en un equilibrio de Nash con estrategias mixtas sobreviven al proceso de €liminación iterativa de las estrategias estrictamente dominadas.
1.12 Hállese el equilibrio de Nash con estrategias mixtas del siguiente juego en forma normal:
1.6 Referencias
1
AUMANN,R. 1974, "Subjectivity and Correlation in Randomized Strategies" Journal of Mathematical Ecol1omícs 1:67-96. -. 1976. "Agreeing to Disagree." Al1l1als of Statístics 4:1236-39.
D
A 2,1 0•.2
B 1,~ 10 "
'
1.13 Dos empresas ofrecen un puesto de trabajo cada una. Supongamos que (por razones que no discutimos aquí, pero que se refieren al grado de importancia de que se ocupe el puesto) las empresas ofrecen salarios dife~ntes: la empresa i ofrece el salario Wi, donde (1/2)w] < 'UJ2 < 2w] .. Imagmemos que hay dos trabajadores, cada uno de los cuales sólo puede
f
-. 1987. "Correlated Equilibrium as an Expression of Bayesian Rationality." Ecol1ometrica 55:1-18. BERTRAND,T 1883. "Théorie Mathématique de la Richesse SociaJe."]oumal des Saval1ts 499-508. BRANDENBURGER, A. 1992. "Knowledge and Equilibrium in Carnes." De próxima aparición en Journal of Ecol1omic Perspectives.
52/
JUEGOS ESTÁTICOS CON INFORMACiÓN
,',
COMPLETA (e. 1)
'.'.'
COURNOT,A. 1838. l\echerches Sllr les Principes Mathématiques de la Théorie des Richesses. Edición inglesa: Researches into the Mathematical Principies of theon) of Wealth. Publicado por N. Bacon. New York: Macmillan, 1897.
2. JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA
DASGUPTA, P, y E. MASKIN,1986. "The Existence of Equilibrium in Discontinuous Economic Games, 1:Theory." ReviC'U!of Economic Studies 53:1-26. FARBER,H., 1980, "An Analysis of Final-Offer Arbitration."Journal flict Resolution 35:683-705. FRIEDMAN,J. 1971. "A Noncooperative Review of Economic Studies 28:1-12.
Equilibrium
for Supergames."
GIBBONS,R. 1988. "Learning in Equilibrium Models of Arbitration." AmerieclrlEconomic Review 78:896-912. HARDIN,G. 19613."The Tragedyof
the Commons." Science 162:1243-48.
HARSANYI,J. 1973. "Games with Randornly Disturbed Payoffs: A New Rationale for Mixed Strategy Equilibrium Points." International Journal of Came Theory 2:1-23. HOTELLING,H. 1929. ';Stability in Competition." Economic JournaI39:41-57. HUME, D. 1739. A Treatise of Human Nature. Dent. 1952. KAKUTANl,S. 1941. "A Generalization Dllke Mathematieal Joumal 8:457-59.
Reedición.
Londres:
J. M.
of Brouwer' s Fixed Point Theorem."
KREPS,D., y J. SCHElNKMAN.1983. "Quantity Precommitrnent and Bertrand Competition Yield Cournot OutcolIles." Bell JOL/rnal of Economics 4:326-37. MONTGOMERY, J. 1991. "Equilibrium Wage Dispersion and Interindustry Wage Differentials." Qllarterly JOl/mal of Economics 106:163-79. NASH,J. 1950. "Equilibrium Points in n-Person Games." Proceedings of the National Aeademy of Sciences 36:48-49. PEARCE,O, 1984. "Rationalizable Strategic Behavior and the Problem of Perfection." Econometrica 52:1029-50. STACKELBERG, H. VON, 1934, Marktfonn Springer.
c\ '.','.
of Con-
L/nd Cleichgewicht.
Viena: Julius
Ijnestecapítulo presentamos los juegos dinámicos. De nuevo, limi~amas nue~tra atención a los juegos con información completa. (es dédr; juegos en los que las fundones de ganancias de los jugadores so~ Wormaciónqel doriúnio público); véase una introducción a 10s'juégOs con información incompleta en el capítulo 3. En la sección 2.1 analiZarnos los juegos dinámicos no sólo con información completa, sino tambiéÍi:co~ información perfecta, lo que significa que en cada momentodeI'jí1ego;~1 jugador a quien le corresponde decidir conoce la historia cómple'fá:de todas las decisiones tornadas hasta ese momento. En las seccióries'i;2'¡; 2.4, considercunos los juegos con información completa pero imperfeét~: en algún momento ~~l juego el jugador a quien le corresponde decidirno conoce toda lahistoria del juego. . El tema central en todo juego dinámico es el de la credibilidad. Como ejemplo de una amenaza que no resulta creíble, consideremos el siguiente juego de dos tiradas. Primero, el jugador 1 escoge entre dar 1.000 pesets al jugador 2 () no darle nada, Én segundo lugar, el jugado.r2 observa la decisióridel jugador 1 y de~ide si hacer estallar o no una granada que los matara a los dos. Supongamos que el jugador 2 amenaza' c;on hacer estallar la granada a no ser que el jugador 11e page las 1.000 pesetas. Si el jugador. 1 cree que puede cumplirse la amenaza, su mejor respuesta es la de pagar las 1.000 pesetas. Pero el jugador 1 no debería creerse una amenaza semejante: si al jugador :2 s~ le diera la oportunidad de ejecutar dicha amenaza, escogería no hacerlo., Por tanto, el jugador 1 no debería' pagar nada al jugador 2.1 En la sección 2.1 analizamos los siguientes casos de juegos dinámicos con información completa y perfecta: el jugador 1 decide primero, acto seguido el jugador 2 observa la decisión dél jugador 1 y finalmente el juga1. El jugador 1 podría preguntarse si un o?>n~nie que amenaza con hacer explotar una' granada está loco. Este tipo de dudas se modelali como información incompleta, porque el jugador 1 no está seguro de la función dé ganancias del jugador 2 (véase capítulo 3).
(,
1",'
:',
'..
-, 1
54 / JUEGOS DINÁMICOS CON INFORMACIÓN
Juegos dillámicos
COMPLETA (e. 2)
dar 2 toma su decisión con lo que concluye el juego. Eljuego de la granada pertenece a esta clase, como el modelo de duopolio de Stackelberg (1934) y . el modelo de Leontief, (1946) de determinación de salarios y nivel de empleo en una empresa con fuerte implantación de un sindicato. Definimos .' el resultado por inducción hacia atrás y consideramos brevemente su relación '" con el equilibrio de Nash (posponiendo la discusión de esta relación hasta la sección 2.4). Resolvemos los modelos de Stackelberg y Leontief, utilizando este criterio. Derivamos también un resultado a~álogo para el modelo de negociación de Rubinstein (1982), aun cuando ese juego tiene una sucesión potencialmente infinita de tiradas y, por tanto, no pertenece ala cl~se de juego,s considera~a, '. . En la sección 2.2 ampliamos la clasé de juegos analizada en la sección anterior: primero ambos jugadores 1 y2 deciden simultáneamente, acto seguido los jugadores 3 y 4 observanlas decisiones de 1 y 2y finalmente, los jugadores 3 y 4 deci~fensimultáneámente'c!Jn lo que concluye el juego. Como ya se explicará en la sección 2.4, la simultaneidad de las decisiones significa en este contexto que estos juegos son de información imperfecta, Definimos el resultado perfecto en subjuegos dé tales juegos, que es la extensión natural de la inducción hacia atrás. Resolvemos los modelos de Diamond. y Dybvig (1983) de pánico bancario" un modelo de aranceles y de competencia internacional imperfecta y el modelo de los torneos de LazearyRosen (1981), utilizandoeste.criterio. En la sección 2.3 estudiamos los juegos repetidoS"; en los cuales un grupo determinado de participantes juegan repetidamente un determinado juego, habiendo observado los resultados de las anteriores rondas del juego antes de iniciar la siguiente. El tema del análisis es que las amenazas y las promesas (creíbles) sobre el comportamiento futuro pueden afectar el comportamiento presente. Definimos el equilibrio de Nash perfecto en subjuegos para juegos repetidos y lo relacionamos con los resultados de la inducción hacia atrásy de la perfección en subjuegos definidos en las secciones 2.1 y 2.2. Enunciamos y demostramos el teorema de tradición oral para juegos repetidos infinitamente y analizamos el modelo de Friedman (1971) de colusión entre duopolistas de Coumot, el de Shapiro y Stiglitz (1984) de salarios de eficiencia y el de política monetaria de Barro y Cardan (1983). En la sección 2.4 presentamos las herramientas necesarias para analizar en general un juego dinámico con información completa, ya sea con informaci9n. perfecta o imperfecta. Definimos la representacipn de un juego enformaextensivaylárelacionamos con la representación en forma
COI¡ ¡'¡formación
completa
y perfecta
/ 5.5
l presentada en el capítulo 1. Definimos también el equilibrio de ., ., 1 Nash perfecto en subjuegos para juegos en general. La cuestlOn pnl~clpa que un Juego (tan to de esta sección como del capítulo en su cODjunto)es h 'l'b' d dinámico con información completa puede tener muc os equt J nos e Nash, pero algunos de ellos pueden incluir amenazas.o promesas que no son creíbles. Los equilibrios de Nash perfectos en subluegos son aquellos que pasan la prueba de credibilidad. norm a
2.1Juegos dinámicos con información completa y perfecta 2.1.A Teoría: induccÍón hacia atrás
El juego de la granada es un representante de la siguiente clase de juegos sencillos con información completa y perfecta: 1. El jugador 1 escoge una acción al del conjunto factible Al' 2. El jugador 2 observa 0'1 y escoge una acción o,z del conjunto factible Az. 3. Las ganancias son
1J,1
(a1,o.z) y'Uz(al,o,z).
z Muchos problemas económicos se ajustan a esta descripción. Dos ejemplos (que más adelante discutiremos con mayor detalle) so~ el mo~elo d,e duopolio de Stackelberg y el modelo de Leontief, de sal~~lO~y mv~l de empleo en una empresa con fuerte implantación ~~ un smdIcato .. ?lros problemas económicos pueden modelarse si permItimOS una suce:J7n de movimientos más amplia, ya sea añadiendo más jugadores o penmllendo q~e los jugadores tiren más de una vez. (El modelo de negoci~ci.ónde Rubinstein discutido en la sección 2.1.0 es un ejemplo de este ultImo caso.) Las característi~as clave de un juego dinámico con información completa y perfecta son que (1) las decisones se toman de manera sucesiv~, .~2) todas las decisiones anteriores son conocidas antes de tomar la deOSlon 2 Se podría permitir que el conjunto fa~tH:'I~'del jugador 2, Az, dep:n~iera de la acción del jugador 1, al' Tal dependencia podría d~notarse con AZ(aI) O podna Incorporarse en la función de ganancias del jugador 2 estableoendo que 11:z(a1'0,z) = para valores de a2 do a Algunos movimientos del Jugador 1 podnan mcluso poner que no son fac ti'bles d al'.' . An al juego sin dar la oportunidad de move~ a~jugador 2; para tales valores de al, el conJ'.~nto de acciones factibles Az(o,J) contiene un umco elemento. de forma que el Jugador 2 no tiene
-ex:
elección posible.
",.'.
56 / JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA (c. 2)
siguiente y (3) las ganancias de los jugadores para cada combinación posible de jugadas son información del dominio público. Resolvemos un juego por inducción hacia atrás de la siguiente forma: cuando al jugador 2 le corresponda decidir en la segunda etapa del juego, se enfrentará al siguiente problema, dada la acción al previamente adoptada por el jugador 1: max
'u2(á.l,az).
azEAz
Supongamos que para cada ajen Al, el problema de optimización del jugador 2 tiene una única solución que podemos denotar con Rz(al)' Ésta es la reacción (o mejor respuesta) a la acción del jugador 1. Dado que el jugador 1 puede resolver el problema de maximización del jugador 2 tanto como el propio jugador 2, el jugador 1 debería prever la reacción del jugador 2 a cada acción al que 1 pudiera tomar, de forma que el"problema de 1 en la primera etapa se concreta en max
'Ul (al,Rz(al»).
alEA]
Supongamos que este problema de optimización del jugador 1 tiene también una solución úlúca que podemos denominar aj. Llamaremos a (aj,Rz(aj» el resultado por inducción hacia atrás de este juego. El resultado por inducción hacia atrás ignora las amenazas no creíbles: el jugador 1 prevé que el jugador 2 responderá óptimamente a cualquier acción que 1 pueda escoger jugando Rz(al); el jugador 1 ignora las amenazas por parte del jugador 2 que no favorezcan a 2 cuando el juego llegue a su segunda etapa. Recordemos que en el capítulo 1 usamos la representación en forma . normal para estudiar juegos estáticos con información completa y hos concentramos en la noción del equilibrio de Nash como concepto para solucionar tales juegos. Sin embargo, en la discusión sobre juegos dinámicos de esta sección no hemos hecho mención alguna ni de la representación en forma normal ni del equilibrio de Nash. Al contrario, hemos dado una descripción verbal de un juego en (1)-(3) y hemos definido el resultado por inducción hacia atrás como solución del juego. En la sección 2.4.A veremos que la descripción verbal en (1)-(3) es la representación en forma extensiva del juego. En esta sección estableceremos la relación entre las representaciones en forma extensiva y normal, y veremos que para juegos dinámicos la representación en forma extensiva es a menudo más conveniente. En la sección 2.4.B definiremos el equilibrio perfecto de Nash
Juegos dinámicos con información completa y perfecta / 57
en subjuegos: un equilibrio de Nash es perfecto en subjuegos si ignora las amenazas que no son creíbles en un sentido que definiremos con más precisión. Veremos que pueden existir múltiples equilibrios de Nash en un juego de la clase definida por (1)-(3)" pero que el único equilibrio de Nash perfecto en subjuegos es el equilibrio asociado con el resultado obtenido por inducción hacia atrás. Éste es un ejemplo de la observación, hecha en la sección 1.1.C, de que algunos juegos tienen múltiplesequili" brios de Nash pero tienen un equilibrio que destaca como la soluciónmás llamativa del juego. Concluirnos esta sección explorando los supuestos de racionalidad inherentes en los argumentos de inducción hacia atrás. Considere~os para ello elsiguiente juego de tres etapas en el que el jugador 1 decide dos veces: 1. El jugador 1 escoge J o D donde J finaliza el juego con ganancias de 2 para el jugador 1 y Opara el jugador 2. 2. El jugador 2 observa la elección de 1. Si 1 escoge D entonces 2 escoge J' o D', donde l' finaliza el juego con ganancias de 1 para ambos jugadores. 3. El jugador 1 observa la elección de 2(y recuerda su propia decis~~t:J: ~ la primera etapa). Si las deCisiones anteriores fueroniJ,y, pi enton2es 1 escoge J" o D" finalizando ambas el juego, J" c0rtganane5.asde 3 para el jugador 1 y Opara el jugador 2 y D" con ganancias ,de O Y: 2 respectiv~mente.,; , ,_.; _~
c.
: . ..;,.:_a..;.:.:_:.:.:.l._.~:.,~. ;--:~.:.'~.. debe solucionar (hj,ej,hi,ei)
'!'~
Como 1r'i(t"tj,h"e"h;,e;) puede escribi~e como la sum~ de los benefi~io,sde la empresa i en ~l.mercado i (los cuales son función de hi y e; Ullicamente) y lm~beneficIOSde la empresa i en el mercado j (los cuales son función, de ei, h;.y tj. únicamente), el problema de optimización en los dos mercados para la empresa i se simplifica al separarse en dos problemas, uno para cada mercado: hi debe solucionar , max h,::::O
.-~
+ eJ~)-
hi[a - (hi
'
,
cL
y ei debe solucionar maxei[a
- Ua.
Juegos repetidos / 81
(2.2.7)
(
ganancias del juego completo son simplemente la suma de las ganancias de cada etapa (es decir, no hay descuento). (
Suponiendo que Ua sea lo suficientemente pequeña corno para que el capataz quiera inducir a los trabajadores a participar en el torneo, éste escogerá los salarios que maximicen el beneficio esperado, 2e* -"illA - WB, sujeto a (2.2.7). En el óptimo, (2.2.7) se satisface con igualdad:
Jugador 2 (
Iz
h
D2
1,1 5,0
Jugador 1 WB
= 2Ua
+ 2g(e*) -
WA.
El beneficio esperado es entonces 2e* - 2Ua - 2g(e*), de forma que el capataz quiere escoger unos salarios tales que el esfuerzo inducido, e*, maximice e* - g(e*). El esfuerzo inducido óptimo, por tanto, satisface la condición de primer orden l(e') = 1. Sustituyendo esto en (2.2.6) se obtiene que el premio óptimo, WA - WB, es una solución de (WA -
WB)
l
f(Ój)2dój
=
1,
J
Y (2.2.8)determina entonces
0,5 4,4
(2.2.8)
WA Y"illB.
2.3Juegos repetidos En esta sección analizarnos si las amenazas y promesas sobre el comportamiento futuro pueden influir en el comportamiento presente en situaciones que se repiten en el tiempo. Buena parte de lo que hay que entender en estas situaciones se ha visto ya en el caso de dos periodos; pocas ideas nuevas se requieren para entender los juegos con un horizonte infinito. Hemos definido también el equilibrio de Nash perfecto en subjuegos. Esta defirüción tiene una expresión más sencilla para el caso especial de los juegos repetidos que en el general de los juegos dinámicos con információn completa que considerarnos en la sección 2.4.B. La introducirnos aquí para tacilitar la exposición posterior. . '. 2.3.A Teoría: Juegos repetidos en dos etapas Consideremos el dilema de los presos dado en forma normal de la figura 2.3.1. Supongamos que hay dos participantes en este juego que deciden simultáneamente en dos ocasiones, habiendo observado el resultad"ode li,'l primera decisión antes de decidir por segunda vez, y supongamos que las
('. Figura 2.3.1 Jugador 2 Iz
D2
(
2,2 6,1 Jugador 1 1,6 5,5
Figura 2.3.2 Llamaremos a este juego repetido el dilema de los presos en:dos etapas. Este juego pertenece a la clase de los juegos analizada en la sección 2.2.A. Aquí los jugadores 3 y 4 son idénticos a los jugadores 1 y 2, los espaCios de acciones A3 y A4 son idénticos a Al y AZ Y las ganancias ui(al,a2,a3,a1l son simplemente la suma de las ganancias en la'pnmera etapa (ái.;a2) y en la segunda etapa (a3,a4)' Además, el dilema de los presos en d.ós etapas satisface el supuesto que hicimos en la sección 2.2.A: para cada resultado factible de la primera etapa del juego, (al,a21, el juego restant.e en la segunda etapa entre los jugadores 3 y 4 tiene un único equilibrio de Nash, que denotamos por (a3(al,a21,a,i(al,a2»' De hecho, el dilema de los presos en dos etapas satisface este supuesto de forma clara, como seguidamente indicamos. En la sección 2.2.A peTInitini.osla posibilidad de que el equilibrio de Nash del juego restante en la segunda etapa dependa del resultado de la primera etapa -de aquí la notación (a; (al ,a2) ,a¡ (al ,a2» en vez de simplemente (aj,a¡). (En el juego de los aranceles, por ejemplo; las cantidades de equilibrio escogidas por las empresas en la segunda etapa dependían de los aranceles escogidos por los gobiernos en la primera etapa.) Sin embargo, en el dilema de los presos en dos étapas, el único
.
~'.
• [IleSOS 82 / JuEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
equilibrio del juego de la segunda etapa es (I¡,h), independientemente del resultado de la primera etapa. Siguiendo el procedimiento descrito en la sección 2.2.A para calcular el resultado perfecto en subjuegos de tal juego, analizamos la primera etapa del dilema de los presos en dos etapas teniendo en cuenta que el resultado del juego restante en la segunda etapa será el equilibrio de Nash de ese juego, es decir, (IIJú con ganancias de (1,1). Por tanto, la interacción en la primera etapa entre los jugadores en el dilema de los p~esos en dos etapas se concreta en el juego de una jugada de la figura 2.3.2, en el que las ganancias 0,1) de la segunda etapa se han sumado á' cada par de ganancias de la primera etapa. El juego de la figura 23.2 tiene también un único equilibrio de Nash: (IIJZ). Por tanto, el único resultado perfecto en subjuegos del dilema de los presos en dos etapas es (¡¡Jz) en la primera etapa, seguidC? de (I¡Jz) en ¡la segunda etapa. No se puede conseguir cooperación, es decir, (DI,Dz) en ninguna etapa del resultado perfecto en subjuegos. Este argumento continúa siendo válido en situaciones más generales. (Aquí nos apartamos momentáneamente del caso de dos periodos para permitir cualquier número finito de repeticiones, T.) Denotemos con G = {A¡, ... , An; Ul; ... ,un} un juego estático con información completa en el que los jugadores 1 a n escogen simultáneamente las acciones a¡ a an de los espacios de acciones A¡ a An respeftivamente, siendo las ganancias U¡(al;', . ,an) a un(a¡, ... ,an). Llamaremos al juego G, juego deetapadel juego repetido.
...
}:
Definición. Dado un juego de etapa G, G(T) denota el juego r.epetido finitamente en el que G se juega T veces, habiendo los jugadores observado los resultados de todas las jugadas anteriores antes de que empiece la siguiente. Las ganancias de G(T) son simplemente la suma de las ganancias de los T juegos de . etapa. Proposición. Si el juego de etapa G .tiene un únicQequilibrio de Nash, entonces, para cualquier T finito, el juego repetido G(T) tiene un ú~ico resultado perfecto en subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3 13 Se ~btienen resUltados análogos si el juego de etapa G es un júego dinámicó con informadón completa. Supongamos que G es un juego dinámico con inJonnádón completa y perfecta de la clase definida en la secdón 21.A. Si G tiene un úr¡jco resultado por inducdón hada atrás, G(T) tiene un único resultado perfecto en subjuegos: en cada etapa se juega el resultado por inducdón hacia atrás de G. Sinillarmente, supongamos que G es un juego en
repef idos / 83
lora al caso de dos periodos, pero consideramos la posi.. vodlvdemqo:::1 J'uego de etapa G tenga múltiples equilibrios :le ..NilSh,¡ blhda e . d . d [y C ll1utan é1 3 3 1~as estrateglils enOillma as ./. d / en l a fi gura 2 .., . 1 como enOJ1Unal . de los presos d e l a fi gura 23.. I , pero las estrategias . 'b .ilS dIlem; sido añadidas al juego de forma que ahora existen dos eqUlh nos Di ha '. (1 J) como en el dilema de los presos, y ¡,2 . "1' I N h en estrategIas puras. de as d 1 ' (D D) Natura men te, es artl' f)' cial añadir un eqUllt mo a a~ora a de~as pr~~os2de esta manera, pero nuestro interés en este juego dIlema, e os 't'vo que sustan h' va. En la próxima sección veremos que es mas exposll , 'h d uilibrios . tidos infinitamente comparten este espm I e eq .. los Juegos ~epe '1' d etapa que se repiten infinitamente tienen . " u'Iti les mc1uso SI os Juegos e m . ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en un UNCOeq. . de etapa artificial en el contexto Sl1nple . , n analIZamos un Juego est~::cC1:riodos, y nos preparamos con ello para el análisis poster~or de de p ..' 'co en un contexto con honzonte un juego de etapa con mteres economl , infinito.
1,1 5,0 0,0 0,5 4,4 0,0 0,0 0,0 3,3 Figura 2.3.3
Supongamos que el juego de etapa de la figura 2.3.3 s.ejuega dos veces, h b' do los J'ugadores observa d o e1 resu lt a d o de la .pnmera etapa antes a len . l d Demostraremos que existe. un único resultado de que empIece a segun a. . (c c) erfecto en subjuegos de este juego, en el que el par de estrategIas 1, 2 P . l' etapa 14 Corno en la sección 2.2.A, supongamos que se Juega en a pnmera . . . .. 22 A Si G tiene un único resultado perfecto en dos etapas de la clase defin~da en Ia.s~cClon ~lt~d'o perfecto en subjuegos: en cada etapa se subjuegos, entonces G(T) hene un unlCOres juega .el resultado perfecto en subjuegOdsfide.~. la nodón de resultado perfecto en subjuegos 14E '-' tamente hablando hemos e ni o S'HC ' '. 'd l .. 22 A El dilema de los presos en dos etapas ól 1 1 se de juegos defim a en a seccJOn . . . . s o para a e a da resultado factible del juego de la primera eta pa eXlste pertenece a esta clase, porque para ca d l gunda etapa Sin embarg0. el Tb' d N sh en el juego que que a en a se . un único eqU11 no e ~ . n el . e o de e~apa de la figura 2.3.3 no pertenece a juego en dos etapas Tepehdo, basadh.oe u'~pfes equilibrios de Nash. No vamos a extender tIque el ¡U.ego de etapa ene m. . 11 es a c ase, por b' os de forma que sea apiJea ) e a formalmente la definición del resultado perfecto en su Jueg
84 / JUEGOS DlNÁ,vllCOS CON INFORfvIAC¡ÓN COMPLETA (e. 2)
en la primera etapa los jugadores prevén que el resultado de la segunda etapa será un equilibrio de Nash del juego de etapa. Puesto que este Juego de etapa tiene más de un equi.librio de Nash, ahora es posible que los Jugadores prevean que a resultados diferentes en la primera etapa les sIguen equilibrios diferentes del juego de etapa en la segunda etapa. Supongamos, por ejemplo, que los jugadores prevén que (Dl,Dz) será el resultado de la segunda etapa si el de la primera etapa es (Cl,CZ), pero que (II,1z) será el resultado de la segunda etapa si el resultado de la primera etapa es cualquiera de los ocho restantes. La interacción entre los jugadores en la primera etapa se concreta entonces en el juego de una etapa de la figura 2.3.4, donde (3,3) se ha sumado a la casilla (C],Cz) y 0,1) se ha sumado a las otras ocho casillas.
2,2 g,1 1,1
!
1-:'"
--
1,6
]1 1,1
1,1 1,1
~''!.
Figura 2.3.4 Existen tres equilibrios de Nash con estrategias puras en el juego de la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2, los equilibrios de Nash de este juego de una etapa corresponden a los resultados perfectos en subjuegos del juego repetido original. Denotemos con «w,x),(y,z) un resultado del juego repetido: (w,x) en la primera etapa y (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4 corresponde al resultado perfecto en subjuegos «(1],[Z),(1],[2» del juego repetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z) como consecuencia de cualquier resultado en la primera etapa excepto de (C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura ~.3.4 corresponde al resultado perfecto en subjuegos «Dl,Dz),(11'!Z» del Juego repetido. Estos dos resultados perfectos en subjuegos del juego repehdo simplemente enlazan los resultados de los equilibrios de Nash de los juegos de etapa, pero el tercer equilibrio de Nash de la figura 2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones es nunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidones mduso mas generales.
Juegos rq;elidos / 85 2.3.4 corresponde al resultado perfecto en subjuegos «Cl,Cz),(D],D2») del juego repetido, puesto que el resultado previsto en la segunda etapa es (Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado' anteriormente, se puede alcanzar la cooperación en la primera etapa de un resultado perfecto en subjuegos del juego repetido. Esto es un ejemplo de un resultado más general: si G = {Al,'" ,An; uI- ... ,un} es un juego estático con información completa que tiene múltiples equilibrios, pueden existir resultados perfectos en subjuegos del juego repetido G(T) en los que, para cualquier t < T, el resultado de la etapa t no es un equilibrio de Nash de G. Volveremos sobre esta idea en el análisis de un juego con horizonte infinito en la próxima sección.
La conclusión principal que debemos sacar de este ejemplo es que las amenazas o las promesas creíbles sobre el comportamiento futuro pueden influir en el c~mportamiento presente. Sin emba'rgo, desde otra perspectiva, puede que quizás el concepto de perfección en subjuegos no utilice una definición de credibilidad lo suficientemente fuerte. Al derivar el resultado perfecto en subjuegos «C],CZ),(D1,Dz», por ejemplo, hemos supuesto que Jos'jugadores prevén q~e (DI,Dz) s~rá el resultaclü, de la segunda ronda si el resitltado en la primera etapa es (C],Cz), y q~~ (I¡'!z) será el resultado en la segunda etapa si eIde la primera ronda es cualquiera de los ()chorestantes. Pero jugar (11,!2)enléi.se~da etapa, con unas ganancias de 0, 1), puede parecer poco atractivo~a:hdo (DI,Dz), con una ganancia de (3, 3), está también disp¿nible cci~oe'luilibrio de Nash del juego de etapa que queda. Dicho en términos poco preciSos. parecería natural que los jugadores renegociiü-an:15.SiJC1,cz) no es'~i resultado de la primera etap~ del-juego, e~d~'~{~e~u'p'~~equ~~~'j~g~á (I¡'!z) en la segu~cl,~~ta,pa, cada jugadorp_~t;4-;;"p~TIs~que_lo p~sadQ; pasado está, y que se debe jugar el eqüilibriodel juegbdeetapa (Dl,D~) unánimemente preferido. Pero si (DI,Dz)va a serelr~sÚltado de la segunda etapa independientemente de cuál sea el rescltadoenla primera ronda, el incentivo para jugar (Cl,Cz) en ia prirñ~~áet~p.a_desaparece: la interacción entre los dos jugadores en la p'riill~;a~tapa' s~~~~.duce al juego de una etapa en el que la gánancia (3, 3Yse'ha~stÜÍ1adóacada casilla del juego de etapa de la figura 2.3.3; d'e'fo~a que Ji e~ la mejor respuesta a Cj del jugador i. ' '. . ."._.. '. ','
15 Decimos que es impreciso p~rq~~"renegociar" sugiere que hay comunicadón (o incluso negodadón) entre la primera y la"Segunda e,tapa. Si esto fuera posible, debería añadirse a la descripdón y análisis del jue¡;¡m.'Aquí súpimemos que no es así, de forma que lo que entendemos por "renegodar" no-esotra cosa que un ejerddo de introspección.
Juegos repetidos / 87
86 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e 2)
JI 1,1 5,0 0,0 0,0 0,0
Cl 0,5 4,4 0,0 0,0 0,0 DI 0,0 0,0 3,3 0,0 0,0 /:;~
PI 0,0 0,0 0,0 4,! 0,0 Ql
0,0 0,0 0,0 0,0 !,4 Figura 2.3.5
Para acercamos a la solución de este problema de renegociación,-con~ sideremos el juego de la figura 2.3.5, que es aún más artificial qué él j\.tego de la figura 2.3.3. Una vez más, huestro interés en este juego' ~s más expositivo que económico. Las lciJ~ásquééstamosdesarrollándó pái~-tTa: tar él tema de la renegociación en esté juego artificial se pueden aplicar también a la renegociación en juegos infinitamente repetidos; véase Fairell y Maskin (1989),por ejemplo. " Eneste juego de etapa se añaden las estrategi~s Pi y Qia1juego de etapa de la figUra 2.:5.3.Existen cuatro equilibrios de Nash con estrategias purasdeljuego de etapa: (IJ,h)' (Dr,1J2) Y ahora también (Pl,P2) y (Ql,Q2)' Como antes, los)ugadores prefieren unánimemente\D1,D2) a (h,h). Más importante aún, no hay ningún equilibrio de Nash (x,y) en lélfigUra 2.3.5 t~l que los jugadores prefieran unánimemente (x,y) a (Pl,P2); (Q1;Q2) o (Dl;D2). Decimos entonces que (Dl,D2) domina en el sentidO de PÚeto' a (IJ,h), y que (P1,P2),(Ql,Q2) y (Dl,D2) están en Ía fronterade Paretode las ganancias de los equilibrios de Nash del juego de etapa de la figtira2.3.5. Supongamos que el juego de etapa de la figura 2.3.5 se'juega dos veces, habiendo los jugadores observado el resultado de la prirnéfa\511da antes de empiece la segunda. Supongamos adicion~J~erit~gue los jugadores prevén' que el resultado de la segundaétapa será el sigUi~nte: (DJ,D2) si el resultado dela primera etapa es (Cl,C2); (PI ,P2) sieiiés'U1tadü de la primera etápa es (Cj,w), donde 1JJ puede ser cualquierco~amE:Ílos C2; (Ql,Q2) si el resultado de la primera etapa eS (x,C2), donde x puede ser cualquier cosa menos Cl y (DJ,D2) si el resultado de la primera etapa es (y,z), donde y puede ser cualquier cosa menos y zpuedes~;, ctialquier cosa menos C2. Entonces «Cl,C2),(Dl,D2» es un resultSegunda ronda, no existe otro equilibrio del juego de etapa preferido por !-F ' ., .eljugador que castiga, de forma que no se puede persuadir al jugador que castiga de que renegocie la penalización. 2.3.B Teoría:Juegos
repetidos
infinitamente
Pasamos ahora a los juegos repetidos' infinitamente. Como en el caso de un horizonte finito, el tema principal es el de que las amenazas o las promesas, creíbles sobre el comportamiento futuro pueden influir en el comportamieritopresente\ En el caso de un horizonte finito vimos que si existen equilibrios de Nash múltiples del juego de etapa G, pueden existir resultados perfedos en subjuegos del juego repetido G(T) en los que, para ,rualquier t < T, el resultado de la etapa t no es un equilibrio de Nash de G. ~ Untesultado más poderoso se da en los juegos repetidos infinitamente: intruso si el juego de etapa tiene un único equilibrio de Nash, pueden ','e3dstir muchos resultados perfectos en subjuegos en los que ning'uno de los resultados en cada etapa sea un equilibrio de Nash de G, _ Empezamos con el estudio del dilemá de los presos repetido in rinitamente. Consideramos a continuación la clase de juegos repetidos infini, tamente análoga a la clase de juegos repetidos finita mente definida en la o" :,'sécción anterior:' un juego estático con información completa, G, se repi te t:r;~LIfullutamente, habiendo los jugadores observado 10s'resultados de todas , las rondas anteriores antes de que empiece la etapa siguiente. Para esta . "cIase de juegos repetidos finita e infinitamente, definimos los conceptos de estrategia de un jugador, de subjuego y de equilibrio dé Nash perfecto el).,"súbjuegos.(En la sección 2.4.B definimos estos conceptos para juegos , dinámicos con información completa en general, no sólo para esta clase de juegos repetidos.) Utilizamos después estas definiciones para enuncia r .;
( ''-.(,
~ ..
1'.
~,
~8 / JUEGOS DINÁMICOS CON INFORMACIÓN
]¡¡egos repetidos /89
COMPLETA (c. 2)
y demostrar el teorema de Friedman (1971) (también llamado teorema de
tradición oral o teorema folk).I6
Jugador 2
h
D2
el valor presente de las ganancias, es decir, la ganancia total que podría ingresarse en un banco ahora de forma que produjera el mismo saldo al final de la sucesión. Definición. Dado un factor de descuento 5, el valor presente infinita de pagos 7f¡,7f2,7f3,' .. es
1,1 5,0 0,5 4,4
Figura 2.3.6
Supongamos que el dilema de los presos de la figura 2.3.6 se repite infinitamente y que, para cada t, los resultados de las t - 1 jugadas anteriores del juego de etapa se han observado antes de que la t-ésima etapa empiece. Sumar simplemente las ganancias de esta sucesión infinita de juegos de etapa no proporciona una medida útil de la ganancia de un jugador en el juego repetido infinitamente. Recibir una ganancia de 4 en cada periodo es mejor que recibir una ganancia de 1 en cada periodo, por ejemplo, pero la suma de ganancias es infinita en ambos casos. , Recordemos (en el modelo de negociación de Rubinstein ei para
cada jugador 'í y si (j está lo suficientemente cerca de uno, existe UI1 equilibrio de Nash perfecto en subjuegos del juego repetido infinitamente G(oo,ti) que alcanza (X], ... ,xn) como ganancia media. ' Pago al jugador 2
(0,5)
(.
(5,0)
Ganancia-al jugador 1
Figura 2.3.8 La demostración de este teorema repite los argumentos ya dados para el dilema de los presos repetido infinitamente, de forma que la relegamos al apéndice, Es conceptualmente inmediato pero algo complicado de notación extender el teorema a los juegos de etapa de buen comportamiento que'~~ ~~~ni,finitosni ~iáticos (veremos algunos ejemplos ~n las apli7 caciones dé las tres próximas secciones). En el contexto del dilema de lo~p~sos de la fiísuril 2.3.6.- el teorema de Friedman garantiza que puede alcanzarse cualquier punto en la región más oscura de la figura 2.3.8como ganancia media en Un equilibrio de Nash perfecto en subjuegos del juego rep~tido, siempre y cuando el factor de descuento esté lo suficientemente cerca de uno. , Concluimos esta sección esbozando dos derivaciones adicionales de la teoría de juegos repetidos infinitamente, que se complican al añadírseles la siguiente característica especial del dilema de los presos. En el dilema de los presos (de una etapa) de la figura 2.3.6, el jugador i puede estar seguro de recibir,como mínimo la ganancia de 1 del equilibrio de Nash, jugando 1;. En un juego de duopolio de Cournot de una etapa (como el descrito en la sección 1.2.A), por el contrario, una empresa no puede estar segura de obtener los beneficios del equilibrio de Nash produciendo
,, .:.
ei, debe ocurrir que (di - xi)/(di - ei) < lpara cada i, de foimá que eI~valormáximo de esta fracción para cualquier jugador sea también estrictamente menor que 1. Queda por demostrar que este equilibrio de Nash es perfecto en subjuegos. Es deCir,'que las estrategias del disparador deben constituir un equilibrio de Nash en cada subjuego de G(oo,o). Recordemos -que cada subjuegode 0(00,0) idéntico al propio G(oo,o). En el equilibrio de Nash con estrategias del disparador estos subjuegos pueden agruparse en dos clases: (i) subjuegos en los que los resultados de las etapas anteriores han sido (axl, .. -: ;a~n), y (ji) subjuegos'en los el resultado de al menoSú.ri¡{ etapa difiere de (axl,' .. ,axn)' Si los jugadores adoptan la estrategia 'del disparador en el juego completo, (i) las estrategias'dé los jugadores ériun' subjuego de la primera etapa son de nuevo las estrategias del disparador que, tal como acabamos de demostrar, constituyen un equilibrio de Nash del juego completo, y (ii) las estrategias de los jugadores emin subjuegdcle . la segunda das e consisten simplemente en repetir el eqcilibno~a~IJiiegÓ de etapa (ael,' .. ,aen), lo que también es un equilibrio de Nash d~l jrieg;;~" completo. Por tanto, el equilibrio de Nash conestrategiasciel cfu;Parador del juego repetido infinitamente es perfecto en subjuegOs.
es
qué
':,.,
....... '
':.."
,
2.3.C Colusión entre duopolistas de Coumot Friedman (971) fue el primero en demostrar que podria alcanzarse la cooperación en un juego repetido infinitamente utilizando estrategias que consistieran en elegir para siempre el equilibrio de Nash del juego de etapa después de cualquier desviación. Originalinente se aplicó a los casos de colusión en un oligopolio de Cmimot, del siguiente modo: Recordemos el juego deCoumot estático de la sección 1.2.A: Si la cantidad agregada es Q =; ql + q2, el precio de equilibrio es P(Q) = a - Q, suponiendo que Q < a. Cada empresa tiene un,coste marginal e y no tiene
--------
•.
102 / JUEGOS DINÁMICOS CON INFORMACIÓN
COMPLETA (c. 2)
Jllegos repel idos / 103
costes fijos. Las empresas escogen sus cantidades simultáneamente, En el único equilibrio de Nash, cada empresa produce una cantidad (a - c)/3; a la que llamaremos la cantidad de Cournot y,denotaremos por qc. Dado que en equilibrio la cantidad agregada, 2(0. - e)/3 es mayor que la cantidad de monopolio, qm == (a- c)/2, ambas empresas estarían mejor si cada una produjera la mitad de la cantidad de monopolio, q¡ = qm/2.
" ",',
Consideremos el juego repetido infinitamente basado en este juego de etapa de Cournot, cuando las dos empresas tienen el mismo factor de descuento 6. Calculemos ahora los valores de 6 para los Wo (es decir, que para el trabajador es eficiente estar empleado por la empresa y esforzarse). Necesitamos una condición más fuerte si estas estrategias han de formar un equilibrio de Nash perfecto en subjuegos: (2.3.5) y (2.3.7) implican Y-e> - 'tilo +
1-/5
---e 60 - p)
,
111
que puede interpretarse como la restricción f~~liar de que fj debe ser lo suficientemente alta para lograr una cooperaclOn sostenIda. Hemos demostrado hasta ahora que si (2.3.5) y (2.3.7) se cumplen, las .estrategias que estamos considerando son un equilibrio de Nash: .Para demostrar que estas estrategias son perfectas en subjuegos, defJmmos primero los subjuegos del juego repetido. Recordemos que cuan~'¡o el juego de etapa obliga a decisiones simultáneas, lo~ subJuegos ~el Juego repetido empiezan entre las etapas del juego repetido. Para el Jue1?ode etapa de decisiones sucesivas considerado aquí, los subjuegos empIezan no sólo entre etapas sino también dentro de cada etapa, después de que el trabajador observa el salario que la empresa ofrece. Dadas las estrategias de los jugadores, podemos agrupar los subjuegos en dos clases: los que empiezan después de una historia de salario alto y producción alta, y los que empiezan después de todas las demás historias. Hemos demosb'ado ya que las estrategias de los jugadores son un equilibrio de Nash dada una historia de la primera clase. Queda por hacer lo mismo cor~una historia del segundo tipo: como el trabajador no se esforzará l1\1nca,es una decisión óptima de la empresa inducir al trabajador a trabajar como independiente; dado que la empresa ofrecerá V) == O en la siguiente etapa y en lo sucesivo, el trabajador no debería esforzarse en esta etapa y debería aceptar lá oferta presente sólo si 'w 2: O. En este equilibrio, trabajar como independiente es permanente: si se descubre al trabajador no esforzándose, la empresa ofrece 1J) == O en lo sucesivo; si la empresa se desvía alguna vez de ofrecer w ==. w*, el t.rabajador nunca volverá a esforzarse, de fiJrma quela empresa no puede permitirse emplear al trabajador. Hay varias razC?naspara preguntarse si es razonable que el trabajo como independiente sea permanente. En nuestro modelo de una empresa y un trabajador, ambos jugadores preferirían volver al equilibrio de salario alto y producción alta del juego repetido infinitamente, antes que jugar para siempre el resultado perfecto en subjuegos del juego de etapa. Éste es el problema de la renegociación presentado en la sección 2.3.A. Recordemos que si los jugadores saben que no se podrán hacer cumplir las penalizaciones, la cooperación inducida por la amenaza de estas penalizaciones ya no es un equilibrio. En el contexto del mercado de trabajo, la empresa puede preferir no renegociar si emplea muchos trabajadores, ya que renegociar con un trabajador puede estropear el equilibrio de salario alto y producción alta que se está todavía jugando (o aún sé ha de empezar a jugar) con los otros trabajadores. Si hay muchas empresas, la cuestión es si ~aempresa .i con-
,'.
'112
í
JUEGOS DlNÁMJCOS CON INFORMACJÓN
COMPLETA (c. 2)
tratará a trabajadores empleados anteriormente en la empresa .¡. Pudiera ser que la empresa j no lo hiciera, por miedo a estropear el equilibrio de salario alto y producción alta logrado con sus trabajadores, como en el caso de una única empresa. Algo así puede explicar la falta de movilidad de los administrativos jóvenes y varones entre las grandes empresas en Japón. Alternativamente,si los trabajadores despedidos pueden siempre encontrar nuevos empleos que sean preferibles a trabajar como independientes, el salario en esos nuevos empleos (neto de cualquier desutilidad del esfuerzo) es el que aquí juega el papel del salario en el trabajo por libre lUo. En el caso extremo en el que un trabajador despedido no sufra ninguna pérdida, no existirán penaliza'ciones por no esforzarse en el juego repetido infinitamente y, por consiguiente, no existirá ningún equilibrio de Nash perfecto en subjuegos en el que el trabajador se esfuerce. Existe una aplicación elegante de estas ideas en el contexto de la deuda pública externa en Bulow y Rogoff (1989): si un país endeudado puede conseguir el importe de los créditos a largo plazo que recibe de los paíSes acreedores mediante transacciones a corto plazo por adelantado en el mercado internacional de capitales, no hay posibilidad de penaliZ~r eliricumplimiento de los términos de la deuda en el juego repetido infinitamente entre paíSes deudores y acreedores.
fllegos repetidos / 113
la autoridad monetaria observa esta expectativa y escoge el nivel real de inflación, -¡r. La ganancia de los empresarios es - (7[- 7[e)2. Es decir, los empresarios quieren simplemente prever correctamente el nivel de inflación; alcanzan su ganancia máxima (que es cero) cuando -¡r= 7[e. A la autoridad monetaria, por su parte, le gustaría que la inflación fuera cero . pero que la producción estuviera en su ruvel de eficiencia (y*). Escribimos la ganancia de la autoridad monetaria como U(-¡r,y),=
::-C'Tr2
_ (y _y*)2,
donde el pªiá,meti-o c > O refleja el dilema de laaú,-t?I1d~dITl();l1~;~ria ~n~,~ S115 dos ~lJjeti~os'?llPo!;ga.mos q';le el verdad~!(): !ÚyeI d~ pr,c)~}lc.ción es i~sigule;tefuIíd¿n del ~velde producción deseado'y de la in£l.ac.i~~ ' iIDpfevista'; " , , , + d(-¡r - -¡re),
y =by*
donde b < 1refleja ,la presencia de un poder de monopolio en los mer~ cados de productos (de forma. que si no hubiera inflación imprevista; se produCiría a un nivel por debajO del de eficiencia) y d >' O mide el efecto de la iriflaciQrlin1prevista sobre.la producción a través de los salarios reales; tal ycomo se describió en el párrafo anterior. Podemos entonces reescribrr la ganancia de la autoridad monetaria como. .
2.3.E Política monetaria estable en el tiempo W(-¡r,7[e)
Consideremos un juego de decisiones sucesivas en el que empresarios y trabajadores renegocian los salarios nominales, después de lo rualla autoridad monetaria escoge la oferta monetaria que, a su vez, determina la tas'a de inflación. Si los contratos salariales no pueden' ser automáticamente achlalizables, empresarios y trabajadores tratarán de prever la inflaCión antes de fijar los salarios. Sin embargo, una vez se ha fijado el salario nominal, un nivel real de inflación superior al previsto erosionará el salario real, haciendo que los empresarios aumenten el empleo y la producción. La autoridad monetaria, por tanto, se enfrenta aun dilema al tener que escoger entre los costes de la inflación y las ventajas de reducir el paro y aumentar la producción ante una evolución impreVista del nivel de inflación. Como en Barro y Cardan (1983), analiZamos una versión en forma reducida de este modelo en el siguiente juego de etapa. Primero, los empresarios forman sus expectativas de inflación, -¡re.En segundo lugar,
=
+d(-¡r - 7[e)]2.
_c-¡r2 - [(b - l)y*
d~¿~~tp.J~
Para h~llar el resultadop;d~to en subjuego~A~:'~!~'jt;~~9. calculambs primero la elección óptima de-n: por Bme~ela,aut0!fd~9 monetari~¡-a.adas l~s exp~étativas de los einpresarib~ -¡re.MaximiZando W(-¡r,-¡re) obtenemos
d
'
1l'*(-¡re) = --:J?[(l c+ u-
b)y*
+ d-¡re].
(2.3.8)
Dado qJle.los empresarios prevén que la autoridad monetaria escogerá -¡r*(-¡re), i~$'empresarios escogerán la -¡reque maximice _[-¡r*(7[e)- -¡re]2,lo que da1r*(-¡re)= -¡re,o,., d(1 - b) *' = ,-¡r., -¡re = ---y c
donde el subíndice s denota, "juego de etapa". De forma similar, podría deCirse que la expectativa' niCiomilque los empresarios deben mantener
.'
~:;,,
~ ,
;:~;~~\:i!~W;Ú.;,~,\
••~r,.lol~J~:~:.i~;~\"1'~'.\I'.I';,;¡,,:,;1;'r,,,,l..l.'~I' .••.,,.:.,,••;"" ••.:.:"'J.._~'
~-...:..!...~...:..-'~~L~,I ...•.•.•...•. _ •.~I;.l...;.'--:'
maX(Vi - bi) Prob{bi
b(vj)}.
donde k es una constante de,integración. Para eliminar k necesitamos una condición de frontera. Afortunadamente, un razonamiento económico simple nos ofrece una: ningún jugador debería pujar por encima de su propia valoración. Por tanto, debe cumplirse que b(Vi) ::; Vi para cada Vi. En particular, debe ocurrir que b(O) ::; O. Puesto que las pujas están restringidas a ser no negativas, esto implica que b(O) = O,Yentonces k = () y b(Vi) = v¡f2, como dijimos.
bi
Sea b-1 (bj) la valoración-que el participante j debe tener para pujar bj; esto es, b-1(bj) = Vj sibj = b(vjtP.4esto que.vj está uniformemente clistribuida en [O,ll,Prob{bi > b(1jÚt= Prob{b:2-I(b»> vü= b-1(bi). La condición de primer orden.para la opti~zación del probletriadél jugador ies .
-b-1(bi)
d' + (Vi ~ bi) db. b-¡(bi) '1
= O.
.;
•
Esta condi Xb e Yb > x" no existe ningún juego de negociación al que quisieran jugar el comprador y el vendedor que tenga un equilibrio bayesiano de Nash en el que el intercambio ocurra si y sólo si es eficiente. En la próxima sección vamos a indicar cómo puede utilizarse el principio de revelación para demostrar este resultado general. Concluimos esta sección aplicando este resultado al modelo de empleo de Hall y Lazear: si la empresa tiene información privada sobre el producto marginal m del trabajador y el trabajador tiene información privada sobre una oportunidad alternativa ti, no existe ningún jÚe'gode negociación que la empresa y el trabajador quisieran jugar que 'produZca empleo si y sólo si es eficiente (es decir, si y sólo si m2: v).
3.3 El principio
de revelación
El principio de revelación, debido a Myerson (1979) en el contexto de los juegos bayesianos (yen otros en contextos relacionados), es Un ins~ trumento importante para diseñar juegos cuando los jugadores tienen información privada. Puede aplicarse a los problemas de las subastas y del intercambio bilateral descritos en las dos secciones anteriores, así como a una amplia gama de problemas. En esta sec~ión enunciamos y demostramos. el principio de revelación para juegos bayesianos estáticos. (La extensión de la demostración' a juegos bayesianos dinámicos es in" mediata.) No obstante, antes de hacerlo, vamos a indicar cómo se utiliza el principio de revelación en los problemas de subastas y de intercambio bilateral. ' Consideremos un vendedor que quiere diseñar una subasta que maximice sus ingresos. Sería una ardua tarea detallar todas y cada una de las diferentes subastas posibles. En la subasta dela sección ;3,2.B, por ejemplo, el participante que puja más alto paga al vendedor y consigue el bien subastado, pero existen muchas otras posibilidades. Los participantes, por ejemplo, pueden tener que pagar una entrada, De forma más general, algunos de los participantes que pierden pudieran tener que pagar dinero, tal vez en cantidades que dependan de sus pujas y de las de los demás. También podría el vendedor establecer un precio de reserva, un precio mínimo por debajo del cual no se aceptaran pujas. De forma más general, puede existir cierta probabilidad de que el vendedor se quede con el bien
o de que éste no siempre vaya a quien puje más alto. Afortunadamente, el vendedor puede utilizar el principio de revelación para simplificar considerablemente este problema de dos maneras. En primer lugar, el vendedor puede limitar su atención a la siguiente clase de juegos: 1. Los participantes hacen declaraciones (posiblemente falsas) sobre sus tipos (es decir, sus valoraciones). El jugador i puede declarar ser cualquier tipo Ti del conjunto Ti de posibles tipos de i, independientemente de cuál sea el verdadero tipo i, k 2; Dadas las declaraciones de los participantes (TI,' .. ,Tn), el jugadori ofrece Xi(Tlt .. "Tn) y recibe el bien subastado con probabilidad qih, . .. ,Tn). Para cada posible¡;ombinación de declaraciones h, ...,Tn),la suma de las probabjlidades ql (TI,' , . ,Tn) + ". + qn(Tl," .,Tn) debe ser menor o igual a uno.
Los juegos de esta clase (es decir, los juegos estáticos bayesianos en los cuales la única acción del jugador es hacer una declaración sobre su tipo) se llaman mecanismos directos. La segunda manera en la que el vendedor puede utilizar el principio de revelación es limitando su atención a los mecanismos directos, en los cuales decir la verdad constituye un equilibrio bayesiano de Nash para cada participante, es decir, a l¡¡s funciones de oferta y de probabilidad {Xl (TI", . ,Tn),. ,. ,Xn(Tl,' .. , Tn); ql (TI,' .. ,Tn), ... ,qn(Tl,'", taun)} tales que la estrategia de equilibrio de cada jugador i sea declarar Ti (t;) =ti para cada ti en n. Un mecanismo directo en el cual decir la verdad constituye un equilibrio bayesiano de Nash se llama de incentivos compatibles. Fuera del contexto del diseño de una subasta, el principio de revelación puede seguir siendo utilizado de estas dos maneras. Cu~lquier equilibrio bayesiano de Nash de un juego bayesiano puede representarse