juegos repetidos

July 10, 2017 | Author: Alejandra Sanchez Chiroque | Category: Profit (Economics), Business, Leisure
Share Embed Donate


Short Description

Descripción: resumen del tema y ejercicios...

Description

Universidad Nacional Mayor de San Marcos Facultad de Ciencias Econ´ omicas ´ n de Juegos Repetidos Teor´ıa y Aplicacio

Gomez Pizarro, Julissa Gutierrez Ventura, Elizabeth Jes´ us Apari, Kevin Mezones Ccorimanya, Ghissell Ruiz Coral, Juan S´anchez Chiroque, Alejandra

Aula : 215 − D Docente: Wilfredo Bacilio Alarc´on

Lima, Per´ u - 26 de noviembre de 2015

´ MARCO TEORICO 1.

Introducci´ on

Los juegos empleados a lo largo de este curso, convencionalmente se han resuelto de la siguiente manera: cada uno anuncia la estrategia que ha seleccionado, de tal manera que se impone una de las salidas, con la correspondiente distribuci´ on de ganancias; ac´a termina el asunto. Si ninguno de los jugadores rechaza su elecci´ on, despu´es de constatar la de los otros, entonces existe un equilibrio de Nash. El hecho de que todo se arregla en una sola oportunidad es evidente inc´omodo, sobre todo si la salida retenida es sub-´ optima. De ac´ a se desprende la idea de juegos repetidos, que permitir´ıa evitar semejantes salidas, para el bien de todos. C´omo no pensar en un proceso de ajuste, con una correcci´ on progresiva de los errores, hasta lograr una salida ´optima En efecto, y como es frecuente cuando se desea traducir a una forma matem´ atica lo que parece tener un buen sentido, la modelaci´on de tal proceso no es evidente, particularmente en el marco de la teor´ıa de juegos. Efectivamente, para que la modelaci´on pueda determinar cuales son las preferencias racionales, debe precisar la informaci´on que tiene cada uno sobre las salidas del juego y tambi´en sobre el comportamiento de los otros y las reglas del juego por ejemplo, orden y n´ umero de los golpes. Ahora, puede no existir problemas de aprendizaje en el marco de una informaci´on completa empleado hasta el presente, en tanto los jugadores tienen una visi´on de conjunto del juego repetido y de todas sus etapas posibles y se encuentra, por tanto, en una situaci´on parecida a la del juego simple en el cual estos solo tienen que determinar su estrategia ´optima. De la misma manera existe un equilibrio de Nash si es cierto que las estrategias retenidas para un juego repetido, en ocasiones denominado superjuego, no hacen arrepentir a ning´ un jugador de la decisi´on tomada. Sin embargo, incluso si en una situaci´ on con informaci´on completa, ning´ un juego repetido difiere fundamentalmente de juego normal, conviene subrayar que presenta ciertas caracteristicas propias: de un lado, su n´ umero de estrategias aumenta exponencialmente con el n´ umero de veces que se repita el juego y permite vislumbrar una gran diversidad de situaciones; por otro lado tal salida conduce a la situaci´on de introducir el concepto de amenaza, que de hecho resalta muy bien el car´acter condicional de las estrategias si ´el hace esto, yo respondo con aquello, pero tambi´en condiciona la idea b´asica del equilibrio de Nash: toda desviaci´ on unilateral por parte de un jugador implica una sanci´on por parte de los otros, o de algunos de ellos, sin que se tenga que recurrir a una instancia externa

2.

Definici´ on

Los juegos repetidos, son una familia particular de juegos din´amicos con una estructura temporal simple, consistente en que durante varias etapas determinados jugadores( los mismos en cada etapa) completan un determinado juego, siempre el mismo, llamado tambi´en juego de etapa(stage-game), haci´endose p´ ublicos los resultados y recibiendo cada jugador sus pagos tras cada etapa1 Observaci´ on 1 Debe entenderse que una situaci´ on con estas caracter´ısticas no es una mera acumulaci´ on de juegos sueltos, sino que constituye un juego complejo en el que las jugadas en las etapas posteriores se pueden hacer depender de como se jug´ o en etapas anteriores y, en consecuencia, las jugadas en una etapa determinada pueden decidirse seg´ un sus consecuencias en etapas posteriores. 1

Teor´ıa de Juegos; Cerda,Joaqu´ın & P´erez Jos´e Jimeno; Capitulo 7; 2004; Pearson Educaci´ on

3.

Campo de aplicaci´ on

Debido a que las interacciones sociales y econ´omicas repetidas son muy habituales e importantes, es l´ogico pensar que su modelaci´ on mediante juegos repetidos puede ser fruct´ıfera para comprender ciertos aspectos importantes de la realidad econ´omica y social. Mediante los juegos repetidos se pretende modelar aquellas relaciones econ´omicas, pol´ıticas, sociales, etc., a las que los individuos se enfrentan de un modo repetido o rutinario, como por ejemplo la competencia entre vendedores, las negociaciones sindicales, o cualquier otro tipo de relaci´on en la que los mismos agentes tienen que enfrentarse o negociar entre s´ı, no de un modo u ´nico sino en distintos momentos del tiempo y de una forma repetitiva.

4.

Factor descuento

Como en el tema de los juegos repetidos se toma en cuenta el horizonte temporal es importante evaluar que en un juego la valoraci´ on de los resultados en distintos periodos del tiempo es diferente. Los agentes econ´ omicos prefieren disponer del dinero en una fecha cercana que en una lejana. Esta preferencia por el ahora frente al ms tarde cabe atribuirla esencialmente a dos razones o factores. • La primera radica en la seguridad del presente frente a la incertidumbre del futuro .En virtud de esta raz´on, ning´ un agente presta dinero a una operaci´on econ´omica arriesgada si no recibe como promesa de pago futuro una cantidad sustancialmente mayor que la que prest´o, de modo que se compense el riesgo de que la promesa no se cumpla. Se le simboliza con β • La segunda raz´ on procede del hecho de que disponer ahora del dinero nos da m´as oportunidades de actuaci´on que disponer de ´el en el futuro, aunque sea seguro que esa promesa de disponibilidad futura se va a cumplir. Se le simboliza con r (costo de oportunidad) Factor descuento de un jugador δ : factor de descuento es el valor, en unidades de pago actuales, de una unidad de pago que se hara efectiva un periodo m´as tarde. 1 δ= 1+r dos casos extremos. • δ = 0: El agente solo valora el presente (impaciencia extrema) • δ = 1: En este caso el agente valora en igual medida el futuro que el presente (paciencia extrema) Observaci´ on 2 Recordemos la f´ ormula de la suma de los t´erminos de una progresi´on geom´etrica de raz´on δ y primer t´ermino igual a la unidad, pues nos ser´ au ´til en las discusiones que siguen. Dada la sucesi´on geom´etrica {gt }t=1,2,3,... donde gt = δ t−1 , asimismo, la suma de sus primeros T t´erminos viene dada por: T X

δ t−1 =

t=1

1 − δt 1−δ

la suma infinita, dado que 0 < δ < 1 es: ∞ X t=1

5.

δ t−1 = l´ım

t→∞

T X t=1

δ t−1 =

1 1−δ

Horizonte Finito

Es un juego din´ amico en el que un juego simult´aneo (juego de etapa) se juega un n´ umero finito de veces y los resultados de cada etapa son observados antes de la siguiente • para el juego en etapa G = {A1 , ..., An, ; g1 , ..., gn } se dice que a las estrategias puras (a las que llamaremos acciones), a las estrategias mixtas y a las funciones de pagos o ganancias del jugador i las denotaremos ai , αi , gi respectivamente.

• Para el juego repetido o global (GT (δ)) a las estrategias puras, a las estrategias mixtas y a las funciones de pagos o ganancias del jugador i las denotaremos si , σi , ui respectivamente. • Tenemos un vector de factores de descuento δ = (δ1 , δ2 , ..., δn ) que para todos los jugadores son iguales a 1. • Se toma en cuenta que antes de que empiece el juego se dice que es dominio p´ ublico, y en los juegos de etapa se dice que antes de que comience cada etapa las jugadas realizadas en etapas anteriores son de dominio p´ ublico.

5.1.

caso I

El juego repetido tiene un u ´nico ENPS si el juego de etapa (el juego simult´aneo) tiene un u ´nico EN. Sea G un juego en forma estrat´egica. • Si G tiene un u ´nico equilibrio de Nash, entonces para cualquier T finito y cualquier factor de descuento δ el juego repetido δ T (δ) tiene un u ´nico ENPS, que consiste en que cada jugador juegue de manera incondicionada en cada etapa su u ´nica estrategia de equilibrio. • Si todos los equilibrios de Nash de G resultan en los mismos pagos, entonces para cualquier T finito y cualquier factor de descuento δ, cualquier ENPS del juego repetido δ T (δ) prescribe que en cada etapa se juegue un EN del juego de etapa G. Caracter´ısticas del juego • Dos jugadores juegan el mismo juego simult´aneo dos veces, en t = 1 y en t = 2 • El resultado de la primera vez que se juega (de t = 1) es observado antes de jugarlo una segunda vez. • El pago del juego repetido es la suma de los pagos en cada jugada (t = 1, t = 2). • Se juega con el fin de que vaya apareciendo la conducta de cooperaci´on o colusi´on para obtener mayores beneficios. Como se observa en el la figura, es un juego repetido en dos etapas en la que los pagos totales se muestran en los nodos finales.

Figura 1:

Elementos del juego: • El juego presenta cinco conjuntos de informaci´on, en la primera etapa presenta un solo conjunto de informaci´on y en la segunda etapa presenta cuatro conjuntos de informaci´on. • Existe 5 subjuegos, cuatro en la segunda etapa y el juego completo.

Para dar soluci´ on a estos tipos de juegos primero se tienen que encontrar los equilibrios de Nash de cada subjuego para as´ı podar las ramas del ´arbol luego, una vez jugado la segunda etapa se prosigue a encontrar el equilibrio perfecto en subjuegos del juego. Implicancia: En estos tipos de juegos no es posible mantener la colusi´ on y la mejor respuesta ya que por su estructura temporal fija, es mejor encontrar un equilibrio (Nash) en la que da soluci´ on al juego.

5.2.

caso II

Si el juego de etapa tiene 2 o m´ as EN, pueden existir ENPS en los que en alguna etapa NO se juegan estrategias que sean EN sino que se juega algo que es mejor para los dos jugadores.Sea G un juego en forma estrat´egica, y sea el juego repetido GT (δ) en donde T es finito. • Cualquier ENPS del juego repetido tiene que dar lugar en la u ´ltima etapa a un EN de G. • Cualquiera de los resultados (α∗ (1), α∗ (2), ..., α∗ (T )), donde cada α∗ (k) es un perfil estrat´egico que es un EN de G, es un resultado perfecto en subjuegos de GT (δ). Adem´as, el perfil de estrategias σ = (σ1 , σ2 , ..., σn ) consistente en que cada jugador juegue de manera incondicionada en la etapa k-´esima la estrategia que le corresponde en α∗ (k) es un ENPS2 . La exigencia de que todo ENPS determine un EN en la u ´ltima etapa es una exigencia l´ogica derivada de la racionalidad de los jugadores. Todos los jugadores saben cu´al es la u ´ltima etapa. Este conocimiento hace que dejen de tener sentido todas las amenazas o promesas que se puedan hacer en dicha etapa, pues no hay turno para las represalias y castigos en caso de incumplimiento. No existiendo posibilidad de penalizaciones futuras, en la u ´ltima etapa cada jugador se comportar´a tal y como se comportar´ıa si el juego tuviese una u ´nica etapa, es decir, jugando una estrategia que determine para el conjunto de los jugadores un EN en dicha etapa.

6.

Horizonte Infinito

Los mismos jugadores juegan el mismo juego G periodo tras periodo. Tras cada periodo observan el resultado obtenido por ambos (y el vector de acciones elegidas). G: juego constituyente o de etapa G(T): juego repetido con horizonte temporal T La conducta estrat´egica en G(T) puede ser muy diferente a la conducta en G. En particular, si G es un dilema de los prisioneros, Bajo qu´e condiciones puede obtenerse cooperaci´on entre jugadores ego´ıstas en G(T)?

Problema: como evaluar una corriente o flujo de pagos? Mediante la suma de su valor presente o descontado, es decir, su valor en euros de t = 1 Factor de descuento de un jugador, δ, es el valor presente (euros de t = 1) de un euro que se obtendr´a ma˜ nana (en t = 2). 1 Si el tipo de inter´es es r, entonces: δ = 1+r Luego, 0 < δ < 1 Si δ tiende a 1, entonces el futuro importa bastante. Si δ tiende a 0, entonces el futuro importa poco. Adem´as del tipo de inter´es, influyen en el factor de descuento (en tus preferencias intertemporales) otros aspectos como los gustos, la probabilidad de continuar activo en el juego, etc. Horizonte temporal: 2

Teor´ıa de Juegos; Cerda,Joaqu´ın & P´erez Jos´e Jimeno; Capitulo 7; 2004; Pearson Educaci´ on

- finito: existe una fecha l´ımite que es conocimiento p´ ublico entre los jugadores. - infinito: no existe tal fecha l´ımite conocida de antemano. En cada periodo existe una probabilidad positiva de volver a jugar el siguiente periodo.

Estrategia de un jugador en G(T): Es una regla o plan que especifica qu´e acci´on adoptar en cada periodo como funci´on de cada posible historia previa del juego. La historia del juego en t es la secuencia de pares de acciones observadas hasta t − 1. Dos estrategias de cooperaci´ on condicional son: Estrategia del disparador Empiezo cooperando en t = 1, y luego coopero si siempre se coopera antes pero si en alg´ un periodo alg´ un jugador no coopera paso a no cooperar para siempre (tras toda historia). Observese que la longitud del castigo no depende de la conducta del otro en el castigo Estrategia del Talin o de Toma y Daca: Empiezo cooperando y luego juego lo que jug´ o mi oponente en el periodo anterior.

Ejercicio 1.1 Dilema del prisionero general Considere el siguiente DP sim´etrico: C c,c a,b

C NC

NC b,a n,n

donde a > c > n > b En el juego repetido con horizonte infinito se puede obtener cooperaci´on mediante estrategias de disparador si se cumple: c δ.n ≥a+ (1 − δ) (1 − δ) donde δ es el factor de descuento de ambos jugadores. Luego 0

δ≥δ =

(a − c) (a − n)

Si los jugadores siguen la estrategia de Toma y Daca (TD), entonces adem´as de la misma desviaci´ on que con la estrategia del Disparador (NC) en t = 1 y luego NC para siempre), existe otra posible desviaci´on: NC en t = 1 para luego volver a C en t = 2. Para que esta desviaci´on no sea provechosa deber´a cumplirse: c + δ.c ≥ a + δ.b que implica δ ≥ δ∗ =

(a − c) (c − b)

Luego, ambos jugadores jugando la estrategia TD es un EN del DP con horizonte infinito si: 0

δ ≥ m´ax {δ , δ ∗ } ¿Qu´e factores favorecen la cooperaci´ on? 1. Altos factores de descuento y altas probabilidades de continuaci´on. 2. Bajas ganancias netas por traicionar la cooperaci´on, a - c. 3. Altas ganancias individuales cuando todos los jugadores cooperan: c. Bajas ganancias individuales cuando todos no cooperan: n

EJEMPLO 1 7.

Juegos repetidos con horizonte finito

7.1.

Juego de etapa con un u ´ nico equilibrio de Nash

Supongamos el siguiente juego simult´ aneo G como juego de etapa: J1 / J2 A B

C 4,4 5,1

D 2,2 2,3

E -1,-1 -1,-1

Consideremos la repetici´ on de dos periodos del juego G, donde al final de cada periodo los jugadores consiguen la informaci´ on de cada periodo y sus pagos son la suma de los pagos por periodo. En otras palabras, el factor de descuento es igual a la unidad (δ = 1). Cuando este juego simult´ aneo se juega una sola vez (T=1), comprobamos que existe un u ´nico equilibrio de Nash (B,D) con pagos (2,3) J1 / J2 A B

C 4,4 5,1

D 2,2 2, 3

E -1,-1 -1,-1

No obstante, la acci´ on (A,C) proporciona unos pagos mayores (4,4) al pago otorgado por (B,D) pero no es un Equilibrio de Nash. Para Jugador 1: si el jugador 2 elige C U1 (B) > U1 (A) si el jugador 2 elige D U1 (B) ∼ U1 (A) si el jugador 2 elige E U1 (B) ∼ U1 (A) Para Jugador 2: si el jugador 1 elige A U2 (C) > U2 (D) > U2 (E) si el jugador 1 elige B U2 (C) > U2 (D) > U2 (E)

Como podemos observar, el jugador 1 presenta un dilema del prisionero debido a que la estrategia B es dominante lo que impide que el jugador 2 coopere. Si inducimos que el jugador 2 coopere, es decir qu juegue C, esto solo se cumplir´a en el primer periodo (T=1) y no en el siguiente periodo (T=2) debido a que no es un equilibrio del juego. La u ´nica forma de que ambos jugadores cooperen es mediante la amenaza de un castigo futuro pero no se cumple en el u ´ltimo periodo porque ya no existe futuro. Por lo tanto, para cualquier equilibrio de Nash de un juego repetido con horizonte finito, en el periodo T=2 se debe jugar un equilibrio de Nash. Por ejemplo, suponemos que el jugador 2 incorpora dicho castigo y decide cooperar, a continuaci´ on conoceremos las estrategias para cada jugador: Estrategia del jugador 1: (a) En el primer periodo (T = 1), jugar A. (b) En el segundo periodo (T = 2), jugar B, tras cualquier historia posible. Estrategia del jugador 2: (a) En el primer periodo (T = 1), jugar C. (b) En el segundo periodo (T = 2), jugar D , si el jugador 1 ha jugado A en T=1. Y jugar E si el jugador 1 ha jugado B en T= 1. si el jugador 1 se desv´ıa y el jugador 2 se mantiene fijo, tenemos las siguientes estrategias: Primer periodo (T=1): J1 / J2 A B

C 4,4 5, 1

D 2,2 2,3

E -1,-1 -1,-1

J1 / J2 A B

C 9,5 10,2

D 7,3 7,4

E 4,0 4, 0

Segundo periodo (T=2):

El jugador 1 en el primer periodo, obtiene un pago de 5 pero en u ´ltimo periodo el jugador 1 el pago que recibe disminuye en 1, es decir, obtiene un pago de 4. Por lo tanto, el jugador 1 no tiene incentivos de desviarse. Lo mismo ocurre con el jugador 2. Ante estos posibles escenarios, el u ´nico plan cre´ıble del jugador 2 es que jugar´a D en T = 2, sea cual sea la historia, es decir, lo sucedido en T = 1. Por supuesto, esta ausencia de una amenaza de castigo cre´ıble hace que el jugador 1 no coopere en el periodo anterior, T = 1. En definitiva, el u ´nico equilibrio perfecto del juego repetido lo constituye el par de estrategias : Estrategia del jugador 1:

(a) En el primer periodo (T = 1), jugar B. (b) En el segundo periodo (T = 2), jugar B, para cualquier historia. Estrategia del jugador 2: (a) En el primer periodo (T = 1), jugar D. (b) En el segundo periodo (T = 2), jugar D , para cualquier historia . El equilibrio que da lugar este par de estrategias es la mera repetici´on del equilibrio Nash de etapa: (B,C),(B,C) Generalizando, para cualquier juego repetido con horizonte finito G(T) con un u ´nico equilibrio de Nash en el juego G, el u ´nico equilibrio perfecto viene dado por la repetici´on en cada periodo del equilibrio de Nash del juego de etapa.

8.

Juegos repetidos con horizonte infinito Consideremos que el siguiente juego de etapa se desarrolla un n´ umero infinito de veces: J1 / J2 A B

C 1,1 0,5

D 5,0 4,4

El equilibrio de Nash de este juego son las estrategias (A,C) con pagos de (1,1) pero si ambos cooperan jugar´ıan (B,D) con pagos de (4,4). J1 / J2 A B

C 1, 1 0,5

D 5,0 4,4

Entonces, es posible mantener una cooperaci´on en el tiempo? Para descubrirlo usaremos la estrategia del gatillo (Tigger Strategy): (a) cooperar hasta que se produzca una desviaci´on. (b) Si se produce la desviacion, jugar no cooperativamente hasta el final. Si el jugador 1 juega la estrategia del gatillo, gana algo si el jugador 2 se desv´ıa en T? (i) Si no se desv´ıa: Tendr´ a una secuencia de pagos de (4,4) en el periodo T hasta el infinito, descontando esos pagos: 4 + 4δ + 4δ 2 + 4δ 3 + ... =

4 1−δ

(ii) Si no se desv´ıa: El jugador 1 jugar´a A del periodo T+1 en adelante y el jugador 2 responder´ a jugando C. Sus pagos ser´an 5,1,1,1,... Descontando esos pagos: 5 + 1δ + 1δ 2 + 1δ 3 + ... = 5 + Ahora, evaluamos ambos casos:

1 1−δ

4 1−δ

≥ 5+ δ ≥

1 1−δ

1 4

Por lo tanto la estrategia de gatillo del jugador 2 es mejor respuesta a la estrategia de gatillo del jugador 1 si δ ≥ 41 . Lo mismo ocurre para el jugador 1. En conclusi´ on, hay un Equilibrio de Nash en el que ambos juegan las estrategias del gatillo si δ ≥ 14 .

EJEMPLO 2 9.

Un juego de etapa con varios equilibrios Nash Consideremos la repetici´ on de dos periodos del siguiente juego simult´aneo 3 . J1 /J2 C D E

P 7,7 8,2 1,2

Q 2,8 5,5 1,1

S 1,2 1,1 2,3

Soluci´on:

Jugadores: N = {1,2}

Acciones: A1 = {C, D, E} A2 ={P,Q,S}

Estrategias:

Si ={3 ∗ 39 } = 310 , i = {1, 2}

Notamos que en el juego constituyente existen dos EN: EN = {(D, Q); (E, S)} El equilibrio (D, Q) que proporciona unos pagos de (5,5) y el equilibrio (E,S) que proporciona unos pagos de (2,3) y ninguno de estos EN es eficiente. Como se observa en el resultado eficiente (cooperativo) es (C, P) con unos pagos (7,7). En este caso, la cooperaci´on no es posible en el juego aislado, porque ambos jugadores se desviaran a una acci´on no cooperativa. Sabemos que en el segundo 3

La tasa de descuento de cada jugador es δ = 1

y el u ´ltimo periodo se jugara un EN del juego de etapa.4 Entonces, ¿podemos sostener en equilibrio perfecto del juego repetido la cooperaci´on en el primer periodo? Pero, se observa que de los dos EN, uno de ellos es “mejor” que el otro. Es decir, el EN (D, Q) ofrece m´as pagos a ambos jugadores que el EN (E, S). Lo que permite usar estrategias con “premios” y “castigos” cre´ıbles que sostienen la cooperaci´on. Esto es, si premiamos y castigamos jugando estrategias que sean EN. Premio: Jugar (D,Q) Pagos : (5,5) Castigo: Jugar (E,S) Pagos : (2,3) Las estrategias que formar´ıan dicho equilibrio perfecto son las siguientes: I. Estrategia del jugador 1: a) En el primer periodo, t = 1, jugar C b) En el segundo periodo, t=2, jugar D, si en t=1 se ha jugado (C,P). Y jugar E, si en t=1 se ha jugado otra opci´on. II. Estrategia del jugador 2: a) En el primer periodo, t=1, jugar P b) En el segundo periodo, t=2, jugar Q, si en t=1 se ha jugado (C, P). Y jugar S, si en t=1 se ha jugado otra opci´on. Por tanto, en cada subjuego de t=2, o se juega la estrategia (D,Q) o se juega la estrategia (E,S) generando un EP en el primer periodo en el que se juegan acciones que no forman un EN del juego de etapa. Por inducci´on hacia atr´ as, sustituimos los subjuegos por sus pagos en EN. El juego en forma Normal que resulta tiene (C,P) como jugada en EN. J1 /J2 C D E

P 12,12 10,5 3,5

Q 4,11 7,8 3,4

S 3,5 3,4 4,6

Analizando el juego por etapa: Las estrategias mencionados anteriormente, formar´ıan un EN porque - Si mantenemos fija la estrategia C del J1, si el J2 se desv´ıa a Q en t=1 obtiene un pago de 8 en ese periodo, pero un pago de 3 en el segundo periodo, obteniendo un pago total de 11.Para que no se desvie: 7 + premio > 8 + castigo , esto es : 7 + 5 > 8 + 3. Por ello, el J2 no tiene incentivos a desviarse. J1 /J2 C D E 4

P 7,7 8,2 1,2

Ver Figura 2. Representaci´ on en forma extensiva (Informal).

Q 2,8 5,5 1,1

s 1,2 1,1 2,3

- Ahora, si mantenemos fija la estrategia P del J2 y el J1 se desv´ıa a D en t=1 obtiene un pago de 8 en ese periodo, pero un pago de 2 en el segundo periodo, obteniendo un pago total de 10. Para que no se desv´ıe 7 + premio > 8 + castigo , esto es : 7 + 5 > 8 + 2. Por ello, el J1 no tiene incentivos a desviarse.

J1 /J2 C D E

P 7,7 8,2 1,2

Q 2,8 5,5 1,1

S 1,2 1,1 2,3

Entonces se deduce que es un equilibrio perfecto porque est´a basado en la amenaza cre´ıble de jugar en el segundo periodo el EN inferior en pagos en vez del EN superior en pagos, para disuadir a los jugadores de que se desv´ıen para obtener 8 en lugar de 7 en el primer periodo. Esta es una amenaza cre´ıble porque (B,R) es un EN del juego de etapa. Luego, la existencia de un EN del juego de etapa que Pareto domina a otro EN permite construir castigos cre´ıbles que sostienen la cooperaci´on aunque el horizonte sea finito. Cabe resaltar que este no es el u ´nico EP de este juego repetido. En conclusi´on, para este juego repetido,las siguientes sendas tambi´en ser´ıan sendas de EP: (D,Q),(D,Q),(E,S),(E,S),(E,S),(D,Q) o (D,Q),(E,S). Pero el hecho destacable es que con multiplicidad de equilibrios en el juego de etapa, tambi´en se pueden construir un EP del juego repetido con estrategias que dictan acciones que no formen parte de ning´ un EN del juego constituyente.5 Figura 2: Forma Extensiva (Informal)

5

M aterial Docente. Juegos Repetidos. U niversidad Carlos III, M adrid (2012) : 21 − 14. W eb. 18 de noviembre del 2015.

´ ´ APLICACION: UN MODELO DE ALIANZA DEPREDACION 10.

´ INTRODUCCION:

En esta aplicaci´ on se presentar´ a un modelo de deprecaci´on con informaci´on completa, con diferentes factores de descuento de las empresas. Teniendo en cuenta que la estrategia de las empresas son: Competencia, Alianza y deprecaci´ on, que se realizan bajo ciertas condiciones. El modelo inicialmente se encuentra bajo condiciones sim´etrico con juego simultaneo repetido.

11.

´ DEPREDACION

Es la pr´actica de desplazar a rivales mediante la reducci´on de precios por debajo del costo de producci´on y con ello eliminando a la competencia. El depredador una vez eliminado al rival buscar´a cobrar rentas monop´ olicas, relativamente grandes para recuperar las p´erdidas de la campa˜ na predatoria. Tengamos en cuenta que la empresa predadora no esta compitiendo pues sacrifica ganancias vendiendo a precios no-econ´ omicos para desplazar al competidor y as´ı cobrar rentas monop´olicas. Definiendo:

J = {J1; J2} Ai = {Dep; Com}

i = A, B

Ahora representamos los pagos de las acciones: Si ambas empresas toman acciones predatorias contraen perdidas iguales al costo fijo: F Si las empresas deciden competir obtienen beneficios no negativos : Πc En el caso que una empresa decida depredar y la otra competir, la primera recibe perdidas iguales a sus costos fijos y la segunda empresa sale del mercado con beneficios nulos, para los siguientes periodos la empresa depredadora obtiene beneficios monop´olicos (ΠM ). Nota: Utilizando factor de descuento de juegos repetidos con horizonte infinito. − Bi : Factor de descuento − r: Tasa de inter´es 1 − B= 1+r

0 < Bi < 1 0 −F + βi (−F ) + βi (Πm ) Πc + F > βi (F + Πi ) Πc + F > βi Πm + F

∀i = A, B

(2)

El otro posible equilibrio de Nash que tambi´en es u ´nico en ciertos casos es ”Dep/Comp”. Esto sucede cuando se supone las siguientes restricciones: (1 − βA )(−F ) + βA (Πm ) > Πc

Πc > (1 − βB )(−F ) + βB (Πm )

−F + βA (F ) + βA (Πm ) > Πc

Πc > −F + βB (F ) + βB (Πm )

βA (F + Πm ) > Πc + F βA >

Πc + F Πm + F

Πc + F > βB (F + Πm ) y

Πc + F > βB Πm + F

(3)

Un tercer caso ”Com/Dep”,es un caso an´alogo a las condiciones presentadas en el perfil de estrategia anterior y por lo tanto las condiciones ser´an:

βB >

Πc + F Πm + F

y

Πc + F > βA Πm + F

(4)

Podemos afirmar, por lo tanto que existen 3 equilibrios de Nash u ´nicos, cuando los βi (F actordeDescuento) son bajos se presenciar´ a competencia en las empresas, si una empresa tiene βi alto y la otra empresa tiene dicho factor bajo, se presentar´ a por parte de la primera empresa acciones predatorias y por la otra parte la segunda empresa tomar´ a decisiones de competencia y por u ´ltimo caso si las dos empresas tienen βi altos, los resultados son inciertos y surgir´ıa una posible guerra de desgaste. 6

12.

ALIANZA

En esta secci´ on analizaremos a los acuerdos impl´ıcitos que sostienen las empresas competidoras, ya sea para fijar o aumentar los precios o reducir la producci´on para poder aumentar las ganancias. Las decisiones de las empresas de producci´on y precio est´an en funci´on de las empresas competidoras, toman en cuenta las acciones de sus rivales y coordinan sus acciones. Los incentivos son mayores si las empresas producen productos homog´eneos. Definiendo:

J = {J1; J2} Ai = {Comp; Al}

i = A, B

Ahora representamos los pagos de las acciones: Si las empresas Ay B deciden aliarse (Al), esto generar´ıa que los beneficios monop´olicos se repartir´ıan en la mitas (Πm /2). En la situaci´on en la cual al empresa A decide competir y la empresa B aliarse, es la sircunstancia en la cual la empresa A decide desviarse del acuerdo de alianza para obtener beneficios monopolicos el primer periodo, por lo cual la empresa B contrae perdidas iguales al costo fijo (F) en dicho periodo. Luego del desvi´ o de la empresa A, la empresa B decide castigarla pasando a tener comportamiento competitivo. En el caso mencionado las empresas A y B tienen los siguientes beneficios intertemporales promedios:

”guerra de desgaste - Aqu´ ı dos o m´as empresas pelean un monopolio, para ello pueden, inician todo tipo de juegos, pueden hacer guerras de precios, y son de desgaste, ya que hasta que uno se desgasta y decide abandonar, el otro gana.” 6

ΠA = Πm + Πc (βA ) + Πc (βA )2 + .. + Πc (βA )n ΠA = Πm + (

ΠA =

ΠB = −F + Πc (βB ) + Πc (βB )2 + .. + Πc (βB )n

βA )(Πm ) 1 − βA

ΠB = −F + (

(Πm )(1 − βA ) + βA (Πc ) 1 − βA

ΠB =

ΠA (1 − βA ) = (Πm )(1 − βA ) + βA (Πc )

ΠA = (Πm )(1 − βA ) + βA (Πc )

βB )(Πc ) 1 − βB

(−F )(1 − βB ) + βB (Πc ) 1 − βB

ΠB (1 − βB ) = (−F )(1 − βB ) + βB (Πc )

ΠB = (−F )(1 − βB ) + βB (Πc )

;

(5)

Por el contrario si la empresa A trata de aliarse y la empresa B es la que se desv´ıa, los pagos ser´ an an´alogos a los presentados en el anterior caso: ΠA = (−F )(1 − βA ) + βA (Πc )

ΠB = (Πm )(1 − βB ) + βB (Πc )

;

(6)

Los pagos del juego mencionado se describe en la siguiente matriz:

Cuadro 2

A\B Dep

Comp Πc , Πc

Comp

((1 − βA )(−F ) + βA Πc ) ,

Al (1 − βA )(Πm ) + βA Πc , (1 − βB )(−F ) + βB Πc Πm Πm , 2 2

((1 − βB )(Πm ) + βB Πc )

Como en la secci´ on anterior, los equilibrios de Nash depender´an de las condiciones presentadas por los valores ”F ”, ”Πc ”, ”Πm ”, ”βA ”, ”βB ”. Para cada equilibrio presentado se debe cumplir lo siguiente: Un posible equilibrio de Nash que es u ´nico en ciertos casos es ”Comp/Comp”. Esto sucede cuando se supone las siguientes restricciones: Πm < (1 − βi )Πm + βi πc 2 Πm < Πm − βi Πm + βi πc 2 βi (Πm − πc ) < Πm 2 βi < (Πm − πc )

Πm 2

∀i = A, B

(7)

Este caso ”Com/Dep”,es un caso an´alogo a las condiciones presentadas en el perfil de estrategia anterior y por lo tanto las condiciones ser´an: Πm 2 βi > (Πm − πc )

∀i = A, B

(8)

Podemos afirmar que existen 2 equilibrios de Equilibrio de Nash u ´nicos, si los βi (f actoresdedescuento) son relativamente bajos se presenciar´a competencia entre las empresas. Por otra parte se realizar´ a la Alianza si y solo s´ı los factores de descuento son relativamente altos.

13.

Depredaci´ on y Alianza

En este modelo, fusionaremos los dos casos desarrollados previamente. Ahora cada empresa (A y B) tiene tres posibles estrategias las cuales son: Aliarze, Depredar y Competir. A la vez tomando en cuenta el factor de descuento que tiene cada una de las empresas, ya que sus acciones dependen de ello. La matriz de beneficios intertemporales promedio del juego, es la integraci´on de las matrices anteriores, analizados de manera independiente; adem´as se agrega dos relaciones mas que son ”Depre/Aliar y Aliar/Depre”. Para lo cual es necesario hacer un supuesto para su desarrollo : cuando una empresa depreda y la otra intenta aliarse, el resultado seria que depredador obtendr´ıa el beneficio Πi = (1 − βi )(−F ) + βi Πi mientras que la presa obtiene una p´erdida igual costo fijo “F” en el primer per´ıodo, y despu´es abandona el mercado.

A\B Dep

Dep -F,-F

Cuadro 3 Comp (1 − βA (−F ) + βA Πm ), 0

Comp

0, (1 − βB (−F ) + βB Πm )

Πc , Πc

Al

(1 − βA (−F ),

(1 − βA )(−F ) + βA Πc ),

(1 − βB )(Πm ) + βB Πc

(1 − βB )(−F ) + βB Πm )

Al (1 − βA )(−F ) + βA Πm ), (1 − βB (−F ) (1 − βA )(Πm ) + βA Πc , (1 − βB )(−F ) + βB Πc Πm Πm , 2 2

Ahora hallaremos los equlibrios del juego,para lo cual se nesecita hacer restricciones que ayudara a probar que son equlibrios de Nash.

Por ejemplo,”Comp/Comp” es el u ´nico equilibrio de Nash si se impone dos restricciones. Como se puede observar la siguiente ecuaci´on es importante porque restringe a la estrategia”Comp/Dep”: Πc > (1 − βA )(−F ) + βA ΠM Πc+F > βA (F + ΠM ) βA <

Πc + F F + ΠM

(9)

Esta siguiente ecuaci´ on restringe que ”Al/Al”sea un equilibrio de Nash. ΠM 2

< (1 − βi )ΠM + βi Πc

βi <

ΠM 2

ΠM − Πc

, ∀i = A, B

(10)

Los resultan son claros, ya que implican que solo puede haber competencia si ambas empresas tienen factores de descuento lo suficientemente bajos. El otro posible equilibrio de Nash que tambi´en es u ´nico en ciertos casos es ”Dep/Comp”. Esto sucede cuando se supone las siguientes restricciones: (1 − βA )(−F ) + βA ΠM > Πc βA (F + ΠM > Πc + F βA >

Πc + F ΠM + F

(11)

(1 − βB )(−F ) + βB ΠM < Πc βB (F + ΠM ) < Πc + F βB <

ΠM 2

Πc + F ΠM + F

(12)

< (1 − βB )ΠM + βB Πc βB <

ΠM 2

ΠM − Πc

(13)

En este caso implican que habr´ a depredaci´on cuando una empresa tiene un factor de descuento relativamente alto y la otra tiene un factor de descuento relativamente bajo. Un tercer caso ”Com/Dep”,que es la inversa del caso anterior, es el u ´nico equilibrio de Nash si se da lo siguiente:

βA <

Πc + F ΠM + F

(14)

βB >

Πc + F ΠM + F

(15)

βA <

ΠM 2

ΠM − Πc

(16)

La empresa competidora terminara desplazada del mercado por la depredadora, debido a los menores costos que incurrir´ a en el presente y por tener un factor de descuento alto.

Sin embargo, si ambas empresas tienen factores de descuento relativamente altos, aparecen m´ ultiples equilibrios posibles. Es relevante mostrar un caso particular en el cual la alianza ”Ali/Ali” es un equilibrio. Para que esto suceda, los factores de descuento no tienen que ser ni muy altos ni muy bajos. En particular, debe encontrarse en el siguiente rango: ΠM 2

ΠM

ΠM +F 2 > βi > +F ΠM − Πc

(17)

Si el factor de descuento de la empresa este por debajo del l´ımite inferior que aparece en la ecuaci´ on , entonces la empresa preferir´ a competir cuando la otra intente aliarse. De lo contrario, cuando el factor de descuento este por encima del l´ımite superior, entonces la empresa preferir´a depredar cuando la otra trate aliarse.

Conclusiones i)El modelo de depredaci´ on nos muestra que las acciones de una empresa (el depredador) cuando tiene un factor de descuento relativamente alto y la otra empresa (la presa) cuando tiene un factor de descuento relativamente bajo. Si esto ocurre, no es necesario hacer ning´ un supuesto respecto de la existencia de asimetr´ıas informativas o mecanismos de se˜ nalizaci´on para obtener un u ´nico equilibrio de Nash, en el cual el proceso del juego repetitivo, ser´a donde una empresa depreda y la otra se retira del mercado. Cuando ambas empresas tienen factores de descuento relativamente bajos, tambi´en existe un u ´nico equilibrio de Nash: nadie depreda y hay competencia,osea ”Com/Com”. ii)En el modelo de depredaci´ on y alianza, existen dos conclusiones principales, el primero hay depredaci´on cuando una empresa tiene un factor de descuento alto y la otra tiene un factor de descuento bajo y ”´este equilibrio es u ´nico hay competencia cuando ambas empresas tienen factores de descuento bajos y ”´este equilibrio tambi´en es u ´nico”. iii)Cuando ambas empresas tienen factores de descuento relativamente altos, aparecen equilibrios m´ ultiples y la competencia jam´ as sera uno de ellos. Lo que se configura es, en cambio, una guerra de desgaste en la que cualquiera de las dos empresas depreda, y existe un equilibrio posible en estrategias mixtas. 2

iv)En el modelo la alianza tambi´en puede sostenerse como un equilibrio en ciertos casos, pero aparece la conclusi´ on adicional de que los factores de descuento requeridos tienen un l´ımite superior y uno inferior. Si por ejemplo,dicha empresa se encuentra debajo del limite la alianza fracasa, porque las empresas encuentran m´as rentable desviarse del acuerdo de alianza a fin de obtener beneficios monop´ olicos presentes y si se encuentra por encima del l´ımite superior rompen con la alianza porque las empresas prefieren incurrir en p´erdidas presentes a cambio de convertirse en monopolistas futuros, despu´es de haber depredado a sus competidores.

BIBLIOGRAF´IA

Material Docente. Juegos Repetidos.Universidad Carlos III, Madrid(2012):21-14.Web.18 de noviembre del 2015. Emilio Cerda, Joaqu´ın P´erez Jos´e Jimeno. (2004). Teor´ıa de Juego. Madrid-Espa˜ na: Pearson Educaci´on S.A. Universidad Carlos III. (2008). Juegos repetidos. 2009, de Universidad Carlos III Sitio web:http : //www.eco.uc3m.es/docencia/newj uegos/doc/3,1 %20Repetidos %20f initos.pdf Robert Gibbons. (1993). Un primer curso de Teor´ıa de Juegos. EE.UU: ANTONI BOSCH. Leandro Zipitr´ıa. (2013). Teor´ıa de Juegos . 2013, de Universidad de Montevideo Sitio web: https: //leandrozipitria.files.wordpress.com/2008/12/4-teojuegos.pdf Jos´e Antonio Grac´ıa Hern´andez, Concepci´on Reyes de la Cruz. Teor´ıa de Juegos y Empresas: Un modelo de Alianza y Depredaci´on. 2008 Universidad Ju´arez Aut´onoma de Tabasco.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF