TEORIA DE JUEGOS OK.doc
Short Description
Download TEORIA DE JUEGOS OK.doc...
Description
TEORÍA DE JUEGOS Y ESTRATEGIAS OBJETIVOS
Introducir los principales conceptos y resultados matemáticos de la Teoría de Juegos. Analizar situaciones de conflicto y estudiar los diferentes tipos de modelos. Conocer los resultados básicos relativos a cada uno de estos tipos de modelos.
El alumno debe ser capaz de construir un modelo matemático adecuado para poder analizar y resolver situaciones de conflicto en las que intervienen dos o más decidores que tienen diferentes intereses y cuyos resultados dependen, en general, de las acciones adoptadas por todos ellos. SUMARIO Juego.- Juegos de suma cero de dos personas.- Punto de silla de montar.Dominancia.- Valor del juego.- Estrategia pura.- Estrategia mixta.- Criterio maximin. La teoría de juegos es una teoría matemática que estudia de manera formal y abstracta las características generales de las situaciones competitivas que pueden ser: juegos de mesa, campañas militares, políticas publicitarias, comercialización del mismo producto por dos (o más) empresas, competencias por la misma cantidad de recursos; y en general, situaciones de conflicto entre dos (o más) adversarios. En ésta teoría se identifica y hace énfasis en el proceso de toma de decisiones de los adversarios enfrentados, suponiendo que se llega a determinado resultado por la combinación de estrategias seleccionadas por cada opositor, que actúa aplicando su estrategia racionalmente, con una cierta lógica, y que solo actúa buscando su beneficio, sin consideración a su oponente. Los criterios para la toma de decisiones bajo incertidumbre se han desarrollado bajo la hipótesis de que la “naturaleza” es el oponente, en este aspecto la naturaleza no es malévola. Este capítulo trata de las decisiones con incertidumbre comprendiendo dos o más oponentes inteligentes donde cada componente aspira a optimizar su propia decisión, pero a costa de los otros. Ejemplos típicos incluyen desarrollar campañas publicitarias para productos competitivos y planear tácticas destinadas a los bandos contendientes. 1.- JUEGO DE DOS PERSONAS CON SUMA CERO En la teoría de juegos, existe un jugador y un oponente. Cada jugador tiene un número de elecciones finito o infinito, llamadas
estrategias. Los resultados o
pagos de un juego se resumen como funciones de las diferentes estrategias para cada jugador. Un juego con dos jugadores, donde la ganancia de un jugador es igual a la perdida del otro, se conoce como un juego de dos personas y suma cero. En tal juego es suficiente expresar los resultados en términos de pago a
un jugador. En general se emplea una matriz para resumir los pagos al jugador cuyas estrategias están dadas por los renglones de la matriz.
1
Ejemplo 1. Para ilustrar las definiciones de un juego de dos persona y suma cero considere un juego de “igualar” monedas, en el cual cada uno de dos jugadores A y B elige Cara (C) o Sello (S). Si son iguales los dos resultados (esto es, C y C o S y S), el jugador A gana $1.00 al jugador B. De otra manera, A pierde $1.00 que paga a B. En este juego cada jugador tiene dos estrategias C o S. Esto proporciona la siguiente matriz de juegos 2X2 expresadas en términos del pago al jugador A.
La solución “óptima” a tal juego puede necesitar que cada jugador emplee una sola estrategia denominada estrategia pura (por ejemplo C o S) o una mezcla de estrategias puras. El último caso se conoce como la selección de
estrategia mixta.
Solución Optima de Juego de Dos Personas y Suma Cero: La selección de un criterio para resolver un problema de decisión depende mucho de la información disponible. Los juegos representan el último caso de falta de información donde los oponentes inteligentes están trabajando en un medio circundante conflictivo. El resultado es que un criterio muy conservador generalmente esta propuesto para resolver juegos de dos personas y suma cero, llamado el criterio maximin (jugador) – minimax (oponente). La principal diferencia es que la "naturaleza” no esta considerada como un oponente activo, o (malévolo) en tanto que en la teoría de juegos cada jugador es inteligente y por tanto, activamente trata de derrotar a su oponente.
Para adaptarse al hecho de que cada oponente esta trabajando en contra de los intereses del otro, el criterio minimax elige la estrategia (mixta o pura) de cada jugador que proporciona el mejor de los peores resultados posibles. Se dice que se alcanza una solución óptima si ningún jugador encuentra beneficioso alterar su estrategia. En este caso se dice que el juego es estable o se encuentra en estado de equilibrio. Ya que la matriz del juego generalmente se expresa en términos del pago al
jugador A (cuyas estrategias están representadas por los renglones), el criterio (conservador) requiere que A seleccione la estrategia (mixta o pura) que maximice su ganancia mínima; el mínimo se toma sobre todas las estrategias del jugador B. Por el mismo razonamiento, el jugador B (oponente) elige su estrategia que minimice sus máximas pérdidas. De nuevo el máximo se toma sobre todas las
estrategias de A.
2
El siguiente ejemplo ilustra los cálculos de los valores minimax y maximin de un juego: Ejemplo 2. Considere la matriz de pagos siguiente que representa la ganancia del jugador A. Los cálculos de los valores minimax y maximin se muestran en la matriz
Cuando el jugador A juega su primera estrategia, puede ganar 8, 2, 9 ó 5, dependiendo de la estrategia elegida por el jugador B. Puede garantizar, sin embargo, una ganancia de por lo menos mín{8, 2, 9, 5} = 2, independientemente de la estrategia elegida por B, de igual manera, si A juega su segunda estrategia, garantiza al menos un ingreso de al menos min{6, 5, 7, 18} = 5; si juega su tercera estrategia, garantiza un ingreso de por lo menos min{7, 3, -4, 10} = -4. Por consiguiente el valor mínimo en cada renglón representa la ganancia mínima garantizada a A si éste juega sus estrategias puras. Estas se indican en la matriz anterior como “mínimo de renglón”. Ahora, el jugador A, eligiendo su segunda estrategia, esta maximizando su ganancia mínima. Esta ganancia esta dada por máx{2,5,-4} = 5. La selección del jugador A se llama estrategia maximin, y su ganancia correspondiente se conoce como valor maximin (o inferior) del juego. El jugador B por otra parte, quiere minimizar sus pérdidas. Observa que si juega su primera estrategia pura, puede perder no más que máx{8, 6, 7} = 8, independientemente de las selecciones de A. Un argumento similar puede también ser aplicado a las tres estrategias restantes. Los resultados correspondientes por lo tanto se indicaron en la matriz anterior como ”máximo de columna”. El jugador B seleccionará entonces la estrategia que minimice sus pérdidas máximas. Esto lo toma en cuenta la segunda estrategia y su pérdida correspondiente está dada por mín{8, 5, 9, 18} = 5. La selección del jugador B se conoce como la estrategia minimax y su pérdida correspondiente se llama valor mimimax (o superior) del juego. De las condiciones que gobiernan el criterio minimax, el valor minimax (superior) es mayor que o igual al valor máximo(inferior). En el caso donde ocurre la igualdad, esto es, valor mimimax = valor maximin, las estrategias puras correspondientes se conocen como estrategias “óptimas” y se dice que el juego tiene un punto de silla. El valor del juego, dado por la cantidad común de las estrategias puras óptimas, es igual a los valores maximin y minimax. La “Optimalidad” significa aquí que ningún jugador está tentado a cambiar su 3
estrategia, ya que su oponente puede contraatacar eligiendo otra estrategia que proporcione pagos menos atractivos. En general, el valor del juego debe satisfacer la desigualdad:
valor maximin (inferior) valor del juego valor mínimax (superior) En el ejemplo anterior, el valor maximin = valor minimax = 5. Esto significa que el juego tiene un punto de silla en (2,2) en la matriz. El valor del juego, por consiguiente, es igual a 5. Observe que ningún jugador puede mejorar su posición seleccionando alguna otra estrategia. 2.- JUEGO ENTRE DOS PERSONAS: ESTRATEGIAS MIXTAS La sección anterior muestra que la existencia de un punto de silla proporciona inmediatamente las estrategias puras óptimas para el juego. Sin embargo, algunos juegos no tienen punto de silla. Por ejemplo, considere el siguiente juego de suma cero:
El valor mimimax (= 4) es mayor que el valor maximin (= 2). Por consiguiente, el juego no tiene un punto de silla y las estrategias puras maximin- minimax no son óptimas. Esto es cierto ya que cada jugador puede mejorar su pago eligiendo una estrategia diferente. En este caso, se dice que el juego es inestable. El fracaso de las estrategias mínimas - maximin (puras), en general, para dar una solución óptima al juego ha llevado a la idea de usar estrategias mixtas. Cada jugador en lugar de seleccionar una estrategia pura solamente, puede jugar todas sus estrategias de acuerdo con un conjunto predeterminado de probabilidades. Sean x 1, x2,…, xm y y1, y2,…,yn las probabilidades del renglón x y de columna y por las cuales A y B, respectivamente, seleccionarán sus estrategias puras. Entonces m
n
x y 1 i
i 1
j
j1
xi, yj 0, para toda i y j
4
Por consiguiente, si aij representa el (i, j)-ésimo elemento de la matriz del juego, x i y yi aparecerán como en la matriz siguiente:
La solución del problema de estrategias mixtas mediante la programación lineal está basada también en los criterios maximin (jugador A) y minimax (oponente B). La única diferencia es que A elige sus estrategias y probabilidades xi la cual maximiza el pago esperado más pequeño en una columna dado que el oponente usa una determinada estrategia, en tanto que B selecciona yj la cual minimiza el mayor pago esperado en un renglón dado que el jugador usa una determinada estrategia. Matemáticamente el criterio maximin para una estrategia mixta está dado como sigue. El jugador A elige xi (xi0,
m i 1
xi 1 ) lo cual proporcionará
máx min xi
m m a i 1 x i , a i2 x i , ..., ainxi i 1 i 1 i 1 m
y el jugador B selecciona yj ( yj 0, min máx yj
n
a j 1
1j
n j 1
= max(min(I1, I2, …In)) = max v
yj 1 ) lo cual proporcionará
n n yj, a2jyj, ..., amjyj j 1 j 1
= min (max(P1, P2, ..Pm)) = min w
Estos valores se denominan pagos maximin y respectivamente Como en el caso de estrategias puras, se verifica la relación: pago esperado minimax pago esperado maximin
minimax esperados,
Cuando xi y yj corresponden a la solución óptima, se cumple la igualdad y los valores resultantes llegan a ser iguales al valor esperado (óptimo) del juego. Si xi* y yj* son dos soluciones óptimas para ambos jugadores cada elemento de pago a ij estará asociado a la probabilidad (xi*yj*). Por consiguiente, el valor esperado óptimo del juego es m
v* =
n
aij x y i 1 j 1
*
*
i
j
= pAq
5
Ejemplo. ¿Cuál es la ganancia esperada para A en el juego de matriz 3x4 2 A= 3 1
1
3
2 4
1 3
0 2 3
a) Si A adopta la estrategia mixta [1/3 1/2 1/6] y B adopta la estrategia mixta 1 / 4 1 / 8
1 / 8 1 / 2
b) Si A y B aplican estrategias puras escogiendo el segundo renglón y la tercera columna respectivamente? Solución: Para dar solución al problema aplicaremos la relación: v=pAq Donde: V es el valor del juego. p es el vector de probabilidades que define la estrategia del jugador 1. q es el vector de probabilidades que define la estrategia del jugador 2. A es la matriz de resultados del juego Entonces tenemos: a)
2 v=pAq = [1/3 1/2 1/6] 3 1
1 2
3 1
4
3
1 / 4 0 1 / 8 2 1 / 8 3 1 / 2
3/ 4 = [1/3 1/2 1/6] 11 / 8 = 7/8 = 0,875 3 / 8
Lo cual significa que el jugador 1 gana al final del juego 0.875, y el jugador 2 pierde 0.875. b)
Aquí p=[0 1 0] y q
2 v = [0 1 0] 3 1
1
3
2 4
1 3
0 2 3
0 0 = . Entonces 1 0 0 3 0 .= [0 1 0] 1 1 3 0
= -1
Está claro que ésta es la componente 2,3 de la matriz A, lo cual significa que al aplicar cada jugador su estrategia pura, el resultado del juego es que el jugador 1 pierde 1 y el jugador 2 gana 1. 3.- JUEGOS DE MATRIZ Y PROGRAMACION LINEAL
La teoría de juegos tiene relación estrecha con la programación lineal, ya que todo juego finito de dos personas y suma cero puede expresarse como un problema lineal y,
6
recíprocamente, todo problema lineal puede representarse como un juego. Aquí se pondrá énfasis al uso de la teoría dual de programación lineal. Ejemplo 1. Considere el siguiente juego de matriz de 3x4; encuentre las estrategias óptimas, así como el valor del juego.
Solución: Sea xi la probabilidad que tiene A de escoger la acción i y yj la probabilidad que tiene B de escoger la acción j
Determinación del Modelo Matemático para el jugador A (maximin): Si el jugador B escoge la acción yj, el ingreso esperado (Ii) para el jugador A será:
Aplicando el criterio maximin, donde el jugador A espera el peor resultado Min{I1, I2, I3, I4}= v pero como el jugador A debe maximizar su ingreso mínimo, se tiene Máx v además, cualquier Ij v
Por lo tanto el modelo matemático para el jugador A será: Función Objetivo:
Máx v
7
Sujeto a:
2x1 + 3x2 + 1x3 v -1x1 - 2x2 + 4x3 v 3x1 - 1x2 + 3x3 v 0x1 + 2x2 -3x3 v x1 + x2+ x3 = 1 xi 0 i=1,2,3
Determinación del Modelo Matemático para el jugador B:
Si el jugador A escoge la acción ai, la pérdida esperada (Pj) para el jugador B será: P1 = 2y1 - 1y2 + 3y3 + 0y4 , si A escoge a1 P2 = 3y1 - 2y2 - 1y3 + 2y4 , si A escoge a2 P3 = 1y1 +4y2 + 3y3 - 3y4 , si A escoge a3 Aplicando el criterio minimáx, donde el jugador A espera el peor resultado Máx{P1, P2, P3}= w pero como el jugador B debe minimizar su pérdida máxima, se tiene Min w además, cualquier Pj w Entonces: Por otro lado:
P1 = 2y1 - 1y2+ 3y3 + 0y4 w P2 = 3y1 - 2y2 -1y3 + 2y4 w P3 = 1y1 + 4y2+ 3y3 - 3y4 w y1 + y2+ y3 + y4 =1
Por lo tanto el modelo matemático para el jugador B será: Función Objetivo: Min w Sujeto a: 2y1 - 1y2+ 3y3 + 0y4 w 3y1 - 2y2 -1y3 + 2y4 w 1y1 + 4y2+ 3y3 - 3y4 w y1 + y2+ y3 + y4 = 1 Yj 0 j=1, 2, 3, 4
8
En este caso v y w representan el valor del juego para el jugador A y B respectivamente, siendo v=w ya que el modelo matemático del jugador B es el Dual del modelo matemático del jugador A. Aplicando el Software LINDO para resolver los modelos matemáticos tenemos: Salida del LINDO para el modelo del jugador A: Máx v St 2x1 + 3x2 + 1x3 -v 0 -1x1 - 2x2 + 4x3 -v 0 3x1 - 1x2 + 3x3 -v 0 0x1 + 2x2 -3x3 -v 0 x1 + x2+ x3 = 1 End LP OPTIMUM FOUND AT STEP
4
OBJECTIVE FUNCTION VALUE 1) 0.1818182 VARIABLE VALUE REDUCED COST V 0.181818 0.000000 X1 0.000000 0.636364 X2 0.636364 0.000000 X3 0.363636 0.000000 ROW SLACK OR SURPLUS DUAL PRICES 2) 2.090909 0.000000 3) 0.000000 -0.454545 4) 0.272727 0.000000 5) 0.000000 -0.545455 6) 0.000000 0.181818 NO. ITERATIONS= 4 En esta solución se tiene lo siguiente: Solución del modelo para el jugador A: El valor del juego, v = 0,1818182 y la estrategia óptima (po): x1 = 0.000000 x2 = 0.636364 x3 = 0.363636 Solución del modelo para el jugador B (solución del Dual): El valor del juego, w = 0,1818182 y la estrategia óptima (qo): y1 = 0.00000 y2 = 0.454545 y3 = 0.000000 y4 = 0.545455 Por lo tanto las estrategias óptimas serían: Para A: po = [ 0.000000 0.636364 0.363636 ] Para B: qo = [ 0.000000 0.454545 0.000000 0.545455 ] 9
Lo que implica que si ambos jugadores quieren optimizar sus resultados deberán realizar lo siguiente: El jugador A nunca deberá aplicar la estrategia 1, la estrategia 2 deberá aplicarla el 63.6364% de las veces y la estrategia 3 el 36.3636%. Al final del juego ganará 0.1818182, valor que representa su ganancia máxima. El jugador B nunca deberá aplicar las estrategias 1 y 3, la estrategia 2 deberá aplicarla el 45.4545% de las veces y la estrategia 4 el 54.5455%. Al final del juego perderá 0.1818182, valor que representa su pérdida mínima. Cabe señalar que si alguno de los jugadores cambia su estrategia, su resultado del juego empeorará, ya que el otro adversario (inteligente) modificará la suya sacando provecho del error cometido. APLICACIONES APLICACIÓN 1.- En el horario de 8 a 9 p.m., Panamericana (PANTEL) y América televisión compiten por la audiencia de 10 millones de espectadores. Las cadenas televisivas deben anunciar en forma simultánea el espectáculo que emitirán en ese horario. Las elecciones posibles de cada cadena y el número de televidentes de Panamericana, en millones, aparecen en la tabla A, para cada elección. Por ejemplo, si ambas cadenas escogen una película de acción, la matriz indica que 3.5 millones escogerán Panamericana y 10 – 3.5 = 6.5 millones verán América. Así tenemos un juego de dos personas con juego constante, con c = 10 (millones). ¿Tiene este juego un punto de silla? ¿Cuál es el valor del juego para cada cadena? Tabla A SOLUCIÓN Aplicando los criterios maximin y minimáx para Pantel y América TV respectivamente, se tiene que este juego tiene un punto de silla en el punto (2,1), por lo que no se requiere de la aplicación de estrategias mixtas para la obtención de las estrategias correspondientes. En este caso se aplicarán estrategias puras. Para Pantel su estrategia pura será Po = [0 1 0] 1 Para América TV será Qo= 0 0
10
Entonces aplicamos la relación V=Po*A*Qo, donde A es la matriz del juego. V= 0 1 V = 4.5
3.5 0 4.5 3.8 5.8
1.5 5.8 1.4
6 1 5 0 7 0
1 5 0 0
V = 4.5 Esto quiere decir que Pantel en el horario de 8 a 9am deberá siempre ofrecer Telenovela, mientras que Panamericana deberá ofrecer siempre Película de acción, el resultado será que Pantel se queda con 4.5 millones de televidente (valor del juego V), mientras que Panamericana se quedará con el resto (10 - 4.5) 5.5 millones de televidentes. APLICACIÓN 2.- Determínese las estrategias óptimas y el valor del juego para A y B en el juego de matriz de 3x3, cuya matriz de pagos es:
SOLUCIÓN Aplicando los criterios maximin y minimáx para el jugador A y B respectivamente, se tiene que este juego no tiene punto de silla, por lo que no es posible aplicar estrategias puras, hay que aplicar estrategias mixtas. A continuación se plantean los modelos matemáticos respectivos para que cada jugador determine sus estrategias óptimas. Modelo matemático para el jugador A: Función Objetivo: Máx V Sujeto a: 2X1 – 2X2 + 1X3 >= V 1X1 + 2X2 + 0X3 >= V 1X1 + 3X2 + 2X3 >= V X1 + X2 + X3 = 1 Xi >=0, i= 1, 2, 3 Modelo matemático para el jugador B: Función Objetivo: Min W Sujeto a: 2Y1 + 1Y2 + 1Y3 = V -10X1 - 5X2 + 0X3 >= V X1 + X2 + X3 = 1 Xi >=0, i= 1, 2, 3 Modelo Matemático para Coca Cola: Función Objetivo: Min W Sujeto a: 0Y1 - 4Y2 - 10Y3 Y1
MAXMIN ≠ MINMAX - 800 = - 200 PUNTO DE SILLA = no hay VALOR DE JUEGO = si hay (Hay que aplicar SIMPLEX) SIMPLEX Sea:
X1 la probabilidad de que R aplique la alternativa 1 X2 la probabilidad de que R aplique la alternativa 2 X3 la probabilidad de que R aplique la alternativa 3 22
V el valor del juego F.O. MAX V SUJETO A: (Restricciones) 1. –200X1 + (-1000) X2 +(-800) X3 ≥ V 2. –1300X1 - 700 X2 + 900 X3 ≥V 3. 2000 X1 - 1500 X2 + 850 X3≥V 4. X1 + X 2 + X 3 = 1 Restricciones lógicas: 5. X1, X2, X3≥ 0 Salida del WinQSB:
a) v 0.61
VALOR DE JUEGO = po*A*qo = - 435.71
0.00
200 0.39 1000 800
1300 700 900
2000 0.79 1500 0.21 435.71 850 0.00
GANA EL BANCO C (El más confiable) b) ¿QUÉ ESTRATEGIAS VAN APLICAR C/U DE LOS COMPETIDORES? El Banco R: X1 = 0.61 sorteo electrodomésticos X2 = 0 X3 = 0.39 sorteo de dinero en efectivo El Banco C: Y1 = 0.79 sorteo de electrodomésticos Y2 = 0.21 tasa de interés más alta Y3 = 0 EL BANCO R PARA MAXIMIZAR SUS MÍNIMAS GANANCIAS UTILIZARÁ LAS ESTRATEGIAS SORTEO DE ELECTRODOMÉSTICOS Y SORTEO DE DINERO EN EFECTIVO. EL BANCO C PARA MINIMIZAR SUS MÁXIMAS PÉRDIDAS UTILIZARÁ LA ESTRATEGIA DE SORTEO DE ELECTRODOMÉSTICOS Y LA DE TASA DE INTERÉS MÁS ALTA. d. CUANTOS CUENTA HABIENTES MÁS ATRAE EL BANCO GANADOR? 436 CUENTAHABIENTES MÁS (Es el valor de V) APLICACIÓN No 9.- Los establecimientos de comida italiana más importantes de la ciudad están compitiendo por atraer el mayor número de comensales. Pizza Hut y Presto, utilizando las siguientes estrategias piensan en lograr su objetivo. 1. 2 pizzas por el precio de una, en cualquier variedad los días martes en delivery. 2. 1 pizza familiar en cualquier variedad, 1 lasagna, 1 spaghetti, 1 porción de pan al ajo y 1 gaseosa de 2 litros por S/.30 todos los días. 3. Buffet de pastas y pizzas de 12:30 a 14:00 Hrs. por S/.15 todos los días. El cuadro siguiente muestra los comensales que optarían por Presto y que Pizza Hut perdería en la realización de cada estrategia, teniendo como variable de tiempo 6 meses:
23
No hay punto de silla, por lo tanto hay que aplicar Programación Lineal para determinar la solución del problema. De acuerdo al reporte del software WinQsb, se tiene que la ganadora del juego en este caso es Presto, atraerá 126 mil comensales más que Pizza Hut en el periodo de 6 meses. Presto deberá aplicar las siguientes estrategias para maximizar sus mínimas ganancias: 1 pizza familiar en cualquier variedad, 1 lasagna, 1 spaghetti, 1 porción de pan al ajo y 1 gaseosa de 2 litros por S/.30 todos los días. Buffet de pastas y pizzas de 12:30 a 14:00 Hrs. por S/.15 todos los días. Mientras que Pizza Hut para minimizar sus máximas pérdidas deberá aplicar las siguientes estrategias: 2 pizzas por el precio de una, en cualquier variedad los días martes en delivery. Buffet de pastas y pizzas de 12:30 a 14:00 Hrs. por S/.15 todos los días. En seis meses Presto deberá de aplicar la segunda estrategia en un periodo de 2 meses y la tercera estrategia en un periodo de 4 meses. En cambio Pizza Hut deberá aplicar la primera estrategia en un periodo de 2 meses con 20 días y deberá aplicar la tercera estrategia en un periodo de 3 meses con 10 días. APLICACIONES PROPUESTAS 01.- Un soldado puede escoger de entre cinco (1, 2, 3, 4 ó 5) una cueva para esconderse (fig. siguiente). Un artillero sólo tiene una bala y puede disparar en cualquiera de los cuatro lugares A, B, C o D. Un disparo matará al soldado si está en una cueva junto al lugar donde pegó el proyectil. Por ejemplo, un proyectil disparado al lugar B matará al soldado si está en el agujero 2 ó 3, mientras que una bala disparada al lugar D matará a quien esté en los agujeros 4 ó 5. Suponga que el artillero recibe una recompensa de 1 día libre si mata al soldado, y una recompensa 0 si sobrevive el soldado. 1 A 2 B 3 C 4 D 5 Escriba los modelos matemáticos de PL para cada jugador que determine el valor del juego y las estrategias óptimas. 02.- Considere el juego que tiene la siguiente matriz de pagos
. Utilice el método gráfico de PL para determinar el valor del juego y la estrategia óptima para cada jugador. 03.- Dos empresas competidoras han de decidir si ubican una tienda nueva en un punto A, B o C. Hay 52 clientes posibles para las dos tiendas. 20 viven en el pueblo A, 20 en el pueblo B y 12 en el pueblo C (véase la figura). Cada cliente irá de compras a la tienda más 24
cercana. Si un cliente está equidistante de ambas tiendas, suponga que hay ½ de probabilidad que vaya de compras a cada una de ellas. Cada empresa desea maximizar el número esperado de clientes que hagan sus compras en su tienda. Dónde debe ubicar cada empresa su almacén? (AB = BC = 10 millas)
04.- Dada la siguiente tabla y salida del Lindo, determine: a) el valor del juego y la estrategia óptima para cada jugador y b) Si el jugador A aplica la estrategia [0,5 0,5], entonces B aplicaría la estrategia [0 1]. ¿Cuál sería el resultado para ambos jugadores?
Salida del Lindo: V = 4,5 X1= 0.75 X2= 0.25
4 6
5 3
Precio Dual Restricción 1 -0.5 Restricción 2 -0.5
5.- Dado el juego bipersonal de suma nula con matriz de pagos: 6 1 0 4
2 0 3 3
1 2 1 0
2 1 3 1
a) Obtenga la estrategia óptima para ambos jugadores y el valor del juego, interpretando los resultados obtenidos. b) ¿Es p = [11/30, 0, 19/30, 0] una estrategia óptima para A? c) Construya el programa lineal que permita resolver el juego para el jugador A y para el jugador B. d) Construya el programa lineal que permita determinar la estrategia de A, así como el valor del juego, si el jugador B adopta la estrategia q = [0.4, 0, 0.6, 0]. Interprete el resultado obtenido. e) Obtenga el resultado esperado del juego si el jugador A opta por la estrategia p = [1/6, 0, 5/6, 0] y el jugador B adopta la estrategia q = [1/2, 0, ½, 0]. Interprete el resultado obtenido. 6.- Sea un juego de suma nula dado por la matriz de pagos:
Determine la solución del juego e interprétela. ¿Qué ocurriría si A eligiese su estrategia pura A3 tratando de obtener el resultado de 10 y B utilizase la estrategia q = [1/2, 1/2]? 7.- Dos empresas A y B que comercializan dos marcas de un mismo producto, en un mercado en el que la demanda es estable, se plantean la posibilidad de hacer una campaña publicitaria en radio, televisión, prensa, etc. La empresa A tiene cuatro posibles programas 25
de publicidad distintos y B tiene tres. Dependiendo del ingenio e intensidad de la campaña, cada empresa puede captar una proporción de mercado captado o perdido por A es:
a) ¿Es razonable que B elija B1 porque es donde puede captar una mayor proporción de clientes de A? b) ¿Cuáles son las estrategias óptimas para ambas empresas y el valor del juego? c) Si A decide jugar de acuerdo con la distribución de probabilidad p = [1/2, 0, ½, 0] Y B jugase con q = [3/5, 0, 2/5] establezca cuáles serían las consecuencias. 8.- Dos grandes cadenas de supermercados, que llamaremos A y B respectivamente, van a inaugurar, en las mismas fechas, un nuevo supermercado en un centro comercial de una ciudad en la que el número de clientes potenciales es de 100,000. El reparto del número de clientes potenciales entre las dos cadenas depende de la estrategia que cada una de las firmas adopte en cuanto a campañas de publicidad y productos en oferta. En función de la estrategia seguida por cada empresa, el número de clientes potenciales que se adjudica a la cadena A, en miles es el siguiente:
a) ¿Cuál es el número mínimo de clientes que aceptará tener A? ¿Y B? b) ¿Cuál es la estrategia óptima de A y B? A la vista de este resultado, ¿podemos afirmar que A y B esperan repartirse por igual el número de clientes potenciales? c) ¿Qué ocurrirá si B decide optar por una estrategia diferente a la óptima? d) Determine, el programa lineal para el jugador A. 9.- A y B son dos cadenas de hamburguesas competitivas. Cada una está expandiendo hacia pueblos más pequeños conforme se saturan las grandes áreas urbanas. Un grupo de tres pueblos está bajo consideración como se muestra enseguida.
Los porcentajes muestran la población de cada pueblo relativa al total de la población para los tres pueblos. Como A es la cadena más grande, se concluye que puede capturar el 60%
26
del mercado cuando ambos restaurantes están equidistantes. No obstante, si B está más cerca, A obtendrá sólo el 30%. Si A está más cerca, capturará el 80% del mercado. Cada firma planea construir sólo un restaurante en el área. ¿Qué pueblo debe seleccionar cada una y cuáles serán los porcentajes del mercado? 10.- Encuentre las estrategias óptimas y el valor del juego para cada uno de los juegos siguientes. Los pagos son para el jugador A.
11.- Encuentre el intervalo de valores para “p” y “q” que harán el elemento (2,2) un punto de silla en los juegos siguientes:
12.- Dados el juego bipersonal de suma nula con matriz de pagos:
y la salida con WinQSB:
6 1 0 4
2
1
0 3 3
2 1 0
2 1 3 1
a) Obtenga la estrategia óptima para ambos jugadores y el valor del juego, interpretando los resultados obtenidos. b) ¿Es p = [11/30, 0, 19/30, 0] una estrategia óptima para A? c) Construya el programa lineal que permita resolver el juego para el jugador A y para el jugador B.
27
d) Obtenga el resultado esperado del juego si el jugador A opta por la estrategia p = [1/6, 0, 5/6, 0] y el jugador B adopta la estrategia q = [1/2, 0, 1/2, 0]. Interprete el resultado obtenido. TEOREMA DE VON NEWMANN Llamaremos E x a la esperanza matemática de la ganancia de P1 . También llamada función de pago. El teorema dice: * * "Existe para el maximizante una estrategia mixta óptima x1 , x 2 para la cual su ganancia * * media E x1 , x 2 será superior o igual a una cantidad v llamada valor del juego y existe
* * * para el minimizante una estrategia mixta óptima y1 , y 2 , y 3 para la cual su pérdida me-
dia E y1 , y 2 , y 3 será inferior o igual al valor del juego v." Definición 3: La función de pago para P1 , o sea la esperanza matemática de P1 se define por *
*
*
m
n
E x , y x A y x i aij y j i 1 j 1
Donde: x e y son estrategias mixtas cualesquiera de P1 y P2 respectivamente. y1 4 2 5 y 2 E x , y x1 x 2 1 1 3 y3 4 x1 x 2 y1 2 x1 3 x 2 y 2 5 x1 x 2 y 3 Definición 4: Una solución a un juego matricial son dos estrategias mixtas óptimas * * x * x1* , x 2 , , x m y
*
y1* * y2 * yn
y un número v tal que
E x * , j v para las estrategias puras j 1, 2, , n
E i , y * v para las estrategias puras i 1, 2, , m
Las x * e y * se llaman estrategias mixtas óptimas. v puede ser negativa, positiva o cero. En el juego de los disparejos cuya matriz era
1
1
1 1
el valor del juego es cero y las estrategias óptimas son x *
1 / 2 1 1 , ; y* . Sin 2 2 1 / 2
demostrarlo aceptamos como axioma que un juego con v = 0 es justo. Todo nos permite decir ahora que E x , y * E x * , y * E x * , y (a) expresión escrita para el maximizante. La expresión (a) es equivalente a: máxmín E x, y mínmáx E x, y v x
y
y
x
(a) recibe el nombre de punto de ensilladura de los juegos matriciales.
28
Definición 5: Un juego simétrico tiene una matriz de pago oblicua simétrica, esto es aij a ji ; aij 0 si i j . Se puede demostrar que el valor del juego es cero y que ambos jugadores tienen estrategias óptimas simétricas. Ejemplo Dos jugadores hablan simultáneamente diciendo o piedra o papel o tijeras. La combinación de papel y piedra gana una unidad para el jugador que dijo papel (el papel envuelve a la piedra); para piedra y tijeras gana la piedra (la piedra rompe las tijeras) y para tijeras y papel ganan las tijeras (cortan al papel). Si los dos jugadores mencionan lo mismo no hay pago. Plantear la matriz de pago y dar el valor del juego. La matriz de pago si P1 es el jugador maximizante es: Piedra Papel Tijeras
Piedra Papel
Tijeras
0 1
1 0
1
1
1 1 0
Por la definición 5 el valor del juego es cero pues la matriz es oblicua simétrica. Propiedad: Para una nueva matriz de pago donde el valor de los elementos es aij w y w es un número positivo, las estrategias óptimas son las mismas que para el juego original y el valor del nuevo juego es v w . Teorema fundamental de los juegos matriciales Para todo juego matricial existen má xmín E x , y y mínmá xE x , y x
y
y
x
y son iguales. Esto es, todo juego matricial tiene una solución. Ejemplo Un jugador extiende alguno o algunos de sus dedos y al mismo tiempo supone (diciéndolo) cuántos dedos extiende el otro. El número de dedos que se puede extender es 1, 2 ó 3. Si uno solo de los jugadores adivina, su pago es el total del número de dedos extendidos. De lo contrario su pago es cero. Equivalencia del juego matricial y el problema de programación lineal Supondremos que se nos da un juego matricial arbitrario: a11 a12 a1n a21 a22 a2 n am1 am2 a mn Por definiciones 3 y 4 el problema es encontrar para P1 un vector x x1 , x 2 , , x m y un número v tales que:
29
a11 x1
a 21 x 2
a12
x1
a 22
x2
a1n
x1
a2n x2
En forma similar para P2 :
x1 x2 xm 1 ; xi 0 i
a11 y1 a12 y 2 a1n y n v a y a y a y v 21 1 22 2 2n n
am1 y1 am2 y 2 amn y n v
y1 y2 yn 1 ; y j 0 i Como cada elemento de (A) puede hacerse positivo mediante la suma de una constante apropiada a todas las aij podemos suponer que v 0. Si hacemos yj x x1 i ; y j v v m m 1 1 x1 xi v i 1 v i 1 n n 1 1 y j y j v j 1 v j 1 m
Al minimizar xi , P1 maximizará el valor del juego v y al maximizar i 1
n
y j , j 1
P2
minimizará el valor del juego. Entonces podemos redefinir el problema de programación lineal de la siguiente manera: Primal: Encuentre un vector
x x1 , x 2 , , x m
tal que minimice
sujeto a:
x1 x2 xm
a11 x1 a21 x 2 am1 x m 1
a12 x1 a22 x2 am2 xm 1
a x a x a x 1 mn m 1n 1 2n 2 30
xi 0 i
El problema dual: Encuentre un vector
y1
y 2 y y 3 y4
tal que maximice
y1 y2 yn
sujeto a
a11 y1 a12 y2 a1n yn 1
a12 y1 a22 y2 a2n y n 1
a y a y a y 1 mn n m1 1 m2 2 y j 0 j Puesto que el juego tiene solución, existen soluciones óptimas a los problemas anteriores y m n 1 mín xi máx y j v i 1 j 1 Ejemplo Dada la matriz de pago 6 8 4
0 2 6
3 3 5
8 9 7
Determinar, aplicando programación lineal, las estrategias óptimas para los dos jugadores.
6 x1 8 x 2 4 x 3 v 2 x 6 x v 2 3
3 x1 3 x 2 5 x 3 v 8 x1 9 x2 7 x 3 v
El dual será:
x1 x2 x3 1 ; xi 0 i
31
6 y1
3 y3 8 y4 v 8 y1 2 y 2 3 y 3 9 y 4 v 4 y 6 y 5 y 7 y v 1 2 3 4
y1 y2 y3 y4 1 ; y j 0 i Si dividimos miembro a miembro por v:
6 y1
3 y 3 8 y 4 1
8 y1 2 y 2 3 y 3 9 y 4 1 4 y 6 y 5 y 7 y 1 1 2 3 4
y1 y2 y3 y4 Sumamos un número w 2 a la matriz original. 8 10
6
2 0
5 5
8
7
1 máx v 10 11 9
El dual será:
8 y1 2 y 2 5 y 3 10 y 4 1
5 y 3 11 y 4 1 10 y1 6 y 8 y 7 y 9 y 1 1 2 3 4
y 1 y 2 y 3 y 4
1 max v*
Si agregamos las variables de holgura:
8 y1 2 y2 5 y3 10 y 4 10 y1
5 y3 11 y 4
6 y1 8 y2 7 y3 9 y4
La resolución por programación lineal es:
32
2
1 1 ; y 3 20 10 1 3 20 * v * 20 3 v
y1 y1 y 3
y1 1 20 1 y1 y1 v * * 20 3 3 v y 1 20 2 *3 y 3 y 3 v * 10 3 3 v
y1 y 3
1 2 1 3 3 1 1 x1 0 ; x2 ; x3 40 8 1 20 1 1 20 20 5 x2 ; x3 40 3 6 8 3 24 6 1 5 x1 x 2 x 3 0 1 6 6 20 v* ; v* v 2 3 20 14 v v* 2 2 3 3 y1 y 3
Aquí, si sobrare tiempo, se puede intercalar la resolución por programación lineal de papel, piedra y tijeras. Principio de dominancia Sea el juego definido por la siguiente matriz: 2 3
4
1
1
4
0 2
El valor del juego para A si juega a la primera fila con probabilidad p1 y si B juega a la primera columna es: V A p1 , B1 2 p1 3 1 p1 2 p1 3 3 p1 3 p1
El valor calculado es la esperanza matemática de la ganancia para el jugador A si A juega a la primer fila con probabilidad p1 y el jugador B juega a la primer columna. Si B juega con estrategia B1 y A juega a la primera fila pierde 2 y si juega a la segunda pierde 3. Si B jugara a la cuarta columna y A a la primera fila, B pierde 0. Si A jugara a la segunda fila, B perdería 2. Siempre convendrá a B jugar en la cuarta columna. B nunca jugará a la primera. Se dice que la primera columna es dominada. Entonces el juego se transforma es una matriz como: 4 1
1 4
33
0 2
De la misma manera, toda fila dominada por otra puede ser suprimida en la matriz de un juego. Es importante porque permite reducir algunos juegos al tamaño 2 x 2 que se resuelven fácilmente en forma gráfica. Ejemplo Reducir el siguiente juego aplicando dominancias: 3 4 4
2 1 3
0 5 3
La columna uno tiene valores superiores respecto a la tercera. Entonces se elimina la primera que es dominada 0 5
2 1 3
3
Ahora todos los elementos de la primera fila son menores a los de la tercera. La tercera domina a la primera. Se anula la primera. 5 3
1 3
Ejemplo Reducir el siguiente juego aplicando dominancias: 3 3 2
10 5 8
16 4 3
Resolución analítica y gráfica de juegos. Supongamos que se nos presenta el siguiente juego:
Jugador A
B y1 y2 x1 4 8
x2 6 2 No tiene punto de ensilladura. El jugador seleccionaría por minimax la peor situación de cada alternativa (4 para x1 y 2 para x2 ) para luego optar por la que asegura la mayor de dichas ganancias mínimas. El valor del juego para A es: VA 4 que es la retribución mínima que espera ganar jugando su estrategia x1. De la misma manera el valor del juego para el jugador B es VB 6 pero esto es un círculo vicioso. Por ello deberían recurrir a estrategias mixtas. Supongamos que A juega a sus alternativas x1 y x 2 con probabilidades p1 y 1 p1 . Su ganancia no depende de lo que él juega sino de la estrategia seguida por B. Por ejemplo si B juega su estrategia y1 , la ganancia de A será: V A p1 , y1 4 p1 6 1 p1 4 p1 6 6 p1 6 2 p1
Expresión que da la esperanza matemática de la ganancia del jugador A si él juega a la primer fila con frecuencia relativa x1 y el jugador B juega a la primera columna. Si B jugara a la estrategia y2 : 34
V A p1 , y 2 8 p1 2 1 p1 8 p1 2 2 p1 2 6 p1
A tratará de hacer máxima la ganancia independientemente de la estrategia de B. Eso significa: V A p1 , y1 V A p1 , y 2 6 2 p1 2 6 p1 6 2 6 p1 2 p1 8 p1 4 8 p1 p1 0,5
Haciendo el mismo razonamiento para B. V B q1 , x1 4 q1 81 q1 4 q1 8 8 q1 8 4 q1
V B q1 , x 2 6 q1 21 q1 6 q1 2 2 q1 2 4 q1 8 4 q1 2 4 q1 8 2 8 q1 6 8 q1 q1
6 0,75 8
Hasta aquí ha sido una mera resolución con geometría analítica elemental. MÉTODO GRÁFICO La figura muestra la variación de la ganancia esperada por el jugador A para diversos valores de p1 cuando su adversario juega sus estrategias y1 e y2 . V A p1 0,5; y1 4 0,5 6 0,5 5 V A p1 0,5; y 2 8 0,5 2 0,5 5
Supongamos que A carga su bolillero con p1* bolillas blancas. En ese caso su beneficio oscilaría entre SN y SM de acuerdo a las estrategias que adopte el jugador B. Con criterio conservador A esperaría ganar SN. Es decir, SN sería el
V A p1*
35
Para otros valores de p1 entre 0 y 1 el valor esperado será la quebrada PQR. Como A pretende maximizar su ganancia mínima, es obvio que eligirá el valor p1 0, 5 con lo que se asegura un valor esperado de la ganancia de V A p1 5
El punto Q es el mayor. Por un razonamiento análogo en la figura se ve que la estrategia óptima para B es con q1 0, 75 V B q1 5
Este método de resolución gráfica de juegos puede utilizarse también para aquellos juegos cuya matriz consta de 2 filas y más de 2 columnas o de 2 columnas y más de 2 filas. Sea por ejemplo el siguiente juego: 2 3
4
1
1
4
0 2
p1 p2 1 ; p2 1 p1
Analíticamente puede hallarse: V A p1 , y1 2 p1 31 p1 2 p1 3 3 p1 3 p1 V A p1 , y 2 4 p1 1 p1 4 p1 1 p1 1 3 p1
V A p1 , y 3 p1 41 p1 p1 4 4 p1 4 5 p1 V A p1 , y 4 2 1 p1 2 2 p1
La figura muestra como varían las ganancias esperadas al variar p1 entre 0 y 1.
36
Analizando la figura se ve claramente que el jugador B no está interesado en las estrategias y1 e y3 pues le aseguran una pérdida mayor que la ganancia esperada por A. Entonces q1 q3 0. Sólo resta hallar los valores de q2 y q4 . La columna 1 es dominada por la 4. En cambio la columna 3 no es dominada estrictamente. Una dominancia estricta significa que las relaciones entre elementos de filas o columnas se expresan mediante los signos ó y no ó . q2 q4 1 ; q4 1 q2 V B q 2 , x1 4 q 2 01 q 2 4 q 2 V B q 2 , x 2 q 2 21 q 2 q 2 2 2 q 2 2 q 2
Ejemplo Resolver gráficamente el juego asociado con la siguiente matriz de pago: 1 8
3 5
11 2
V A p1 , y1 p1 81 p1 p1 8 8 p1 8 7 p1
V A p1 , y 2 3 p1 51 p1 3 p1 5 5 p1 5 2 p1
V A p1 , y 3 11 p1 21 p1 11 p1 2 2 p1 2 9 p1
37
5 2 p1 2 9 p1 3 11 p1 3 p1 0,27 11 3 5 49 V A 5 2 p1 5 2 5 4 ,45 11 11 11
y1 0 ; p1 0, 27 ; p2 0, 73 ; V A 4 , 45
Planteamos para B. V B q 2 , x1 3 q 2 111 q 2 3 q 2 11 11q 2 11 8 q 2 V B q 2 , x 2 5 q 2 21 q 2 5 q 2 2 2 q 2 2 3 q 2
11 8 q 2 2 3 q 2 9 11q 2 q2
11 8 q2 11 8 Ejemplo
9 11
9 121 72 49 4, 5 11 11 11
Un supermercado desea implantar un sistema de vigilancia para su sector ventas. A tal efecto se han considerado dos zonas (A y B) en el edificio, el cual consta de una sola planta. La primera, donde se exhiben la mayoría de los artículos, es frecuentada por una gran cantidad de clientes, mientras que la segunda no es tan concurrida. 38
Se han instalado dos cámaras de T.V. que permiten observar las zonas A y B desde el local T donde están ubicados los monitores. De esta forma, los policías pueden situarse en A, en B o en T mientras que los ladrones pueden presentarse en A o en B. Los policías han hecho una estimación de las probabilidades de descubrir y capturar al ladrón. Una de las hipótesis es suponer que es muy raro que varios ladrones actúen al mismo tiempo en el supermercado. Según la experiencia se estima que si el ladrón se encuentra en A y el policía en T, la probabilidad de captura es 0,3. Para el resto de posibilidades se obtiene la siguiente tabla:
Se pide: 1. Construir la matriz de pago. 2. Definir las estrategias óptimas de los policías. Los dos policías se pueden encontrar juntos o separados en A, B ó T. Las probabilidades de captura serán entonces para los casos TT (ambos en T); AA (los dos en A); TA (uno en T y otro en A), etc. La captura del ladrón por el primer policía será representada por la variable aleatoria x1 que puede tomar valor 1 (capturado) ó 0 (ladrón no capturado). La captura del ladrón por parte del segundo policía será x2 . Y se acepta la hipótesis de que x1 e x2 son variables independientes, pTA( y el ladrón en A ) pT p A 1 pT
0,3 0,41 0,3 0,58
probabilidad de captura por parte del prim
pTA( y el ladrón en A )
captura por parte del segundo policía si el primero
Así se pueden calcular todas las posibilidades de posición del ladrón con la disponibilidad conjunta de los dos policías.
Otro ejemplo.
pTT y el ladron en A pT pT 1 pT 0,3 0,3 1 0,3 0,51
Las ecuaciones de los policías son:
0,51 x1 0,64 x 2 0,19 x 3 0,58 x 4 0,37 x 5 0,46 x 6 v 0,75 x1 0,36 x 2 0,91 x 3 0,60 x 4 0,85 x 5 0,76 x 6 v
Y las del ladrón serán
x1 x2 x3 x4 x5 x6 1 ; xi 0 i
0,51 y1 0,75 y 2 v (1) 0,64 y1 0,36 y 2 v ( 2) 0,19 y1 0,91 y 2 v (3)
39
0,58 y1 0,6 y 2 v ( 4) 0,37 y1 0,85 y 2 v (5) 0, 46 y1 0,76 y 2 v (6)
y1 y2 1 ; y j 0 j Resolvemos por el método gráfico.
y1 0, 58 ; y2 0, 42 ; v 0, 63 No intervienen las inecuaciones (2), (3), (5) y (6). Por lo tanto x 2 , x 3 , x 5 y x 6 son nulas. Las inecuaciones de los policías se reducen a: 0,51 x1 0,58 x 4 v
x1
0,75 x1 0,6 x 4 v x3 1 ; xi 0 i
que se puede resolver fácilmente usando el método gráfico. Juegos contra la naturaleza. Es un problema de decisión que aparece cuando conociendo varios futuros posibles no se pueden determinar las probabilidades de cada uno de esos futuros. Por ejemplo la demanda que tendrá un producto de acuerdo a su precio. Ejemplo (Donde es razonable usar el criterio minimax) Supongamos que quiero invertir 10.000 UM para un período donde no sabemos si habrá paz, guerra fría o la guerra. Se puede elegir entre: — Bonos del tesoro; — Acciones de empresas que producen armas; — Acciones de empresas comerciales. Las tasas de rendimiento anual son:
40
Guer a Guer a fría Paz 2 3 32, Bonos del Tesoro 18 6 2 Valores en armamentos 2 7 12 Acciones comerciales
La línea 3 domina (en forma no estricta) a la línea 1. Esto transforma la matriz de pago: 18 2
6 7
2 12
Las inecuaciones que rigen el juego son: (si y sólo si la naturaleza fuese racional, pero no se comporta como tal desde nuestro punto de vista). 18 x2 2 x3 v 6 x2 7 x3 v 2 x2 12 x3 v x2 x3 1 Aplicando el método gráfico se encuentra: 5 12 x2 ; x3 ; v 6, 7 17 17 Si hay guerra la ganancia será: 5 12 18 2 6, 7 17 17 Si hay guerra fría: 5 12 6 7 6, 7 17 17 Si hay paz:
2
5 12 12 7,88 17 17
5 12 2. 941 UM en armamento y 10. 000 UM 7. 059 UM en 17 17 acciones comerciales, el financista se asegura por lo menos una ganancia de 670 UM. Ejemplo con información parcial. Colocando 10. 000 UM
Ejemplo Para calentar una casa se necesitan 4 t de carbón si el invierno es suave, 5 t si es normal y 6 t si es riguroso. El carbón se compra en verano. En verano se paga 200 UM/t. Si el invierno es suave la t cuesta 200 UM, si es normal 220 UM y 240 UM si es muy frío. ¿Qué decisión tomar? Si se compran 4 t en verano se deberá gastar: — 800 UM si el invierno es suave; — 800 UM + 220 UM = 1.020 UM si es normal y — 800 UM +2 x 240 UM = 1.280 UM si es riguroso. Cuando se adquieran 6 t en verano se deberán desembolsar 1.200 UM cualquiera sea la temperatura del invierno.
41
Suave Normal Riguroso . 4t -800 -1.020 -1.280 1280 . 5t -1.000 -1.000 -1.240 1240 . 6t -1.200 -1.200 -1.200 1200 Si ahora la oficina meteorológica afirma que el invierno no será riguroso. ¿Cuál será la estrategia óptima?. Se suprimen las filas y columnas terceras.
Suave Normal
800 1020. 1020. 4 t 1000. 1000. 1000. 5 t
v 1. 000 Se puede enunciar la siguiente propiedad: Toda información parcial o total sobre el estado de la naturaleza no podrá jamás disminuir el valor del juego si se está maximizando." Ejemplo donde el criterio minimax resulta inaceptable. JUEGOS MATRICIALES Los Juegos como Dilemas La Sra. Pura está en un problema. Ella es la dueña del Diamante más Grande del Mundo y la ha llamado el Sr. Malo dispuesto a comprarlo por una cantidad de dinero mayor que lo que cualquier persona ofrecería. La Sra. Pura sabe que el Sr. Malo no es malo, sino que es un muy buen negociante que en otras oportunidades similares ha ofrecido mucho dinero por lo que quiere y una vez hecho el trato ha tomado el objeto y su dinero y se ha desaparecido. Pero.... es tan atractivo el precio que ofrece....... Entonces a la Sra. Pura se le ha ocurrido una idea genial: Ella dejará el Diamante más Grande del Mundo en un lugar que sólo ella conoce. A su vez el Sr. Malo dejará la Mayor cantidad de Dinero que nunca nadie le ha ofrecido en otro lugar que sólo él conoce. Una vez hayan hecho esto se comunicarán por teléfono los respectivos lugares y cada uno podrá ir a buscar lo que pretende. Al plantearle esta propuesta al Sr. Malo, éste aceptó encantado...., de hecho estaba extrañamente contento con la idea...., tanto que la Sra. Pura comenzó a pensar si no habría algún truco escondido. Y comenzó a pensar que el Sr. Malo probablemente pretendía NO DEJAR el dinero y, SI TOMAR el Diamante más Grande del Mundo....., pero inmediatamente cayó en cuenta que también ella podría NO DEJAR el Diamante y SI TOMAR el Dinero.... ¿Cuáles son las posibles estrategias que podrían aplicar el Sr. Malo y la Sra. Pura?, Expréselas acudiendo a la siguiente sencilla regla: Quién obtiene lo que desea gana 1 (un) punto; Quién no obtiene lo que desea gana 0 (cero) puntos. Sra. Pura
42
Deja
Sr. Malo
No Deja
Deja No Deja
Las posibles estrategias que podrían aplicar el Sr. Malo y la Sra. Pura son las siguientes: Sra. Pura
Sr. Malo
Deja
No Deja
Deja
(1,1)
(0,1)
No Deja
(1,0)
(0,0)
Si ambos deciden dejar lo que les corresponde, ambos ganan y el resultado es igual a (1,1). Si ninguno decide dejar los que le corresponde, ambos se frustran en su deseo, pero.... técnicamente NO PASA NADA, y el resultado es (0,0). Podrían intentar nuevamente, buscar otras alternativas, etc. Pero, si uno deja y el otro no, el resultado puede ser (1,0) o (0,1) que significa que uno de los dos SALE PERJUDICADO. El proceder adecuado para la Sra. Pura o el Sr. Malo dependerá del tipo de relación que sean capaces de crear entre ambos. Si es de confianza mutua, ambos saldrán gananciosos. Si es de confrontación o de sacar el máximo provecho del otro, uno de los dos perderá. Si es de desconfianza, ambos podrían salvarse, optando por no hacer nada momentáneamente. El Problema del Conductor Ecológico: Suponga que le gustaría vivir en un ambiente menos contaminado y que existe un aparato catalizador que puede colocarse a los automóviles para que contaminen menos el aire. Pero el asunto reside en que la mejora del ambiente sólo ocurre si un número grande de personas usa este dispositivo. ¿Qué pasa si usted no lo usa, pero los otros si lo hacen?, ¿Cómo se beneficiaría Ud?.... ¿Y... si usted usa el dispositivo mientras los otros no lo hacen?, ¿Cuanto pagará usted por un dispositivo que no lo beneficiará...? (Si se le facilita use una escala de 1 -el menor- a 4 -el mayor-) Otros Usan
Ud.
Usa No Usa
43
No Usan
El Problema del Conductor Ecológico: Si usted no usa el dispositivo, pero los otros si lo hacen, usted se beneficia de mejor aire sin pagar por él: en este caso Ud. obtiene una utilidad de 4 (o 4 veces mayor que la menor utilidad a obtener). Si usted usa el dispositivo mientras los otros no lo hacen, usted obtendrá la utilidad más pequeña de todas, igual a 1. Si TODOS lo usan, todos se benefician obteniendo la mayor utilidad secundaria, igual a 3. Si NADIE lo usa, ninguno se beneficia obteniendo la segunda utilidad más pequeña, igual a 2. Otros
Ud.
Usan
No Usan
Usa
3
1
No Usa
4
2
El Juego del Gallina: El nombre de GALLINA dice relación con un tipo de desafío en la que dos individuos manejan cada uno en frente del otro y con un par de ruedas en la línea de la mitad del camino. El individuo que vira del curso de la colisión "ES UN GALLINA....". Este tipo de situación es altamente representativa del pensamiento de "yo no me dejo...." y refleja una alta posibilidad de que se de un escalamiento del conflicto Suponga los siguientes puntajes: Sin daño: 0 .............. Con daño: -5 ¿Cómo se darían las posibilidades? A Cede
B
No Cede
Cede No Cede
El Juego del Gallina: Si ambos ceden, ninguno de los dos queda lesionado, ni física, ni moralmente, por lo tanto la suma es (0,0). Si cede sólo uno de los dos, el que lo hace queda lesionado moralmente, siendo la suma (0,-5) o (-5,0) Si NINGUNO CEDE, ambos quedan lesionados físicamente, por lo que la suma es (-5,5) La reflexión a realizar es acerca de ¿cuál es la manera racional de desbaratar un juego de este tipo....?
44
A
B
Cede
No Cede
Cede
(0,0)
(-5,0)
No Cede
(0,-5)
(-5,-5)
EL DILEMA DEL PRISIONERO Dos sospechosos son detenidos en cercanías del lugar de un crimen y la policía comienza aplicar las técnicas de interrogatorio por separado. Cada uno de ellos tiene la posibilidad de elegir entre confesar acusando a su compañero, o de no hacerlo. Si ninguno de ellos confiesa, entonces ambos pasarán un año en prisión acusados de cargar un arma sin autorización. Si ambos confiesan y se acusan mutuamente, los dos irán a prisión por 10 años cada uno, pero si sólo uno confiesa y acusa a su compañero al implicado le caerán 20 años y el acusador saldrá libre por colaborar con la policía. Las estrategias a definir en este caso son: Confesar o No Confesar. ¿Cómo se construiría la tabla de alternativas? y ¿Cuáles son las Estrategias Adecuadas para cada uno de ellos y para los dos en su conjunto? Preso Nº 1 Confiesa
Preso Nº 2
No Confiesa
Confiesa No Confiesa
La tabla de alternativas sería como la siguiente: Preso Nº 1 Confiesa
Preso Nº 2
Confiesa
(10,10)
No Confiesa
(20,0)
No Confiesa (0,20) (1,1)
¿Cómo resolver este Juego?, ¿Cuáles son las "Estrategias Racionales" a aplicar si ambas personas desean minimizar su estadía en la cárcel? El Prisionero Nº 2 puede razonar de la siguiente forma: " Aquí pueden suceder dos cosas, o mi compañero habla o no habla. Supongamos que confiesa, entonces yo pasaré 20 años en la cárcel, si no confieso yo también. Pero si lo hago sólo estaré 10 años. En este caso es mejor confesar. De otro lado, si él no confiesa y yo tampoco lo hago, entonces estaré 1 año. Pero si sólo yo confieso saldré libre. De todas maneras es mejor confesar ". 45
Es de suponer que el Prisionero Nº 2 está razonando de la misma manera, pero si es así, entonces los dos pasarán 10 años en la cárcel. Por lo tanto, si ambos actúan "irracionalmente" y se mantienen callados cada uno pasará en prisión sólo 1 año. Este sorprendente resultado en el cual acciones individuales resultantes de un análisis racional hecho por las dos personas involucradas lleva a muy malas consecuencias frente a las finalidades de maximizar la utilidad individual que cada uno busca, ha tenido un poderoso impacto en las ciencias sociales modernas. Por cierto existen numerosas interacciones en el mundo de hoy similares a la planteada: grandes congestiones de tráfico y polución, depredación del medio ambiente y alto riesgo personal para los seres humanos, sobre explotación de los recursos renovables y no-renovables y alto riesgo alimentario o aparición de enfermedades como la de las "Vacas Locas", etc., en las cuales las decisiones "racionales" individuales llevan a desastrosos resultados (de corto, mediano y largo plazo) para quienes las toman y para la sociedad en su conjunto. El poder del "Dilema del Prisionero" reside en su capacidad para poder explicar que la "racionalidad" puede volverse en contra de los seres humanos y que es necesario buscar formulas alternativas para solucionar los dilemas. Quizás se podrá aducir que el planteamiento del Dilema del prisionero adolece de ingenuidad o que no es realista frente a las características fundamentales del ser humano, no obstante sus propias debilidades pueden señalar el camino para superarlas: El Dilema del Prisionero es un juego de "dos-personas", no obstante sus aplicaciones pueden darse en múltiples situaciones dónde se involucran a numerosas personas o actores sociales. Se asume que no existe comunicación entre los dos sospechosos. Sin embargo si ellos pudieran hablar entre ellos y coordinar sus estrategias, con seguridad la solución adoptada sería muy diferente y consideraría el mayor beneficio para ambos. En el Dilema del Prisionero, las dos personas interactúan sólo una vez. La repetición del juego y de las interacciones podría llevar a resultados muy diferentes JUEGOS COOPERATIVOS En todos los juegos presentados (Prisioneros, Precios y Publicidad dos partes deben tomar una decisión, dónde los resultados dependen de las decisiones de ambas partes y bajo el supuesto que cada uno busca favorecer sus propios intereses. No obstante, cada uno escoge en aislamiento del otro, tomando la otra decisión como dada. Como resultado, los dos tienen resultados relativamente malos (larga duración en prisión o cero ganancias). El Dilema del Prisionero ha sido influyente a lo largo de las ciencias sociales, desde la segunda mitad del siglo XX, porque ilustra cómo quienes toman las decisiones de manera racional y buscando proteger sus intereses, pero escogiendo sus estrategias en aislamiento, actúan recíprocamente para obtener resultados malos. ¿Pero es realmente racional actuar así? En el juego del Dilema del Prisionero, el aislamiento es impuesto por las reglas del juego --los Prisioneros han sido aislados por la Policía, y no tiene ninguna opción para comunicarse--. Pero los empresarios pudieron, en principio, ponerse de acuerdo en una estrategia común, y compartir las ganancias del mercado entre ellos. Así no estarían tomando la estrategia del otro como dada, sino que en cambio, estarían coordinando sus estrategias. Por supuesto, se diseñan leyes antimonopolios para hacer que conductas semejantes sean ilegales, y que han sido promulgadas porque muchas personas creen que los hombres de negocios no deberían colaborar para establecer precios altos en los 46
mercados. Sin embargo, en otro tipo de problemas la cooperación también puede ser la mejor solución para un juego. Cuando en un "juego" las decisiones se coordinan, se establecen acuerdos para una estrategia común, y se comparten ganancias, el acuerdo al que se llega se llama una "solución cooperativa" del juego. Comprar y vender son de hecho, un juego cooperativo, en que el comprador y el vendedor son los dos "jugadores" y el precio en el que ellos están de acuerdo es su estrategia común. Veamos el ejemplo de la Bicicleta: A tiene una bicicleta pero no tiene máquina de juegos que desea. Una persona ha ofrecido comprarle su bicicleta por $ 20.000. B no tiene ninguna bicicleta, y desea tener una. Un amigo le ha ofrecido una por $ 45.000. Las estrategias disponibles para A y B son dar o guardar. Es decir, A puede darle su bicicleta a B o puede guardarla, y B puede darle su dinero a B o puede guardarlo. Esto es lo que se denomina "intercambio"
Si se piensa en un juego no-cooperativo, este juego se parece mucho al Dilema del Prisionero. Guardar es una estrategia dominante y guarda-guarda es el equilibrio de la estrategia dominante, en la cual nadie da y los dos pierden. Siendo niños pueden desconfiar entre si y pueden llegar a no hacer el intercambio. Pero las sociedades de mercado tienen un rango de instituciones que les permiten a los adultos comprometerse mutuamente en transacciones beneficiosas. Así, se podría esperar una solución cooperativa, que estaría en la esquina superior izquierda. ¿Cuál sería el precio adecuado para que el intercambio fuera beneficioso para ambos? La mitad de la diferencia entre los dos precios de referencia de cada uno de ellos, o lo que es lo mismo de la MAAN de cada uno, ya que cada peso sobre 20.000 es una ganancia para A, y cada peso por debajo de 45.000 es una ganancia para B. Así el precio más conveniente para ambos, es de $ 32.500. Las soluciones de tipo cooperativo no son raras en una sociedad de mercado. Al contrario, ¡Ellas son la razón de ser de un sistema de mercado!. Análisis Cooperativo del Dilema del Prisionero Interés Particular vs. Interés Colectivo Para un estudioso de la teoría de los juegos, en el Dilema del Prisionero, la estrategia para dirimir el dilema es clara traicionar porque como el objetivo del juego es el de estar preso el menor tiempo posible, la estrategia adecuada para cada preso es la de no cooperar con el otro. No importa lo que la otra persona haga, para cada uno de los presos la mejor estrategia es no cooperar con el compañero. Pero si la situación se repitiera VARIAS VECES, sin duda la mejor estrategia seria la de no hablar con la policía. Cada uno de los presos cae en una situación de falta de confianza en el otro, y en parte esto se produce porque consideran la situación como única y definitiva, así entonces lo 47
racional es buscar la satisfacción del interés personal inmediato y traicionar al colega bandido. Moraleja de la historia: La toma de decisiones enfrenta en si misma un dilema ya que desde el punto de vista de cada uno, ES racional confesar, pero NO LO ES desde un punto de vista colectivo. Para solucionar este dilema es necesario ir mas allá de las formulaciones simples sobre las que generalmente se basan nuestros análisis de la realidad. El problema con los falsos supuestos es que fácilmente nos llevan a situaciones sociales erróneas y sin salidas. No obstante, las representaciones de la realidad que guían nuestras acciones sin soporte verdadero en hechos comprobables, rodean las percepciones de nuestra vida política y social. Por ejemplo, existe una idea muy superticiosa y muy difundida que plantea que la seguridad de un país esta directamente relacionada con su fortaleza militar. Es una superticion porque no hay pruebas de que esto sea realmente así. Si seguridad significa no tener guerras o sea poseer la habilidad para evitar conflictos administrándolos eficazmente, ciertamente no es así como se consigue la paz. Imagine un duelo de 3 personas en el que cada uno tiene que disparar a los otros dos: “A” acierta el 95% de las veces y donde apunta generalmente es fatal o sea mata con absoluta seguridad, “ B” acierta el 90% de las veces y no es tan bueno como “A”, pero casi...., y “C” es un tirador mediocre. En estas condiciones quien tiene las mejores posibilidades de sobrevivir? Análisis Cooperativo del Dilema del Prisionero La paradoja de la racionalidad Actuar racionalmente implica intentar matar al mas peligroso, y los mejores ( o sea Ä”y “B”) van a disparar uno hacia el u otro. En este duelo ambos se olvidaran de “C”, quien podrá así tener las mejores probabilidades de salir con vida. Esta situación es el reflejo de un antiguo proverbio: Los mansos heredaran la tierra, y hoy en dia significa que la fuerza no es siempre una garantia de seguridad. La paradoja de la racionalidad se evidencia claramente al analizar la “Tragedia del Colectivo”. Imagine que varios campesinos utilizan un terreno de pastos comum para alimentar las vacas que cada uno posee. Cada uno puede querer tener el mayor numero posible de vacas comiendo en el pasto. Si uno solo de ellos coloca un animal mas, no hay grandes diferencias, pero si solo uno de ellos lo hace, todos los demás tendrán el mismo derecho. así al final habrá mas animales de los que el pasto puede soportar. El lugar quedaría sobrepoblado y todos saldrían perdiendo. En nuestros días esto mismo sucede con la pesca en aguas profundas, Puede ser muy ventajosos para cada país comercializador maximizar y tornarla lo mas eficiente posible utilizando alta tecnología. Pero si todos hacen lo mismo, es posible que la pesca se agote y todos saldremos perdiendo. El interés particular de cada jugador lo lleva a actuar de determinada manera, pero si todos hicieran lo mismo, todos saldrían perdiendo. En un teatro lleno de personas, si hay un incendio el interés de cada uno es hallar rápidamente la salida, pero si todos intentan salir al mismo tiempo, todos podrían morir. Si todos actuaran de manera disciplinada, al contrario del interés individual, todos se podrían salvar. Esto se puede ver día tras día en la vida real. Por las mañana la radio informa sobre las condiciones del transito, es natural dirigirse a las vías con menos transito, esto es 48
individualmente racional pero no lo es cuando se analiza desde el punto de vista colectivo. Si todos actuaran así las vías vacías quedarían congestionadas. Es racional ser el único poseedor de la bomba atómica para poder gritar y amenazar a quien no la tiene, Pero si todos poseen la bomba atómica, entonces deja de ser racional porque se perdió la ventaja que se poseía. Análisis Cooperativo del Dilema del Prisionero Pagando con la misma moneda En una transacción que se repetirá mas de una vez, la teoría de juegos muestra como salir de la encerrona de la traición, presentando la cooperación como la mejor manera de mantener un relacionamiento en el que ambas partes podrán obtener satisfacción y donde esta puede tener mas valor que la tentación de traicionar. Existe una forma de jugar en la cual se comienza siendo cooperativo para terminar imitando” escrupulosamente” el ultimo movimiento del oponente. Un juego es ‘escrupuloso” cuando: 1. nunca se es el primero en traicionar (se comienza siendo cooperativo y solo se traiciona cuando se es traicionado), 2. nunca se provoca al oponente, pero no se da ninguna otra posibilidad (se responde de inmediato a la acción no cooperativa del oponente), 3. se perdona sin guardar resentimiento (si el otro decide cooperar, se responde cooperando, aunque antes se haya sido traicionado) La promesa de lo que todavía puede acontecer en el relacionamiento futuro es la llave que mantiene la evolución de la cooperación. Esto es lo que lo teóricos llaman La “Sombra del Futuro”. Tendemos a ver TODA la vida como un juego de suma cero, como un juego de victoria o derrota, no obstante en la naturaleza vemos cooperación en todos los niveles, y donde las “Sombras del Futuro” se expanden indefinidamente (como en un coral o en el caso de los parásitos). El ajustado al medio es el que sobrevive, y no necesariamente el mas feroz, y muchas veces lo hace porque aprendió de una manera dolorosa que lo mejor es cooperar con otros. Si lo que nos interesa es encontrar los patrones que llevan a fortalecer la cooperación, una posible respuesta se encuentra en “pagando con la misma moneda”. Análisis Cooperativo del Dilema del Prisionero Cooperación y Supervivencia No obstante si los hombres utilizan el poder de la cooperación para saquear el medio ambiente, esta puede ser la causa de nuestra extinción como especie. así la idea de cooperación debe ir necesariamente acompañada de la idea de humanidad. A pesar de que concebimos la evolución como un resultado de la competencia de todos contra todos, existe evidencia racional, alejada de cualquier principio moral, que demuestra que aquellos que juegan a “pagar con la misma moneda”de una manera escrupulosa ganan mayores puntos, y sobreviven. Los que no lo hacen ganan menos puntos y tienden a la extinción. Si pudiéramos evitar la destrucción de nostros mismos y de nuestro planeta, tal vez podamos aprender el significado de la cooperación. Para dos guerreros enfrentados el que una de las partes no este dispuesta a disparar hacia la otra representa una ventaja para esta ultima. Pero es mas claro, que si ambas 49
partes recurren a esta alternativa, ambos saldrán ganando ya que no serán eliminados por el otro. Una guerra es un juego de suma cero. No importa si es justa o no. Personas mueren, bienes se destruyen, etc. Un ejercito es una forma particular de cooperación. Es quizás la parte más romántica de una guerra: un conjunto de personas muy bien organizadas y coordinadas en la búsqueda de un objetivo común y en contra de un enemigo común. El mas fuerte incentivo para la cooperación ha sido, a trabes de la historia, la necesidad de luchar contra un enemigo común. Es así como se forman los Estados y las Alianzas. La percepción de un enemigo común une a las personas. Y para la institución de la guerra es importante que pensemos que debemos pegar antes que nos peguen. Como resultado guerreamos unos contra otros y .... con toda la vida sobre la tierra... en vez de luchar contra nuestros verdaderos enemigos: la intolerancia, la guerra y la depredación del medio ambiente. El estudio de la Teoria de los Juegos nos permite comprender que la evolucion de la cooperación no es simplemente una posibilidad. Ella esta profundamente enraizada en la estructura de la vida en general...... Análisis Cooperativo del Dilema del Prisionero Una Solución Integrativa para el Dilema del Prisionero
1. 2.
3. 4. 5. 6. 7.
El dilema del prisionero tendría una solución mucho más clara (y menos angustiosa) si pudiéramos: Actuar basados en el establecimiento inicial de propósitos claros a lograr, en lugar de comenzar recelando y desconfiando de la otra parte. Cuestionar y evaluar nuestras suposiciones sobre la otra parte procurando entender de la mejor manera posible los mensajes, y no de la peor manera, como acostumbramos a hacer tradicionalmente, y siendo simples y directos en nuestras apreciaciones Examinar el tema de la confianza (y desconfianza) desde la perspectiva de las dos partes, teniendo presente que es mucho mas fácil destruir la confianza que crearla Mantener nuestra mente abierta a los cambios de valores, actitudes y conductas de la otra parte, y estar dispuestos a comprender los criterios aplicados por ella. Preocuparnos mas por el largo plazo que por las ganancias a corto plazo Ser amable y preocuparnos por desarrollar estrategias para lograr la cooperación en la negociación. Tratar de no jugar el Dilema del Prisionero, pero si nos vemos obligados a ello, tratar de cambiar el juego, mostrando, si es preciso, nuestro desacuerdo cuando nos ataquen. Aplicaciones de la Teoría de Juegos a la publicidad de dos productos que compiten en un mismo mercado El planteamiento del problema Algunas personas creen que la publicidad persuasiva puede ser realmente un gran desperdicio de dinero. Otras que son una verdadera necesidad del negocio en la medida que permite posicionar la marca y generar mayores ventas, posibilitando también ganar una mayor porción del mercado. A continuación se presenta un ejemplo típico del juego que se genera en un mercado en el cual existe un competidor directo. El análisis se basa en el balance final de las 50
ganancias de dos productores de cerveza: uno que vende la marca Golden Beer y otro que vende Pilsener . Si ambos anuncian, pueden vender más cerveza y el mercado más grande les dará a ambos mayores ganancias, pero el costo de la publicidad consumirá una parte del aumento de ingresos y hará que las ganancias sean ligeramente menores. Por otro lado, si solo anuncia uno de ellos, conquistará a la mayoría de los clientes actuales, generará otros y conseguirá una gran ganancia final. ¿Cuales son las posibilidades básicas de resultado del juego, si en la actualidad existe una situación de equilibrio en la cual las ganancias son similares para ambos? Golden Beer Anuncia
Pilsener
No Anuncia
Anuncia No Anuncia
Una posible Solución del Problema Los resultados que se presentan a continuación, se generan con base en el análisis inter - relacionado de los posibles balances finales que se podrían presentar con mayor frecuencia. Probablemente bajo supuestos diferentes, los resultados podrían ser distintos. Golden Beer
Pilsener
Anuncia
No Anuncia
Anuncia
40,40
110,10
No Anuncia
10,110
50,50
El análisis de la solución planteada i) El punto de partida es suponer que sin hacer publicidad, ambos productores se encuentran en situación de equilibrio, y que por lo tanto perciben igual ganancia en el mercado. La situación en la cual ninguno hace publicidad puede ser comprendida entonces como (50,50). ii) Si sólo uno de ellos hace publicidad, su meta debería ser la siguiente: - Ganar el máximo posible del mercado del competidor. No obstante es razonable suponer que existe un porcentaje de consumidores que cualquiera sea la circunstancia, continuarán siendo leales a la marca que tradicionalmente consumen. Por lo tanto si se supone que este porcentaje está alrededor del 20% del mercado de cada competidor, el máximo a ganar de manera suplementaria no será superior a 40. - Ganar el máximo posible de los nuevos consumidores que se sentirán motivados para ingresar al mercado de la cerveza. Esta cifra dependerá de diversos eventos (tamaño de la población, crecimiento de la distribución de la población por edades, productos 51
sustitutos, etc.), pero podría ser razonable suponer un incremento equivalente a la mitad de lo que ingresa por el mercado que se le gana al competidor. La situación para la ganancia neta cuando sólo uno hace publicidad puede ser comprendida entonces como ([50+40+20],10). Pero el ingreso por ventas debe ser superior para quien hace la publicidad dado que debe recuperar el costo de la campaña, y este valor podría llegar a no ser inferior a la mitad de los nuevos ingresos, o sea 30 + 110 = 140. iii) Si ambos hacen publicidad, las metas para cada uno de los productores podrían ser las siguientes: - Mantener el máximo posible del mercado que actualmente se posee y ganar el máximo posible del otro mercado. Es indudable suponer que existe un porcentaje de consumidores que se sentirá tentado a probar el otro producto. Por lo tanto si se supone que este porcentaje está alrededor del 33% del mercado de cada competidor, los cambios se neutralizarán. - Ganar el máximo posible de los nuevos consumidores que se sentirán motivados para ingresar al mercado de la cerveza. Al igual que en el caso anterior, esta cifra dependerá de diversos eventos y ya se determinó un incremento máximo de 20, el cual se deberá repartir ahora entre ambos productores. El esfuerzo TOTAL en publicidad para los productores fluctuará entre 30 (dividido por dos, es decir 15 por parte de cada uno) a 60 (es decir 30 por cada uno de ellos). La situación para la ganancia neta cuando ambos hacen publicidad puede ser comprendida entonces como sigue: Los nuevos ingresos netos generados son iguales a 10, pero el costo de la campaña es superior a la mitad de estos (5), ya que fluctúan entre 15 y 30, por lo tanto mantener el mercado actual y aumentar ligeramente las ventas puede suponer razonablemente un gasto adicional de 20, que restado a la suma de 50 (ingresos actuales) mas 10 (nuevos ingresos) da como resultado 40, que es igual a una perdida de 10 frente a la situación actual, cuando no se hace publicidad. Una solución cooperativa podría consistir en ponerse de acuerdo para orientar la campaña sólo hacia nuevos consumidores, minimizando los costos de publicidad para cada productor (haciéndolos cercanos a 5) y distribuyéndose el campo de acción dentro de los nuevos mercados. Así el crecimiento de cada uno podría tener un incremento máximo que se encontraría entre 55 y 60. Aplicaciones de la Teoría de Juegos Juegos Cooperativos En todos los juegos presentados (Prisioneros, Precios y Publicidad dos partes deben tomar una decisión, dónde los resultados dependen de las decisiones de ambas partes y bajo el supuesto que cada uno busca favorecer sus propios intereses. No obstante, cada uno escoge en aislamiento del otro, tomando la otra decisión como dada. Como resultado, los dos tienen resultados relativamente malos (larga duración en prisión o cero ganancias). El Dilema del Prisionero ha sido influyente a lo largo de las ciencias sociales, desde la segunda mitad del siglo XX, porque ilustra cómo quienes toman las decisiones de manera racional y buscando proteger sus intereses, pero escogiendo sus estrategias en aislamiento, actúan recíprocamente para obtener resultados malos. ¿Pero es realmente racional actuar así? En el juego del Dilema del Prisionero, el aislamiento es impuesto por las reglas del juego --los Prisioneros han sido aislados por la Policía, y no tiene ninguna opción para comunicarse--. Pero los empresarios pudieron, en principio, ponerse de acuerdo en una estrategia común, y compartir las ganancias del mercado entre ellos. Así no estarían tomando la estrategia del otro como dada, sino que en cambio, estarían coordinando sus estrategias. 52
Por supuesto, se diseñan leyes antimonopolios para hacer que conductas semejantes sean ilegales, y que han sido promulgadas porque muchas personas creen que los hombres de negocios no deberían colaborar para establecer precios altos en los mercados. Sin embargo, en otro tipo de problemas la cooperación también puede ser la mejor solución para un juego. Cuando en un "juego" las decisiones se coordinan, se establecen acuerdos para una estrategia común, y se comparten ganancias, el acuerdo al que se llega se llama una "solución cooperativa" del juego. Comprar y vender son de hecho, un juego cooperativo, en que el comprador y el vendedor son los dos "jugadores" y el precio en el que ellos están de acuerdo es su estrategia común. Veamos el ejemplo de la Bicicleta: A tiene una bicicleta pero no tiene máquina de juegos que desea. Una persona ha ofrecido comprarle su bicicleta por $ 20.000. B no tiene ninguna bicicleta, y desea tener una. Un amigo le ha ofrecido una por $ 45.000. Las estrategias disponibles para A y B son dar o guardar. Es decir, A puede darle su bicicleta a B o puede guardarla, y B puede darle su dinero a B o puede guardarlo. Esto es lo que se denomina "intercambio" A Da Guarda B Da 1,1 1,0 Guarda 0,1 0,0 Si se piensa en un juego no-cooperativo, este juego se parece mucho al Dilema del Prisionero. Guardar es una estrategia dominante y guarda-guarda es el equilibrio de la estrategia dominante, en la cual nadie da y los dos pierden. Siendo niños pueden desconfiar entre si y pueden llegar a no hacer el intercambio. Pero las sociedades de mercado tienen un rango de instituciones que les permiten a los adultos comprometerse mutuamente en transacciones beneficiosas. Así, se podría esperar una solución cooperativa, que estaría en la esquina superior izquierda. ¿Cuál sería el precio adecuado para que el intercambio fuera beneficioso para ambos? La mitad de la diferencia entre los dos precios de referencia de cada uno de ellos, o lo que es lo mismo de la MAAN de cada uno, ya que cada peso sobre 20.000 es una ganancia para A, y cada peso por debajo de 45.000 es una ganancia para B. Así el precio más conveniente para ambos, es de $ 32.500. Las soluciones de tipo cooperativo no son raras en una sociedad de mercado. Al contrario, ¡Ellas son la razón de ser de un sistema de mercado Análisis Cooperativo del Dilema del Prisionero Interés Particular vs. Interés Colectivo Para un estudioso de la teoría de los juegos, en el Dilema del Prisionero, la estrategia para dirimir el dilema es clara traicionar porque como el objetivo del juego es el de estar preso el menor tiempo posible, la estrategia adecuada para cada preso es la de no cooperar con el u otro. No importa lo que la otra persona haga, para cada uno de los presos la mejor estrategia es no cooperar con el compañero. Pero si la situación se repitiera VARIAS VECES, sin duda la mejor estrategia seria la de no hablar con la policía. 53
Cada uno de los presos cae en una situación de falta de confianza en el otro, y en parte esto se produce porque consideran la situación como única y definitiva, así entonces lo racional es buscar la satisfacción del interés personal inmediato y traicionar al colega bandido. Moraleja de la historia: La toma de decisiones enfrenta en si misma un dilema ya que desde el punto de vista de cada uno, ES racional confesar, pero NO LO ES desde un punto de vista colectivo. Para solucionar este dilema es necesario ir mas allá de las formulaciones simples sobre las que generalmente se basan nuestros análisis de la realidad. El problema con los falsos supuestos es que fácilmente nos llevan a situaciones sociales erróneas y sin salidas. No obstante, las representaciones de la realidad que guían nuestras acciones sin soporte verdadero en hechos comprobables, rodean las percepciones de nuestra vida política y social. Por ejemplo, existe una idea muy superticiosa y muy difundida que plantea que la seguridad de un país esta directamente relacionada con su fortaleza militar. Es una superticion porque no hay pruebas de que esto sea realmente así. Si seguridad significa no tener guerras o sea poseer la habilidad para evitar conflictos administrándolos eficazmente, ciertamente no es así como se consigue la paz. Imagine un duelo de 3 personas en el que cada uno tiene que disparar a los otros dos: “A” acierta el 95% de las veces y donde apunta generalmente es fatal o sea mata con absoluta seguridad, “ B” acierta el 90% de las veces y no es tan bueno como “A”, pero casi...., y “C” es un tirador mediocre. En estas condiciones quien tiene las mejores posibilidades de sobrevivir? Aplicaciones de la Teoría de Juegos Un Juego de Precios entre 2 Empresas El Juego: Se trata de dos compañías que están compitiendo por el mismo mercado. Cada empresa debe escoger entre un precio alto ($2 por unidad) o un precio bajo ($1 por unidad). Las Reglas: Cada compañía tiene un costo fijo de $5000, independiente de si vende algo o no. A un precio de $2, pueden venderse 5000 unidades A un precio de $1, pueden venderse 10000 unidades Si ambas compañías cobran el mismo precio, las ventas se distribuyen uniformemente entre ambas. Si una compañía cobra un precio más alto, la compañía con el precio más bajo vende la cantidad entera y la compañía con el precio más alto no vende nada. El "Contador" es igual a las utilidades, es decir el ingreso menos el costo fijo. A $2 $1 B $2 $1 Como en el Dilema del Prisionero, cada compañía tiene una razón fuerte para escoger una estrategia, que en este caso es la definición del precio. 54
La Solución: Por ejemplo, "A" podría razonar como sigue: "O "B" cobrará a $1 o no lo hace. Si lo hace, entonces yo podría cobrar lo mismo o perderé a todos mis clientes y perderé también $5000. Por otro lado, si "B" , vende a $ 2 yo me llevaré a sus clientes y conseguiré una ganancia de $5000, pero si yo lo hago -y el NO lo hace, perderé $ 5.000-." SITUACION PARA CUALQUIERA DE LAS DOS COMPAÑIAS Unidades Vendidas Ingreso Costos Fijos Utilidad A Ambas venden a 2
2500
5000
5000
0
B Ambas venden a 1
5000
5000
5000
0
0
0
5000
-5.000
10000
10000
5000
5000
C Vende a 2 La Otra Vende a 1
La Matriz de Alternativas, sería entonces como la siguiente: A B $2
$2
$1
(0, 0)
(-5.000,5000)
$ 1 (5.000, -5.000)
(0,0)
Un Juego de Precios entre 2 Empresas El Juego: Las dos compañías están compitiendo por el mismo mercado y cada empresa debe escoger entre un precio alto ($3 por unidad), un precio medio ($2 por unidad), o un precio bajo ($1 por unidad). Las Reglas: Cada compañía tiene un costo fijo de $5000, independiente de si vende algo o no. A un precio de $1, pueden venderse 10000 unidades, a un precio de $2, el mercado se reduce a 8000 unidades, pero a un precio de $3, se limita a 6000 unidades. Si ambas compañías cobran el mismo precio, las ventas se distribuyen uniformemente entre ambas. Si una compañía cobra un precio más alto, el tamaño máximo del mercado es del precio más bajo. Si la diferencia de precios entre las dos empresas es mínima, existe un 10% de los compradores para los cuales el precio más alto es indiferente, pero si la diferencia es la máxima este porcentaje se reduce a la mitad. El "Contador" es igual a las utilidades, es decir el ingreso menos el costo fijo. A 1 2 3 1 B 2 3
55
Cada compañía tiene una razón fuerte para escoger una estrategia, que en este caso es la definición del precio. La Solución:
A AyB=3 B AyB=2 C AyB=1 D A= 3 B=2 E A= 3 B=1 F A=2 B=1
Unidades Vendidas Ingreso Costos Fijos 3000 9000 5000 4000 8000 5000 5000 5000 5000 800 2400 5000 7200 14400 5000 500 1500 5000 9500 9500 5000 1000 2000 5000 9000 9000 5000
Utilidad Mercado 4000 6000 3000 8000 0 10000 -2600 8000 9400 8000 -3500 10000 4500 10000 -3000 10000 4000 10000
Ganar en este ejemplo dependerá de las estrategias escogidas por el rival y del precio adoptado por usted en consecuencia. Si el competidor escoge un precio de 3, cualquier precio adoptado será beneficioso (aunque el mejor sería 2, pero también se puede tomar 1), pero si el escoge un precio de 2, se puede tomar 2 o 1 (que sería el mejor). Ninguno es dominante. En estas dos estrategias, cada competidor puede beneficiarse bajando su precio si el otro jugador mantiene su estrategia inalterada. No obstante, si considera que el otro cobrará $3 o $2, usted se beneficiará de todas las maneras cobrando $1. Pero el otro puede pensar lo mismo...!!!. De esta manera, se puede eliminar cualquiera de las estrategias excepto en la que ambos competidores cobrarán $1. El equilibrio se genera entonces en la ganancia-cero, o lo que es lo mismo en el precio-más-bajo. Esto significa que NO EXISTE UNA ESTRATEGIA DOMINANTE, y cuando esto se produce se denomina como el "Equilibrio de Nash". El Equilibrio de Nash se presenta en un juego de estrategias cuando ningún jugador puede beneficiarse cambiando su estrategia mientras los otros jugadores mantienen sus estrategias inalteradas. La Matriz de Alternativas, sería entonces como la siguiente: A 1 2 3 1 0,0 4000,-3000 4500,-3500 B 2 -3000,4000 3000,3000 9400,-2600 3 -3500,4500 -2600,9400 4000,4000 Juegos Cooperativos En todos los juegos presentados (Prisioneros, Precios y Publicidad dos partes deben tomar una decisión, dónde los resultados dependen de las decisiones de ambas partes y bajo el supuesto que cada uno busca favorecer sus propios intereses. No obstante, cada uno escoge en aislamiento del otro, tomando la otra decisión como dada. Como resultado, los dos tienen resultados relativamente malos (larga duración en prisión o cero ganancias). 56
El Dilema del Prisionero ha sido influyente a lo largo de las ciencias sociales, desde la segunda mitad del siglo XX, porque ilustra cómo quienes toman las decisiones de manera racional y buscando proteger sus intereses, pero escogiendo sus estrategias en aislamiento, actúan recíprocamente para obtener resultados malos. ¿Pero es realmente racional actuar así? En el juego del Dilema del Prisionero, el aislamiento es impuesto por las reglas del juego --los Prisioneros han sido aislados por la Policía, y no tiene ninguna opción para comunicarse--. Pero los empresarios pudieron, en principio, ponerse de acuerdo en una estrategia común, y compartir las ganancias del mercado entre ellos. Así no estarían tomando la estrategia del otro como dada, sino que en cambio, estarían coordinando sus estrategias. Por supuesto, se diseñan leyes antimonopolios para hacer que conductas semejantes sean ilegales, y que han sido promulgadas porque muchas personas creen que los hombres de negocios no deberían colaborar para establecer precios altos en los mercados. Sin embargo, en otro tipo de problemas la cooperación también puede ser la mejor solución para un juego. Cuando en un "juego" las decisiones se coordinan, se establecen acuerdos para una estrategia común, y se comparten ganancias, el acuerdo al que se llega se llama una "solución cooperativa" del juego. Comprar y vender son de hecho, un juego cooperativo, en que el comprador y el vendedor son los dos "jugadores" y el precio en el que ellos están de acuerdo es su estrategia común. Veamos el ejemplo de la Bicicleta: A tiene una bicicleta pero no tiene máquina de juegos que desea. Una persona ha ofrecido comprarle su bicicleta por $ 20.000. B no tiene ninguna bicicleta, y desea tener una. Un amigo le ha ofrecido una por $ 45.000. Las estrategias disponibles para A y B son dar o guardar. Es decir, A puede darle su bicicleta a B o puede guardarla, y B puede darle su dinero a B o puede guardarlo. Esto es lo que se denomina "intercambio" A Da Guarda B Da 1,1 1,0 Guarda 0,1 0,0 Si se piensa en un juego no-cooperativo, este juego se parece mucho al Dilema del Prisionero. Guardar es una estrategia dominante y guarda-guarda es el equilibrio de la estrategia dominante, en la cual nadie da y los dos pierden. Siendo niños pueden desconfiar entre si y pueden llegar a no hacer el intercambio. Pero las sociedades de mercado tienen un rango de instituciones que les permiten a los adultos comprometerse mutuamente en transacciones beneficiosas. Así, se podría esperar una solución cooperativa, que estaría en la esquina superior izquierda. ¿Cuál sería el precio adecuado para que el intercambio fuera beneficioso para ambos? La mitad de la diferencia entre los dos precios de referencia de cada uno de ellos, o lo que es lo mismo de la MAAN de cada uno, ya que cada peso sobre 20.000 es una ganancia para A, y cada peso por debajo de 45.000 es una ganancia para B. Así el precio más conveniente para ambos, es de $ 32.500. Las soluciones de tipo cooperativo no son raras en una sociedad de mercado. Al contrario, ¡Ellas son la razón de ser de un sistema de mercado!.
57
Aplicación de un modelo de Teoría de Juegos dentro de la Ciencia Política Legados institucionales y estrategia electoral Cuando, a fines de noviembre de 1998, los principales líderes de La Alianza convocaron a una conferencia de prensa en el Hotel Bauen de Buenos Aires, los periodistas destacados anticiparon que finalmente el frente electoral compuesto por la Unión Cívica radical y el FrePaSo anunciaría su candidato a vicepresidente para las elecciones de 1999. Con sorpresa, sin embargo, recibieron un anuncio diferente. El diputado Rodolfo Terragno denunció que la administración Menem se preparaba a licitar importantes contratos públicos antes de las elecciones, comprometiendo así la capacidad de acción del gobierno entrante. Para detener este proceso, La Alianza entendía necesario lanzar una amenaza contundente: todo nuevo contrato firmado por el gobierno a partir de la fecha sería revisado en caso de que la oposición llegara al poder. El anuncio de Terragno abría una serie de interrogantes sobre el rol de las amenazas en un contexto electoral. En primer lugar, ¿por qué justamente La Alianza—un frente político cuya mayor fortaleza parecía estribar en la defensa del estado de derecho y la “seguridad jurídica”— amenazaría con desconocer las obligaciones contraídas por el estado? ¿No comprometía esta estrategia la credibilidad de su discurso en el largo plazo? En segundo lugar, ¿por qué esta amenaza resultó ser tan poco efectiva? En los meses subsiguientes al anuncio del Hotel Bauen, el gobierno abrió una serie de licitaciones críticas en las que los empresarios nunca desistieron de participar. El presente ensayo analiza estos problemas desde una perspectiva de teoría de los juegos. Nuestra interpretación modela la forma en que La Alianza intentó transformar los incentivos de los empresarios a través de una amenaza pública que incrementaba el riesgo de participar en las licitaciones. El problema, sin embargo, es que esta amenaza no resultaba suficientemente creíble, por lo que los grupos económicos decidieron aceptar el esquema de la administración saliente a pesar del riesgo futuro. La primera parte de este trabajo presenta un “juego” que refleja la situación inicial del gobierno, los empresarios y el frente opositor antes de noviembre. La segunda parte muestra que la amenaza operó como estrategia electoral para preservar la credibilidad de la oposición y al mismo tiempo intentar detener las licitaciones. A través de ella, los líderes de La Alianza buscaban alterar los incentivos del juego inicial a través de un compromiso público. En las secciones finales mostramos por qué la amenaza no resultó “creíble” (en un sentido estratégico) y por qué su efectividad fue limitada a los efectos de detener las licitaciones. Las conclusiones sugieren que este caso es una ilustración de un problema más amplio: los legados institucionales en el marco de la política presidencialista. Aplicación de un modelo de Teoría de Juegos dentro de la Ciencia Política Legados institucionales y estrategia electoral
58
PRIMER JUEGO: EL DILEMA DE LA SEGURIDAD JURIDICA Imaginemos un juego en el que participan tres jugadores: el gobierno saliente GS, un grupo económico de primer nivel que aspira a obtener los contratos ofrecidos por el gobierno, E, y un candidato de la oposición que aspira a constituir el futuro gobierno FG. El objetivo principal de GS en este juego es cerrar los contratos antes de que expire el período de gobierno. Esta preferencia puede ser entendida como un intento por acaparar los últimos frutos de la corrupción antes de abandonar el poder, pero también puede ser entendida como un interés genuino del gobierno por resolver importantes problemas con anterioridad al período electoral—en este punto, la interpretación sustantiva del juego queda librada a la preferencia del lector. Idealmente, GS preferiría cerrar los contratos con E dado que es un empresario de primer nivel que garantiza el cumplimiento de los acuerdos y brinda legitimidad al proceso, pero eventualmente prefiere cerrar los contratos con otro empresario si E se abstiene de participar en las ofertas. El objetivo principal de E en el juego es obtener los contratos del gobierno. Dado que E es un grupo empresario de primera línea, podría ganar los contratos en una licitación futura, pero para minimizar el riesgo este actor preferiría asegurarse los contratos en el corto plazo—incluso si esto exige un costo adicional limitado en términos de sobornos a los funcionarios del gobierno saliente. En una licitación futura, E ganaría los contratos con probabilidad g, en donde 0g1. Es importante notar que E es un actor moralmente neutral. Es decir, no tiene una preferencia especial—ni repugnancia—por un arreglo corrupto, simplemente desea asegurarse la concesión de los contratos lo antes posible. El escenario es riesgoso, sin embargo, porque el futuro gobierno podría revisar los contratos. De este modo, E está atrapado en un dilema. Si obtiene los contratos del presente gobierno y éstos son revisados en el futuro, no solamente pagará el costo de la negociación con el gobierno saliente (sobornos, costos de oportunidad, etc.) sino que finalmente perderá los contratos de cualquier manera—efectivamente, éste es el peor escenario posible para el empresario. De saber con seguridad que el futuro gobierno revisaría los contratos, E postergaría las negociaciones para reservar su capital—y su capacidad de soborno—para la próxima licitación. El problema es que si el futuro gobierno no revisa el caso, el gobierno saliente puede asignar los contratos a los competidores y E perdería toda oportunidad de ingresar en el negocio. El tercer actor es FG, el futuro gobierno. FG desea conservar control sobre los contratos y su escenario ideal es aquél en el cual el gobierno actual no contrae nuevas obligaciones antes de su salida—esto es, posterga las licitaciones para el próximo período constitucional.
59
Este ideal, sin embargo, resulta improbable dado que el gobierno saliente no tiene incentivos para cooperar con FG. FG puede revisar los contratos en el futuro—y recuperar así el control sobre las licitaciones—pero ha basado su ascenso electoral en la defensa de la seguridad jurídica y revisar los compromisos públicos tendría un costo para su credibilidad frente a la opinión pública y, en particular, frente a la clase capitalista. La estructura de preferencias de los tres actores está resumida en la Tabla 1. Por motivos de claridad en el argumento, el juego presenta tres pagos simples: –1, cuando el actor recibe su peor opción; 0, cuando recibe su segunda alternativa, y 1, cuando alcanza su objetivo preferido. Estos pagos tienen sentido heurístico, y podrían ser reemplazados por otros pagos representando la misma estructura de preferencias .[1] TABLA 1. ESTRUCTURA DE PAGOS PARA GS, E Y FG Pagos
Gobierno Saliente (GS) Empresario (E)
Futuro Gobierno (FG)
1
Cierra contratos con participación de E Cierra contratos, pero sin participación de E
GS no firma contratos. No hay necesidad de revisión. FG preserva credibilidad pero reconoce contratos firmados por GS FG viola promesa de seguridad jurídica y revisa contratos
0 –1
No cierra tardíos
Consigue contratos No paga a GS, pero pierde contrato contratos Paga a GS y pierde contrato
La Figura 1 sintetiza la estructura del juego. Cada uno de los tres jugadores tiene dos estrategias posibles. El primero en mover es el gobierno saliente, que deberá decidir si concede nuevos contratos (estrategia codificada como N), o si difiere las negociaciones para la próxima administración (~N). El segundo movimiento corresponde a E, quien debe decidir si prefiere negociar con el gobierno saliente (P) o evitar la participación en las licitaciones en curso (~P). El tercer movimiento se produce con posterioridad a la transferencia de gobierno en caso de que FG gane las elecciones. Corresponde al futuro gobierno decidir si revisará los contratos (R) o si respetará los compromisos públicos heredados de la administración anterior (~R).
. 60
Actor Estrategias GS (Gobierno Saliente): N (Negociar Nuevos Contratos), ~N (Postergar contratos) E (Grupo Económico): P (Participar en negocio), ~P (Esperar próxima vuelta) g (Probabilidad de ganar licitación en segunda vuelta) FG (Futuro Gobierno): R (Revisar los contratos), ~R (Aceptar validez de contratos)
(Recompensas en negrita señalan resultados en equilibrio) Cada “rama” del árbol representa un posible movimiento de un actor. En caso de que el gobierno saliente decida no convocar a la licitación (~N), el juego finaliza inmediatamente. En caso contrario, los otros actores deben jugar. Los valores entre paréntesis muestran cada posible resultado del juego: el primer pago corresponde a GS, el segundo a E y el tercero a FG. Por ejemplo, si el gobierno saliente llama a licitación, el grupo económico se abstiene de participar, y el nuevo gobierno revisa los contratos (trayectoria: N, ~P, R) el resultado para los actores es (0,g,-1). Esto es, GS otorga los contratos sin la participación de E, E obtiene la licitación en la segunda vuelta con probabilidad g—cuando el contrato es revisado—y FG pierde credibilidad en defensa de la seguridad jurídica. Es importante notar que de los cinco resultados posibles, sólo uno resulta viable si todos los actores protegen sus propios intereses.
61
Este resultado constituye un equilibrio Nash, en el sentido de que ningún actor cambiará su estrategia a menos que otro lo haga. La posición de equilibrio puede identificarse fácilmente utilizando el método de inducción inversa. Observemos al último actor en mover, FG: en cualquiera de los dos nodos, su estrategia dominante es ~R, dado que el resultado final es preferible a las consecuencias de revisar los contratos (R). Sabiendo que FG no revisará los contratos, E moverá P (participará en las negociaciones), de forma de asegurarse la licitación. GS, por su parte, siempre tiene N como estrategia dominante. De esta forma, la trayectoria N, P, ~R (recompensas en negrita en la figura) constituye el primer resultado en equilibrio. La principal conclusión del juego es que E tiene fuertes incentivos para participar de un arreglo corrupto con el gobierno saliente—dado que un gobierno honesto cumplirá con su palabra de defender la seguridad jurídica. Esta situación genera una verdaera paradoja electoral para FG. Cuánto más se esfuerza por presentarse ante el electorado como un candidato honesto, cuánto más enfatiza la defensa de la seguridad jurídica, mayor es la probabilidad de que los empresarios accedan a participar de acuerdos corruptos con el gobierno saliente. ¿Cómo salir de esta trampa? Aplicación de un modelo de Teoría de Juegos dentro de la Ciencia Política Legados institucionales y estrategia electoral SEGUNDO JUEGO: ESTRATEGIA ELECTORAL Y AMENAZAS CREIBLES Una posible salida de este dilema radica en la formulación de una amenaza creíble contra todo nuevo contrato. La amenaza creíble cambia la naturaleza del juego y las estrategias viables para los actores. Al comprometerse a revisar todos los nuevos compromisos públicos, FG emite una señal para los otros jugadores—en especial para E, quien teme perder los contratos obtenidos en el futuro. Esta amenaza debe realizarse públicamente, como parte de la campaña electoral, porque de este modo el prestigio de FG queda comprometido. Si el futuro gobierno no revisa los contratos pagará un costo político—lo que sugiere a los otros jugadores que FG cumplirá la promesa y de este modo brinda credibilidad a la amenaza. La formulación de una amenaza pública no transforma la estructura de preferencias de GS (quien todavía busca cerrar los contratos) o E (quien todavía busca asegurarse los contratos). Pero ciertamente puede cambiar el esquema de pagos para FG, quien ahora ha prometido a sus votantes a revisar cualquier nuevo acuerdo y deberá cumplir la amenaza con el objeto de preservar su credibilidad. Así, en el nuevo juego FG tiene incentivos adicionales para actuar de manera más agresiva y la revisión de las licitaciones, R, pasa a ser su estrategia dominante. La Tabla 2 presenta el nuevo orden de preferencias para el futuro gobierno. TABLA 2. ESTRUCTURA DE PAGOS PARA GS, E Y FG Pagos 1
Gobierno Saliente Empresario (E) (GS) Cierra contratos con Consigue 62
Futuro Gobierno (FG) GS no firma contratos.
No hay
0 -1
participación de E contratos Cierra contratos, pero No paga a GS, sin participación de E pero pierde contrato No cierra contratos Paga a GS y tardíos pierde contrato
necesidad de revisión. GS cumple su promesa de revisar contratos aunque afecte parcialmente seguridad jurídica GS preserva seguridad jurídica pero viola su promesa de revisar los contratos.
La estructura modificada del juego se presenta en la Figura 2 que sigue. El orden de los movimientos y las estrategias de los actores son iguales a los del primer juego, pero los resultados en equilibrio difieren porque la estructura de preferencias de FG ha cambiado: el futuro gobierno tiene ahora incentivos para revisar los contratos. Anticipando esta realidad, E evitará cerrar un acuerdo con el gobierno saliente; es decir que su estrategia dominante pasa a ser ~P.
Actor
Estrategias
GS (Gobierno Saliente): N (Negociar Nuevos Contratos), ~N (Postergar contratos) E (Grupo Económico): P (Participar en negocio), ~P (Esperar próxima vuelta) g (Probabilidad de ganar licitación en segunda vuelta) FG (Futuro Gobierno): R (Revisar los contratos), ~R (Aceptar validez de contratos) (Recompensas en negrita señalan resultados en equilibrio) Aplicación de un modelo de Teoría de Juegos dentro de la Ciencia Política Legados institucionales y estrategia electoral ¿CUAN CREIBLE ES LA AMENAZA? En principio, entonces, la amenaza pública aparece como un mecanismo efectivo para disuadir a E de participar en las licitaciones—e, indirectamente, para reducir las posibilidades del gobierno saliente de cerrar contratos de última hora. El problema, sin embargo, es más complejo porque E puede dudar de la decisión (o capacidad) de FG para llevar a cabo su amenaza en el futuro. En primer lugar, existe incertidumbre sobre la conformación del nuevo gobierno. Si el actual partido gobernante gana nuevamente las elecciones, la amenaza pierde sentido simplemente porque el futuro gobierno FG no estaría bajo el control de aquellos que 63
prometieron revisar los contratos. Aunque la oposición lleve una hipotética ventaja en las encuestas, existe siempre una probabilidad h de que el partido de gobierno sea reelecto (y por ende una probabilidad 1–h de que la oposición llegue al poder). En segundo lugar, existen dudas con respecto a validez de la amenaza incluso si la oposición llega al poder. Una vez en el gobierno, FG puede descubrir que el costo de reabrir las licitaciones es demasiado elevado para el estado, puede enfrentar prioridades de gobierno que le impiden ocuparse del tema, puede descubrir que la opinión pública no está interesada en las licitaciones del pasado, etc. Digamos, para simplificar el argumento, que el futuro gobierno de la oposición puede ser de dos tipos: un gobierno blando, que olvidará rápidamente su amenaza y privilegiará la defensa de la seguridad jurídica, o un gobierno duro, que castigará a quienes desafiaron su amenaza revisando los contratos. Si E anticipa la presencia de un gobierno blando, debe ignorar la amenaza y actuar como si jugara el primer juego. Si, por el contrario, espera confrontar un gobierno duro, debe tomar la amenaza seriamente. Es decir que, en un marco de incertidumbre, E no tiene claridad con respecto a cuál es el juego que debe jugar. Los actores E y GS ignoran el verdadero tipo de FG, pero pueden anticiparlo con cierta probabilidad. Denotemos como j a la probabilidad de que FG pertenezca al tipo “blando”—y por ende (1–j) a la probabilidad de que pertenezca al tipo “duro.” De acuerdo con lo expuesto, la probabilidad de que el gobierno entrante revise los contratos se reduce a la probabilidad de que la oposición gane las elecciones (1–h) ponderada por la probabilidad de que ejecute la amenaza si gana (1–j). Denominemos a este factor que refleja la “credibilidad” de la amenaza como p, en donde p=(1–h)(1–j). 1[2] Desde este punto de vista, la credibilidad de la amenaza tiende a ser baja en cualquier escenario realista. Supongamos que el gobierno saliente tiene chances limitadas de regresar al poder (h=.4) y que el partido opositor tiene fama de “duro” (j=.3). En este escenario favorable, p=.42. Imaginemos ahora que la fama de “dureza” de la oposición se debilita un poco y j=.5. En este caso, p=.30, es decir que los empresarios anticipan apenas un 30% de posibilidades de que la amenaza sea cumplida. En muy pocas ocasiones el valor de p superaría el umbral de .50, lo que hace a la amenaza muy poco creíble. La figura que sigue ilustra el juego en un contexto de incertidumbre. El primer movimiento corresponde al destino (D), que determina con probabilidad p si la amenaza de FG se cumplirá en el futuro. La mitad superior del juego (si FG no está en manos de la oposición, o ésta ejerce un gobierno blando) corresponde al juego descrito en la Figura 1, la mitad inferior (cuando la amenaza es creíble), a la Figura 2. Las líneas punteadas señalan que ni GS ni E conocen con certeza en qué situación se encuentran—aunque pueden estimar el valor de p. Esto es irrelevante para el gobierno saliente, que prefiere cerrar los contratos en cualquier circunstancia, pero es importante para el empresario, quien enfrenta serios costos si evalúa erróneamente la naturaleza del futuro gobierno. 1 64
Ahora bien, si éste estima que el valor de p es relativamente bajo en cualquier escenario realista, deberá asumir como probable que el juego se desarrolle en la mitad superior del esquema. Carente de credibilidad, la amenaza electoral se torna entonces en un arma poco efectiva para alterar la estrategia del empresariado.
Actor GS (Gobierno Saliente): E (Empresario): FG (Futuro Gobierno):
Estrategias N (Negociar Nuevos Contratos), ~N (Postergar contratos) P (Participar en negocio), ~P (Esperar próxima vuelta) R (Revisar los contratos), ~R (Aceptar validez de contratos)
(Recompensas en negrita señalan resultados en equilibrio) Aplicación de un modelo de Teoría de Juegos dentro de la Ciencia Política Legados institucionales y estrategia electoral LAS LECCIONES DEL JUEGO La principal conclusión de este juego es que si FG quiere que su amenaza surta efecto sobre la estrategia del empresario deberá convencer a E de que 1) tiene serias chances de ganar la elección; y 2) es un jugador “duro,” Este argumento puede resumirse en una hipótesis simple: la probabilidad de que E participe de las licitaciones será mayor cuanto menor sea el valor de p. Sin embargo, la estrategia del empresario también está informada por su propia capacidad competitiva. Si éste tiene pocas oportunidades de ganar los contratos en una licitación futura, entonces estará más dispuesto a correr riesgos negociando con el gobierno saliente.
65
Esto conduce a una segunda hipótesis: la probabilidad de que E participe en las licitaciones es mayor a medida que cae el valor de g. El lector interesado en la prueba matemática de estas hipótesis puede considerar algunos ejemplos que presentamos a continuación. Para que E participe de las licitaciones, es necesario que la utilidad esperada de participar U[P] sea mayor que la utilidad esperada de no participar U[~P], en donde, de acuerdo con la Figura 3: (1) U[P] = (1–p)(1) + p(–1) = 1–2p (2) U[~P] = (1–p)(0) + pg = pg Para ilustrar nuestras conclusiones, utilizamos tres posibles valores para p: los actores tienen certeza de que FG es un “blando” (p=0), las chances de que la amenaza sea creíble están equilibradas (p=.5), o los actores tienen certeza de que el futuro gobierno cumplirá su amenaza (p=1). De la misma forma, imaginamos tres posibles tipos para E: no tiene ninguna posibilidad de ganar los contratos en una licitación futura (g=0), tiene una posibilidad moderada (g=.5), o tiene certeza de ganar la licitación futura (g=1). La Tabla 3 ilustra la interacción entre estos dos factores. A iguales valores de g, cuanto mayor es el valor de p, mayores son los incentivos para cerrar un acuerdo con el nuevo gobierno. Cuando el valor de g crece, sin embargo, los incentivos para participar de las licitaciones en el corto plazo se reducen. TABLA 3. UTILIDAD ESPERADA DE P Y ~P PARA DIFERENTES VALORES DE p Y g p 0.0 0.5 1.0 0.0 0.5 1.0 0.0 0.5 1.0
g 0.0 0.0 0.0 0.5 0.5 0.5 1.0 1.0 1.0
U[P] 1 0 -1 1 0 -1 1 0 -1
U[~P] 0 0 0 0 1/4 1/2 0 1/2 1
Nota: valores en negrita muestran estrategia preferida La interacción entre p y g también puede ilustrarse a través de un gráfico como el que se presenta en la Figura 4. La línea gris muestra la utilidad esperada de participar en la licitación, dependiendo de la probabilidad de que la amenaza sea cumplida, p. Las dos líneas punteadas muestran la utilidad esperada de no participar cuando E tiene una baja probabilidad de ganar los contratos en una licitación futura (g=.3) y cuando es un grupo económico altamente competitivo (g=.8). La intersección entre la diagonal gris y cada una de las diagonales punteadas muestra un “punto de indiferencia” a partir del cual los riesgos de participar en una licitación comienzan a superar los beneficios.
66
La Figura 4 sugiere que la utilidad de participar en las licitaciones del gobierno saliente se ve rápidamente superada por el riesgo incluso cuando la amenaza no resulta demasiado creíble. El problema es que, tal como mostramos anteriormente, la credibilidad de la amenaza tiende a ser muy baja en casi todos los escenarios realistas, y difícilmente p>.5. Esta falta de credibilidad de la amenaza nos lleva a concluir que, en circunstancias reales, el empresariado preferirá negociar las licitaciones en el corto plazo y correr riesgos en el futuro, a menos que el partido de gobierno saliente sea absolutamente débil en términos electorales y que la oposición se muestre dispuesta a cumplir su amenaza a cualquier costo. Estas condiciones, sin embargo, estuvieron ausentes en los primeros meses de 1999, lo que en buena medida explicaría el fracaso de la estrategia electoral para frenar las licitaciones CONCLUSIONES: EL PROBLEMA DE LOS LEGADOS INSTITUCIONALES El modelo desarrollado sirve esencialmente para ilustrar un problema de carácter más general. Debido a su amplios poderes formales e informales, el poder ejecutivo tiene capacidad para tomar decisiones de largo plazo que condicionan la autonomía y la capacidad de acción de futuros gobiernos—aún cuando el actual partido gobernante haya salido del poder. Denominamos a esta cuestión el problema de los “legados institucionales” porque las futuras administraciones enfrentan un dilema: o bien aceptan los condicionamientos heredados del pasado o bien desconocen la validez de estos compromisos, afectando con ello la institucionalidad democrática (en tanto entendemos las instituciones como pautas regulares y predecibles de comportamiento). Los legados institucionales se manifiestan en tres niveles. El primero es el de los nombramientos—por ejemplo, cuando el presidente designa jueces o funcionarios que continúan ejerciendo influencia bajo administraciones posteriores.
67
El segundo nivel es el de los recursos. El ejemplo de las licitaciones que motiva este ensayo ilustra bien cómo el ejecutivo del presente puede condicionar la distribución de recursos públicos en el futuro. El tercer nivel, ciertamente el de mayor importancia, es el de las reglas del juego. Las reformas constitucionales o del sistema electoral impulsadas por el ejecutivo son muestras claras de cómo las reglas del juego democrático pueden ser alteradas en el largo plazo. En términos generales, la existencia de legados institucionales es un atributo positivo y necesario de la vida democrática (y del estado de derecho en general). La estabilidad jurídica exige que cada nuevo gobierno no recree radicalmente las políticas públicas—lo que resultaría de cualquier modo operativamente imposible. El problema de interés, sin embargo, es la capacidad de un presidente saliente para utilizar los legados institucionales como arma política en cuestiones puntuales, de modo de inmovilizar a la oposición cuando llegue su turno de gobernar. ¿Es legítimo anticipar este dilema y bloquear las decisiones del gobierno saliente? Y lo que es igualmente importante, ¿existen vías efectivas para lograrlo? Nuestro modelo sugiere que las amenazas electorales son un recurso poco efectivo para tal fin, a menos que resulten altamente creíbles. Pero la cuestión general de los legados institucionales merece un estudio más amplio que promete abrir otras interesantes (y políticamente relevantes) preguntas de investigación. La Teoría del Drama En la búsqueda del perfeccionamiento de la Teoría de Juegos Analice esta historia real: Dos economistas viajeros, especializados en Teoría de Juegos tomaron un taxi a su hotel desde el Aeropuerto. Preocupados porque iban sobrecargados, decidieron no negociar sobre el precio hasta que llegaran al hotel, cuando su posición sería muy más fuerte. Pero su estrategia basada en la absolutamente racional teoría de juegos no funcionó demasiado bien. El chofer se ultrajó tanto con esta conducta que cerró con llave las puertas del taxi, manejó de vuelta a dónde ellos habían empezado, y los descargó en la calle. Que había salido mal? Aunque el taxista no conocía nada de la teoría de juegos, él supo cuando las personas estaban jugando juegos con él, y no le gustó. E hizo algo que a los teóricos del juego no les gusta: se enfado, actuó incluso contra sus propios intereses al no cobrar y recorrer dos veces la misma distancia, y cambió el juego. No se trataba solamente de un juego, era un drama, donde las creencias y valores de los caracteres evolucionaron según la situación. La teoría del drama había nacido. En su corazón estaba la idea que los juegos no son estáticos, y que los acuerdos no son necesariamente decididos por la racionalidad, sino que son situaciones dinámicas que pueden ser absolutamente transformadas por las emociones de los jugadores. Su planteamiento central se sitúa en que las emociones juegan un papel importante activando contestaciones y respuestas, racionales o irracionales según sea la óptica de análisis del caso. Se originó buscando perfeccionar la TEORÍA de JUEGOS que se basa en las matemáticas pero cuyas aplicaciones son intuitivas al responder a una situación dependiendo de cómo se evalúan las diversas opciones. Nigel Howard, Peter Bennett, Morris Bradley, Jim Bryant., Sheffield Hallam University Hugh Miall, Lancaster University Steven Brams, New York University Peter Bennett, Britain's Department of Health in London 68
Las reflexiones que dieron origen a la Teoría del Drama En un juego simple de "suma cero" las valoraciones se capturan en una "matriz de resultados" en la que lo que es bueno para usted (una valoración alta) es una penalización exactamente igual de mala para el otro jugador. En una situación hipotética los Militares deben analizar si los guerrilleros atacaran o no. Frente a esta situación deben decidir si se prepararan de antemano o no invierten tiempo y recursos en esta tarea. Cada una de las cuatro posibles combinaciones tiene su propia valoración. Por ejemplo, se puede pensar que actuando anticipadamente por lo menos se dará alguna práctica útil a los hombres, incluso si los guerrilleros no atacan, pero esto tendrá un costo reflejado en la matriz de resultados como –1, la ganancia por el contrario será de 5, si el ataque se produce y se esta preparado para enfrentarlo. Por supuesto, si los guerrilleros también actúan racionalmente, ellos preverán su opción no atacando y obteniendo una ganancia de sólo 1 en lugar de 5, lograda porque consiguieron al menos mantener en tensión a los militares. Pero si usted decide que actuando pueden arriesgar a su informador de inteligencia, o esta extremadamente confiado en que no atacaran, la decisión podría tener finalmente costos muy altos o ninguno. Guerrilleros
Militares
Atacan
No Atacan
se Preparan
(5, - 5)
(-1, 1)
No se Preparan
(-5, 5)
(0 , 0)
No obstante, las cosas se vuelven más complicadas en los juegos de “suma no-cero” en los que lo que es bueno para un jugador también puede ser bueno para el otro, y es aquí donde entra la teoría del drama. Supongamos el tradicional juego del gallina donde Buzz y Jumbo se enfrentan con sus coches, frente a frente. Quien desvía es un gallina. Claramente, desviar pueden ser bueno para ambos, --y manejar adelante sin desviarse, desastroso para los dos. Buzz
Jumbo
Desvía
No Desvía
Desvía
(3, 3)
(2, 4)
No Desvía
(4, 2)
(1 , 1)
Las emociones pueden llevar a que cualquiera de los dos decida racionalmente si se desviará, o no Una posibilidad es que Jumbo y Buzz respondan a sus propios miedos según se acerca el día del concurso, o podrían llegar a reconocer el valor que tiene cada uno y quizás incluso llegar a sentir simpatía por el otro. Esta relación emocional podría hacer que Jumbo valorara el acordar una desviación conjunta, que se transformaría en un salvavidas por encima incluso de su propia victoria potencial. Pero, por otro lado, si Buzz acosa implacablemente a Jumbo, acusándolo de no ser un "hombre real", el enojo 69
ciego de este podría llevarlo a resolver su paradoja prefiriendo la muerte a la deshonra – y no desviando. Entendiendo estas acciones y las reacciones no sólo se pueden analizar conflictos potenciales, sino que también es posible llegar a gestionarlos en nuestro beneficio. El análisis resultante de la teoría del drama muestra que pueden plantearse soluciones convincentes para los juegos resolviendo las paradojas, a través precisamente del estudio de las pendientes que ellas crean (es decir las fuerzas que producen), para cambiar un juego de una u otra manera por medio de la alteración de las preferencias de los jugadores. En el juego del gallina parece bastante racional para Jumbo querer ganar. Para lograrlo debe convencer a Buzz que él no desviará, no importa cuánto Buzz insista en que él no lo hará. Pero viniendo de una persona racional, la amenaza de Jumbo es escasamente creíble: ninguna persona sensata declararía una determinación para seguir a Buzz hasta el infierno. Como sucede con los juegos de suma-cero, también en estos otros hay una regla para encontrar estrategias óptimas para los juegos más complejos. El teorema de Nash dice que siempre es posible para un jugador escoger una estrategia que es mejor para él, cuando todos los otros jugadores también están siguiendo sus mejores estrategias. En este "equilibrio", ningún jugador puede mejorar sus perspectivas escogiendo una estrategia alternativa. Pero en este caso no hay solo UN estado de equilibrio para el juego, hay dos: usted puede decidir desviar, mientras la otra persona planea continuar manejando, o viceversa. En cualquier caso, ni usted ni su antagonista pueden mejorar su cuenta cambiando su mente unilateralmente. Pero cual estrategia es "mejor?" Solo los jugadores verdaderamente irracionales pueden amenazar con no desviarse no importa que tan creíble sea eso--y así para lograr una estrategia racional es necesario ser completamente irracional. En la solución existen tres tipos de paradojas: por una parte se encuentra una "paradoja de la racionalidad" y por la otra una "paradoja de credibilidad" y una "paradoja de la inducción". Jumbo debería elaborar una amenaza irracional, pero por sobre todo creíble, para inducir a Buzz a desviar, dejando de actuar racionalmente, y comportándose como un loco ANTES de ir a cualquier parte en su automóvil. Así, su amenaza para seguir manejando se volvería para todos creíble. De manera diferente a la insistencia de la teoría del juego en adoptar la racionalidad como una guía para comportarse, este ejemplo muestra como el comportamiento irracional a veces paga. Las maneras en las que las personas reaccionan a las paradojas están en el corazón mismo de la teoría del drama. La idea básica es que las paradojas tienen un efecto emocional en los caracteres. Y la razón por las que estas emociones surgen --como enojo y temor, o afecto y buena voluntad-- es que ellas tienen, desde siempre, un papel dentro de la representación dramática de la vida. En esta misma línea, el famoso enigma del Dilema del Prisionero, involucra una "paradoja de cooperación": cada prisionero debe convencer al otro que ellos actuarán como un equipo silencioso a pesar del hecho que para cada uno lo mejor a hacer es hablar. Para cada prisionero como un individuo, el teorema de Nash da una única, racional solución: acepte la oferta policíaca, y salga hablando. Pero para el par de bandidos como un equipo, es preferible gastar ambos un mes en prisión a encerrar a uno de ellos con llave durante años, pero la única manera de lograr esto es que ambos prisioneros pongan su confianza en el otro. 70
Según la teoría del drama, lo que realmente sucederá dependerá de las emociones y eventos que tuvieron lugar en la vida de los prisioneros. Para los compañeros duraderos en el crimen como Butch Cassidy y el Sundance Kid, las ataduras emocionales prevalecerán cuando ellos enfrenten la paradoja de la cooperación. Pero si uno de los prisioneros siempre ha sido un cómplice involuntario, la paradoja de la cooperación activará el enojo y la desconfianza y cada uno actuará para salvar su propia piel. Que los juegos pueden cambiarse no es una idea nueva. Lo que realmente es un aporte de la teoría del drama es la sugerencia de que en los juegos frecuentemente se activan emoción y cambio de las preferencias, de acuerdo con las paradojas involucradas. Y que estas activaciones y cambios pueden ser analizados, deducidos, gerenciados, utilizados y predecidos. Que es la Teoría del Drama Todos los días la vida se desenvuelve siguiendo el guión de una obra teatral, poblada por actores ( individuos y/o grupos) que buscan alcanzar sus propios objetivos, y donde a menudo posiciones diversas están compitiendo de una manera confrontativa. La teoría del drama es una herramienta que permite investigar e interpretar situaciones por medio del análisis de las interacciones. A trabes de la aplicación de un marco conceptual analítico sustentado en una base matemática rigurosa se pueden manejar las interacciones estratégicas con otros más eficazmente, - sea como colaborador, competidor, cliente o proveedor,. explorando y evaluando oportunidades futuras y desafíos de una manera novedosa. Las visiones que se desarrollan permiten elaborar políticas coherentes, y formular iniciativas estratégicas diferentes. En la teoría del drama el desdoblamiento de situaciones a través del tiempo se ve más bien como el guión para un drama, que involucra una sucesión de episodios. en el tiempo, donde cada uno de ellos está relacionado con otros y el resultado de cada episodio es otro episodio.
Los episodios son considerados de manera diferente por cada uno de los implicados, según los marcos de cada participante. La teoría del drama modela cada marco subjetivo basado en: Caracteres: determinados por sus posiciones y limites Opciones: oportunidades de acción para cada carácter Utilitarios: valor de futuros posibles para cada carácter Una distinción importante con la teoría de juegos es que se pueden producir cambios en el desarrollo de los episodios como resultado de las presiones internas y externas. Algunos marcos son no-problemáticos. La resolución se puede alcanzar dando a cada uno satisfacción plena. Con frecuencia sin embargo, los caracteres se enfrentan en un 71
momento de la verdad donde un marco no puede ser resuelto. Quizás sus posiciones son irreconciliables; quizás los caracteres no pueden confiar en cada uno de ellos etc. Esto se llama una confrontación, y es el corazón de la teoría del drama: El único escape de los caracteres es alterar el marco. En tal caso, los caracteres que desean actuar racionalmente deben hacer frente a varios dilemas. Cualquier elemento del bastidor puede ser cambiado (caracteres, opciones o utilitarios), sin embargo habrá siempre un ' costo emocional ' de tales cambios puesto que implican una revisión fundamental de cómo responder a lo qué está aconteciendo y a lo que acontecerá a continuación. La teoría del drama anticipa cuáles serán estos efectos emocionales, y cómo cambiará el marco.
Un ejemplo de aplicación Un productor de programas de computador desea vender un lote de programas ahora que el mercado esta receptivo al producto. No puede permitirse el lujo de regalarlo a un precio muy bajo, pero si pusiera un precio demasiado alto nadie querría comprarlo. Tomó contacto con un distribuidor minorista de software que está seguro que puede revender una cantidad grande del programa si el precio es suficientemente bajo. La Situación: Vendedor Comprador El punto de vista Debe decidir el precio al que Debe decidir cuánto software venderá el software quiere comprar. Debe seleccionar entre poner un Debe decidir si compra una precio alto o un precio bajo cantidad grande o una pequeña Existe un amplio rango de Podría ofrecer comprar cualquier posibilidades para tomar la cantidad decisión La Posición Vendiendo una gran cantidad del Por sobre todo al distribuidor le software a un precio alto gustaría comprar una gran generará una buena ganancia y cantidad de software a un precio podrá cambiar el programa antes bajo para salir luego del programa de que se vuelva obsoleto. y obtener una rápida ganancia. ¡Esto es lo que mas le gustaría - El proyecto no es muy atractivo y el comprador lo sabe!. para el comprador ya que esta ¡Pero es el resultado que menos proporcionando el mercado que le gustaría al distribuidor! es lo fundamental. Las Amenazas Intentara obstinadamente exigir Rechazará comprar una cantidad un precio alto. grande a un precio alto 72
Alternativa: Resultado preferido Resultado que menos gusta Sólo Cantidad Grande, podría ser peor Precio Alto y Precio Alto Cantidad Pequeña Alternativa: Resultado que menos gusta. Sólo Resultado preferido Cantidad Grande, podría ser peor Precio Bajo y Precio Bajo Cantidad Pequeña Futuro Pre - Nadie quiere esto Nadie quiere esto configurado: Cantidad Pequeña, Precio Alto ¿Cómo puede el Vendedor persuadir al Comprador a adoptar su posición? Un ejemplo de aplicación: Una posible Solución Los Dilemas del Vendedor Cómo puede persuadir al Comprador a adoptar SU posición? (1) Debería tratar de persuadirlo de optar por SU posición dado que el futuro preconfigurado puede ser peor. Pero dado que se enfatiza en el precio alto, es improbable que esta posibilidad sea aceptada (2) Podría cambiar la posición generando una alternativa que sea preferible a la del futuro pre-configurado Una posibilidad es ofrecer inicialmente una pequeña cantidad a un precio bajo en el entendido que luego se compraría una mayor cantidad a un precio mayor. (3) Podría cambiar completamente la posición ofreciendo por ejemplo un precio intermedio. pero como probablemente el comprador intentaría bajar este al máximo, no parece muy conveniente ir por este camino. El Comprador tiene la última palabra si se desea hacer un trato, y el Vendedor siempre puede cambiar sus costumbres. Una mejor alternativa podría consistir en ser más creativo para logra cerrar un mejor trato examinando cuestiones como las siguientes: Quizás deberían hablar sobre los intereses mutuos a largo-plazo trabajando conjuntamente como proveedor y cliente Quizás deberían contemplar en las discusiones algunas de las otras cosas que se están ofreciendo tales como: términos del crédito, servicio de calidad, rápida distribución, etc. (nota de Temas de Negociación: Como puede observarse los amigos ingleses creadores de la teoría del Drama al final llegan a los mismos resultados de la Negociación Integrativa, lo que no deja de ser interesante ya que interrelacionan fácilmente la teoría de Juegos con los Elementos de la Negociación Efectiva). Las 6 Estapas del Modelo de Resolución Dramática Según la Teoría del Drama, existe un proceso natural, a través del cual los seres humanos resuelven sus diferencias:
73
ETAPA 1 En primer lugar se establece el Escenario donde serán colocados el o los problemas a resolver, por parte de los caracteres involucrados o por una autoridad superior, como resultado de una circunstancia o la continuación de un episodio precedente. ETAPA 2 Dentro del escenario planteado los caracteres generan su comprensión particular del problema y establecen en que, como y por que difieren. Es decir se define el Marco de Referencia del Problema que contiene elementos compartidos y percepciones diferenciadoras. ETAPA 3 Si los caracteres encuentran que su diferencia no es sustancial o existe una real intención de solucionarla de manera cordial, es posible construir un Acuerdo. ETAPA 4 Si por el contrario los caracteres encuentran que su diferencia es profunda comienza el Clímax el cual los caracteres definen sus posiciones con base en: los requisitos mínimos sobre los que se debería formular el acuerdo final, según los planteamientos de cada uno de los involucrados (limites positivos) las acciones unilaterales que cada uno adoptara si estos requisitos no se incluyen (limites de abandono) El Clímax es la etapa en la cual, una vez fracasada la tentativa de acuerdo, los caracteres se encuentran bajo presión para cambiar aquello que suponían su posición final o la forma en que percibían su marco de referencia (percibiendo además lo que cada uno de los otros percibe). Bajo esta presión, los caracteres generan argumentos racionales y emocionales para si mismos y para los otros, buscando acomodar el cambio posible en los sistemas de creencias y de valores. La Emoción es necesaria para generar los cambios ya que de hecho los caracteres asumen como reales sus marco de referencia, las oportunidades que se le presentan y sus propias preferencias. Con base en todos estos elementos generan sus decisiones "finales" y adoptan sus posiciones. La calma y las frías consideraciones (y reconsideraciones) no producen los cambios, es necesario que intervenga el amor, la ira o el miedo. Los cambios son motivados por la emoción y producen la revisión de las evidencias y las razones. Dentro de todo esto se genera una paradoja. Tan solo cuando el marco de referencia y las posiciones son adoptadas como "finales" es que se puede generar un cambio real, 74
porque es tan solo allí que se genera la emoción suficiente que posibilita la movilización de los caracteres. Una vez que los caracteres han tenido la posibilidad de analizar y comprender suficientemente su diferencia y sus posibilidades entonces pueden comunicarse y proporcionarse la información que cada uno requiere. Esto generalmente sucede en la etapa de solución Cuando los cambios ocurren, los caracteres lógicamente generan un nuevo marco de referencia y se asumen nuevas posiciones que llevan a un Acuerdo. Para finalmente resolver sus diferencias, los caracteres deben completar los ciclos de clímax y marco de referencia hasta ingresar a la etapa de solución (existiendo en cada uno de ellos el riesgo de ingresar a la etapa de conflicto). ETAPA 5 Pero los cambios pueden no producirse. La presión puede no ser lo suficientemente alta debido a: que no es posible para las partes aceptar las evidencias. (sus arrogantes amenazas eran intolerables para mi), no es posible atentar contra la escala de valores (Yo prefiero la vida sana a la muerte dosificada), o no puede existir discusión alguna (nunca dejare a mis hijos). Si el cambio es imposible los caracteres ingresan a la etapa del Conflicto y asumen automáticamente sus limites de abandono. Mientras que la solución es un producto conjunto de los caracteres, el Conflicto es preparado por cada una de las partes de manera unilateral y por separado. ETAPA 6 Existen dos tipos de Desenlace, Solución Acordada o Generación del Conflicto dependiendo de si la Solución se ha logrado o no, o si pasando por un Clímax como una etapa necesaria dentro del proceso, los caracteres han sido incapaces de evitar el Conflicto. Lo que realmente pasa en el Desenlace (acuerdo o conflicto), probablemente será muy diferente de lo que los caracteres esperaban. Realmente nadie puede prever que el futuro llegara a suceder según sus planes; aunque la obligación es intentar construirlo lo más cercano posible. Lo que el modelo pretende mostrar es cómo los humanos intentan influir en el futuro trabajando juntos, así a veces no lo hagan. El desenlace vuelve a generar un nuevo episodio dramático para los mismos caracteres, aunque generalmente se incorporan otros nuevos adicionales. El progreso de un drama puede ser concebido como una pieza de música. Cada episodio tiene el potencial de llegar a una solución, un acuerdo o en un conflicto. o puede ser interrumpido por otros temas. La no-resolución levanta la expectativa de episodios extensos, cuando quiebra temas que requieren solución. A estos temas, el desenlace agrega un nuevo e inesperado material. Decisiones Reversibles e Irreversibles El Escenario y el Descelance difieren de las otras etapas en un aspecto fundamental. Una vez que se ha ingresado en ellas no se puede volver atrás. Volver a establecer el escenario implica comenzar un NUEVO episodio. Así mismo una vez generada una definición final (acuerdo o conflicto), tan solo es posible volver a un desenlace de otro episodio, NO del mismo que ya se cerro. Antes de estas etapas existe un cúmulo de intenciones de comunicación, creencias, valores, razones, etc. que no se han concretado en decisiones tomadas. Siempre es posible invertir una intención o una creencia. Siempre se puede regresar. Por ejemplo, puedo salir de las negociaciones y entrar en la fase del Conflicto, pero siempre puedo regresar al Clímax, re-entrando en el cuarto e intentando, por ejemplo hacer una nueva oferta. Si tengo éxito, regresamos del Clímax al Acuerdo. 75
De hecho mientras más reversible es una decisión importante, mas fortaleza debe tener su presentación para que genere el efecto deseado de persuadir ya que la lentitud deliberada señala indecisión. Para llevar a cabo una decisión irreversible debo jugarla durante un tiempo tal que pueda llegar al límite de tiempo de un episodio. La definición temporal de un episodio debe ser tal que a menos que sea interrumpido por una nueva información, continúa hasta que se resuelva totalmente o se genera algo irreversible. La decisión de una esposa, que esta perdiendo un juego de ajedrez, de tirar las piezas por la cabeza de su marido es un ejemplo de decisión irreversible, un episodio terminado por una decisión. Lo que pasa luego constituye un nuevo episodio. Suponga, por otro lado, que ella solo se ha enfurruñado. Enfurruñarse es reversible, y el episodio continúa hasta que suceda alguna otra cosa. Cierre Informativo Nótese la importancia de alcanzar la solución por medio de la no-interrupción. No pueden resolverse satisfactoriamente temas si se traen continuamente nuevos hechos inesperados. Una función muy importante de la fase del Marco de Referencia del Problema es generar un cierre informativo: para poner a los caracteres en un cuarto (metafórico o real) en que ellos intercambien información pero fuera de las fuentes externas hasta que los problemas entre ellos este resuelto. Recíprocamente, una manera importante de retardar una solución es seguir abriendo brecha en el cierre informativo; proporcionando continuamente nuevos hechos. Dentro del Modelo, la interrupción significa un retorno a la etapa inicial y el principio de un nuevo episodio. La escena tiene que ser re-puesta debido a los nuevos e inesperados factores que han entrado.
76
View more...
Comments