Para formar las características básicas de la teoría de juegos, consideremos una versión simplificada del juego de los dos dedos.
Este juego incluye a dos jugadores, los cuales muestran simultáneamente uno o dos dedos de una mano.
Luis y Andrea están practicando este clásico juego, si ambos muestran un dedo, Andrea la paga a Luis $6, si Luis muestra un dedo y Andrea dos, Luis paga a Andrea $11, si Luis saca dos dedos y Andrea uno, Andrea paga a Luis $3, si Luis saca dos dedos y Andrea dos dedos, Luis paga a Andrea $2.
Teniendo en cuenta que Luis es el jugador renglón y Andrea el jugador columna, el arreglo matemático de apuestas se resume en la siguiente matriz, llamada Matriz de recompensa:
JUGADOR COLUMNA
| |||
muestra un dedo
|
muestra dos dedos
| ||
JUGADOR RENGLON
|
muestra un dedo
|
6
|
-11
|
muestra dos dedos
|
3
|
2
|
Para el renglón 1 columna 1, indica que Andrea le paga a Luis $6, en este caso el premio de Luis es $6 y el de Andrea es $-6 por lo tanto para el resultado de este caso y el de los demás la suma de los premios es 0, por lo tanto el juego se denomina suma cero.
Esto significa que la ganancia de Luis y Andrea promedian entre $0 por cada juego, si este lo realizan una gran cantidad de veces, pero Luis sospecha que él lleva más ventaja porque tiene más maneras de ganar a Andrea, y esta sospecha que ella lleva ventaja porque cuando gana, sus éxitos son mayores que los de Luis.
ESTRATEGIAS PURAS
De las estrategias la más simple de todas es aquella en la que el jugador constantemente elige siempre el mismo renglón o columna, a dichas estrategias se les denomina estrategias puras.
Usando la matriz de recompensa del juego de Luis y Andrea donde I es sacar un dedo y II es sacar dos dedos encontremos cuales son las estrategias puras que usa cada uno de ellos y determinar si alguno debería desviarse de su mejor estrategia pura:
I
|
II
| |
I
|
6
|
-11
|
II
|
3
|
2
|
La mayor ganancia de Luis ocurre cuando él y Andrea muestran un dedo, sin embargo si el muestra constantemente un dedo, Andrea descubrirá pronto la estrategia de Luis y de igual forma ella mostrara siempre dos dedos, lo cual daría como resultado que sea Luis quien pague a Andrea $11 por juego. Por otra parte si Luis siempre muestra dos dedos, Andrea del mismo modo mostrara dos dedos con lo cual solo pagara a Luis $2 por juego. Para Luis es mejor recibir $2 que paga $11, así su mejor estrategia pura consiste en mostrar siempre dos dedos.
Si Andrea muestra constantemente un dedo tendría que pagar $6 o $3 a Luis. Este respondería ante esta estrategia para mostrarle un dedo con los cual ganaría $6 por juego. Si Andrea muestra siempre dos dedos, pagara $2 a Luis o éste pagara $11. A su vez Luis respondería mostrando dos dedos y ganaría $2 por juego. Andrea estaría mejor si pagara $2 en vez de $6, asi su mejor estrategia pura es mostrar siempre dos dedos.
Andrea no deberá desviarse de su mejor estrategia pura porque si lo hace deberá pagar a Luis $3 por juego. De la misma forma Luis no deberá desviarse de su mejor estrategia pura, porque de lo contrario deberá pagar $11 a Andrea por juego.
VALOR DEL JUEGO
Si Luis y Andrea se consolidan con sabiduría a sus mejores estrategias puras, cada uno elegirá siempre dos dedos lo cual favorecería siempre a Luis, incluso seria aun más sabio si Andrea se retira del juego, ya que Andrea siempre pagara $2 a Luis, a este $2 se le denomina valor del juego.
Una forma más sencilla de determinar el valor del juego y la estrategia más pura de un jugador es de la matriz de recompensa elegir el mínimo de cada renglón y de esos el máximo y el máximo de cada columna y de esos el menor, también se le conoce como criterio mini Max para los renglones y criterio MAXI mini para la columna, lo cual se realiza así:
I
|
II
|
miniMAX
| |
I
|
6
|
-11
|
-11
|
II
|
3
|
2
|
2
|
MAXImini
|
6
|
2
|
Como se observa los menores de cada renglón son -11 y 2 y de estos el mayor es 2, de igual forma en las columnas los mayores de cada una son 6 y 2 y de estos el menor es dos, si pasamos una línea en la intercepción de estos dos valores así:
I
|
II
|
miniMAX
| |
I
|
6
|
-11
|
-11
|
II
|
3
|
2
|
2
|
MAXImini
|
6
|
2
|
Esa intersección es la que denominamos valor del juego lo cual nos indica también que el juego está estrictamente determinado y que las estrategia a usar por Luis es la II, es decir, mostrar siempre dos dedos y la de Andrea es la II, es decir mostrar siempre dos dedos.
Miremos otro ejemplo, con la siguiente matriz de recompensa determinar el valor del juego, las estrategias de cada jugador y si es un juego determinado:
I
|
II
|
mínimax
| |
I
|
2
|
3
|
2
|
II
|
-2
|
2
|
-2
|
MAXImini
|
2
|
3
|
Como se observa el máximo de los mínimos es 2 y el minino de los máximos es 2, por tal motivo el valor del juego es 2, la estrategia usada por el jugador renglón es la estrategia I y la del jugador columna es la estrategia I.
Pero ¿qué pasa cuando el juego es indeterminado y no podemos encontrar el valor del juego?
CUANDO EL JUEGO NO ESTA ESTRICTAMENTE DETERMINADO
· Método algebraico:
Tomemos como ejemplo si dos personas juegan el juego de los dedos, en esta versión llamaremos a uno de los jugadores impar, el cual gana si la suma de los dedos que saca él y el otro jugador es impar, al otro jugador lo llamaremos par y el cual gana si la suma de los dedos que saque él y el jugador impar es par, la ganancia es la suma de los dedos, miremos la matriz de recompensa:
PAR
| |||
I
|
II
| ||
IMPAR
|
I
|
-2
|
3
|
II
|
3
|
-4
|
Ahora determinemos los criterios mini Max y MAXI mini:
PAR
| ||||
I
|
II
|
miniMAX
| ||
IMPAR
|
I
|
-2
|
3
|
-2
|
II
|
3
|
-4
|
-4
| |
MAXImini
|
3
|
3
|
Como se observa no hay un elemento que sea simultáneamente el máximo de los mínimos y el mínimo de los máximos por lo tanto no podemos encontrar el valor del juego, las estrategias, lo que indican que el juego no está estrictamente determinado.
En este caso los jugadores deberán adoptar estrategias mixtas las cuales consisten en una combinación de varias estrategias escogidas al azar, una cada vez, según determinadas probabilidades.
Una forma de hallar esas probabilidades es a través del método algebraico, donde la probabilidades de hallar el renglón I o II es respectivamente p1 y p2 y suponiendo que el jugador columna adopta una estrategia pura. Entonces para hallarlas seria de este modo:
p1 p2
|
-2
|
3
| |
3
|
-4
|
[p1*-2 + 3p2 ; p1*3 + p2*-4]
Si remplazamos p2 por 1-p1, recordemos que la suma de las proporciones p1 y p2 debe dar 1, tendríamos:
[p1*-2 + (1-p1)*3 ; p1*3 + (1-p1)*-4]
[ -2 p1 +3 - 3p1 ; 3p1 -4 + 4p1]
[ -5 p1 + 3 ; 7p1 - 4]
Luego de obtener estas dos ecuaciones las igualamos y encontramos el valor de la proporción de p1:
-5 p1 + 3 = 7p1 – 4
-5 p1 -7p1= – 4 - 3
-12p1= -7
p1= 7/12
Reemplazamos en 1- p1 para hallar el valor de p2:
p2 = 1 – p1
p2 = 1 – 7/12
p2= 5/12
Esto nos indica que 7/12 de las veces el jugador impar usara la estrategia 1 y que las 5/12 usara la estrategia 2.
· Método gráfico:
El método grafico es otro procedimiento que se sigue para resolver un ejercicio cuyo juego no se encuentra estrictamente determinado, tal y como se muestra en el siguiente ejemplo:
1. Para la tabla siguiente, utilícese el procedimiento grafico para determinar el valor del juego y la estrategia mixta óptima para cada jugador, de acuerdo con el criterio mínimax:
A continuación se muestra la explicación de la solución de este ejercicio por medio del procedimiento gráfico, con el propósito de determinar lo establecido en el ejercicio. En la hoja siguiente esta solución:
Ahora veamos como soluciones un juego que no está estrictamente determinado a través de la programación lineal usando Excel y la herramienta solver.
ELIMINACIÓN DE ESTRATEGIAS DOMINADAS MATRIZ DE RECOMPESA REDUCIDA
Cuando en un juego existe más de dos estrategias es posible eliminar aquellas estrategias que resulten no ser tan efectivas, a las estrategias que puede eliminarse se les llama estrategias dominadas y la matriz que queda como resultado de esa eliminación se llama matriz de recompensa reducida.
De la siguiente matriz de recompensa determine que estrategias se puede eliminar y halle la matriz de pago reducida:
C1
|
C2
|
C3
|
C4
| |
R1
|
1
|
2
|
-2
|
-2
|
R2
|
-1
|
-2
|
3
|
3
|
R3
|
-1
|
-3
|
-3
|
-3
|
Lo elementos positivos indican que son ganancia del jugador renglón y los elementos negativos ganancia del jugador columna, tomemos primero el renglón 1 y el renglón 2, aquí no hay posibilidad de eliminar alguno ya que no todos los elementos del renglón 1 domina a los del renglón 2 ya que si miramos para el e mejor ganar 1 que perder -1, mejor ganar 2 que perder -2, pero no le es mejor perder -2 que ganar 3.
Si tomamos el renglón 1 y el renglón 3 se observa que cada elemento del renglón 1 es mayor o igual que del 3 (1>= -1, 2 >= -3, -2 >= -3 y -2>= -3), lo que indica que el renglón 1 domina al renglón 3
Hagamos ahora con el renglón 2 donde cada elemento del renglón es mayor o igual que los del renglón 3, (-1>= -1, -2 >= -3, 3 >=3 y 3>=-3), el jugador renglón no debería jugar con la estrategia 3 y por tal motivo se elimina.
En el caso de las columnas la estrategia 3 domina a la 4, ya que en ambas tiene el mismo resultado, con las otras dos no existe un dominancia constante, por tal motivo se elimina la columna 4, y la matriz de recompensa reducida seria:
C1
|
C2
|
C3
| |
R1
|
1
|
2
|
-2
|
R2
|
-1
|
-2
|
3
|
EJEMPLO DE EJERCICIOS RESUELTOS EN EXCEL
https://spreadsheets.google.com/ccc?key=tqHNxfgTCxCtS8FuK7t_Phg&hl=en#gid=2
Fuente: MOWRY, Tomas. JOHNSON, David. Matemáticas finitas. Aplicaciones prácticas. Pág 361.
Las paginas ya no estan disponibless!
ResponderEliminar