ESTRATEGIA
MIXTA
También llamada estrategia mezclada (del nombre en
inglés mixed strategy), es una generalización de las estrategias puras, usada
para describir la selección aleatoria de entre varias posibles estrategias
puras, lo que determina siempre una distribución de probabilidad sobre el
vector de estrategias de cada jugador. Una estrategia totalmente mixta es
aquella en la que el jugador asigna una probabilidad estrictamente positiva a
cada estrategia pura. Las estrategias totalmente mixtas son importantes para el
refinamiento del equilibrio.
Ejemplo:
Juegos de coordinación
•
En él, un jugador elige las filas y otro las
columnas. El jugador de las filas recibe la recompensa marcada por el primer
dígito, el de las columnas la marcada por el segundo. Si el de las filas opta
por jugar A con probabilidad 1 (es decir, juega A seguro), entonces
está jugando una estrategia pura. Si el de las columnas elige lanzar una moneda
y jugar A si sale cara y B si sale cruz, entonces está
jugando una estrategia mixta.
Ejemplo
Piedra, papel o
tijera
Supongamos
que el jugador 1 juega siempre en estrategias puras, por ejemplo piedra.
Entonces el jugador 2 podría sacar ventaja de ello jugando siempre papel. Una
mejor respuesta del jugador 1 sería entonces jugar con estrategias mixtas, es
decir, asignarle cierta probabilidad a cada estrategia y en cada jugada elegir
aleatoriamente de acuerdo a la distribución elegida.
Puede
demostrarse que siempre que haya sesgo en estas probabilidades (es decir,
cuando se le asigne más probabilidad a una estrategia que a otra), el otro
jugador puede sacar ventaja de ello y mejorar su pago esperado. De éste modo,
el juego sólo tiene un equilibrio de Nash y es (1/3,1/3,1/3), es decir, jugar
con igual probabilidad cada estrategia (siempre y cuando se mantengan los pagos
dados por la matriz).
Ejemplo:
Competencia de empresas
Consideremos
una empresa que tiene el monopolio de un producto y una recién llegada que
quiere entrar a competir por dicho mercado. Justo antes de que la nueva empresa
entre al mercado, el monopolio decide lanzar una campaña de publicidad, para la
cual existen tres opciones: Regalar productos (con un costo x), anunciarse
en la prensa escrita (con un costo y) o anunciarse en medios electrónicos
(con un costo z). La nueva empresa solo tiene dos opciones: entrar a
competir o no entrar. La matriz de pagos del juego está dada como sigue:
Si
el monopolio jugara en estrategias puras dedicaría todo el capital disponible
para una de las estrategias. Podemos pensar en cambio que el monopolio tiene la
opción de no hacerse publicidad en un solo medio, sino repartir el dinero
disponible en dos o más de las estrategias. Por ejemplo, la estrategia mixta
(1/2,1/4,1/4) significa que el monopolio gastó x/2 en regalar muestras, y/4 en
medios escritos y z/4 en medios electrónicos. Podemos entonces usar las
estrategias mixtas para encontrar la mejor respuesta del monopolio ante la
amenaza del competidor.
REPRESENTACIÓN DE JUEGOS
Los
juegos estudiados por la teoría de juegos están bien definidos por objetos
matemáticos. Un juego consiste en un conjunto de jugadores, un conjunto de
movimientos (o estrategias) disponible para esos jugadores y una
especificación de recompensas para cada combinación de estrategias. Hay dos
formas comunes de representar a los juegos.
A.
Forma normal
de un juego
En teoría de juegos, la forma
normal es una forma de describir un juego. A diferencia de
la forma extensiva, las representaciones en forma normal no
son grafos, sino matrices. Esto puede ser de gran utilidad a la hora
de identificar estrategias estrictamente
dominantes y equilibrios de Nash. Por otra parte se pierde algo de
información si la comparamos con la forma extensiva, pues ésta incluye todas
las estrategias de cada jugador junto con sus recompensas.
En
juegos estáticos de información completa y perfecta, una forma normal de representación de un juego es una especificación de los espacios de
estrategia de los jugadores y las funciones de recompensa. Un espacio de
estrategia de un jugador es el conjunto de estrategias disponibles para ese
jugador, mientras que una estrategia es un plan completo de acción para cada
situación del juego, sin tener en cuenta si esa situación se da realmente en el
juego. Una función de recompensa de un jugador es una correspondencia entre el
producto cruzado de los espacios de estrategia de los jugadores y el conjunto
de recompensas del jugador (normalmente, el conjunto de los números reales,
donde el número representa una utilidad ordinal o cardinal - a menudo cardinal)
de un jugador, por ejemplo la función de recompensa de un jugador toma como
entrada un perfil de estrategia (es decir, la especificación de las estrategias
de cada jugador) y da lugar a una representación de la recompensa a su salida.
Ejemplo
de Forma normal de un juego
La matriz de la derecha es una representación en
forma normal de un juego en el que los jugadores mueven simultáneamente (o, al
menos, no conocen el movimiento del otro jugador) y reciben las recompensas tal
y como se especifica para la combinación jugada. Por ejemplo, si el jugador 1
elige arriba y el jugador 2 elige izquierda, el jugador 1 recibe 4 y el jugador
2 recibe 3. En cada celda, el primer número representa la recompensa del
jugador de las filas (en este caso el jugador 1), y el segundo número
representa la recompensa del jugador de las columnas (en este caso el jugador 2
FORMULACIÓN GENERAL DE FORMA NORMAL DE UN JUEGO
Para que un juego esté representado en forma normal,
tienen que cumplirse los siguientes requisitos:
•
Hay un conjunto finito P de
jugadores {1, 2,..., m}
•
Cada jugador k de P tiene
un número finito de estrategias puras.
Un perfil de estrategia pura es una
asociación de estrategias con
jugadores, que es una m-tupla 
tal que 
Llamamos al conjunto de perfiles de estrategia Σ
Una función de recompensa es una
función
cuya interpretación es el premio que recibe cada
jugador al final del juego. De acuerdo con esto, para especificar por completo
un juego, la función de recompensa tiene
que especificarse para cada jugador del conjunto de jugadores P={1,
2,..., m}. El juego es entonces una función 
Un juego en forma normal es
una estructura
•
No hay ninguna razón para excluir juegos que
tienen un número infinito de jugadores o un número infinito de estrategias por
jugador. Sin embargo, el estudio de los juegos infinitos es más difícil, pues
requiere usar técnicas de análisis funcional.
•
Una generalización adicional puede ser lograda
dividiendo el juego en dos funciones: la "forma normal del juego",
que describe la manera en que las estrategias definen eventos, y una segunda
función, que ilustra las preferencias del jugador sobre el conjunto de eventos.
Así:
•
donde es el conjunto de eventos del
juego. Y para cada jugador hay una función de preferencia
B.
Forma extensiva de un juego
Un juego en forma extensiva es
una especificación de un juego en la teoría de juegos, que permite (como
su nombre sugiere) la representación explícita de una serie de aspectos
importantes, como la secuencia de movimientos posibles de los jugadores, sus
elecciones en cada punto de decisión, lo imperfecto de la
información que cada jugador tiene en algunos movimientos del otro jugador
cuando él toma una decisión, y sus ganancias para todos los resultados posibles
del juego. Juegos en forma extensiva también permitir la representación de la
información incompleta en forma de casualidades codificados como " se
mueve por naturaleza".
Juegos finitos en forma
extensiva
Un juego de N-jugadores en forma
extensiva consiste en lo siguiente:
•
Un conjunto finito de n jugadores (racionales)
•
Un árbol con raíz, llamado el árbol de juego
•
Cada terminal (hoja) nodo del árbol de juego
tiene una n-tupla de pagos, es decir, hay una ganancia para cada jugador
al final de cada juego posible
•
Una partición de los nodos no terminales
del árbol de juego en n +1 subconjuntos, uno para cada jugador (racional), y
con un subconjunto especial para un jugador ficticio llamado Chance (o la
naturaleza). Cada jugador subconjunto de nodos que se conoce como los
"nodos" del jugador. (Un juego de información completa por lo tanto
tiene un conjunto vacío de nodos de azar.)
•
Cada nodo aleatorio de un jugador tiene una distribución
de probabilidad sobre los resultados salientes.
Un juego es por lo tanto un
camino a través del árbol desde la raíz hasta un nodo terminal. En cualquier
nodo no terminal dado que pertenece a Chance, una rama que se escoge de acuerdo
con la distribución de probabilidad. En el nodo cualquier jugador racional, el
jugador debe elegir una de las clases de equivalencia para los bordes, lo que
determina precisamente un borde saliente excepto (en general) el jugador no
sabe que se está siguiendo. (Un observador externo conocer las opciones de los
demás jugadores hasta ese punto, y la realización de movimientos de la
naturaleza, se puede determinar el límite exacto.) Una estrategia pura para un
jugador consiste, pues, de una selección, eligiendo precisamente una clase de
bordes salientes para cada información establecido (de él). En un juego de
información perfecta, los conjuntos de información son únicos.
Información perfecta y
completa
Una completa representación en
forma extensiva especifica:
1. Los jugadores de un juego
2. Para todos los jugadores de
todas las oportunidades que tienen que moverse
3. Lo que cada jugador puede
hacer en cada uno de sus movimientos
4. Lo que cada jugador sabe con
cada movimiento
5. Los pagos recibidos por cada
jugador para cada combinación posible de movimientos
Información imperfecta
Una ventaja de representar el
juego de esta manera es que está claro lo que el orden del juego. El árbol
muestra claramente que el jugador 1 mueve primero y el jugador 2 observa este
movimiento. Sin embargo, en algunos juegos del juego no ocurre así. Un jugador
no siempre observar la elección de otro (por ejemplo, movimientos pueden ser
simultáneos o un movimiento puede estar oculto). Un conjunto de información es
un conjunto de nodos de decisión de tal manera que:
1. Cada nodo del conjunto
pertenece a uno de los jugadores.
2. Cuando el juego llegue al
conjunto de información, el jugador con el movimiento
no puede diferenciar entre los nodos del conjunto de información, es decir, si el conjunto de datos contiene más
de un nodo, el jugador al que pertenece ese
grupo no sabe qué nodo en el conjunto se ha alcanzado.
En forma extensiva, un conjunto
de información se indica mediante una línea de puntos que conecta todos los
nodos que en conjunto o, a veces por un bucle dibujado alrededor de todos los
nodos en ese conjunto.
Si
un juego tiene un conjunto de información con más de un miembro de ese partido
se dice que tiene información imperfecta. Un juego con información perfecta es
tal que en cualquier momento de la partida, cada jugador sabe exactamente lo
que ha ocurrido antes en el juego, es decir, cada conjunto de información es un
singleton set. Cualquier juego sin información perfecta tiene información
imperfecta.
No hay comentarios.:
Publicar un comentario