viernes, 4 de marzo de 2016

Estrategia mixta y representación de juegos



ESTRATEGIA MIXTA
También llamada estrategia mezclada (del nombre en inglés mixed strategy), es una generalización de las estrategias puras, usada para describir la selección aleatoria de entre varias posibles estrategias puras, lo que determina siempre una distribución de probabilidad sobre el vector de estrategias de cada jugador. Una estrategia totalmente mixta es aquella en la que el jugador asigna una probabilidad estrictamente positiva a cada estrategia pura. Las estrategias totalmente mixtas son importantes para el refinamiento del equilibrio.

Ejemplo:

 Juegos de coordinación
       En él, un jugador elige las filas y otro las columnas. El jugador de las filas recibe la recompensa marcada por el primer dígito, el de las columnas la marcada por el segundo. Si el de las filas opta por jugar A con probabilidad 1 (es decir, juega A seguro), entonces está jugando una estrategia pura. Si el de las columnas elige lanzar una moneda y jugar A si sale cara y B si sale cruz, entonces está jugando una estrategia mixta.

Ejemplo 

Piedra, papel o tijera
Supongamos que el jugador 1 juega siempre en estrategias puras, por ejemplo piedra. Entonces el jugador 2 podría sacar ventaja de ello jugando siempre papel. Una mejor respuesta del jugador 1 sería entonces jugar con estrategias mixtas, es decir, asignarle cierta probabilidad a cada estrategia y en cada jugada elegir aleatoriamente de acuerdo a la distribución elegida.
Puede demostrarse que siempre que haya sesgo en estas probabilidades (es decir, cuando se le asigne más probabilidad a una estrategia que a otra), el otro jugador puede sacar ventaja de ello y mejorar su pago esperado. De éste modo, el juego sólo tiene un equilibrio de Nash y es (1/3,1/3,1/3), es decir, jugar con igual probabilidad cada estrategia (siempre y cuando se mantengan los pagos dados por la matriz).


Ejemplo: 
Competencia de empresas
Consideremos una empresa que tiene el monopolio de un producto y una recién llegada que quiere entrar a competir por dicho mercado. Justo antes de que la nueva empresa entre al mercado, el monopolio decide lanzar una campaña de publicidad, para la cual existen tres opciones: Regalar productos (con un costo x), anunciarse en la prensa escrita (con un costo y) o anunciarse en medios electrónicos (con un costo z). La nueva empresa solo tiene dos opciones: entrar a competir o no entrar. La matriz de pagos del juego está dada como sigue:
Si el monopolio jugara en estrategias puras dedicaría todo el capital disponible para una de las estrategias. Podemos pensar en cambio que el monopolio tiene la opción de no hacerse publicidad en un solo medio, sino repartir el dinero disponible en dos o más de las estrategias. Por ejemplo, la estrategia mixta (1/2,1/4,1/4) significa que el monopolio gastó x/2 en regalar muestras, y/4 en medios escritos y z/4 en medios electrónicos. Podemos entonces usar las estrategias mixtas para encontrar la mejor respuesta del monopolio ante la amenaza del competidor.

REPRESENTACIÓN DE JUEGOS
Los juegos estudiados por la teoría de juegos están bien definidos por objetos matemáticos. Un juego consiste en un conjunto de jugadores, un conjunto de movimientos (o estrategias) disponible para esos jugadores y una especificación de recompensas para cada combinación de estrategias. Hay dos formas comunes de representar a los juegos.

A.    Forma normal  de un juego
En teoría de juegos, la forma normal es una forma de describir un juego. A diferencia de la forma extensiva, las representaciones en forma normal no son grafos, sino matrices. Esto puede ser de gran utilidad a la hora de identificar estrategias estrictamente dominantes y equilibrios de Nash. Por otra parte se pierde algo de información si la comparamos con la forma extensiva, pues ésta incluye todas las estrategias de cada jugador junto con sus recompensas.
En juegos estáticos de información completa y perfecta, una forma normal de representación de un juego es una especificación de los espacios de estrategia de los jugadores y las funciones de recompensa. Un espacio de estrategia de un jugador es el conjunto de estrategias disponibles para ese jugador, mientras que una estrategia es un plan completo de acción para cada situación del juego, sin tener en cuenta si esa situación se da realmente en el juego. Una función de recompensa de un jugador es una correspondencia entre el producto cruzado de los espacios de estrategia de los jugadores y el conjunto de recompensas del jugador (normalmente, el conjunto de los números reales, donde el número representa una utilidad ordinal o cardinal - a menudo cardinal) de un jugador, por ejemplo la función de recompensa de un jugador toma como entrada un perfil de estrategia (es decir, la especificación de las estrategias de cada jugador) y da lugar a una representación de la recompensa a su salida.

Ejemplo de Forma normal  de un juego
La matriz de la derecha es una representación en forma normal de un juego en el que los jugadores mueven simultáneamente (o, al menos, no conocen el movimiento del otro jugador) y reciben las recompensas tal y como se especifica para la combinación jugada. Por ejemplo, si el jugador 1 elige arriba y el jugador 2 elige izquierda, el jugador 1 recibe 4 y el jugador 2 recibe 3. En cada celda, el primer número representa la recompensa del jugador de las filas (en este caso el jugador 1), y el segundo número representa la recompensa del jugador de las columnas (en este caso el jugador 2

FORMULACIÓN GENERAL DE FORMA NORMAL  DE UN JUEGO
Para que un juego esté representado en forma normal, tienen que cumplirse los siguientes requisitos:
       Hay un conjunto finito P de jugadores {1, 2,..., m}

       Cada jugador k de P tiene un número finito de estrategias  puras.

Un perfil de estrategia pura es una asociación de estrategias con 
jugadores, que es una m-tupla

 tal que

Llamamos al conjunto de perfiles de estrategia Σ

Una función de recompensa es una función cuya interpretación es el premio que recibe cada jugador al final del juego. De acuerdo con esto, para especificar por completo un  juego, la función de recompensa tiene que especificarse para cada jugador del conjunto de jugadores P={1, 2,..., m}. El juego es entonces una función

 Un juego en forma normal es una estructura
               donde P = {1,2,...,m} es un conjunto de jugadores,
  es una m-tupla de conjuntos de estrategias puras, una para cada jugador, y
            es una m-tupla de funciones de recompensa.
       No hay ninguna razón para excluir juegos que tienen un número infinito de jugadores o un número infinito de estrategias por jugador. Sin embargo, el estudio de los juegos infinitos es más difícil, pues requiere usar técnicas de análisis funcional.
       Una generalización adicional puede ser lograda dividiendo el juego en dos funciones: la "forma normal del juego", que describe la manera en que las estrategias definen eventos, y una segunda función, que ilustra las preferencias del jugador sobre el conjunto de eventos. Así:
        donde  es el conjunto de eventos del juego. Y para cada jugador  hay una función de preferencia


B.      Forma extensiva de un juego
Un juego en forma extensiva es una especificación de un juego en la teoría de juegos, que permite (como su nombre sugiere) la representación explícita de una serie de aspectos importantes, como la secuencia de movimientos posibles de los jugadores, sus elecciones en cada punto de decisión, lo imperfecto de la información que cada jugador tiene en algunos movimientos del otro jugador cuando él toma una decisión, y sus ganancias para todos los resultados posibles del juego. Juegos en forma extensiva también permitir la representación de la información incompleta en forma de casualidades codificados como " se mueve por naturaleza".

Juegos finitos en forma extensiva

Un juego de N-jugadores en forma extensiva consiste en lo siguiente:

       Un conjunto finito de n jugadores (racionales)
       Un árbol con raíz, llamado el árbol de juego
       Cada terminal (hoja) nodo del árbol de juego tiene una n-tupla de pagos, es decir, hay una ganancia para cada jugador al final de cada juego posible
       Una partición de los nodos no terminales del árbol de juego en n +1 subconjuntos, uno para cada jugador (racional), y con un subconjunto especial para un jugador ficticio llamado Chance (o la naturaleza). Cada jugador subconjunto de nodos que se conoce como los "nodos" del jugador. (Un juego de información completa por lo tanto tiene un conjunto vacío de nodos de azar.)
       Cada nodo aleatorio de un jugador tiene una distribución de probabilidad  sobre los resultados salientes.

Un juego es por lo tanto un camino a través del árbol desde la raíz hasta un nodo terminal. En cualquier nodo no terminal dado que pertenece a Chance, una rama que se escoge de acuerdo con la distribución de probabilidad. En el nodo cualquier jugador racional, el jugador debe elegir una de las clases de equivalencia para los bordes, lo que determina precisamente un borde saliente excepto (en general) el jugador no sabe que se está siguiendo. (Un observador externo conocer las opciones de los demás jugadores hasta ese punto, y la realización de movimientos de la naturaleza, se puede determinar el límite exacto.) Una estrategia pura para un jugador consiste, pues, de una selección, eligiendo precisamente una clase de bordes salientes para cada información establecido (de él). En un juego de información perfecta, los conjuntos de información son únicos.

Información perfecta y completa
Una completa representación en forma extensiva especifica:
1. Los jugadores de un juego
2. Para todos los jugadores de todas las oportunidades que tienen que moverse
3. Lo que cada jugador puede hacer en cada uno de sus movimientos
4. Lo que cada jugador sabe con cada movimiento
5. Los pagos recibidos por cada jugador para cada combinación posible de movimientos

Información imperfecta
Una ventaja de representar el juego de esta manera es que está claro lo que el orden del juego. El árbol muestra claramente que el jugador 1 mueve primero y el jugador 2 observa este movimiento. Sin embargo, en algunos juegos del juego no ocurre así. Un jugador no siempre observar la elección de otro (por ejemplo, movimientos pueden ser simultáneos o un movimiento puede estar oculto). Un conjunto de información es un conjunto de nodos de decisión de tal manera que:
1. Cada nodo del conjunto pertenece a uno de los jugadores.
2. Cuando el juego llegue al conjunto de información, el jugador con el movimiento no puede diferenciar entre los nodos del conjunto de información, es     decir, si el conjunto de datos contiene más de un nodo, el jugador al que pertenece ese grupo no sabe qué nodo en el conjunto se ha alcanzado.

En forma extensiva, un conjunto de información se indica mediante una línea de puntos que conecta todos los nodos que en conjunto o, a veces por un bucle dibujado alrededor de todos los nodos en ese conjunto.

Si un juego tiene un conjunto de información con más de un miembro de ese partido se dice que tiene información imperfecta. Un juego con información perfecta es tal que en cualquier momento de la partida, cada jugador sabe exactamente lo que ha ocurrido antes en el juego, es decir, cada conjunto de información es un singleton set. Cualquier juego sin información perfecta tiene información imperfecta.






No hay comentarios.:

Publicar un comentario