Cápitulo 6

21
1 Cápitulo 6 BUSQUEDA EN JUEGOS DE ADVERSARIO Sección 1-4

description

Cápitulo 6. BUSQUEDA EN JUEGOS DE ADVERSARIO Sección 1-4. Bosquejo. Las decisiones óptimas Poda α-β Las decisiones imperfectas de tiempo real. Juegos vs. Búsqueda. A dversario “ imprevisible ”  especifica r un movimiento para cada respuesta posible del adversario - PowerPoint PPT Presentation

Transcript of Cápitulo 6

Page 1: Cápitulo 6

1

Cápitulo 6

BUSQUEDA EN JUEGOS DE ADVERSARIO

Sección 1-4

Page 2: Cápitulo 6

2

Bosquejo

• Las decisiones óptimas• Poda α-β • Las decisiones imperfectas de tiempo real

Page 3: Cápitulo 6

3

Juegos vs. Búsqueda

• Adversario “imprevisible” especificar un movimiento para cada respuesta posible del adversario

• Límite de tiempo improbable encontrar meta, deben aproximarse

Page 4: Cápitulo 6

4

Arbol de juego (2 jugadores, deterministas, turnos)

Page 5: Cápitulo 6

5

Minimax• Jugada perfecta para juegos determinísticos• Idea: mover a la posición con mayor valor minimax

= Mejor ganancia vs. mejor jugada• E. g. Explorando a profundidad 2

Page 6: Cápitulo 6

6

Algoritmo Minimax

Page 7: Cápitulo 6

7

Propiedades de minimax

• ¿Completa? Sí (si el árbol es finito)• ¿Óptimo? Sí (en contra de un adversario

óptimo)• ¿Complejidad en Tiempo? O(bm)• ¿Complejidad en espacio? O(bm) DFS

• Para el ajedrez, b ≈ 35, m ≈100, para juegos "razonables“. Solución exacta no factible.

Page 8: Cápitulo 6

8

Ejemplo de α-β

Page 9: Cápitulo 6

9

Ejemplo de α-β

Page 10: Cápitulo 6

10

Ejemplo de α-β

Page 11: Cápitulo 6

11

Ejemplo de α-β

Page 12: Cápitulo 6

12

Ejemplo de α-β

Page 13: Cápitulo 6

13

Propiedades de α-β

• La poda no afecta el resultado final

• Un buen orden de movimientos mejora la efectividad de poda

Orden perfecto. Complejidad en tiempo = O(bm/2) duplica la profundidad de búsqueda

• Un ejemplo simple del valor de razonamiento donde las computaciones tienen importancia (una forma de metarazonamiento)

Page 14: Cápitulo 6

14

¿Por que α-β?

• α es el valor de la mejor elección (el valor más alto) encontrada hasta ahora en cualquier punto a lo largo del camino hacia max

• Si v es peor que α, max lo evitará poda esa rama

• β semejante para min

Page 15: Cápitulo 6

15

Algoritmo α-β

Page 16: Cápitulo 6

16

Algoritmo α-β

Page 17: Cápitulo 6

17

Recursos Limitados

Tenemos 100 s, explorar 104 nodos/s 106 nodos por movimiento

método estándar:• Prueba de truncamiento:

v.g., Límite de profundidad• La función de evaluación

= estimar la conveniencia de la posición

Page 18: Cápitulo 6

18

Funciones de evaluación

• Para el ajedrez, típicamente la suma ponderada lineal de características

Eval(s) = w1 f1(s) + w2 f2(s) + … + wn fn(s)

w1 = 9 con

f1(s) = (el número de reinas blancas) – (el número de reinas negras)

etc.

Page 19: Cápitulo 6

19

Recortando la búsqueda

MinimaxCutoff es idéntico a MinimaxValue excepto1. Terminal? es remplazada por Cutoff?2. Utility es remplazada por Eval

Funciona en la práctica?bm = 106, b=35 m=4

Adelantarse 4 jugadas jugador pésimo!– 4-ply ≈ Principiante humano– 8-ply ≈ PC típica, maestro humano– 12-ply ≈ Deep Blue, Kasparov

Page 20: Cápitulo 6

20

Juegos Determinísticos

• Damas: Chinook acabó reinado de 40 años de campeón mundial Marion Tinsley en 1994. Usaba una base de datos precomputada de finales perfectos para 8 o menos piezas. Un total de 444 billones de posiciones.

• Ajedrez: Deep Blue derrotó al campeón mundial Garry Kasparov en seis juegos en 1997. Deep Blue registra 200 millones de posiciones por segundo. Evaluación muy sofisticada, y métodos sin revelar para explorar hasta 40 jugadas adelante.

• Othello: Los campeones humanos se reúsan a jugar en contra de computadoras. Son demasiado buenas.

• Go: Los campeones humanos se reúsan a jugar contra computadoras. Son demasiados malas. En Go, b > 300, la mayoría de programas usan bases de

conocimiento de patrones para sugerir movimientos aparentemente buenos.

Page 21: Cápitulo 6

21

Resumen

• ¡Los juegos son divertidos !• Ilustran varias puntos importantes acerca

de IA• La perfección es inalcanzable debe

aproximarse