Beruflich Dokumente
Kultur Dokumente
Grafos
Procesos de
Decisión de
Markov 01
Descubriendo la Inteligencia Artificial - 160
No
Observabilidad Determinista
Determinista
Búsquedas
Total MDP
en Grafos
Búsqueda
Parcial Limitada POMDP
en Grafos
Descubriendo la Inteligencia Artificial - 160
Entornos Secuenciales
- Problema de la Decisión Secuencial:
la utilidad depende de una secuencia
de acciones (entorno secuencial)
en vez de una única acción
(entorno episódico).
- Utilidad: suma de recompensas
obtenidas a lo largo de la
secuencia de acciones.
Descubriendo la Inteligencia Artificial - 160
MiniMax
Podemos ver el no determinismo como
un adversario que no sabemos qué
va a hacer. MAX 3
MIN 3 2 2
3 12 8 2 4 6 14 5 2
Descubriendo la Inteligencia Artificial - 160
ExpectiMax
Pero si que podemos calcular las
probabilidades de que se realicen
ciertas acciones: MAX
NODO-Q ? ?
P1 P2 P3
3 12 8 2 4 6 14 5 2
Descubriendo la Inteligencia Artificial - 160
Nodos-Q
Nodos MIN → Función Mínimo.
Nodos-Q → Suma Ponderada: Σ Pi·Ui
6.7 MAX
3 12 8 2 4 6 14 5 2
Descubriendo la Inteligencia Artificial - 160
Ventajas
Sensible a la escala de la utilidad:
10 54.5
10 9 10.0 54.5
MIN NODO-Q
0.5 0.5 0.5 0.5
10 10 9 100 10 10 9 100
Descubriendo la Inteligencia Artificial - 160
Desventajas
- Sigue teniendo costes exponenciales.
- No se puede podar.
- Estados y cálculos repetidos.
- Sólo indica la siguiente acción a
realizar, pero no indica una política,
es decir, asociar a cada estado con
una acción predeterminada.
Solución: MDP (óptimo si usa MUE).
Descubriendo la Inteligencia Artificial - 160
Despedida
- ¡Participa y Colabora!
- Dale a “Me Gusta”
- Suscríbete al Canal
- Deja tus Comentarios