Temario del curso
Introducción al aprendizaje por refuerzo y a la IA agéntica
- Toma de decisiones bajo incertidumbre y planificación secuencial
- Componentes clave del RL: agentes, entornos, estados y recompensas
- Papel del RL en sistemas de IA adaptativos y agénticos
Procesos de Decisión de Markov (MDP)
- Definición formal y propiedades de los MDP
- Funciones de valor, ecuaciones de Bellman y programación dinámica
- Evaluación, mejora e iteración de políticas
Aprendizaje por refuerzo sin modelo
- Aprendizaje Monte Carlo y de diferencia temporal (TD)
- Q-learning y SARSA
- Práctica: implementación de métodos tabulares de RL en Python
Aprendizaje por refuerzo profundo
- Combinación de redes neuronales con RL para aproximación de funciones
- Redes Deep Q (DQN) y replay de experiencias
- Arquitecturas Actor-Crítico y gradientes de política
- Práctica: entrenamiento de un agente utilizando DQN y PPO con Stable-Baselines3
Estrategias de exploración y modelado de recompensas
- Equilibrio entre exploración y explotación (ε-greedy, UCB, métodos de entropía)
- Diseño de funciones de recompensa y prevención de comportamientos no deseados
- Modelado de recompensas y aprendizaje curricular
Temas avanzados en RL y toma de decisiones
- Aprendizaje por refuerzo multiagente y estrategias cooperativas
- Aprendizaje por refuerzo jerárquico y marco de opciones
- RL offline y aprendizaje por imitación para una implementación más segura
Entornos de simulación y evaluación
- Uso de OpenAI Gym y entornos personalizados
- Espacios de acción continuos frente a discretos
- Métricas para el rendimiento, estabilidad y eficiencia de muestreo del agente
Integración del RL en sistemas de IA agéntica
- Combinación de razonamiento y RL en arquitecturas híbridas de agentes
- Integración del aprendizaje por refuerzo con agentes que utilizan herramientas
- Consideraciones operativas para la escalabilidad y el despliegue
Proyecto final integrador
- Diseñar e implementar un agente de aprendizaje por refuerzo para una tarea simulada
- Analizar el rendimiento del entrenamiento y optimizar los hiperparámetros
- Demostrar comportamiento adaptativo y toma de decisiones en un contexto agéntico
Resumen y siguientes pasos
Requerimientos
- Gran dominio de la programación en Python
- Comprensión sólida de los conceptos de aprendizaje automático y aprendizaje profundo
- Familiaridad con álgebra lineal, probabilidad y métodos básicos de optimización
Público objetivo
- Ingenieros en aprendizaje por refuerzo e investigadores aplicados de IA
- Desarrolladores de robótica y automatización
- Equipos de ingeniería que trabajan en sistemas de IA adaptativos y agénticos
Testimonios (3)
El instructor es paciente y muy útil. Conoce bien el tema.
CLIFFORD TABARES - Universal Leaf Philippines, Inc.
Curso - Agentic AI for Business Automation: Use Cases & Integration
Traducción Automática
Buena mezcla de conocimiento y práctica
Ion Mironescu - Facultatea S.A.I.A.P.M.
Curso - Agentic AI for Enterprise Applications
Traducción Automática
La mezcla de teoría y práctica, así como de perspectivas de alto y bajo nivel
Ion Mironescu - Facultatea S.A.I.A.P.M.
Curso - Autonomous Decision-Making with Agentic AI
Traducción Automática