Contacta con nosotros

Temario del curso

Introducción al aprendizaje por refuerzo y a la IA agéntica

  • Toma de decisiones bajo incertidumbre y planificación secuencial
  • Componentes clave del RL: agentes, entornos, estados y recompensas
  • Papel del RL en sistemas de IA adaptativos y agénticos

Procesos de Decisión de Markov (MDP)

  • Definición formal y propiedades de los MDP
  • Funciones de valor, ecuaciones de Bellman y programación dinámica
  • Evaluación, mejora e iteración de políticas

Aprendizaje por refuerzo sin modelo

  • Aprendizaje Monte Carlo y de diferencia temporal (TD)
  • Q-learning y SARSA
  • Práctica: implementación de métodos tabulares de RL en Python

Aprendizaje por refuerzo profundo

  • Combinación de redes neuronales con RL para aproximación de funciones
  • Redes Deep Q (DQN) y replay de experiencias
  • Arquitecturas Actor-Crítico y gradientes de política
  • Práctica: entrenamiento de un agente utilizando DQN y PPO con Stable-Baselines3

Estrategias de exploración y modelado de recompensas

  • Equilibrio entre exploración y explotación (ε-greedy, UCB, métodos de entropía)
  • Diseño de funciones de recompensa y prevención de comportamientos no deseados
  • Modelado de recompensas y aprendizaje curricular

Temas avanzados en RL y toma de decisiones

  • Aprendizaje por refuerzo multiagente y estrategias cooperativas
  • Aprendizaje por refuerzo jerárquico y marco de opciones
  • RL offline y aprendizaje por imitación para una implementación más segura

Entornos de simulación y evaluación

  • Uso de OpenAI Gym y entornos personalizados
  • Espacios de acción continuos frente a discretos
  • Métricas para el rendimiento, estabilidad y eficiencia de muestreo del agente

Integración del RL en sistemas de IA agéntica

  • Combinación de razonamiento y RL en arquitecturas híbridas de agentes
  • Integración del aprendizaje por refuerzo con agentes que utilizan herramientas
  • Consideraciones operativas para la escalabilidad y el despliegue

Proyecto final integrador

  • Diseñar e implementar un agente de aprendizaje por refuerzo para una tarea simulada
  • Analizar el rendimiento del entrenamiento y optimizar los hiperparámetros
  • Demostrar comportamiento adaptativo y toma de decisiones en un contexto agéntico

Resumen y siguientes pasos

Requerimientos

  • Gran dominio de la programación en Python
  • Comprensión sólida de los conceptos de aprendizaje automático y aprendizaje profundo
  • Familiaridad con álgebra lineal, probabilidad y métodos básicos de optimización

Público objetivo

  • Ingenieros en aprendizaje por refuerzo e investigadores aplicados de IA
  • Desarrolladores de robótica y automatización
  • Equipos de ingeniería que trabajan en sistemas de IA adaptativos y agénticos
 28 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas