Contacta con nosotros

Temario del curso

Introducción al Aprendizaje por Refuerzo

  • Panorama general del aprendizaje por refuerzo y sus aplicaciones
  • Diferencias entre aprendizaje supervisado, no supervisado y por refuerzo
  • Conceptos clave: agente, entorno, recompensas y política

Procesos de Decisión de Markov (MDP)

  • Comprensión de estados, acciones, recompensas y transiciones de estado
  • Funciones de valor y la Ecuación de Bellman
  • Programación dinámica para resolver MDP

Algoritmos centrales de RL

  • Métodos tabulares: Q-Learning y SARSA
  • Métodos basados en políticas: algoritmo REINFORCE
  • Marcos Actor-Crítico y sus aplicaciones

Aprendizaje por Refuerzo Profundo

  • Introducción a las Redes Cuánticas Profundas (DQN)
  • Reproducción de experiencias y redes objetivo
  • Gradientes de políticas y métodos avanzados de RL profundo

Marcos de trabajo y herramientas de RL

  • Introducción a OpenAI Gym y otros entornos de RL
  • Uso de PyTorch o TensorFlow para el desarrollo de modelos de RL
  • Entrenamiento, pruebas y evaluación comparativa de agentes de RL

Desafíos en RL

  • Equilibrar la exploración y la explotación durante el entrenamiento
  • Abordar recompensas escasas y problemas de asignación de crédito
  • Escalabilidad y desafíos computacionales en RL

Actividades prácticas

  • Implementar algoritmos de Q-Learning y SARSA desde cero
  • Entrenar un agente basado en DQN para jugar un juego sencillo en OpenAI Gym
  • Ajustar finamente modelos de RL para mejorar el rendimiento en entornos personalizados

Resumen y siguientes pasos

Requerimientos

  • Sólido conocimiento de los principios y algoritmos de aprendizaje automático
  • Dominio de la programación en Python
  • Familiaridad con redes neuronales y marcos de aprendizaje profundo

Público objetivo

  • Ingenieros de aprendizaje automático
  • Especialistas en inteligencia artificial
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas