Programa del Curso

Introducción al Aprendizaje por Refuerzo

  • Visión general del aprendizaje por refuerzo y sus aplicaciones
  • Diferencias entre el aprendizaje supervisado, no supervisado y por refuerzo
  • Conceptos clave: agente, entorno, recompensas y política

Procesos de Decisión de Markov (MDPs)

  • Comprender estados, acciones, recompensas y transiciones de estado
  • Funciones de valor y la ecuación de Bellman
  • Programación dinámica para resolver MDPs

Algoritmos Clave del Aprendizaje por Refuerzo (RL)

  • Métodos tabulares: Q-Learning y SARSA
  • Métodos basados en políticas: algoritmo REINFORCE
  • Marco de Actor-Critic y sus aplicaciones

Aprendizaje por Refuerzo Profundo

  • Introducción a las Redes Neuronales Q-Deep (DQN)
  • Repetición de experiencias y redes objetivo
  • Gradientes de política y métodos avanzados del aprendizaje por refuerzo profundo

Marco y Herramientas RL

  • Introducción a OpenAI Gym y otros entornos RL
  • Uso de PyTorch o TensorFlow para el desarrollo de modelos RL
  • Entrenamiento, prueba y benchmarking de agentes RL

Desafíos en RL

  • Equilibrar la exploración y explotación durante el entrenamiento
  • Manejar recompensas escasas y problemas de asignación de crédito
  • Desafíos de escalabilidad y computacionales en RL

Actividades Prácticas

  • Implementar los algoritmos Q-Learning y SARSA desde cero
  • Entrenar un agente basado en DQN para jugar un juego simple en OpenAI Gym
  • Afinar modelos RL para mejorar el rendimiento en entornos personalizados

Resumen y Próximos Pasos

Requerimientos

  • Comprensión sólida de los principios y algoritmos de aprendizaje automático
  • Habilidad en programación con Python
  • Familiaridad con redes neuronales y marcos de aprendizaje profundo

Publico objetivo

  • Ingenieros de aprendizaje automático
  • Especialistas en IA
 14 Horas

Número de participantes


Precio por Participante​

Testimonios (1)

Próximos cursos

Categorías Relacionadas