Contacta con nosotros

Temario del curso

Introducción al aprendizaje por refuerzo

  • ¿Qué es el aprendizaje por refuerzo?
  • Conceptos clave: agente, entorno, estados, acciones y recompensas
  • Desafíos en el aprendizaje por refuerzo

Exploración y explotación

  • Equilibrar la exploración y la explotación en modelos de aprendizaje por refuerzo
  • Estrategias de exploración: epsilon-greedy, softmax, entre otras

Q-Learning y redes neuronales profundas de Q (DQNs)

  • Introducción al Q-learning
  • Implementación de DQNs utilizando TensorFlow
  • Optimización del Q-learning con replay de experiencias y redes objetivo

Métodos basados en políticas

  • Algoritmos de gradiente de políticas
  • Algoritmo REINFORCE y su implementación
  • Métodos actor-crítico

Trabajo con OpenAI Gym

  • Configuración de entornos en OpenAI Gym
  • Simulación de agentes en entornos dinámicos
  • Evaluación del rendimiento de los agentes

Técnicas avanzadas de aprendizaje por refuerzo

  • Aprendizaje por refuerzo multiagente
  • Gradiente determinista de políticas profundas (DDPG)
  • Optimización de políticas cercanas (PPO)

Despliegue de modelos de aprendizaje por refuerzo

  • Aplicaciones del mundo real del aprendizaje por refuerzo
  • Integración de modelos de aprendizaje por refuerzo en entornos de producción

Resumen y siguientes pasos

Requerimientos

  • Experiencia en programación con Python
  • Conocimientos básicos de los conceptos de aprendizaje profundo y aprendizaje automático
  • Dominio de los algoritmos y conceptos matemáticos utilizados en el aprendizaje por refuerzo

Público objetivo

  • Científicos de datos
  • Practicantes de aprendizaje automático
  • Investigadores en inteligencia artificial
 28 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas