Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Introducción al Aprendizaje por Refuerzo
- Visión general del aprendizaje por refuerzo y sus aplicaciones
- Diferencias entre el aprendizaje supervisado, no supervisado y por refuerzo
- Conceptos clave: agente, entorno, recompensas y política
Procesos de Decisión de Markov (MDPs)
- Comprender estados, acciones, recompensas y transiciones de estado
- Funciones de valor y la ecuación de Bellman
- Programación dinámica para resolver MDPs
Algoritmos Clave del Aprendizaje por Refuerzo (RL)
- Métodos tabulares: Q-Learning y SARSA
- Métodos basados en políticas: algoritmo REINFORCE
- Marco de Actor-Critic y sus aplicaciones
Aprendizaje por Refuerzo Profundo
- Introducción a las Redes Neuronales Q-Deep (DQN)
- Repetición de experiencias y redes objetivo
- Gradientes de política y métodos avanzados del aprendizaje por refuerzo profundo
Marco y Herramientas RL
- Introducción a OpenAI Gym y otros entornos RL
- Uso de PyTorch o TensorFlow para el desarrollo de modelos RL
- Entrenamiento, prueba y benchmarking de agentes RL
Desafíos en RL
- Equilibrar la exploración y explotación durante el entrenamiento
- Manejar recompensas escasas y problemas de asignación de crédito
- Desafíos de escalabilidad y computacionales en RL
Actividades Prácticas
- Implementar los algoritmos Q-Learning y SARSA desde cero
- Entrenar un agente basado en DQN para jugar un juego simple en OpenAI Gym
- Afinar modelos RL para mejorar el rendimiento en entornos personalizados
Resumen y Próximos Pasos
Requerimientos
- Comprensión sólida de los principios y algoritmos de aprendizaje automático
- Habilidad en programación con Python
- Familiaridad con redes neuronales y marcos de aprendizaje profundo
Publico objetivo
- Ingenieros de aprendizaje automático
- Especialistas en IA
14 Horas
Testimonios (1)
Entrenador respondiendo preguntas al vuelo.
Adrian
Curso - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Traducción Automática