Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción al afinamiento de LLM de DeepSeek
- Panorama general de los modelos de DeepSeek, por ejemplo, DeepSeek-R1 y DeepSeek-V3
- Comprensión de la necesidad de afinar los LLM
- Comparación entre afinamiento e ingeniería de prompts
Preparación del conjunto de datos para el afinamiento
- Curaduría de conjuntos de datos específicos de un dominio
- Técnicas de preprocesamiento y limpieza de datos
- Tokenización y formato de conjuntos de datos para LLM de DeepSeek
Configuración del entorno de afinamiento
- Configuración de la aceleración con GPU y TPU
- Configuración de Hugging Face Transformers con LLM de DeepSeek
- Comprensión de los hiperparámetros para el afinamiento
Afinamiento del LLM de DeepSeek
- Implementación del afinamiento supervisado
- Uso de LoRA (Adaptación de Baja Rango) y PEFT (Afinamiento Eficiente en Parámetros)
- Ejecución de afinamiento distribuido para conjuntos de datos a gran escala
Evaluación y optimización de modelos afinados
- Evaluación del rendimiento del modelo con métricas de evaluación
- Manejo del sobreajuste y el subajuste
- Optimización de la velocidad de inferencia y la eficiencia del modelo
Despliegue de modelos afinados de DeepSeek
- Empaquetado de modelos para su implementación mediante API
- Integración de modelos afinados en aplicaciones
- Escalado de despliegues con computación en la nube y en el borde
Casos de uso y aplicaciones del mundo real
- LLM afinados para finanzas, atención médica y atención al cliente
- Estudios de caso de aplicaciones industriales
- Consideraciones éticas en modelos de IA específicos de un dominio
Resumen y próximos pasos
Requerimientos
- Experiencia con frameworks de aprendizaje automático y aprendizaje profundo
- Familiaridad con transformadores y modelos de lenguaje grandes (LLM)
- Comprensión de técnicas de preprocesamiento de datos y entrenamiento de modelos
Público objetivo
- Investigadores de IA que exploran el afinamiento de LLM
- Ingenieros de aprendizaje automático que desarrollan modelos de IA personalizados
- Desarrolladores avanzados que implementan soluciones impulsadas por IA
21 Horas