Contacta con nosotros

Temario del curso

Introducción al afinamiento de LLM de DeepSeek

  • Panorama general de los modelos de DeepSeek, por ejemplo, DeepSeek-R1 y DeepSeek-V3
  • Comprensión de la necesidad de afinar los LLM
  • Comparación entre afinamiento e ingeniería de prompts

Preparación del conjunto de datos para el afinamiento

  • Curaduría de conjuntos de datos específicos de un dominio
  • Técnicas de preprocesamiento y limpieza de datos
  • Tokenización y formato de conjuntos de datos para LLM de DeepSeek

Configuración del entorno de afinamiento

  • Configuración de la aceleración con GPU y TPU
  • Configuración de Hugging Face Transformers con LLM de DeepSeek
  • Comprensión de los hiperparámetros para el afinamiento

Afinamiento del LLM de DeepSeek

  • Implementación del afinamiento supervisado
  • Uso de LoRA (Adaptación de Baja Rango) y PEFT (Afinamiento Eficiente en Parámetros)
  • Ejecución de afinamiento distribuido para conjuntos de datos a gran escala

Evaluación y optimización de modelos afinados

  • Evaluación del rendimiento del modelo con métricas de evaluación
  • Manejo del sobreajuste y el subajuste
  • Optimización de la velocidad de inferencia y la eficiencia del modelo

Despliegue de modelos afinados de DeepSeek

  • Empaquetado de modelos para su implementación mediante API
  • Integración de modelos afinados en aplicaciones
  • Escalado de despliegues con computación en la nube y en el borde

Casos de uso y aplicaciones del mundo real

  • LLM afinados para finanzas, atención médica y atención al cliente
  • Estudios de caso de aplicaciones industriales
  • Consideraciones éticas en modelos de IA específicos de un dominio

Resumen y próximos pasos

Requerimientos

  • Experiencia con frameworks de aprendizaje automático y aprendizaje profundo
  • Familiaridad con transformadores y modelos de lenguaje grandes (LLM)
  • Comprensión de técnicas de preprocesamiento de datos y entrenamiento de modelos

Público objetivo

  • Investigadores de IA que exploran el afinamiento de LLM
  • Ingenieros de aprendizaje automático que desarrollan modelos de IA personalizados
  • Desarrolladores avanzados que implementan soluciones impulsadas por IA
 21 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas