Contacta con nosotros

Temario del curso

Introducción a los LLMs de código abierto

  • ¿Qué son los modelos de pesos abiertos y por qué son importantes?
  • Resumen de LLaMA, Mistral, Qwen y otros modelos de la comunidad.
  • Casos de uso para despliegues privados, in situ o en entornos seguros.

Configuración del entorno y herramientas

  • Instalación y configuración de las bibliotecas Transformers, Datasets y PEFT.
  • Selección del hardware adecuado para el ajuste fino.
  • Carga de modelos preentrenados desde Hugging Face u otros repositorios.

Preparación y procesamiento de datos

  • Formatos de conjuntos de datos (ajuste por instrucciones, datos de chat, solo texto).
  • Tokenización y gestión de secuencias.
  • Creación de conjuntos de datos personalizados y cargas de datos (data loaders).

Técnicas de ajuste fino

  • Ajuste fino completo estándar versus métodos eficientes en parámetros.
  • Aplicación de LoRA y QLoRA para un ajuste fino eficiente.
  • Uso de la API Trainer para experimentación rápida.

Evaluación y optimización del modelo

  • Evaluación de modelos ajustados mediante métricas de generación y precisión.
  • Gestión del sobreajuste, la generalización y los conjuntos de validación.
  • Consejos de optimización del rendimiento y registro de datos (logging).

Despliegue y uso privado

  • Guardado y carga de modelos para inferencia.
  • Despliegue de modelos ajustados en entornos empresariales seguros.
  • Estrategias de despliegue in situ frente a en la nube.

Estudios de caso y casos de uso

  • Ejemplos de uso empresarial de LLaMA, Mistral y Qwen.
  • Manejo del ajuste fino multilingüe y específico de dominio.
  • Debate: Ventajas y desventajas entre modelos abiertos y cerrados.

Resumen y próximos pasos

Requerimientos

  • Comprensión de los modelos de lenguaje grandes (LLMs) y su arquitectura.
  • Experiencia con Python y PyTorch.
  • Conocimiento básico del ecosistema de Hugging Face.

Audiencia objetivo

  • Profesionales de aprendizaje automático (ML).
  • Desarrolladores de inteligencia artificial (IA).
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas