Programa del Curso

Introducción

  • ¿Qué son Large Language Models (LLMs)?
  • LLMs vs modelos tradicionales de PNL
  • Descripción general de las características y la arquitectura de los LLM
  • Desafíos y limitaciones de los LLM

Comprensión de los LLM

  • El ciclo de vida de un LLM
  • Cómo funcionan los LLM
  • Los componentes principales de un LLM: codificador, decodificador, atención, incrustaciones, etc.

Empezar

  • Configuración del entorno de desarrollo
  • Instalar un LLM como herramienta de desarrollo, por ejemplo, Google Colab, Hugging Face

Trabajar con LLM

  • Explorando las opciones de LLM disponibles
  • Creación y uso de un LLM
  • Ajuste de un LLM en un conjunto de datos personalizado

Resumen de texto

  • Comprender la tarea del resumen de textos y sus aplicaciones
  • Uso de un LLM para el resumen de textos extractivos y abstractos
  • Evaluar la calidad de los resúmenes generados utilizando métricas como ROUGE, BLEU, etc.

Respuesta a preguntas

  • Comprender la tarea de responder preguntas y sus aplicaciones
  • Uso de un LLM para responder preguntas de dominio abierto y dominio cerrado
  • Evaluar la precisión de las respuestas generadas utilizando métricas como F1, EM, etc.

Generación de texto

  • Comprender la tarea de la generación de texto y sus aplicaciones
  • Uso de un LLM para la generación de texto condicional e incondicional
  • Controlar el estilo, el tono y el contenido de los textos generados mediante parámetros como temperatura, top-k, top-p, etc.

Integración de LLM con otros marcos y plataformas

  • Uso de LLM con PyTorch o TensorFlow
  • Uso de LLM con Flask o Streamlit
  • Uso de LLM con Google Cloud o AWS

Solución de problemas

  • Comprender los errores y fallos comunes en los LLM
  • Uso de TensorBoard para supervisar y visualizar el proceso de entrenamiento
  • Uso de PyTorch Lightning para simplificar el código de entrenamiento y mejorar el rendimiento
  • Uso de conjuntos de datos de Hugging Face para cargar y preprocesar los datos

Resumen y próximos pasos

Requerimientos

    Comprensión del procesamiento del lenguaje natural y el aprendizaje profundo Experiencia con Python y PyTorch o TensorFlow Experiencia básica en programación

Audiencia

    Desarrolladores Entusiastas de la PNL Científicos de datos
 14 horas

Número de participantes



Precio por participante

Cursos Relacionados

LangChain: Building AI-Powered Applications

14 horas

LangChain Fundamentals

14 horas

Avanzado Stable Diffusion: Aprendizaje profundo para la generación de texto a imagen

21 horas

Introducción a Stable Diffusion para la generación de texto a imagen

21 horas

AlphaFold

7 horas

TensorFlow Lite for Embedded Linux

21 horas

TensorFlow Lite for Android

21 horas

TensorFlow Lite for iOS

21 horas

Tensorflow Lite for Microcontrollers

21 horas

Deep Learning Neural Networks with Chainer

14 horas

Distributed Deep Learning with Horovod

7 horas

Accelerating Deep Learning with FPGA and OpenVINO

35 horas

Building Deep Learning Models with Apache MXNet

21 horas

Deep Learning with Keras

21 horas

Advanced Deep Learning with Keras and Python

14 horas

Categorías Relacionadas