Contacta con nosotros

Temario del curso

Temario detallado del curso

  1. Introducción al NLP
    • Comprensión del NLP
    • Frameworks de NLP
    • Aplicaciones comerciales del NLP
    • Extracción de datos de la web
    • Trabajo con varias APIs para recuperar datos de texto
    • Trabajo y almacenamiento de corpora de texto, guardando el contenido y los metadatos relevantes
    • Ventajas de usar Python y curso intensivo de NLTK
  2. Comprensión práctica de un corpus y un conjunto de datos
    • ¿Por qué necesitamos un corpus?
    • Análisis de corpus
    • Tipos de atributos de datos
    • Distintos formatos de archivo para corpora
    • Preparación de un conjunto de datos para aplicaciones de NLP
  3. Comprensión de la estructura de una oración
    • Componentes del NLP
    • Comprensión del lenguaje natural
    • Análisis morfológico: raíz, palabra, token, etiquetas de parte de la oración
    • Análisis sintáctico
    • Análisis semántico
    • Gestión de la ambigüedad
  4. Preprocesamiento de datos de texto
    • Corpus: texto sin procesar
      • Tokenización de oraciones
      • Stemming para texto sin procesar
      • Lematización de texto sin procesar
      • Eliminación de palabras vacías
    • Corpus: oraciones sin procesar
      • Tokenización de palabras
      • Lematización de palabras
    • Trabajo con matrices Término-Documento/Documento-Término
    • Tokenización de texto en n-gramas y oraciones
    • Preprocesamiento práctico y personalizado
  5. Análisis de datos de texto
    • Características básicas del NLP
      • Analizadores y análisis sintáctico
      • Etiquetado de partes de la oración y etiquetadores
      • Reconocimiento de entidades nominales
      • N-gramas
      • Bolsa de palabras
    • Características estadísticas del NLP
      • Conceptos de álgebra lineal para NLP
      • Teoría probabilística para NLP
      • TF-IDF
      • Vectorización
      • Codificadores y decodificadores
      • Normalización
      • Modelos probabilísticos
    • Ingeniería de características avanzada y NLP
      • Fundamentos de word2vec
      • Componentes del modelo word2vec
      • Lógica del modelo word2vec
      • Extensión del concepto de word2vec
      • Aplicación del modelo word2vec
    • Estudio de caso: Aplicación de la bolsa de palabras: resumen automático de textos usando algoritmos simplificados y verdaderos de Luhn
  6. Agrupación, clasificación y modelado de temas de documentos
    • Agrupación de documentos y minería de patrones (agrupación jerárquica, k-means, clustering, etc.)
    • Comparación y clasificación de documentos utilizando medidas de distancia TFIDF, Jaccard y coseno
    • Clasificación de documentos usando Naive Bayes y Entropía Máxima
  7. Identificación de elementos de texto importantes
    • Reducción de dimensionalidad: Análisis de Componentes Principales, Descomposición en Valores Singulares, factorización de matrices no negativas
    • Modelado de temas y recuperación de información usando Análisis Semántico Latente
  8. Extracción de entidades, análisis de sentimiento y modelado avanzado de temas
    • Positivo frente a negativo: grado de sentimiento
    • Teoría de Respuesta al Ítem
    • Etiquetado de partes de la oración y su aplicación: encontrar personas, lugares y organizaciones mencionadas en el texto
    • Modelado avanzado de temas: Asignación Dirichlet Latente
  9. Estudios de caso
    • Minería de reseñas de usuarios no estructuradas
    • Clasificación de sentimiento y visualización de datos de reseñas de productos
    • Minería de registros de búsqueda para patrones de uso
    • Clasificación de texto
    • Modelado de temas

Requerimientos

Conocimiento y comprensión de los principios del NLP y una apreciación de la aplicación de la IA en los negocios.

 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas