Contacta con nosotros

Temario del curso

Esquema detallado del curso

  1. Introducción al NLP
    • Comprensión del NLP
    • Frameworks de NLP
    • Aplicaciones comerciales del NLP
    • Extracción de datos desde la web
    • Uso de diversas APIs para recuperar datos de texto
    • Trabajo y almacenamiento de corpus de texto, guardando contenido y metadatos relevantes
    • Ventajas de utilizar Python y curso intensivo de NLTK
  2. Comprensión práctica de un corpus y conjunto de datos
    • ¿Por qué necesitamos un corpus?
    • Análisis de corpus
    • Tipos de atributos de datos
    • Diferentes formatos de archivo para corpus
    • Preparación de un conjunto de datos para aplicaciones de NLP
  3. Comprensión de la estructura de una oración
    • Componentes del NLP
    • Comprensión del lenguaje natural
    • Análisis morfológico: raíz, palabra, token, etiquetas gramaticales
    • Análisis sintáctico
    • Análisis semántico
    • Manejo de ambigüedades
  4. Preprocesamiento de datos de texto
    • Corpus: texto crudo
      • Tokenización de oraciones
      • Reducción de palabras a su raíz (stemming) para texto crudo
      • Leematización de texto crudo
      • Eliminación de palabras de parada (stop words)
    • Corpus: oraciones crudas
      • Tokenización de palabras
      • Leematización de palabras
    • Trabajo con matrices término-documento/documento-término
    • Tokenización de texto en n-gramas y oraciones
    • Preprocesamiento práctico y personalizado
  5. Análisis de datos de texto
    • Características básicas del NLP
      • Analizadores y análisis sintáctico
      • Etiquetado de partes de la oración (POS) y etiquetadores
      • Reconocimiento de entidades nombradas
      • n-gramas
      • Bolsa de palabras (Bag of Words)
    • Características estadísticas del NLP
      • Conceptos de álgebra lineal para NLP
      • Teoría probabilística para NLP
      • TF-IDF
      • Vectorización
      • Codificadores y decodificadores
      • Normalización
      • Modelos probabilísticos
    • Generación avanzada de características y NLP
      • Conceptos básicos de word2vec
      • Componentes del modelo word2vec
      • Lógica del modelo word2vec
      • Extensión del concepto word2vec
      • Aplicación del modelo word2vec
    • Estudio de caso: Aplicación de la bolsa de palabras: resumen automático de texto utilizando algoritmos simplificados y reales de Luhn
  6. Agrupamiento, clasificación de documentos y modelado de temas
    • Agrupamiento de documentos y minería de patrones (agrupamiento jerárquico, k-means, agrupamiento, etc.)
    • Comparación y clasificación de documentos utilizando medidas de distancia TFIDF, Jaccard y coseno
    • Clasificación de documentos mediante Naïve Bayes y Máxima Entropía
  7. Identificación de elementos importantes del texto
    • Reducción de dimensionalidad: Análisis de componentes principales, descomposición en valores singulares, factorización de matriz no negativa
    • Modelado de temas y recuperación de información utilizando Análisis Semántico Latente
  8. Extracción de entidades, análisis de sentimientos y modelado avanzado de temas
    • Positivo vs. negativo: grado de sentimiento
    • Teoría de la respuesta al ítem
    • Etiquetado de partes de la oración y su aplicación: identificación de personas, lugares y organizaciones mencionadas en el texto
    • Modelado avanzado de temas: Asignación Latente de Dirichlet
  9. Estudios de caso
    • Minería de reseñas de usuarios no estructuradas
    • Clasificación y visualización de sentimientos en datos de reseñas de productos
    • Minería de registros de búsqueda para identificar patrones de uso
    • Clasificación de texto
    • Modelado de temas

Requerimientos

Conocimientos y comprensión de los principios del NLP, así como una apreciación de la aplicación de la IA en los negocios

 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas