Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Temario detallado del curso
- Introducción al NLP
- Comprensión del NLP
- Frameworks de NLP
- Aplicaciones comerciales del NLP
- Extracción de datos de la web
- Trabajo con varias APIs para recuperar datos de texto
- Trabajo y almacenamiento de corpora de texto, guardando el contenido y los metadatos relevantes
- Ventajas de usar Python y curso intensivo de NLTK
- Comprensión práctica de un corpus y un conjunto de datos
- ¿Por qué necesitamos un corpus?
- Análisis de corpus
- Tipos de atributos de datos
- Distintos formatos de archivo para corpora
- Preparación de un conjunto de datos para aplicaciones de NLP
- Comprensión de la estructura de una oración
- Componentes del NLP
- Comprensión del lenguaje natural
- Análisis morfológico: raíz, palabra, token, etiquetas de parte de la oración
- Análisis sintáctico
- Análisis semántico
- Gestión de la ambigüedad
- Preprocesamiento de datos de texto
- Corpus: texto sin procesar
- Tokenización de oraciones
- Stemming para texto sin procesar
- Lematización de texto sin procesar
- Eliminación de palabras vacías
- Corpus: oraciones sin procesar
- Tokenización de palabras
- Lematización de palabras
- Trabajo con matrices Término-Documento/Documento-Término
- Tokenización de texto en n-gramas y oraciones
- Preprocesamiento práctico y personalizado
- Corpus: texto sin procesar
- Análisis de datos de texto
- Características básicas del NLP
- Analizadores y análisis sintáctico
- Etiquetado de partes de la oración y etiquetadores
- Reconocimiento de entidades nominales
- N-gramas
- Bolsa de palabras
- Características estadísticas del NLP
- Conceptos de álgebra lineal para NLP
- Teoría probabilística para NLP
- TF-IDF
- Vectorización
- Codificadores y decodificadores
- Normalización
- Modelos probabilísticos
- Ingeniería de características avanzada y NLP
- Fundamentos de word2vec
- Componentes del modelo word2vec
- Lógica del modelo word2vec
- Extensión del concepto de word2vec
- Aplicación del modelo word2vec
- Estudio de caso: Aplicación de la bolsa de palabras: resumen automático de textos usando algoritmos simplificados y verdaderos de Luhn
- Características básicas del NLP
- Agrupación, clasificación y modelado de temas de documentos
- Agrupación de documentos y minería de patrones (agrupación jerárquica, k-means, clustering, etc.)
- Comparación y clasificación de documentos utilizando medidas de distancia TFIDF, Jaccard y coseno
- Clasificación de documentos usando Naive Bayes y Entropía Máxima
- Identificación de elementos de texto importantes
- Reducción de dimensionalidad: Análisis de Componentes Principales, Descomposición en Valores Singulares, factorización de matrices no negativas
- Modelado de temas y recuperación de información usando Análisis Semántico Latente
- Extracción de entidades, análisis de sentimiento y modelado avanzado de temas
- Positivo frente a negativo: grado de sentimiento
- Teoría de Respuesta al Ítem
- Etiquetado de partes de la oración y su aplicación: encontrar personas, lugares y organizaciones mencionadas en el texto
- Modelado avanzado de temas: Asignación Dirichlet Latente
- Estudios de caso
- Minería de reseñas de usuarios no estructuradas
- Clasificación de sentimiento y visualización de datos de reseñas de productos
- Minería de registros de búsqueda para patrones de uso
- Clasificación de texto
- Modelado de temas
Requerimientos
Conocimiento y comprensión de los principios del NLP y una apreciación de la aplicación de la IA en los negocios.
21 Horas
Testimonios (1)
Soporte individual
Simon the 2nd - Cboost
Curso - ROS: Programming for Robotics
Traducción Automática