Programa del Curso

Esquema detallado de la formación

  1. Introducción a la PNL
    • Entendiendo la PNL
    • Marcos de NLP
    • Aplicaciones comerciales de la PNL
    • Extracción de datos de la web
    • Trabajar con varias API para recuperar datos de texto
    • Trabajo y almacenamiento de corpus de texto, almacenamiento de contenido y metadatos relevantes
    • Ventajas de usar el curso intensivo Python y NLTK
  2. Comprensión práctica de un corpus y un conjunto de datos
    • ¿Por qué necesitamos un corpus?
    • Análisis de corpus
    • Tipos de atributos de datos
    • Diferentes formatos de archivo para corpus
    • Preparación de un conjunto de datos para aplicaciones de NLP
  3. Comprender la estructura de una oración
    • Componentes de la PNL
    • Comprensión del lenguaje natural
    • Análisis morfológico: tallo, palabra, token, etiquetas de voz
    • Análisis sintáctico
    • Análisis semántico
    • Manejo de la ambigüedad
  4. Preprocesamiento de datos de texto
    • Corpus: texto en bruto
      • Tokenización de oraciones
      • Derivación para texto sin formato
      • Lemización de texto sin formato
      • Eliminación de palabras vacías
    • Sentencias en bruto de corpus
      • Word Tokenización
      • Word Lematización
    • Trabajar con matrices Término-Documento/Documento-Término
    • Tokenización de texto en n-gramas y oraciones
    • Preprocesamiento práctico y personalizado
  5. Análisis de datos de texto
    • Característica básica de NLP
      • Analizadores sintácticos y análisis sintáctico
      • Etiquetado y etiquetadores de puntos de venta
      • Reconocimiento de entidades de nombre
      • N-gramas
      • Bolsa de palabras
    • Características estadísticas de la PNL
      • Conceptos de álgebra lineal para PNL
      • Teoría probabilística de la PNL
      • TF-IDF
      • Vectorización
      • Codificadores y decodificadores
      • Normalización
      • Modelos probabilísticos
    • Ingeniería de características avanzada y NLP
      • Conceptos básicos de word2vec
      • Componentes del modelo word2vec
      • Lógica del modelo word2vec
      • Extensión del concepto word2vec
      • Aplicación del modelo word2vec
    • Estudio de caso: Aplicación de la bolsa de palabras: resumen automático de texto utilizando algoritmos de Luhn simplificados y verdaderos
  6. Agrupación de documentos, clasificación y modelado de temas
    • Agrupación de documentos y minería de patrones (agrupación jerárquica, k-means, agrupación, etc.)
    • Comparación y clasificación de documentos utilizando medidas de distancia TFIDF, Jaccard y coseno
    • Clasificación de documentos utilizando Bayes ingenuo y máxima entropía
  7. Identificación de textos importantes Elements
    • Dimensionalidad reductora: Análisis de componentes principales, descomposición de valores singulares, factorización de matrices no negativas
    • Modelado de temas y recuperación de información mediante análisis semántico latente
  8. Extracción de Entidades, Sentiment Analysis y Modelado Avanzado de Temas
    • Positivo vs. negativo: grado de sentimiento
    • Teoría de la respuesta al ítem
    • Parte del etiquetado de voz y su aplicación: encontrar personas, lugares y organizaciones mencionadas en el texto
    • Modelado avanzado de temas: Asignación latente de Dirichlet
  9. Casos de estudio
    • Minería de opiniones de usuarios no estructuradas
    • Clasificación de opiniones y visualización de datos de reseñas de productos
    • Minería de registros de búsqueda de patrones de uso
    • Clasificación de textos
    • Modelado de temas

Requerimientos

Conocimiento y concienciación de los principios de la PNL y apreciación de la aplicación de la IA en los negocios

 21 Horas

Número de participantes


Precio por Participante​

Testimonios (1)

Próximos cursos

Categorías Relacionadas