Contacta con nosotros

Temario del curso

Introducción

  • Bases de datos y bibliotecas de grafos

Comprensión de los datos de grafos

  • El grafo como estructura de datos
  • Uso de vértices (puntos) y aristas (líneas) para modelar escenarios del mundo real

Uso de bases de datos de grafos para modelar, almacenar y procesar datos de grafos

  • Algoritmos y recorridos de grafos locales
  • neo4j, OrientDB y Titan

Ejercicio: Modelado de datos de grafos con neo4j

  • Modelado de datos en pizarra

Más allá de las bases de datos de grafos: Computación con grafos

  • Comprensión del grafo de propiedades
  • Modelado de grafos para diferentes escenarios (grafo de software, grafo de discusiones, grafo de conceptos)

Resolución de problemas del mundo real mediante recorridos

  • Recorrido algorítmico o dirigido sobre el grafo
  • Determinación de dependencias circulares

Estudio de caso: Clasificación de contribuyentes en discusiones

  • Clasificación según el número y la profundidad de las discusiones aportadas
  • Una nota sobre el análisis de sentimientos y conceptos

Computación con grafos: kits de herramientas de grafos locales y en memoria

  • Análisis y visualización de grafos
  • JUNG, NetworkX e iGraph

Ejercicio: Modelado de datos de grafos con NetworkX

  • Uso de NetworkX para modelar un sistema complejo

Computación con grafos: frameworks de procesamiento por lotes para grafos

  • Aprovechamiento de Hadoop para almacenamiento (HDFS) y procesamiento (MapReduce)
  • Visión general de algoritmos iterativos
  • Hama, Giraph y GraphLab

Computación con grafos: computación paralela en grafos

  • Unificación de ETL, análisis exploratorio y cómputo iterativo de grafos en un solo sistema
  • GraphX

Configuración e instalación

  • Hadoop y Spark

Operadores de GraphX

  • Propiedades, estructurales, de unión, agregación de vecindad, caché y limpieza de caché

Iteración con la API de Pregel

  • Paso de argumentos para envío, recepción y cómputo

Construcción de un grafo

  • Uso de vértices y aristas en un RDD o en disco

Diseño de algoritmos escalables

  • Optimización de GraphX

Acceso a algoritmos adicionales

  • PageRank, componentes conectados, conteo de triángulos

Ejercicio: PageRank y usuarios principales

  • Construcción y procesamiento de datos de grafos usando archivos de texto como entrada

Despliegue a producción

Comentarios de cierre

Requerimientos

  • Conocimiento de la programación y los frameworks en Java
  • Es útil, aunque no obligatorio, tener una comprensión general de Python
  • Conocimiento general de conceptos de bases de datos

Audiencia

  • Desarrolladores
 28 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas