Programa del Curso

Principios de la computación distribuida

  • Apache Spark
  • Hadoop

Principios de serialización de datos

  • Cómo se pasa el objeto de datos por la red
  • Serialización de objetos
  • Enfoques de serialización
    • Ahorro
    • Buffers de protocolo
    • Apache Avro
      • estructura de datos
      • tamaño, velocidad, características de formato
      • almacenamiento persistente de datos
      • integración con lenguajes dinámicos
      • tipeo dinámico
      • esquemas
        • datos sin etiquetar
        • gestión del cambio

Serialización de datos y computación distribuida

  • Avro como un subproyecto de Hadoop
    • Serialización de Java
    • Serialización Hadoop
    • Serialización Avro

Usando Avro con

  • Colmena (AvroSerDe)
  • Cerdo (AvroStorage)

Portar marcos de RPC existentes

Requerimientos

Una familiaridad general con la informática distribuida

  14 horas
 

Número de participantes


Comienza

Termina


Las fechas están sujetas a disponibilidad y tienen lugar entre 09:30 y 16:30.
Los cursos de formación abiertos requieren más de 5 participantes.

Testimonios (3)

Cursos Relacionados

Categorías Relacionadas