Programa del Curso

Desglose de temas diarios: (Cada sesión es de 2 horas)

Día-1: Sesión -1: Visión general del negocio de por qué Big Data Business Intelligence en las telecomunicaciones.

  • Estudios de casos de T-Mobile, Verizon, etc.
  • Tasa de adaptación de Big Data en las empresas de telecomunicaciones de América del Norte y cómo están alineando su futuro modelo de negocio y operación en torno a Big Data BI
  • Área de aplicación a gran escala
  • Gestión de redes y servicios
  • Abandono de clientes Management
  • Integración de datos y visualización de cuadros de mando
  • Gestión del fraude
  • Generación de reglas de negocio
  • Elaboración de perfiles de clientes
  • Envío de anuncios localizados

Día-1: Sesión-2 : Introducción de Big Data-1

  • Principales características del Big Data: volumen, variedad, velocidad y veracidad. Arquitectura MPP para el volumen.
  • Almacenes de datos: esquema estático, conjunto de datos que evoluciona lentamente
  • Bases de datos MPP como Greenplum, Exadata, Teradata, Netezza, Vertica, etc.
  • Soluciones basadas en Hadoop: no hay condiciones en la estructura del conjunto de datos.
  • Patrón típico: HDFS, MapReduce (crunch), recuperar de HDFS
  • Por lotes: adecuado para análisis / no interactivo
  • Volumen : Datos de transmisión de CEP
  • Opciones típicas: productos CEP (por ejemplo, Infostreams, Apama, MarkLogic, etc.)
  • Menos producción lista – Storm/S4
  • Bases de datos NoSQL (en columnas y clave-valor): Más adecuadas como complemento analítico para el almacén de datos/base de datos

Día-1 : Sesión -3 : Introducción a Big Data-2

NoSQL soluciones

  • KV Store - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
  • Tienda KV - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
  • Almacén KV (Jerárquico) - GT.m, Caché
  • Tienda KV (Ordenada) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
  • KV Cache - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua
  • Tienda de tuplas - Gigaspaces, Coord, Apache River
  • Base de datos de objetos: ZopeDB, DB40, Shoal
  • Almacén de documentos: CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
  • Amplio almacén en columnas: BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI

Variedades de datos: Introducción al tema Data Cleaning en Big Data

  • RDBMS: estructura/esquema estático, no promueve un entorno ágil y exploratorio.
  • NoSQL – semiestructurado, estructura suficiente para almacenar datos sin un esquema exacto antes de almacenar datos
  • Problemas de limpieza de datos

Día-1 : Sesión-4 : Introducción a Big Data-3 : Hadoop

  • ¿Cuándo seleccionar Hadoop?
  • ESTRUCTURADO: los almacenes/bases de datos empresariales pueden almacenar datos masivos (a un costo) pero imponer una estructura (no es bueno para la exploración activa)
  • Datos ESTRUCTURADOS SEMI: difíciles de hacer con las soluciones tradicionales (DW/DB)
  • Datos de almacenamiento = ENORME esfuerzo y estática incluso después de la implementación
  • Para variedad y volumen de datos, procesados en hardware básico – HADOOP
  • Commodity H/W necesario para crear un Hadoop clúster

Introducción a Map Reduce /HDFS

  • MapReduce: distribuya la informática en varios servidores
  • HDFS: hacer que los datos estén disponibles localmente para el proceso informático (con redundancia)
  • Datos: pueden ser no estructurados o sin esquema (a diferencia de RDBMS)
  • Responsabilidad del desarrollador para dar sentido a los datos
  • Programming MapReduce = trabajar con Java (pros/contras), carga manual de datos en HDFS

Día 2: Sesión 1.1: Spark : Base de datos distribuida en memoria

  • ¿Qué es el procesamiento "en memoria"?
  • Chispa SQL
  • Spark SDK
  • Spark API
  • RDD
  • Liberación de chispas
  • Hanna
  • Cómo migrar un sistema Hadoop existente a Spark

Día-2 Sesión -1.2: Tormenta -Procesamiento en tiempo real en Big Data

  • Arroyos
  • Brotes
  • Pernos
  • Topologías

Día-2: Sesión-2: Sistema Big Data Management

  • Piezas móviles, nodos de cómputo de inicio/fallo: ZooKeeper: para servicios de configuración/coordinación/nomenclatura
  • Canalización/flujo de trabajo complejo: Oozie: gestiona el flujo de trabajo, las dependencias y la conexión en cadena
  • Implementar, configurar, administrar clústeres, actualizar, etc. (administrador de sistemas): Ambari
  • En la nube : Whirr
  • Evolución Big Data de las herramientas de la plataforma para el seguimiento
  • Problemas de aplicación de la capa ETL

Día-2: Sesión-3: Analítica predictiva en Business Intelligence -1: Técnicas fundamentales y BI basado en aprendizaje automático:

  • Introducción al aprendizaje automático
  • Aprendizaje de técnicas de clasificación
  • Archivo de entrenamiento de preparación de predicción bayesiana
  • Campo aleatorio de Markov
  • Aprendizaje supervisado y no supervisado
  • Extracción de características
  • Máquina de vectores de soporte
  • Red neuronal
  • Aprendizaje por refuerzo
  • Big Data Problema de variable grande -Bosque aleatorio (RF)
  • Aprendizaje de la representación
  • Aprendizaje profundo
  • Big Data Problema de automatización: RF de conjunto multimodelo
  • Automatización a través de Soft10-M
  • LDA y modelado de temas
  • Aprendizaje ágil
  • Aprendizaje basado en agentes: ejemplo de operación de telecomunicaciones
  • Aprendizaje distribuido: ejemplo de funcionamiento de la empresa de telecomunicaciones
  • Introducción a las herramientas de código abierto para el análisis predictivo : R, Rapidminer, Mahut
  • Laboratorio de análisis de Hama, Spark y CMU Graph más escalable

Día-2: Sesión-4 Ecosistema de analítica predictiva-2: Problemas comunes de analítica predictiva en Telecom

  • Analítica de información
  • Analítica de visualización
  • Análisis predictivo estructurado
  • Analítica predictiva no estructurada
  • Elaboración de perfiles de clientes
  • Motor de recomendaciones
  • Detección de patrones
  • Descubrimiento de reglas/escenarios: fallo, fraude, optimización
  • Descubrimiento de la causa raíz
  • Análisis de sentimiento
  • Analítica de CRM
  • Análisis de redes
  • Análisis de texto
  • Revisión asistida por tecnología
  • Análisis de fraude
  • Analítica en tiempo real

Día-3 : Sesión-1 : Análisis de la operación de la red: análisis de la causa raíz de las fallas de la red, interrupción del servicio a partir de metadatos, IPDR y CRM:

  • Uso de CPU
  • Uso de memoria
  • Uso de la cola de QoS
  • Temperatura del dispositivo
  • Error de interfaz
  • Versiones de IoS
  • Eventos de enrutamiento
  • Variaciones de latencia
  • Análisis de Syslog
  • Pérdida de paquetes
  • Simulación de carga
  • Inferencia de topología
  • Umbral de rendimiento
  • Trampas de dispositivos
  • Recopilación y procesamiento de IPDR (registro detallado de IP)
  • Uso de datos IPDR para el consumo de ancho de banda del suscriptor, la utilización de la interfaz de red, el estado del módem y el diagnóstico
  • Información sobre HFC

Día-3: Sesión-2: Herramientas para el análisis de fallos del servicio de red:

  • Panel de resumen de red: supervise las implementaciones generales de la red y realice un seguimiento de los indicadores clave de rendimiento de su organización
  • Panel de análisis de período pico: comprenda las tendencias de la aplicación y los suscriptores que impulsan la utilización máxima, con granularidad específica de la ubicación
  • Panel de eficiencia de enrutamiento: controle los costos de la red y cree casos de negocio para proyectos de capital con una comprensión completa de las relaciones de interconexión y tránsito
  • Panel de entretenimiento en tiempo real: acceda a las métricas que importan, incluidas las visualizaciones de vídeo, la duración y la calidad de la experiencia de vídeo (QoE)
  • Panel de control de transición a IPv6: investigue la adopción continua de IPv6 en su red y obtenga información sobre las aplicaciones y los dispositivos que impulsan las tendencias
  • Caso práctico 1: El minero de datos Big Network Analytics (BNA) de Alcatel-Lucent
  • Inteligencia móvil multidimensional (m.IQ6)

Día-3 : Sesión 3: Big Data BI para Marketing/Ventas –Comprensión de las ventas/marketing a partir de los datos de ventas: (Todos ellos se mostrarán con una demostración analítica predictiva en vivo)

  • Para identificar los clientes de mayor velocidad
  • Identificar clientes para un determinado producto
  • Identificar el conjunto correcto de productos para un cliente (motor de recomendación)
  • Técnica de segmentación de mercado
  • Técnica de venta cruzada y venta adicional
  • Técnica de segmentación de clientes
  • Técnica de previsión de ingresos por ventas

Día-3: Sesión 4: BI necesario para la oficina del CFO de telecomunicaciones:

  • Descripción general de Business Trabajos de análisis necesarios en una oficina de CFO
  • Análisis de riesgos en nuevas inversiones
  • Previsión de ingresos y beneficios
  • Previsión de adquisición de nuevos clientes
  • Previsión de pérdidas
  • Análisis de fraude en las finanzas ( detalles próxima sesión )

Día-4 : Sesión-1: BI de prevención de fraude desde Big Data en Telco-Fraud analytic:

  • Fuga de ancho de banda / Fraude de ancho de banda
  • Fraude de proveedores/cobro excesivo por proyectos
  • Fraudes de reembolsos/reclamaciones de clientes
  • Fraudes en el reembolso de viajes

Día-4 : Sesión-2: De la predicción de la pérdida de clientes a la prevención de la pérdida de clientes:

  • 3 tipos de abandono: activo/deliberado, rotativo/incidental, pasivo involuntario
  • 3 Clasificación de clientes abandonados: Total, Oculto, Parcial
  • Descripción de las variables de CRM para la pérdida de clientes
  • Recopilación de datos sobre el comportamiento del cliente
  • Recopilación de datos de percepción del cliente
  • Recopilación de datos demográficos de los clientes
  • Limpieza de datos de CRM
  • Datos no estructurados de CRM (llamadas de clientes, tickets, correos electrónicos) y su conversión en datos estructurados para el análisis de Churn
  • Social Media CRM: nueva forma de extraer el índice de satisfacción del cliente
  • Estudio de caso-1 : T-Mobile USA: Reducción de la pérdida de clientes en un 50%

Día-4 : Sesión-3: Cómo utilizar el análisis predictivo para el análisis de la causa raíz de la insatisfacción del cliente:

  • Estudio de caso -1 : Vinculación de la insatisfacción con los problemas - Contabilidad, Fallas de ingeniería como interrupción del servicio, servicio de ancho de banda deficiente
  • Estudio de caso 2: Big Data Panel de control de calidad para realizar un seguimiento del índice de satisfacción del cliente a partir de varios parámetros, como escalamientos de llamadas, criticidad de problemas, eventos pendientes de interrupción del servicio, etc.

Día-4: Sesión-4: Big Data Panel de control para un rápido acceso a diversos datos y visualización:

  • Integración de la plataforma de aplicaciones existente con Big Data Dashboard
  • Gestión de Big Data
  • Estudio de caso de Big Data Dashboard: Tableau y Pentaho
  • Utilice la aplicación Big Data para impulsar la publicidad basada en la ubicación
  • Sistema de seguimiento y gestión

Día-5 : Sesión-1: Cómo justificar Big Data la implementación de BI dentro de una organización:

  • Definición del ROI para la implementación Big Data
  • Casos prácticos para ahorrar tiempo a los analistas en la recopilación y preparación de datos: aumento de la productividad
  • Casos prácticos de aumento de ingresos por abandono de clientes
  • Aumento de ingresos de anuncios basados en la ubicación y otros anuncios dirigidos
  • Un enfoque de hoja de cálculo integrado para calcular aprox. gastos frente a ganancias/ahorros de ingresos de Big Data implementación.

Día-5 : Sesión-2: Procedimiento paso a paso para reemplazar el sistema de datos heredado a Big Data Sistema:

  • Comprensión práctica Big Data de la hoja de ruta de la migración
  • ¿Cuál es la información importante que se necesita antes de diseñar una implementación Big Data
  • ¿Cuáles son las diferentes formas de calcular el volumen, la velocidad, la variedad y la veracidad de los datos?
  • Cómo estimar el crecimiento de los datos
  • Casos de estudio en 2 Telco

Día-5: Sesión 3 y 4: Revisión de Big Data Proveedores y revisión de sus productos. Sesión de preguntas y respuestas:

  • AccentureAlcatel-Lucent
  • Amazonas –A9
  • APTEAN (anteriormente software de los CDC)
  • Sistemas Cisco
  • Cloudera
  • Dell
  • EMC
  • Corporación GoodData
  • Guavus
  • Sistemas de datos de Hitachi
  • Hortonworks
  • Huawei
  • HP
  • IBM
  • Informatica
  • Intel
  • Jaspersoft
  • Microsoft
  • MongoDB (anteriormente 10Gen)
  • MU Sigma
  • Netapp
  • Soluciones de Opera
  • Oráculo
  • Pentaho
  • Platfora
  • Qliktech
  • Cuanto
  • Espacio en rack
  • Análisis de Revolution
  • Ventas de ventas
  • SAVIA
  • Instituto SAS
  • Sisense
  • Software AG/Terracotta
  • Automatización de Soft10
  • Splunk
  • Sqrrl
  • Supermicro
  • Tableau Software
  • Teradata
  • Piensa en grande en analítica
  • Sistemas de señalización de mareas
  • VMware (Parte de EMC)

Requerimientos

  • Debe tener conocimientos básicos de funcionamiento empresarial y sistemas de datos en Telecom en su dominio
  • Debe tener conocimientos básicos de SQL/Oracle o bases de datos relacionales
  • Conocimientos básicos de Estadística (en niveles de Excel)
 35 horas

Número de participantes



Precio por participante

Testimonios (2)

Cursos Relacionados

Kaggle

14 horas

Accelerating Python Pandas Workflows with Modin

14 horas

GPU Data Science with NVIDIA RAPIDS

14 horas

Anaconda Ecosystem for Data Scientists

14 horas

Data Analysis with Redash

14 horas

Business Intelligence and Data Analysis with Metabase

14 horas

QlikView para usuarios de negocios

7 horas

QlikView para desarrolladores

14 horas

Google Sheets for Excel Users

14 horas

Cognos 11

14 horas

IBM Cognos Analytics

14 horas

Alteryx Advanced

14 horas

Alteryx for Data Analysis

7 horas

Alteryx para Desarrolladores

14 horas

Data Preparation with Alteryx

7 horas

Categorías Relacionadas