KMMX Capacitación acorde a tu pensamiento

Big Data Analytics con Spark (30 hrs.)

Descripción: Spark es una de las más importantes tecnologías Big Data. La cantidad de datos generados por los dispositivos de hoy en día, las aplicaciones y los usuarios se está disparando. Por lo tanto, existe una necesidad crítica de herramientas que puedan analizar datos a gran escala y percibir el valor de los mismos. Spark es una poderosa tecnología que satisface esa necesidad. Hay una escasez crítica de personas con experiencia en el análisis de grandes volúmenes de datos, por lo que las empresas están dispuestas a pagar mucho por las personas con habilidades en áreas como Spark y Scala. Luego de la absorción de sus principios mediante este curso, proporcionará un gran impulso a su carrera.

Objetivo: Este curso es una guía para el aprendizaje de Spark para el análisis de datos a gran escala. Usted aprenderá cómo usar Spark para diferentes tipos de grandes proyectos de análisis de datos, incluyendo lotes, interactivo, grafos, y el análisis de flujo de datos, así como el aprendizaje automático.


Temario:

Parte 1: El panorama de la tecnología Big Data

Hadoop | Serialización de datos | Almacenamiento Columnar | Sistemas de mensajería | NoSQL | Motor de consultas Distribuidas SQL

Parte 2: Programando en Scala

Programación Funcional | Fundamentos de Scala | Una aplicación en Scala

Parte 3: El núcleo de Spark

Arquitectura de alto nivel | Ejecución de aplicación | Fuentes de Datos | El API de Spark | Lazi Operations | Cacheo | Variables Compartidas

Parte 4: Análisis de Datos interactivo con Spark Shell

Primeros pasos | Comandos REPL | Uso del Shell de Spark como un Shell de Scala | Análisis numérico | Análisis de Logs

Parte 5: Escribiendo aplicaciones en Spark

Compilando y ejecutando aplicación | Monitoreo de aplicación | Depuración de aplicación | Spark Streaming

Parte 6: Spark SQL

Introducción a Spark SQL | Performance | Aplicaciones | El API de Spark SQL | Funciones incorporadas | UDFs y UDAFs | Ejemplo de Análisis Interactivo | Análisis Interactivo con Spark SQL y JDBC Server

Parte 7: Machine Learning con Spark

Introducción a Machine Learning | Librerías en Spark de Machine Learning | El API de MLib | Spark ML

Parte 8: Procesamiento de Grafos con Spark

Introducción a Grafos | Introducción a GraphX | El API de GraphX

Parte 9: Gestores de Clústers y Monitoreo

Gestión de un Clúster independiente | Apache Mesos | YARN | Monitoreo de un Clúster independiente | Monitoreo de una Aplicación Spark


Precio por participante: $11,600 MN (IVA incluido)

Formas de pago