u-virtual

instagram

Twitter 512x512

 Youtube 2013 icon

facebook-hover

linkedin-hover

 

 

 

 

banner 11

big data 02

Objetivo General

Aprender a almacenar y acceder a grandes volúmenes de datos, que provienen diferentes fuentes para la toma de decisiones.

Objetivos espeficos

  • Conocer la diferentes herramientas y tecnologías disponibles para el desarrollo de proyectos de Big Data.
  • Realizar un consumo básico de información
  • Usar bases de datos No SQL
  • Crear, administrar y usar flujos de datos
  • Usar bases de datos relacionales en Big Data
  • Optimizar el almacenamiento
  • Usar grafos
  • Realizar una introducción a análisis predictivo

Conocimientos Previos Requeridos

Base de datos relacionales, Lenguaje SQL, programación (cualquier lenguaje)

INTRODUCCIÓN A BIG DATA 

  • Introducción a Big Data
  •  Evolución de los datos
  •  Evolución de la plataforma (OpenSource)
  • Las 4 V
  • Ciclo de vida de la información
  •  Ecosistema de Big Data
  • Ciclo de vida de los datos
  • Casos de Uso
  • Aplicaciones para seguros 

HDFS

  • Almacenamiento en Clúster
  • Esquema de ejecución en Hadoop
  • Administradores de recursos
  •  Laboratorio HDFS

Ingestión Básica de Datos

  • Ingestión desde sistemas relacionales
  • Optimización de ingestión
  • Laboratorio Ingestión Básica de datos

Introducción a ETL

  • Creación de transformaciones usando PIG
  •  Transformación de datos
  • Análisis de estructuras
  • Agregación de datos
  •  Laboratorio ETL

ETL Avanzado

  • Análisis de estructura de datos
  • Análisis de varios conjuntos de datos
  • Laboratorio ETL Avanzado

Creación de Flujos de ejecución

  • Creación de flujos
  • Control y monitoreo de flujos de ejecución
  • Tareas y control
  • Laboratorio de flujos de ejecución

Introducción a bases de datos NoSql en Hadoop

  • Esquema de desarrollo
  • Nivel de aislamiento
  • Manejo de histórico
  • Esquema de acceso
  • Laboratorio acceso a datos NoSql

Introducción a Consumo de datos usando SQL

  • Definición de esquemas
  • Consumo de tablas
  • Uso de Sql para consumir datos desde Hadoop
  • Administración de datos y esquemas
  • Laboratorio de Acceso a datos en Hadoop usando SQL
  • Laboratorio de administración de datos

Formatos de archivo

  • Formatos de archivo
  • Criterio de elección entre formatos de archivo
  • Labotarorio de formatos de Archivo

Particionamiento de datos

  • Introducción
  • Diseño de particiones
  • Tipos de particiones
  • Labotarorio particiones

 Introducción a análisis en tiempo real

  • Creación ingestión basada en eventos
  • Análisis de eventos en tiempo real
  • Fuentes y destinos
  • Laboratorio en nube usando IoT
  • Laboratorio de introducción análisis en tiempo real

Análisis en Tiempo Real en Hadoop

Introducción a Spark

  • Introducción a Spark
  • Introducción a la programación funcional
  • Introducción a Phython y Scala
  • Como jugador del análisis en tiempo real
  • Laboratorio Spark

Trabajando con RDDs con Spark

  • Uso de la representación de las estructuras de datos en spark
  • Uso de RDDs par
  • Laboratorio RDD  

Agregación de datos con Spark

  • Introducción a las agregaciones usando programación funcional
  • Agregación de alto rendimiento con Spark
  • Laboratorio agregación de datos

Escribiendo y publicando aplicaciones con Spark

  • Introducción al desarrollo y publicación de aplicaciones con Spark
  • Mejores prácticas
  • Labotarorio de desarrollo y publicación de aplicaciones

Programación de alto rendimiento en Spark

  • Técnicas de programación en paralelo
  • Optimización de algoritmos
  • Laboratorio de programación en paralelo en Spark

Persistencia de RDDs

  • Persistencia para la optimización de RDDs
  • Técnicas de persistencia
  • Consideraciones
  • Laboratorio persistencia Spark

Algoritmos Spark

  • Algoritmos iterativos
  • Algoritmos de alto rendimiento
  • Consideraciones
  • Laboratorio de Algoritmos iterativos

Spark SQL

  • Definición de DataFrames
  • Ejecución de consultas SQL usando dataframes
  • Uso de DF y RDDs
  • Laboratorio de Spark SQL

Introducción a concentradores de eventos

  • Introducción a concentradores de eventos
  • Ventanas de tiempos
  • Arquitectura
  • Laboratorio concentradores de eventos

Spark Streaming

  • Desarrollo de aplicaciones en tiempo real
  • Estructura de datos para el análisis en tiempo real
  • Consumo de eventos desde concentradores
  • Laboratorio Spark Streaming

Introducción al análisis predictivo

  • Introducción
  • Proceso
  • Algoritmos
  • Introducción a análisis predictivo en tiempo real
  • Laboratorio introductorio a análisis predictivo en hadoop

  

descuentos   inscribirse   pago linea
Descuentos Inscribirse ahora Pagar en linea
Conoce si eres beneficiario de alguno de nuestros descuentos. En nuestra plataforma online puedes realizar la inscripción a nuestros cursos. Ingresa para realizar el pago en linea de tu curso.

IMPORTANTE

Los programas podrán ser aplazados o cancelados, esto depende del número de participantes matriculados. En ambos casos el personal de inscripciones comunicará el cambio realizado a los estudiantes inscritos.

Contáctanos para mayores informes:
Ubicación: Centro Docente de Cómputos, bloque 14, piso 2
Teléfonos: (4) 340 52 62 / (4) 340 54 53 / (4) 340 51 99
Horarios de Atención: Lunes a viernes 8am a 12m y 1 a 7pm Sábados de 8am a 2pm
Correo Electrónico: Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Centro Docente de Cómputos