u-virtual

instagram

logo twitter udemedellin

 Youtube 2013 icon

f logo RGB Hex Blue 512

linkedin-hover

 

 

 

 horario big data en la nube

Objetivo General:

El progreso en términos tecnológicos ha desembocado en lo que se conoce como Industria 4.0. Con el transcurrir del tiempo, cada vez más industrias han adoptado diversas tecnologías que con frecuencia retan a las áreas operativas, técnicas y funcionales de las empresas. De esta manera es como ha aparecido en el contexto la computación en la nube. Diversas compañías, entre ellas Amazon proveen al mundo diariamente con infraestructura capaz de atender negocios que oscilan entre pocos usuarios y millones. El curso “Big Data en la Nube” pretende proveer a los asistentes de las capacidades necesarias para empezar con la implementación de procesos productivos en la nube, haciendo uso principalmente de herramientas diseñadas para trabajar sobre grandes volúmenes de datos

Objetivos Específicos:

  • Conocer la diferentes herramientas y tecnologías disponibles para el desarrollo de proyectos de Big Data.
  • Realizar un consumo básico de información
  • Usar bases de datos No SQL
  • Realizar transacciones sobre bases de datos masivas
  • Usar bases de datos relacionales en Big Data
  • Implementar procesos de Machine Learning en entornos de Big Data

Conocimientos previos requeridos:

Base de datos relacionales, Lenguaje SQL, programación (cualquier lenguaje)

 

 SUBTEMAS

Módulo 1

  • Introducción a HDFS 16
  • Introducción a MapReduce (MRv2: YARN)
  • Introducción a la nube de AWS
  • Implementación de un Cluster Hadoop en AWS
  • Implementación de una base de datos relacional en AWS
  • Lab1: Construcción de un Cluster Hadoop en AWS
  • Lab2: Construcción de una base de datos relacional en AWS
  • Lab3: Comunicación entre las bases de datos y el Cluster EMR

Número de Horas - 16

INGESTIÓN DE DATOS EN EL CLUSTER

 Módulo 2

  • Sqoop
  • Almacenamiento
  • Hive
  • Phoenix
  • Presto
  • Lab1: Ingestión de datos en EMR
  • Lab2: Registro de tablas en Hive
  • Lab3: Consultas en Presto
  • Lab4: Consultas en Presto y Hive desde Hue

Número de Horas - 16

ANÁLISIS DE FLUJOS DE DATOS

Módulo 3

  • Introducción a Spark
  • Spark con Python y Scala
  • Desarrollo de ETLs con Spark
  • Compilación y Ejecución de Jobs
  • Lab1: Implementación de ETLs en Spark
  • Lab2: Implementación de programas en Spark usando Map-Reduce
  • Lab3: Generación de JAR para ejecución automatizada
  • Lab4: Ejecución de un Job de Spark de manera automatizada

Número de Horas - 16

BASE DE DATOS SOBRE BIG DATA

Módulo 4

  • Introducción a las bases de datos distribuidas
  • Mongo en EC2
  • Hbase en EMR
  • Dynamo DB
  • Conexión desde Spark a Bases de datos de Big Data
  • Lab1: ETL desde y hacia Hbase con Spark
  • Lab2: Uso del servicio REST de HBASE para acceder a los datos desde Python
  • Lab3: Consulta de transacciones desde servicio WEB

Número de Horas - 16

ANÁLISIS PREDICTIVO

Módulo 5

  • Spark ML
  • Algoritmos de clasificación en Spark
  • Algoritmos de regresión en Spark
  • Algoritmos de clasificación en Spark
  • Deep Learning sobre Spark
  • Lab 1: Solución caso de estudio 1
  • Lab2: Solución caso de estudio 2
  • Lab3: Modelos de machine learning en producción

Número de Horas - 32

 

 

descuentos inscribirse pago linea
Descuentos Inscribirse ahora Pagar en linea
Conoce si eres beneficiario de alguno de nuestros descuentos. En nuestra plataforma online puedes realizar la inscripción a nuestros cursos. Ingresa para realizar el pago en linea de tu curso.

IMPORTANTE

Los programas podrán ser aplazados o cancelados, esto depende del número de participantes matriculados. En ambos casos el personal de inscripciones comunicará el cambio realizado a los estudiantes inscritos.  

Contáctanos para mayores informes 01

Centro Docente de Cómputos