formacion@asime.es 986 410 727

Descripción

Este curso te permitirá conocer las principales tecnologías existentes en el mercado para BIG DATA.

DURACIÓN: 40 Horas

MODALIDAD: Presencial

PRÓXIMA CONVOCATORIA: Consúltanos próxima fecha de inicio

IMPULSADO POR: Ministerio de Economía y Empresa a través de Red.es

Objetivos

Conocer las principales tecnologías existentes en el mercado para BIG DATA.

Diseñar soluciones basadas en el uso de las tecnologías BIG DATA: Hadoop, Spark y R.

Coste

Formación totalmente subvencionada.

Requisitos de acceso

Trabajadores en activo.

Prioridad a trabajadores de Pymes, contratados de forma eventual o a tiempo parcial, mayores de 45 años y mujeres.

Horario

Solicita información sin compromiso y te comentaremos los horarios y fechas para siguientes convocatorias.

Plan de estudios

Índice de contenidos

Módulo 1 – Diseño y arquitectura de soluciones con Hadoop, Spark y R

contenidos

Módulo 1 – Diseño y arquitectura de soluciones con Hadoop, Spark y R

1. MÓDULO 1. DISEÑO Y ARQUITECTURA DE SOLUCIONES CON HADOOP, SPARK Y R

UNIDAD DIDÁCTICA 1. FUNDAMENTOS
• Introducción al Big Data
Fundamentos data management y estadística
Tecnologías Hadoop, Spark y R entre otros
Infraestructura de las distribuciones Hadoop
Fundamentos de almacenamiento

UNIDAD DIDÁCTICA 2. TECNOLOGÍAS VINCULADAS AL BIG DATA
Instalación: modos de instalación
Planificación y tareas: introducción, lenguajes de programación, appification, RDD, ingesta de datos, Lambdas, Java en Spark, instrumentación y librerías.

UNIDAD DIDÁCTICA 3. INFRAESTRUCTURAS Y CONFIGURACIÓN
En este módulo se trabajará sobre Cloudera, la distribución Hadoop más utilizada. Introducción
Infraestructura Hadoop
Arquitectura Apache Spark: introducción, instalación, modos de despliegue, lenguajes de programación, Appification, RDD, instrumentación y librerías, entre otros.
Configuración de servicios Hadoop
YARN

UNIDAD DIDÁCTICA 4. MONITORIZACIÓN Y ADMINISTRACIÓN

UNIDAD DIDÁCTICA 5. ALMACENAMIENTO DE DATOS
Introducción al almacenamiento Big Data. Tipos de bases de datos, noSQL vs SQL, Graph Databases y bases de datos MPP.
Apache Cassandra: introducción, arquitectura, instalación, replicación y consistencia.
MongoDB: introducción.
Hive: arquitectura, esquema, Hive Warehouse, lenguaje Hive, HiveQL, Bucketing, entre otros.
Ingesta de datos SQOOP y FLUME
Hbase: arquitectura, diseño de tablas, relaciones, nodos de cluster, Hfiles y regions, scaling y compaction.

UNIDAD DIDÁCTICA 6. ANÁLISIS DE DATOS
Introducción a R: introducción e instalación, IDES para R, variables, operadores, estructuras de datos y explotación de datos.

UNIDAD DIDÁCTICA 7. VISUALIZACIÓN DE DATOS
Introducción a la analítica de datos, herramientas, modelado de datos, relaciones, normalización, estadística, visualización y presentación.
Datos con R: introducción e instalación, IDES para R, variables y operadores, estructuras de datos, funciones, explotación de datos.
Tableau: introducción a Data Mining, modeler, recolección de datos, clasificación y modelado.

Proyecto cofinanciado por el Fondo Social Europeo 2014-2020 con cargo al Programa Operativo de Empleo, Formación y Educación (POEFE). Expediente C058/17-ED

Nuestras oficinas

VIGO

Avenida Doctor Corbal Nº51

O Freixiño

36207 Vigo (Pontevedra)

NARÓN

Pol. Ind. A Gándara, Arena 76 Centro De Negocios

Avda. Otero Predrayo E. Vicente Risco, p. 2ª of. 5

15570 Narón (A Coruña)

LUGO

Rúa do Progreso 28, 1º

27001 Lugo (Lugo)