Este curso te permitirá conocer las principales tecnologías existentes en el mercado para BIG DATA.
Conocer las principales tecnologías existentes en el mercado para BIG DATA.
Diseñar soluciones basadas en el uso de las tecnologías BIG DATA: Hadoop, Spark y R.
Formación totalmente subvencionada.
Trabajadores en activo.
Prioridad a trabajadores de Pymes, contratados de forma eventual o a tiempo parcial, mayores de 45 años y mujeres.
Solicita información sin compromiso y te comentaremos los horarios y fechas para siguientes convocatorias.
Módulo 1 – Diseño y arquitectura de soluciones con Hadoop, Spark y R
1. MÓDULO 1. DISEÑO Y ARQUITECTURA DE SOLUCIONES CON HADOOP, SPARK Y R
UNIDAD DIDÁCTICA 1. FUNDAMENTOS
• Introducción al Big Data
Fundamentos data management y estadística
Tecnologías Hadoop, Spark y R entre otros
Infraestructura de las distribuciones Hadoop
Fundamentos de almacenamiento
UNIDAD DIDÁCTICA 2. TECNOLOGÍAS VINCULADAS AL BIG DATA
Instalación: modos de instalación
Planificación y tareas: introducción, lenguajes de programación, appification, RDD, ingesta de datos, Lambdas, Java en Spark, instrumentación y librerías.
UNIDAD DIDÁCTICA 3. INFRAESTRUCTURAS Y CONFIGURACIÓN
En este módulo se trabajará sobre Cloudera, la distribución Hadoop más utilizada. Introducción
Infraestructura Hadoop
Arquitectura Apache Spark: introducción, instalación, modos de despliegue, lenguajes de programación, Appification, RDD, instrumentación y librerías, entre otros.
Configuración de servicios Hadoop
YARN
UNIDAD DIDÁCTICA 4. MONITORIZACIÓN Y ADMINISTRACIÓN
UNIDAD DIDÁCTICA 5. ALMACENAMIENTO DE DATOS
Introducción al almacenamiento Big Data. Tipos de bases de datos, noSQL vs SQL, Graph Databases y bases de datos MPP.
Apache Cassandra: introducción, arquitectura, instalación, replicación y consistencia.
MongoDB: introducción.
Hive: arquitectura, esquema, Hive Warehouse, lenguaje Hive, HiveQL, Bucketing, entre otros.
Ingesta de datos SQOOP y FLUME
Hbase: arquitectura, diseño de tablas, relaciones, nodos de cluster, Hfiles y regions, scaling y compaction.
UNIDAD DIDÁCTICA 6. ANÁLISIS DE DATOS
Introducción a R: introducción e instalación, IDES para R, variables, operadores, estructuras de datos y explotación de datos.
UNIDAD DIDÁCTICA 7. VISUALIZACIÓN DE DATOS
Introducción a la analítica de datos, herramientas, modelado de datos, relaciones, normalización, estadística, visualización y presentación.
Datos con R: introducción e instalación, IDES para R, variables y operadores, estructuras de datos, funciones, explotación de datos.
Tableau: introducción a Data Mining, modeler, recolección de datos, clasificación y modelado.
Proyecto cofinanciado por el Fondo Social Europeo 2014-2020 con cargo al Programa Operativo de Empleo, Formación y Educación (POEFE). Expediente C058/17-ED
Avenida Doctor Corbal Nº51
O Freixiño
36207 Vigo (Pontevedra)
Pol. Ind. A Gándara, Arena 76 Centro De Negocios
Avda. Otero Predrayo E. Vicente Risco, p. 2ª of. 5
15570 Narón (A Coruña)
Rúa do Progreso 28, 1º
27001 Lugo (Lugo)