Programa del Curso
- Introducción
- Hadoop Historia, Conceptos
- Ecosistema
- Distribuciones
- Arquitectura de alto nivel
- Hadoop Mitos
- Hadoop Desafíos (hardware / software)
- Labs: discuta sus proyectos y problemas de Big Data
- Operaciones de HDFS
- Conceptos (escalado horizontal, replicación, localidad de datos, reconocimiento de rack)
- Nodos y daemons (NameNode, Secondary NameNode, HA Standby NameNode, DataNode)
- Supervisión de la salud
- Administración basada en explorador y línea de comandos
- Adición de almacenamiento, sustitución de unidades defectuosas
- Labs: familiarizarse con las líneas de comandos de HDFS
- Operaciones y administración de MapReduce
- Computación paralela antes de mapreduce: comparación de la administración de HPC con Hadoop
- Cargas de clúster de MapReduce
- Nodos y demonios (JobTracker, TaskTracker)
- Tutorial de la interfaz de usuario de MapReduce
- Configuración de Mapreduce
- Configuración del trabajo
- Optimización de MapReduce
- RM infalible: qué decirle a tus programadores
- Labs: ejecución de ejemplos de MapReduce
- Temas avanzados
- Monitoreo de hardware
- Supervisión de clústeres
- Adición y eliminación de servidores, actualización Hadoop
- Planificación de copias de seguridad, recuperación y continuidad del negocio
- Flujos de trabajo de Oozie
- Hadoop alta disponibilidad (HA)
- Hadoop Federación
- Protección del clúster con Kerberos
- Laboratorios: configurar la supervisión
Requerimientos
- Cómodo con la administración básica del sistema Linux
- Habilidades básicas de scripting
No se requieren conocimientos de Hadoop y Computación Distribuida, pero se introducirán y explicarán en el curso.
Entorno de laboratorio
Instalación cero: ¡No es necesario instalar el software hadoop en las máquinas de los estudiantes! Se proporcionará a los estudiantes un clúster de hadoop en funcionamiento.
Los estudiantes necesitarán lo siguiente
- un cliente SSH (Linux y Mac ya tienen clientes ssh, para Windows se recomienda Utty )
- Un explorador para acceder al clúster. Recomendamos el navegador Firefox con la extensión FoxyProxy instalada
Testimonios (6)
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Curso - Impala for Business Intelligence
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Curso - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Curso - Administrator Training for Apache Hadoop
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Curso - Big Data Analytics in Health
The fact that all the data and software was ready to use on an already prepared VM, provided by the trainer in external disks.
vyzVoice
Curso - Hadoop for Developers and Administrators
practical things of doing, also theory was served good by Ajay