Curso de Apache Spark

Curso de Apache Spark

Los cursos de capacitación locales en línea de Apache Spark demuestran a través de la práctica cómo Spark encaja en el ecosistema Big Data y cómo utilizar Spark para el análisis de datos El entrenamiento de Apache Spark está disponible como "entrenamiento en vivo en el sitio" o "entrenamiento en vivo a distancia" El entrenamiento en vivo in situ se puede llevar a cabo localmente en las instalaciones del cliente en México o en los centros de capacitación corporativa de NobleProg en México La capacitación remota en vivo se lleva a cabo a través de un escritorio remoto interactivo NobleProg Su proveedor local de capacitación.

Testimonios

★★★★★
★★★★★

Apache Spark Subcategorías

Programa del curso Apache Spark

CódigoNombreDuraciónInformación General
sparkdevSpark para Desarrolladores21 horasOBJETIVO: Este curso presentará Apache Spark Los estudiantes aprenderán cómo encaja Spark en el ecosistema Big Data y cómo usar Spark para el análisis de datos El curso cubre Spark shell para análisis interactivo de datos, Spark internals, Spark APIs, Spark SQL, Spark Streaming, machine learning y graphX AUDIENCIA: Desarrolladores / Analistas de datos .
hdpHortonworks Data Platform (HDP) para Administradores21 horasHortonworks Data Platform es una plataforma de soporte de Apache Hadoop de código abierto que proporciona una base estable para el desarrollo de soluciones de big data en el ecosistema de Apache Hadoop.

Esta capacitación en vivo dirigida por un instructor presenta a Hortonworks y guía a los participantes a través del despliegue de la solución Spark + Hadoop.

Al final de esta capacitación, los participantes podrán:

- Use Hortonworks para ejecutar confiablemente Hadoop a gran escala
- Unifique las capacidades de seguridad, gobierno y operaciones de Hadoop con los flujos de trabajo analíticos ágiles de Spark.
- Use Hortonworks para investigar, validar, certificar y dar soporte a cada uno de los componentes en un proyecto Spark
- Procese diferentes tipos de datos, incluidos estructurados, no estructurados, en movimiento y en reposo.

Audiencia

- Administradores de Hadoop

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
magellanMagellan: Análisis Geoespacial con Spark14 horasMagellan es un motor de ejecución distribuida de código abierto para el análisis geoespacial en big data. Implementado sobre Apache Spark, amplía Spark SQL y proporciona una abstracción relacional para el análisis geoespacial.

Esta capacitación en vivo dirigida por un instructor presenta los conceptos y enfoques para implementar el análisis geospacial y guía a los participantes a través de la creación de una aplicación de análisis predictivo utilizando Magellan en Spark.

Al final de esta capacitación, los participantes podrán:

- Consultar, analizar y unir datos geoespaciales de manera eficiente a escala
- Implementar datos geoespaciales en inteligencia empresarial y aplicaciones de análisis predictivo
- Utilice el contexto espacial para ampliar las capacidades de dispositivos móviles, sensores, registros y dispositivos portátiles

Audiencia

- Desarrolladores de aplicaciones

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
alluxioAlluxio: Unificando Sistemas de Almacenamiento Dispares7 horasAlexio es un sistema de almacenamiento distribuido virtual de código abierto que unifica sistemas de almacenamiento dispares y permite que las aplicaciones interactúen con datos a la velocidad de la memoria. Es utilizado por compañías como Intel, Baidu y Alibaba.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Alexio para unir diferentes marcos de computación con sistemas de almacenamiento y administrar de manera eficiente los datos de escala de varios petabytes mientras avanzan en la creación de una aplicación con Alluxio.

Al final de esta capacitación, los participantes podrán:

- Desarrolle una aplicación con Alluxio
- Conecte aplicaciones y sistemas de big data mientras conserva un espacio de nombres
- Extrae de manera eficiente el valor de los grandes datos en cualquier formato de almacenamiento
- Mejorar el rendimiento de la carga de trabajo
- Implemente y administre Alluxio de forma independiente o en clúster

Audiencia

- Científico de datos
- Desarrollador
- Administrador de sistema

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
sparkpythonPython y Spark para Big Data (PySpark)21 horasPython es un lenguaje de programación de alto nivel famoso por su claridad de sintaxis y código. Spark es un motor de procesamiento de datos utilizado para consultar, analizar y transformar big data. PySpark permite a los usuarios interactuar con Spark con Python.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Python y Spark juntos para analizar los datos grandes mientras trabajan en ejercicios prácticos.

Al final de esta capacitación, los participantes podrán:

- Aprenda a usar Spark con Python para analizar Big Data
- Trabajar en ejercicios que imitan las circunstancias del mundo real
- Utilice diferentes herramientas y técnicas para el análisis de Big Data utilizando PySpark

Audiencia

- Desarrolladores
- Profesionales de TI
- Científicos de datos

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
sparksqlApache Spark SQL7 horasSpark SQL es el módulo de Apache Spark para trabajar con datos estructurados y no estructurados Spark SQL proporciona información sobre la estructura de los datos y el cálculo que se realiza Esta información puede usarse para realizar optimizaciones Dos usos comunes para Spark SQL son: para ejecutar consultas SQL para leer datos de una instalación Hive existente En este entrenamiento en vivo instrumentado (in situ o remoto), los participantes aprenderán cómo analizar varios tipos de conjuntos de datos usando Spark SQL Al final de esta capacitación, los participantes podrán: Instalar y configurar Spark SQL Realice análisis de datos usando Spark SQL Conjuntos de datos de consulta en diferentes formatos Visualice datos y resultados de consultas Audiencia Analistas de datos Científicos de datos Ingenieros de datos Formato del curso Conferencia de parte, parte de discusión, ejercicios y práctica manual Notas Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos .
introtostreamprocessingUna introducción práctica al procesamiento de flujo21 horasEl procesamiento de flujo se refiere al procesamiento en tiempo real de "datos en movimiento", es decir, realizar cálculos sobre datos a medida que se reciben. Dichos datos se leen como flujos continuos de fuentes de datos tales como eventos de sensores, actividad de usuarios de sitios web, transacciones financieras, transferencias de tarjetas de crédito, transmisiones de clics, etc. Los marcos de procesamiento de flujos pueden leer grandes volúmenes de datos entrantes y proporcionar información valiosa casi instantáneamente.

En este entrenamiento en vivo dirigido por un instructor (in situ o remoto), los participantes aprenderán cómo configurar e integrar diferentes marcos de Procesamiento de Stream con los sistemas de almacenamiento de big data existentes y aplicaciones de software y microservicios relacionados.

Al final de esta capacitación, los participantes podrán:

- Instale y configure diferentes marcos de procesamiento de flujo, como Spark Streaming y Kafka Streaming
- Comprender y seleccionar el marco más adecuado para el trabajo
- Proceso de datos de forma continua, concurrente y de forma récord por registro
- Integre soluciones de procesamiento de flujo con bases de datos existentes, almacenes de datos, lagos de datos, etc.
- Integración de la biblioteca de procesamiento de flujo más apropiada con aplicaciones empresariales y microservicios

Audiencia

- Desarrolladores
- Arquitectos de software

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Notas

- Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos.
bigdataanahealthBig Data Analytics in Health21 horasEl análisis de Big Data implica el proceso de examinar grandes cantidades de conjuntos de datos variados para descubrir correlaciones, patrones ocultos y otros conocimientos útiles La industria de la salud tiene cantidades masivas de información médica y clínica compleja y heterogénea La aplicación de análisis de big data en datos de salud presenta un gran potencial para obtener ideas para mejorar la prestación de la atención médica Sin embargo, la enormidad de estos conjuntos de datos plantea grandes desafíos en análisis y aplicaciones prácticas para un entorno clínico En este entrenamiento en vivo con instructor (remoto), los participantes aprenderán cómo realizar análisis de big data en salud a medida que avanzan en una serie de ejercicios livelab manuales Al final de esta capacitación, los participantes podrán: Instalar y configurar herramientas de análisis de big data como Hadoop MapReduce y Spark Comprender las características de los datos médicos Aplicar técnicas de big data para tratar datos médicos Estudiar los sistemas de big data y los algoritmos en el contexto de las aplicaciones de salud Audiencia Desarrolladores Científicos de datos Formato del curso Conferencia de parte, parte de discusión, ejercicios y práctica de handson pesado Nota Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos .
spmllibApache Spark MLlib35 horasMLlib es la biblioteca de aprendizaje automático (ML) de Spark. Su objetivo es hacer que el aprendizaje práctico de la máquina sea escalable y fácil. Consiste en algoritmos comunes de aprendizaje y utilidades, incluyendo clasificación, regresión, agrupación, filtrado colaborativo, reducción de dimensionalidad, así como primitivas de optimización de nivel más bajo y API de oleoducto de nivel superior.

Se divide en dos paquetes:

- spark.mllib contiene la API original construida sobre RDDs.
- spark.ml proporciona una API de nivel superior construida en la parte superior de DataFrames para la construcción de tuberías de ML.

Audiencia

Este curso está dirigido a ingenieros y desarrolladores que buscan utilizar una biblioteca de máquinas construida para Apache Spark
aitechInteligencia Artificial - La Materia más Aplicada - Análisis de Datos + AI Distribuido + PNL21 horasThis course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
graphcomputingIntroducción a Graph Computing28 horasUna gran cantidad de problemas del mundo real se pueden describir en términos de gráficos. Por ejemplo, el gráfico web, el gráfico de red social, el gráfico de red de tren y el gráfico de lenguaje. Estos gráficos tienden a ser extremadamente grandes; su procesamiento requiere un conjunto especializado de herramientas y procesos; estas herramientas y procesos se pueden denominar Computación de Gráficos.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán sobre las diversas ofertas de tecnología e implementaciones para procesar datos de gráficos. El objetivo es identificar los objetos del mundo real, sus características y relaciones, luego modelar estas relaciones y procesarlas como datos utilizando enfoques de computación gráfica. Comenzamos con una amplia visión general y nos limitamos a herramientas específicas a medida que avanzamos en una serie de estudios de casos, ejercicios prácticos e implementaciones en vivo.

Al final de esta capacitación, los participantes podrán:

- Comprender cómo se conservan y atraviesan los datos de gráfico
- Seleccione el mejor marco para una tarea determinada (desde bases de datos de gráficos hasta marcos de procesamiento por lotes)
- Implemente Hadoop, Spark, GraphX ​​y Pregel para llevar a cabo la computación gráfica en muchas máquinas en paralelo
- Ver problemas de Big Data en el mundo real en términos de gráficos, procesos y recorridos

Audiencia

- Desarrolladores

Formato del curso

- Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Próximos Cursos Apache Spark

CursoFechaPrecio del Curso [A distancia / Presencial]
Spark for Developers - Querétaro - Milenio IIILun, 2018-11-05 09:3099,900MXN / 123,500MXN
Alluxio: Unifying Disparate Storage Systems - Ciudad de Mexico - Colonia Del ValleMar, 2018-11-06 09:3029,500MXN / 51,500MXN
Magellan: Geospatial Analytics on Spark - Ciudad de Mexico - Mariano EscobedoMar, 2018-11-06 09:3057,900MXN / 81,900MXN
Big Data Analytics in Health - Guadalajara - Puerta del HierroMar, 2018-11-27 09:3085,000MXN / 112,800MXN
A Practical Introduction to Stream Processing - Guadalajara - Country Club FinancialLun, 2018-12-03 09:3085,000MXN / 108,600MXN
Cursos de Fin de Semana de Apache Spark, Capacitación por la Tarde de Apache Spark, Apache Spark boot camp, Clases de Apache Spark, Capacitación de Fin de Semana de Apache Spark, Cursos por la Tarde de Apache Spark, Apache Spark coaching, Instructor de Apache Spark, Capacitador de Apache Spark, Apache Spark con instructor, Cursos de Formación de Apache Spark, Apache Spark en sitio, Cursos Privados de Apache Spark, Clases Particulares de Apache Spark, Capacitación empresarial de Apache Spark, Talleres para empresas de Apache Spark, Cursos en linea de Apache Spark, Programas de capacitación de Apache Spark, Clases de Apache Spark

Promociones

Curso Ubicación Fecha Precio del Curso [A distancia / Presencial]
Business Rule Management (BRMS) with Drools Puebla - Triangulo Las Animas Mié, 2018-10-31 09:30 34,110MXN / 54,260MXN
MoDAF/NAF Introduction Puebla - Triangulo Las Animas Jue, 2018-12-13 09:30 26,550MXN / 46,700MXN
Introduction to Recommendation Systems Ciudad de Mexico - Colonia Del Valle Jue, 2018-12-27 09:30 34,110MXN / 56,110MXN
Matlab for Prescriptive Analytics Guadalajara - Country Club Financial Lun, 2019-01-21 09:30 52,110MXN / 74,510MXN
Introduction to Data Visualization with Tidyverse and R Ciudad de Mexico - Colonia Del Valle Jue, 2019-03-14 09:30 26,550MXN / 48,550MXN

Descuentos en los Cursos

Respetamos la privacidad de su dirección de correo electrónico. No transmitiremos ni venderemos su dirección a otras personas.
En cualquier momento puede cambiar sus preferencias o cancelar su suscripción por completo.

Algunos de nuestros clientes

is growing fast!

We are looking to expand our presence in your region!

As a Business Development Manager you will:

  • expand business in the region
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

contact us right away!