Curso de Apache Spark

Curso de Apache Spark

Los cursos de capacitación locales en línea de Apache Spark demuestran a través de la práctica cómo Spark encaja en el ecosistema Big Data y cómo utilizar Spark para el análisis de datos El entrenamiento de Apache Spark está disponible como "entrenamiento en vivo en el sitio" o "entrenamiento en vivo a distancia" El entrenamiento en vivo in situ se puede llevar a cabo localmente en las instalaciones del cliente en México o en los centros de capacitación corporativa de NobleProg en México La capacitación remota en vivo se lleva a cabo a través de un escritorio remoto interactivo NobleProg Su proveedor local de capacitación.

Testimonios

★★★★★
★★★★★

Apache Spark Subcategorías

Programa del curso Apache Spark

CódigoNombreDuraciónInformación General
sparkdevSpark for Developers21 horasOBJETIVO: Este curso presentará Apache Spark Los estudiantes aprenderán cómo encaja Spark en el ecosistema Big Data y cómo usar Spark para el análisis de datos El curso cubre Spark shell para análisis interactivo de datos, Spark internals, Spark APIs, Spark SQL, Spark Streaming, machine learning y graphX AUDIENCIA: Desarrolladores / Analistas de datos .
hdpHortonworks Data Platform (HDP) for administrators21 horasHortonworks Data Platform es una plataforma de apoyo Apache Hadoop de código abierto que proporciona una base estable para el desarrollo de soluciones de big data en el ecosistema Apache Hadoop Este entrenamiento en vivo instruido introduce a Hortonworks y guía a los participantes a través del despliegue de la solución Spark + Hadoop Al final de esta capacitación, los participantes podrán: Use Hortonworks para ejecutar confiablemente Hadoop a gran escala Unifique las capacidades de seguridad, gobierno y operaciones de Hadoop con los flujos de trabajo analíticos ágiles de Spark Use Hortonworks para investigar, validar, certificar y dar soporte a cada uno de los componentes en un proyecto Spark Procese diferentes tipos de datos, incluidos estructurados, no estructurados, inmotion y atrest Audiencia Administradores de Hadoop Formato del curso Conferencia de parte, parte de discusión, ejercicios y práctica manual .
magellanMagellan: Geospatial Analytics on Spark14 horasMagellan es un motor de ejecución distribuida de código abierto para el análisis geoespacial en big data Implementado sobre Apache Spark, amplía Spark SQL y proporciona una abstracción relacional para el análisis geoespacial Esta capacitación presencial, instrumentada, presenta los conceptos y enfoques para implementar el análisis geospacial y guía a los participantes a través de la creación de una aplicación de análisis predictivo utilizando Magellan en Spark Al final de esta capacitación, los participantes podrán: Consultar, analizar y unir datos geoespaciales de manera eficiente a escala Implementar datos geoespaciales en inteligencia empresarial y aplicaciones de análisis predictivo Utilice el contexto espacial para ampliar las capacidades de dispositivos móviles, sensores, registros y dispositivos portátiles Audiencia Desarrolladores de aplicaciones Formato del curso Conferencia de parte, parte de discusión, ejercicios y práctica manual .
alluxioAlluxio: Unifying Disparate Storage Systems7 horasAlexio es un sistema de almacenamiento distribuido virtual de código abierto que unifica sistemas de almacenamiento dispares y permite que las aplicaciones interactúen con datos a la velocidad de la memoria Es utilizado por compañías como Intel, Baidu y Alibaba En esta capacitación en vivo con instructor, los participantes aprenderán a usar Alexio para unir diferentes marcos de cálculo con sistemas de almacenamiento y administrar de manera eficiente los datos de escala multipetabyte a medida que avanzan en la creación de una aplicación con Alluxio Al final de esta capacitación, los participantes podrán: Desarrolle una aplicación con Alluxio Conecte aplicaciones y sistemas de big data mientras conserva un espacio de nombres Extrae de manera eficiente el valor de los grandes datos en cualquier formato de almacenamiento Mejorar el rendimiento de la carga de trabajo Implemente y administre Alluxio de forma independiente o en clúster Audiencia Científico de datos Desarrollador Administrador de sistema Formato del curso Conferencia de parte, parte de discusión, ejercicios y práctica manual .
graphcomputingIntroduction to Graph Computing28 horasUna gran cantidad de problemas del mundo real se pueden describir en términos de gráficos Por ejemplo, el gráfico web, el gráfico de red social, el gráfico de red de tren y el gráfico de lenguaje Estos gráficos tienden a ser extremadamente grandes; su procesamiento requiere un conjunto especializado de herramientas y procesos Estas herramientas y procesos pueden denominarse Graph Computing (también conocido como Graph Analytics) En esta capacitación en vivo con instructor, los participantes aprenderán acerca de las ofertas de tecnología y los enfoques de implementación para procesar datos de gráficos El objetivo es identificar los objetos del mundo real, sus características y relaciones, luego modelar estas relaciones y procesarlas como datos utilizando un enfoque de computación gráfica Comenzamos con una amplia visión general y nos acercamos a herramientas específicas mientras avanzamos a través de una serie de estudios de casos, ejercicios manuales e implementaciones en vivo Al final de esta capacitación, los participantes podrán: Comprender cómo se conservan y atraviesan los datos de gráfico Seleccione el mejor marco para una tarea determinada (desde bases de datos de gráficos hasta marcos de procesamiento por lotes) Implemente Hadoop, Spark, GraphX ​​y Pregel para llevar a cabo la computación gráfica en muchas máquinas en paralelo Ver problemas de Big Data en el mundo real en términos de gráficos, procesos y recorridos Audiencia Desarrolladores Formato del curso Conferencia de parte, parte de discusión, ejercicios y práctica manual .
sparkpythonPython and Spark for Big Data (PySpark)21 horasPython es un lenguaje de programación de alto nivel famoso por su claridad de sintaxis y código Spark es un motor de procesamiento de datos utilizado para consultar, analizar y transformar big data PySpark permite a los usuarios interactuar con Spark con Python En este entrenamiento en vivo instruido, los participantes aprenderán a usar Python y Spark juntos para analizar los datos grandes mientras trabajan en ejercicios manuales Al final de esta capacitación, los participantes podrán: Aprenda a usar Spark con Python para analizar Big Data Trabajar en ejercicios que imitan las circunstancias del mundo real Utilice diferentes herramientas y técnicas para el análisis de Big Data utilizando PySpark Audiencia Desarrolladores Profesionales de TI Científicos de datos Formato del curso Conferencia de parte, parte de discusión, ejercicios y práctica manual .
sparksqlApache Spark SQL7 horasSpark SQL es el módulo de Apache Spark para trabajar con datos estructurados y no estructurados Spark SQL proporciona información sobre la estructura de los datos y el cálculo que se realiza Esta información puede usarse para realizar optimizaciones Dos usos comunes para Spark SQL son: para ejecutar consultas SQL para leer datos de una instalación Hive existente En este entrenamiento en vivo instrumentado (in situ o remoto), los participantes aprenderán cómo analizar varios tipos de conjuntos de datos usando Spark SQL Al final de esta capacitación, los participantes podrán: Instalar y configurar Spark SQL Realice análisis de datos usando Spark SQL Conjuntos de datos de consulta en diferentes formatos Visualice datos y resultados de consultas Audiencia Analistas de datos Científicos de datos Ingenieros de datos Formato del curso Conferencia de parte, parte de discusión, ejercicios y práctica manual Notas Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos .
introtostreamprocessingA Practical Introduction to Stream Processing21 horasEl procesamiento de flujo se refiere al procesamiento en tiempo real de "datos en movimiento", es decir, realizar cálculos sobre datos a medida que se reciben Dichos datos se leen como flujos continuos de fuentes de datos tales como eventos de sensores, actividad de usuarios de sitios web, transacciones financieras, transferencias de tarjetas de crédito, transmisiones de clics, etc Los marcos de procesamiento de flujos pueden leer grandes volúmenes de datos entrantes y proporcionar información valiosa casi instantáneamente En este entrenamiento en vivo instrumentado (in situ o remoto), los participantes aprenderán a configurar e integrar diferentes marcos de procesamiento de flujo con los sistemas de almacenamiento de big data existentes y las aplicaciones de software y microservicios relacionados Al final de esta capacitación, los participantes podrán: Instale y configure diferentes marcos de procesamiento de flujo, como Spark Streaming y Kafka Streaming Comprender y seleccionar el marco más adecuado para el trabajo Proceso de datos de forma continua, concurrente y de forma recordbyrecord Integre soluciones de procesamiento de flujo con bases de datos existentes, almacenes de datos, lagos de datos, etc Integración de la biblioteca de procesamiento de flujo más apropiada con aplicaciones empresariales y microservicios Audiencia Desarrolladores Arquitectos de software Formato del curso Conferencia de parte, parte de discusión, ejercicios y práctica manual Notas Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos .
bigdataanahealthBig Data Analytics in Health21 horasEl análisis de Big Data implica el proceso de examinar grandes cantidades de conjuntos de datos variados para descubrir correlaciones, patrones ocultos y otros conocimientos útiles La industria de la salud tiene cantidades masivas de información médica y clínica compleja y heterogénea La aplicación de análisis de big data en datos de salud presenta un gran potencial para obtener ideas para mejorar la prestación de la atención médica Sin embargo, la enormidad de estos conjuntos de datos plantea grandes desafíos en análisis y aplicaciones prácticas para un entorno clínico En este entrenamiento en vivo con instructor (remoto), los participantes aprenderán cómo realizar análisis de big data en salud a medida que avanzan en una serie de ejercicios livelab manuales Al final de esta capacitación, los participantes podrán: Instalar y configurar herramientas de análisis de big data como Hadoop MapReduce y Spark Comprender las características de los datos médicos Aplicar técnicas de big data para tratar datos médicos Estudiar los sistemas de big data y los algoritmos en el contexto de las aplicaciones de salud Audiencia Desarrolladores Científicos de datos Formato del curso Conferencia de parte, parte de discusión, ejercicios y práctica de handson pesado Nota Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos .

Próximos Cursos Apache Spark

CursoFechaPrecio del Curso [A distancia / Presencial]
Big Data Analytics in Health - Querétaro - Milenio IIILun, 2018-09-03 09:3085000MXN / 108600MXN
Python y Spark para Big Data (PySpark) - Guadalajara - Puerta del HierroMar, 2018-09-04 09:3085000MXN / 112800MXN
Apache Spark - Puebla - Triangulo Las AnimasMar, 2018-09-11 09:3069500MXN / 89800MXN
Hortonworks Data Platform (HDP) para Administradores - Guadalajara - Country Club FinancialMar, 2018-09-11 09:3085000MXN / 108600MXN
Alluxio: Unificando Sistemas de Almacenamiento Dispares - Ciudad de Mexico - Colonia Del ValleVie, 2018-09-14 09:3029500MXN / 51500MXN
Cursos de Fin de Semana de Apache Spark, Capacitación por la Tarde de Apache Spark, Apache Spark boot camp, Clases de Apache Spark, Capacitación de Fin de Semana de Apache Spark, Cursos por la Tarde de Apache Spark, Apache Spark coaching, Instructor de Apache Spark, Capacitador de Apache Spark, Apache Spark con instructor, Cursos de Formación de Apache Spark, Apache Spark en sitio, Cursos Privados de Apache Spark, Clases Particulares de Apache Spark, Capacitación empresarial de Apache Spark, Talleres para empresas de Apache Spark, Cursos en linea de Apache Spark, Programas de capacitación de Apache Spark, Clases de Apache Spark

Promociones

Curso Ubicación Fecha Precio del Curso [A distancia / Presencial]
Haskell Avanzado Ciudad de Mexico - Colonia Del Valle Jue, 2018-08-23 09:30 52110MXN / 76110MXN
Haskell Avanzado Puebla - Triangulo Las Animas Mar, 2018-09-11 09:30 52110MXN / 72410MXN
Fundamentos de Haskell Monterrey - Dataflux Mié, 2018-09-19 09:30 52110MXN / 74510MXN
Gestión de Reglas de Negocios (BRMS) con Drools Puebla - Triangulo Las Animas Mié, 2018-10-31 09:30 34110MXN / 54260MXN
Introducción MoDAF/NAF Puebla - Triangulo Las Animas Jue, 2018-12-13 09:30 26550MXN / 46700MXN

Descuentos en los Cursos

Respetamos la privacidad de su dirección de correo electrónico. No transmitiremos ni venderemos su dirección a otras personas.
En cualquier momento puede cambiar sus preferencias o cancelar su suscripción por completo.

Algunos de nuestros clientes