Cloudera

Cloudera Streaming Analytics: Using Apache Flink and SQL Stream Builder on CDP

Presencial / Live Virtual Class     14 horas       920.00 €   644.00€

Acerca de este curso

Durante este curso de capacitación de dos días dirigido por un instructor, los participantes aprenderán el desarrollo y las operaciones de Cloudera Streaming Analytics, un marco para el procesamiento y el análisis de baja latencia impulsado por Apache Flink y el innovador SQL Stream Builder de Cloudera.

A través de extensos ejercicios prácticos, los estudiantes obtendrán experiencia en la implementación y administración de un clúster de Flink, el desarrollo y la ejecución de aplicaciones de Flink y el uso de SQL continuo de SQL Stream Builder para realizar análisis de datos de transmisión.

PUE, Strategic Partner de Cloudera, está autorizado oficialmente por esta multinacional para impartir formación oficial en tecnologías Cloudera.

PUE también está acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

Este curso está diseñado para perfiles laborales con experiencia en administración y desarrollo de aplicaciones en la plataforma Cloudera.

Prerrequisitos

Los estudiantes deben tener al menos un conocimiento básico de Java y Linux.

El curso Cloudera Training for Apache Kafka, o una experiencia equivalente con Apache Kafka, es un requisito previo recomendado para realizar la presente formación.

Objetivos del curso

Los estudiantes que completen con éxito este curso podrán:

  • Implementar un clúster de Flink con Cloudera Manager
  • Desarrollar aplicaciones Flink por lotes y de transmisión
  • Ejecutar y ver trabajos de Flink
  • Transformar flujos de datos
  • Utilice marcas de agua y ventanas para analizar la transmisión de datos.
  • Analice datos con Cloudera SQL Stream Builder
  • Supervisar las métricas de la aplicación Flink

Contenidos

Módulo 1: Descripción general

  • Introducción a Apache Flink y Stream Processing
  • Casos de uso típicos
  • Productos relacionados

Módulo 2: Arquitectura básica

  • Lógico
  • Físico
  • Paralelismo
  • Tolerancia a fallos
  • Almacenamiento de datos

Módulo 3: Implementación de servicios

  • Requisitos de planificación
  • Instalación
  • Tablero de Flink
  • Ejercicio: Ejecución de un programa Flink

Módulo 4: Conceptos básicos de Flink

  • Entorno de ejecución
  • Estructura de la aplicación Flink
  • Crea un proyecto Flink
  • Cree un programa Flink
  • Ejercicio: Creación de un programa sencillo de Flink

Módulo 5: API DataStream

  •  Tipos de datos y serialización
  • Fuentes y sumideros
  • Canalizaciones de datos y ETL
  • Transformaciones
  • Ejercicio: Procesamiento por lotes con Flink
  • Ejercicio: Creación de una aplicación Flink Streaming
  • Usando Kafka como fuente y sumidero
  • Ejercicio: Creación de una aplicación de transmisión mediante una fuente Kafka

Módulo 6: Flink SQL y Table API

  • Conceptos de transmisión
  • Opciones de programación
  • Integraciones
  • Ejercicio: Uso de Flink SQL y Kafka

Módulo 7: Procesamiento de flujo con estado

  • Secuencias conectadas
  • Análisis de transmisión
  • Procesamiento de tiempo de evento
  • Marcas de agua
  • Ventanas
  • Ejercicio: Ventanas giratorias con la hora del evento

Módulo 8: Generador de secuencias SQL de Cloudera

  • Visión general
  • Consola de SQL Stream Builder
  • Procesamiento de flujo y análisis
  • Ejercicio: Creación de trabajos de secuencia SQL

Módulo 9: Monitoreo

  • Métricas de Flink
  • Checkpointing
  • Contrapresión
  • Archivos de registro
  • Ejercicio: Seguimiento y puntos de control

Próximas convocatorias