Acerca de este curso
Durante este curso de capacitación de dos días dirigido por un instructor, los participantes aprenderán el desarrollo y las operaciones de Cloudera Streaming Analytics, un marco para el procesamiento y el análisis de baja latencia impulsado por Apache Flink y el innovador SQL Stream Builder de Cloudera.
A través de extensos ejercicios prácticos, los estudiantes obtendrán experiencia en la implementación y administración de un clúster de Flink, el desarrollo y la ejecución de aplicaciones de Flink y el uso de SQL continuo de SQL Stream Builder para realizar análisis de datos de transmisión.
PUE, Strategic Partner de Cloudera, está autorizado oficialmente por esta multinacional para impartir formación oficial en tecnologías Cloudera.
PUE también está acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.
A quién va dirigido
Este curso está diseñado para perfiles laborales con experiencia en administración y desarrollo de aplicaciones en la plataforma Cloudera.
Prerrequisitos
Los estudiantes deben tener al menos un conocimiento básico de Java y Linux.
El curso Cloudera Training for Apache Kafka, o una experiencia equivalente con Apache Kafka, es un requisito previo recomendado para realizar la presente formación.
Objetivos del curso
Los estudiantes que completen con éxito este curso podrán:
- Implementar un clúster de Flink con Cloudera Manager
- Desarrollar aplicaciones Flink por lotes y de transmisión
- Ejecutar y ver trabajos de Flink
- Transformar flujos de datos
- Utilice marcas de agua y ventanas para analizar la transmisión de datos.
- Analice datos con Cloudera SQL Stream Builder
- Supervisar las métricas de la aplicación Flink
Contenidos
Módulo 1: Descripción general
- Introducción a Apache Flink y Stream Processing
- Casos de uso típicos
- Productos relacionados
Módulo 2: Arquitectura básica
- Lógico
- Físico
- Paralelismo
- Tolerancia a fallos
- Almacenamiento de datos
Módulo 3: Implementación de servicios
- Requisitos de planificación
- Instalación
- Tablero de Flink
- Ejercicio: Ejecución de un programa Flink
Módulo 4: Conceptos básicos de Flink
- Entorno de ejecución
- Estructura de la aplicación Flink
- Crea un proyecto Flink
- Cree un programa Flink
- Ejercicio: Creación de un programa sencillo de Flink
Módulo 5: API DataStream
- Tipos de datos y serialización
- Fuentes y sumideros
- Canalizaciones de datos y ETL
- Transformaciones
- Ejercicio: Procesamiento por lotes con Flink
- Ejercicio: Creación de una aplicación Flink Streaming
- Usando Kafka como fuente y sumidero
- Ejercicio: Creación de una aplicación de transmisión mediante una fuente Kafka
Módulo 6: Flink SQL y Table API
- Conceptos de transmisión
- Opciones de programación
- Integraciones
- Ejercicio: Uso de Flink SQL y Kafka
Módulo 7: Procesamiento de flujo con estado
- Secuencias conectadas
- Análisis de transmisión
- Procesamiento de tiempo de evento
- Marcas de agua
- Ventanas
- Ejercicio: Ventanas giratorias con la hora del evento
Módulo 8: Generador de secuencias SQL de Cloudera
- Visión general
- Consola de SQL Stream Builder
- Procesamiento de flujo y análisis
- Ejercicio: Creación de trabajos de secuencia SQL
Módulo 9: Monitoreo
- Métricas de Flink
- Checkpointing
- Contrapresión
- Archivos de registro
- Ejercicio: Seguimiento y puntos de control