Confluent

Confluent Stream Processing Using KSQL & Apache Kafka Streams

21 horas
1995,00 €
Presencial o Live Virtual Class
Presencial o Live Virtual Class

Acerca de este curso

La Plataforma Confluent Kafka es un entorno de transmisión de datos que permite organizar y administrar grandes cantidades de datos que llegan cada segundo a los entry points de organizaciones modernas en diversas industrias desde minoristas, logística, fabricación y servicios financieros hasta redes sociales en línea. Con Confluent, este creciente flujo de datos organizado en un modelo Publish/Subscribe, a menudo no estructurado e increíblemente valioso. Kafka Confluent se convierte en una plataforma de datos de flujo unificado y de fácil acceso que siempre está disponible para muchos usos en toda la organización. Estos usos pueden abarcar fácilmente desde el análisis de Big Data por lotes con Hadoop y la alimentación de sistemas de monitorización en tiempo real hasta las tareas de integración de datos de gran volumen más tradicionales que requieren un backbone de alto rendimiento, extracción, transformación y carga (ETL). Confluent Kafka ofrece a los clientes distintas clases de formación, tanto para los administradores (implementación) como para desarrolladores (creación de clientes pub/sub) y el método más moderno de consulta de datos con KSQL.

Durante este curso práctico aprenderás a utilizar Confluent KSQL para transformar, enriquecer, filtrar y agregar flujos de datos en tiempo real utilizando un lenguaje similar al de SQL. También aprenderás a usar la librería de Apache Kafka Streams para crear aplicaciones de transmisión. Además, aprenderás a probar, monitorizar, proteger y escalar esas aplicaciones. En el curso se te enseñará como estas aplicaciones se integran con la plataforma Confluent con tecnología de Apache Kafka, Kafka Connect, Confluent Schema Registry, Confluent REST Proxy y Confluent Control Center. Se analizarán los conceptos de arquitectura y los componentes de KSQL y Kafka Streams.

PUE es Training Partner oficial de Confluent, autorizado por dicha multinacional para impartir formación oficial en tecnologías Confluent.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Confluent en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

Esta formación está diseñada para desarrolladores de aplicaciones, desarrolladores ETL (extracción, transformación y carga), ingenieros de DevOps y Científicos de Datos que necesitan interactuar con los clústeres de Kafka como fuente de flujos de datos en tiempo real y transformar, enriquecer y unirse a esos flujos para descubrir anomalías, analizar el comportamiento o monitorizar sistemas complejos.

Los estudiantes deben estar familiarizados con el desarrollo en Java (preferido), .NET o Python. Los asistentes también deben estar familiarizados con la arquitectura de Apache Kafka y el desarrollo de aplicaciones cliente Kafka, ya sea a través de experiencia previa o mediante  los cursos Confluent Fundamentals of Apache Kafka y Confluent Developer Skills for Building Apache Kafka.

Objetivos del curso

Al finalizar esta formación, obtendrás habilidades relacionadas con:

  • Identificar patrones comunes y casos de uso para el procesamiento de flujos de datos en tiempo real
  • Comprender la arquitectura de alto nivel de Kafka Streams
  • Creación de aplicaciones en tiempo real con la API Kafka Streams para filtrar, transformar, enriquecer, agregar y unir flujos de datos
  • Describir cómo KSQL combina eslasticidad, tolerancia a fallas y alto rendimiento  de Kafka Streams para el procesamiento de flujos de datos con la simplicidad de una sintaxis similar a SQL
  • Crear consultas KSQL que muestren su equilibrio entre potencia y simplicidad
  • Testear, securizar, implementar y monitorizar aplicaciones de Kafka Streams y consultas KSQL

Contenidos

Steams, motivación y conceptos

  • Motivación y casos de uso para la transmisión de datos en tiempo real
  • Comparación de alto nivel de Kafka Streams y KSQL
  • Conceptos de procesamiento de flujos de datos

Arquitectura de Kafka Streams

  • Kafka Streams en el ecosistema de Kafka
  • Diseño de arquitectura de alto nivel
  • Tipos de datos de Kafka Streams

Creación de aplicaciones Kafka Streams

  • Anatomía de una aplicación Kafka Streams
  • Kafka Streams DSL - Operaciones sin estado
  • Kafka Streams DSL - Agregaciones
  • Kafka Streams DSL - Agregaciones de ventana
  • Kafka Streams DSL - Joins
  • Kafka Streams DSL - Resumen
  • API del procesador
  • Optimizaciones

Testing de aplicaciones Kafka Streams

  • Tests unitarios
  • Tests de integración
  • Tests de estrés
  • Tests End-to-end

Introducción a KSQL

  • Ejemplos de casos de uso
  • Ejemplos End-to-end
  • Interactuando con KSQL

Uso de KSQL

  • Manipulación de datos
  • Agregaciones
  • Testing

Despliegue

  • Paralelismo
  • Elasticidad
  • Tolerancia a fallos
  • Planificación de capacidad
  • Solución de problemas
  • Consideraciones específicas de KSQL

Seguridad

  • Visión general
  • Control de acceso
  • Ejemplos
  • Consideraciones específicas de KSQL

Monitorización

  • JMX
  • Confluent Control Center
  • Consideraciones específicas de KSQL

Convocatorias abiertas