Acerca de este curso
La Plataforma Confluent Kafka es un entorno de transmisión de datos que permite organizar y administrar grandes cantidades de datos que llegan cada segundo a los entry points de organizaciones modernas en diversas industrias, desde minoristas, logística, fabricación y servicios financieros, hasta redes sociales en línea. Con Confluent, este creciente flujo de datos organizado en Publish/Subscribe, a menudo no estructurado, pero increíblemente valiosos, Kafka Confluent se convierte en una plataforma de datos de flujo unificado y de fácil acceso que siempre está disponible para muchos usos en toda la organización. Estos usos pueden abarcar fácilmente desde el análisis de Big Data por lotes con Hadoop y la alimentación de sistemas de monitorización en tiempo real, hasta las tareas de integración de datos de gran volumen más tradicionales que requieren un backbone de alto rendimiento, extracción, transformación y carga (ETL). Confluent Kafka ofrece a los clientes distintas clases de formación, en particular, para los administradores (implementación), para desarrolladores (creación de clientes pub/sub) y el método más moderno de consulta de datos con KSQL.
En este curso práctico para la creación de operaciones en Apache Kafka de tres días de duración, aprenderá a construir y administrar clústeres de Kafka utilizando las mejores prácticas de la industria desarrolladas por los expertos mundiales más destacados de Apache Kafka. Aprenderá cómo funcionan Kafka y la plataforma Confluent, sus subsistemas principales, sus funciones, cómo interactúan y cómo configurar, administrar y personalizar su clúster.
PUE es Training Partner oficial de Confluent, autorizado por dicha multinacional para impartir formación oficial en tecnologías Confluent.
PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Confluent en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.
A quién va dirigido
Esta formación está diseñada para ingenieros, administradores de sistemas y personal de operaciones responsable de crear, administrar, monitorear y modificar los clústeres de Kafka.
Los estudiantes deben estar familiarizados con Linux / Unix y comprender los conceptos básicos de las redes TCP / IP. Conocer la máquina virtual de Java (JVM) es útil.
Se recomienda disponer de conocimiento previo de Kafka o realizar el curso Confluent Fundamentals of Apache Kafka, pero no es obligatorio. Para evaluar tus conocimientos de Kafka, puedes realizar el siguiente test anónimo de auto-evaluación:
https://confluent.io/training.
Objetivos del curso
Al finalizar la formación, el estudiante obtendrá habilidades relacionadas con:
- Uso de las herramientas de linea de comandos de Kafka.
- Automatizar la configuración.
- Uso de las herramientas administrativas de Kafka.
- Ajustar el rendimiento de Consumer y Producer.
- Securizar el Clúster.
- Construir data pipelines con Kafka Connect.
Contenidos
Fundamentos de Apache Kafka
- Kafka como Plataforma de Streaming Distribuido.
- Log Distribuido.
- Fundamentos de Producer y Consumer.
Arquitectura de Kafka
- Commit Log de Kafka.
- Replicación para Alta Disponibilidad.
- Particiones y Consumer Groups para la escalabilidad.
- Visión general sobre seguridad en Kafka.
Proporcionar durabilidad
- Replicación de datos.
- Recuperación de fallas.
- Archivos de Log y gestión de Offsets
- Exactly-Once Semantics (EOS).
Administración de un Clúster
- Instalación de la plataforma Confluent.
- Administración de la configuración.
- Monitorización.
- Retención y compactación de Logs.
- Arranque y parada de Brokers.
Seguridad en Kafka
- Transporte cifrado.
- Autenticación.
- Securizar Apache Kafka y la plataforma completa de Confluent.
- Migración a un Clúster seguro.
Data Pipelines con Kafka Connect
- Motivos para utilizar Kafka Connect .
- Tipos de Connectors.
- Implementación de Kafka Connect.
- Modo independiente y modo distribuido.
- Configuración de Connectors.
Kafka en producción
- Arquitectura de referencia para Apache Kafka y la plataforma Confluent completa.
- Planificación de la capacidad.
- Despligues Multi Data Center.