Acerca de este curso
Este curso muestra la arquitectura, implementación, configuración y ejecución de los Data Services de CDP en Embedded Containerized Services (ECS). Los Data Services de CDP son una tecnología avanzada con poco código que fusiona todo el ciclo de vida de los datos en un conjunto único de herramientas, lo que permite reducir los costes de desarrollo de casos de uso, acelerando el desarrollo y la implementación.
El curso comienza mostrando recomendaciones para gestionar imágenes y contenedores Docker, lo que resulta en la creación de un registro privado de Docker que se utiliza para implementar el clúster de Data Services en ECS. Los estudiantes también aprenderán a instalar, configurar y validar Cloudera Data Engineering, Cloudera Data Warehouse y Cloudera Machine Learning.
Los ejercicios se centran en aprender Kubernetes, instalar Private Cloud Embedded Container Service (ECS) e implementar los Data Services de Cloudera. El curso incluye requisitos de redes y hardware, así como explicaciones sobre cómo las cápsulas de Kubernetes se escalan dinámicamente para admitir los Data Services de CDP.
A quién va dirigido
Este curso de inmersión está dirigido a Administradores de CDP que están avanzando hacia los Data Services de CDP que se ejecutan en un entorno de nube privada. Recomendamos un mínimo de 3 a 5 años de experiencia en administración de sistemas en su sector.
Prerrequisitos
- Conocimientos avanzados en la interfaz de línea de comando de Linux, conocimiento en gestión de identidades, gestión de seguridad de la capa de transporte y plataforma Kerberos.
- Recomendable experiencia con sentencias SELECT de SQL.
- Experiencia previa con productos de Cloudera.
- Experiencia con productos de Cloudera CDP, CDH o HDP es idóneo.
- Los estudiantes deben tener acceso a Internet para acceder a Amazon Web Services.
Objetivos del curso
Los estudiantes que completen con éxito este curso serán capaces de instalar, configurar y validar Cloudera Data Engineering, Cloudera Data Warehouse y Cloudera Machine Learning.
Contenidos
Módulo 1: De Big Data a Big Compute
- La importancia de los microservicios.
- Resumen de las aplicaciones en contenedores.
- Principios de diseño para los Data Services de CDP.
Módulo 2: Imágenes y Contenedores de Docker
- Docker CLI para imágenes y contenedores.
- Creación de una aplicación en contenedor.
Módulo 3: Arquitectura para Cloudera Data Platform
- Arquitectura para Data Platform, Data Lake y Data Services.
- Arquitectura para Embedded Containerized Services (ECS).
Módulo 4: Registro Privado de Docker
- Generar un registro privado de Docker.
- Cargar paquetes de imágenes de Cloudera.
Módulo 5: Clústeres para Servicios Contenerizados Integrados
- Requisitos de red.
- Requisitos de hardware.
- Recomendaciones para Clúster.
Módulo 6: Experiencia Compartida de Datos
- La importancia de Ranger, Atlas y Hive Metastore.
- Crear políticas de Ranger en bases de datos de Hive en apoyo a Cloudera Data Warehouse.
Módulo 7: Configuración de Servicios Contenerizados Integrados
- Gestión de un repositorio aislado (Air-Gapped).
- Seguridad de una base de datos de Metastore.
- Creación de DNS y certificados.
Módulo 8: Instalación de Embedded Containerized Services
- Instalación de Embedded Containerized Services (ECS).
- Gestión del registro Docker de ECS.
Módulo 9: Configuración de la consola de Administración
- Configuración de LDAP seguro.
- Configuración de un administrador.
Módulo 10: Configuración de entornos
- Agregar usuarios y grupos.
- Crear entornos.
- Asignar usuarios a entornos.
Módulo 11: Operación de la consola de Administración
- Gestionar alertas.
- Crear paquetes de soporte.
Módulo 12: Teoría de Kubernetes
- Teoría de clústeres de Kubernetes.
- Teoría de espacios de nombres en Kubernetes.
- Teoría de despliegues de Kubernetes.
- Teoría de Embedded Containerized Services (ECS).
Módulo 13: Gestión de Kubernetes
- Usar la interfaz web de Kubernetes.
- Usar la interfaz de línea de comandos (CLI) kubectl.
- Usar la interfaz terminal K9.
Módulo 14: Gestión de Almacenamiento para ECS
- Arquitectura de almacenamiento.
- Arquitectura de Longhorn.
Módulo 15: Ejecución de Cloudera Data Warehouse
- Crear almacenes virtuales para Hive e Impala.
- Administrador de almacenes virtuales.
Módulo 16: Ejecución de Cloudera Data Engineering
- Configuración de principios y certificados comodín.
- Crear clústeres virtuales para Spark.
- Administrador de clústeres virtuales.
Módulo 17: Ejecución de Cloudera Data Engineering
- Crear clústeres virtuales para Spark.
- Administrador de clústeres virtuales.
- Administrador de espacios de trabajo.
Módulo 18: Administración de Embedded Containerized Services
- Detener y reiniciar clústeres CDP.
- Desinstalar Embedded Containerized Services ECS.