Acerca de este curso
Este curso ayuda al candidato a utilizar Cloudera Data Platform para abordar las tareas de gobernanza de datos, motivados por la necesidad de cumplir con regulaciones como el Reglamento General de Protección de Datos (GDPR) de la Unión Europea y la Ley de Responsabilidad y Portabilidad de Seguros de Salud de los Estados Unidos (HIPAA).
PUE, Strategic Partner de Cloudera, está autorizado oficialmente por esta multinacional para impartir formación oficial en tecnologías Cloudera.
PUE también está acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.
A quién va dirigido
Este curso está enfocado a administradores de datos y personal responsables de (o con interés en) implementar el cumplimiento normativo o realizar actividades típicas de gobernanza de datos utilizando Cloudera Data Platform.
Prerrequisitos
La familiaridad con los conceptos básicos de gobernanza de datos es útil, pero no obligatoria.
Objetivos del curso
Los estudiantes que completen con éxito la presente formación podrán:
- Identificar qué herramientas utilizar en Cloudera Data Platform (CDP) para las actividades clave de gobernanza de datos
- Organizar objetos de datos utilizando clasificaciones y términos de glosario empresarial
- Encontrar el historial de acceso para los objetos y políticas de datos
- Utilizar Data Catalog Profilers en CDP para ayudar a organizar los objetos de datos
- Utilizar Data Catalog para fomentar la colaboración con compañeros
- Ver e interpretar el linaje de un objeto de datos
- Crear y aplicar políticas de control de acceso basadas en recursos y etiquetas
- Crear políticas para el enmascaramiento de datos y el filtrado row-level
Contenidos
Módulo 1: Descripción general de la gobernanza de datos
- ¿Qué es la gobernanza de datos?
- Conceptos básicos
- SDX: gobernanza de datos en CDP
Módulo 2: Organización de objetos de datos
- Búsqueda de objetos por tipo
- Clasificaciones
- Términos del glosario
Módulo 3: Auditoría
- Resumen de auditoría
- Visualización información de auditorías
Módulo 4: Trabajar con Data Catalog
- Descripción general del catálogo de datos
- Generador de perfiles de datos confidenciales
- Definición y seguimiento de la calidad de los datos
- Preparación para auditorías utilizando Data Catalog
- Colaborando
Módulo 5: Linaje
- Inspeccionando el linaje
- Propagación y linaje en Atlas
- Inspeccionando el linaje en Atlas
Módulo 6: Controles de acceso
- Conceptos básicos de Apache Ranger
- Creación de usuarios y roles
- Políticas basadas en recursos
- Políticas basadas en etiquetas
- Protección de objetos de metadatos
- Proporcionar acceso parcial
Módulo 7: Gestión del ciclo de vida de los datos
- Gobernando el ciclo de vida de los datos