Description
Este curso está diseñado para desarrollar las habilidades fundamentales en ingeniería de datos en Microsoft Fabric, centrándose principalmente en el concepto de Lakehouse. Explorará las capacidades de Apache Spark para el procesamiento distribuido de datos y las técnicas esenciales para una gestión eficiente de datos, versionado y fiabilidad trabajando con tablas Delta Lake. También se explorará la ingesta y orquestación de datos mediante Dataflows Gen2 y pipelines de Data Factory.
Audience and prerequisites
Este curso está diseñado para profesionales de datos que están familiarizados con el modelado de datos, la extracción y el análisis de datos que estén interesados en adquirir conocimientos sobre la arquitectura Lakehouse, la plataforma Microsoft Fabric y cómo habilitar análisis end-to-end utilizando estas tecnologías.
Prerrequisitos:
- Debe estar familiarizado con los conceptos básicos de datos y la terminología.
Objectives
El curso tiene como objetivos proporcionar una introducción al análisis end-to-end utilizando Microsoft Fabric, familiarizar a los participantes con los lakehouses en Microsoft Fabric, enseñarles a utilizar Apache Spark y trabajar con tablas Delta Lake en Microsoft Fabric. Además, el curso cubre cómo realizar la ingesta de datos con Dataflows Gen2 y cómo utilizar pipelines de Data Factory en Microsoft Fabric.
Topics
Módulo 1: Introducción al análisis de extremo a extremo utilizando Microsoft Fabric.
Módulo 2: Comenzar con Lakehouses en Microsoft Fabric.
Módulo 3: Utilizar Apache Spark en Microsoft Fabric.
Módulo 4: Trabajar con tablas Delta Lake en Microsoft Fabric.
Módulo 5: Ingesta de datos con Dataflows Gen2 en Microsoft Fabric.
Módulo 6: Utilizar pipelines de Data Factory en Microsoft Fabric.