Curso Workshop

Workshop Online

Databricks

vector
cloud_done

Aprende sobre Databricks con nosotros

aws

Entrega de Certificado Oficial de realización por los principales especialistas Business Intelligence Open Source de España.

Aprende sobre esta plataforma interactiva y colaborativa en la nube basada Apache Spark que se emplea para el proceso, análisis y transformación de datos, facilitando el diseño de modelos de aprendizaje automático complejos (Machine Learning).

Somos Partners Oficiales de Databricks

school

Nuestros expertos ponentes

EmilioArias

Emilio Arias

Robertotardio

Roberto Tardío

menu_book

Temario

Introducción

  • ¿Que es Databricks?
  • Arquitectura: Lakehouse, Spark y MLflow
  • Integración
  • Seguridad y administración
  • Clústeres
  • Motor optimizado
  • Ejercicio práctico

Almacenamiento y Gestión de Datos

  • Tipos de almacenamiento
  • Uso de Autoloader para datos en streaming
  • Administración de formatos de datos
  • Optimización
  • Integración con DW y DL externos
  • Unity Catalog para gobernanza de datos
  • Ejercicio práctico

Transofrmación de Datos

  • Introducción a Apache Spark en Databricks
  • Uso de PySpark
  • Aplicación de Spark SQL
  • Catalyst Optimizer y Tungsten
  • Photon Engine y Genie
  • Jobs y Pipelines ETL
  • Ejercicio práctico

Machine Learning y MLOps

  • Introducción a MLflow
  • Ciclo de vida con MLflow Tracking
  • Uso de AutoML
  • Model Serving
  • Optimización con Hyperopt y MLflow
  • Integración IA: Hugging Face y TensorFlow
  • Ejercicio práctico

IA Generativa y LLMs

  • Integración con Modelos de Lenguaje (LLMs)
  • Uso de Mosaic AI
  • Optimización de modelos IA
  • Aplicaciones con modelos preentrenados
  • Fine-tuning con Huggging Face
  • Model Serving en tiempo real
  • Ejercicio práctico

Visualización de datos y Dashboards

  • Uso de Databricks SQL
  • Dashboards y visualizaciones
  • Integración con Tableau, PowerBI y Looker
  • Visualización avanzada (Python y Matplotlib)
  • Informes dinámicos con Ploty y Seaborn
  • Optimización de queries
  • Ejercicio práctico

Automatización y Orquestación

  • Introducción a Databricks Workflows y Jobs
  • Creación de Pipelines automatizadas
  • Delta Live Tables ETLs
  • Programación de tareas con Airflow
  • Uso de Genie
  • Monitoreo de tareas
  • Ejercicio práctico

Seguridad, Gobernanza y Optimización de costos

  • Seguridad en Databricks
  • Permisos y roles con Unity Catalog
  • Auditoría y Monitoreo
  • Estrategias de optimización de costos
  • Uso de Databricks SQL Warehouses
  • Buenas prácticas de Data Governance
  • Ejercicio práctico
psychology

Más sobre Cloud Analytics

Lakehouse Analytics con MS Fabric y Azure Databricks

Big Book of Data Warehousing and BI

Videotutorial Cloud Analytics

Diccionario de Arquitecturas de Datos

Cloud Data Lake con Snowflake y Talend

Amazon vs Azure vs Google vs Snowflake

Snowflake, El Data Warehouse enfocado a Cloud

Ver más
how_to_reg

Regístrate al Workshop

rotate_right