Formation Mettre en œuvre une solution d’analyse de données avec Azure Databricks (DP-3011).
Score de satisfaction : 4.82/5
Durée :
1 jour
Distanciel et 16 villes en France
numero vert : 0805 950 800 (service et appel gratuits)
à partir de
950 €HT
96% d'avis positifs* participants

Référence :
SF34382
Durée :
1 jour

En présentiel ou distanciel


  • 7 heures de formation
  • Exercices pratiques
  • Prise en charge OPCO possible
Vous souhaitez personnaliser cette formation ?
  • En entreprise ou à distance
  • Cadrage pédagogique gratuit
  • Programme de formation sur mesure
  • Formateur expert dédié
  • Prise en charge OPCO possible

Formation Mettre en œuvre une solution d’analyse de données avec Azure Databricks (DP-3011).

Exploitez les performances d’Apache Spark sur Azure Databricks pour exécuter des charges de travail analytiques à grande échelle dans le cloud !

Cette formation vous initie à l'utilisation d'Azure Databricks, une plateforme d’analyse de données moderne et puissante reposant sur Apache Spark. Vous apprendrez à déployer et gérer des clusters cloud, à traiter de grands volumes de données, à créer des pipelines avec Delta Live Tables et à automatiser les traitements avec Azure Databricks Workflows. Grâce à une approche pratique basée sur des cas concrets, vous développerez les compétences nécessaires pour implémenter des solutions analytiques évolutives sur Azure.

Objectifs pédagogiques.

1Comprendre les composants clés de la plateforme Azure Databricks et leur rôle dans les architectures analytiques cloud.

2Utiliser Apache Spark pour ingérer, explorer et transformer des données.

3Manipuler des données avec Delta Lake pour assurer la fiabilité et la qualité des traitements.

4Concevoir et exécuter des pipelines de données avec Delta Live Tables.

5Automatiser le déploiement de charges de travail avec Azure Databricks Workflows.

Prérequis : Maîtriser les bases de Python et de SQL (écriture de scripts simples, requêtes avec filtres, jointures et agrégations). Être à l’aise avec le portail Azure et des services comme Azure Storage. Avoir une compréhension générale des concepts liés aux données : traitement par lots vs temps réel, données structurées vs non structurées.
Partagez cette formation

Programme de formation Mettre en œuvre une solution d’analyse de données avec Azure Databricks (DP-3011).

1. Découverte d’Azure Databricks

Présentation de la plateforme
Démarrage avec Azure Databricks
Identification des types de charges de travail pris en charge
Concepts fondamentaux d’Azure Databricks
Gouvernance des données avec Unity Catalog et Microsoft Purview
Atelier pratique : prise en main d’Azure Databricks

2. Analyser des données avec Azure Databricks

Ingestion de données
Outils d’exploration disponibles dans la plateforme
Analyse via les API DataFrame
Atelier pratique : exploration de données

3. Utiliser Apache Spark sur Azure Databricks

Introduction à Apache Spark
Création et configuration d’un cluster Spark
Utilisation de notebooks pour les traitements Spark
Lecture et traitement de fichiers avec Spark
Visualisation des données
Atelier pratique : traitements Spark dans Azure Databricks

4. Gérer les données avec Delta Lake

Introduction à Delta Lake
Création et gestion de tables Delta
Application des schémas
Contrôle de version et historique des données
Assurer l’intégrité des données
Atelier pratique : manipuler les données avec Delta Lake

5. Créer des pipelines avec Delta Live Tables

Présentation des pipelines Lakeflow
Ingestion et intégration des données
Traitements en temps réel avec Lakeflow
Atelier pratique : mise en œuvre d’un pipeline déclaratif

6. Déployer des charges de travail avec Azure Databricks Workflows

Présentation des travaux Lakeflow
Composants essentiels des workflows
Bénéfices de l’automatisation des traitements
Déploiement de workloads avec les travaux Lakeflow
Atelier pratique : création d’un workflow automatisé

Notre charte qualité et éthique.

A travers sa Charte Engagement Qualité, Sparks s’engage à tout mettre en œuvre pour que chaque session de formation soit un succès et que votre satisfaction soit totale.

Amandine de Sparks
Des chiffres étincelants.
20 années
à vos côtés
+ de 1000
sujets de formation
8702
stagiaires formés en 2024
252
formateurs actifs en 2024
97,9%
de stagiaires satisfaits
23793
heures de formation réalisées en 2024
HAUT