SF34585
2 jours
En présentiel ou distanciel
- 14 heures de formation
- Exercices pratiques
- Prise en charge OPCO possible
Un renseignement ?
Contactez-nous !- En entreprise ou à distance
- Cadrage pédagogique gratuit
- Programme de formation sur mesure
- Formateur expert dédié
- Prise en charge OPCO possible
Formation Data Mesh : adopter le paradigme de l'architecture de données décentralisée.
Appropriez-vous les principes du Data Mesh pour décentraliser la gestion des données, responsabiliser vos domaines métier et construire une feuille de route d'adoption.
Les architectures data centralisées (Data Warehouse, Data Lake) atteignent leurs limites face à la croissance des volumes et à la multiplicité des cas d'usage. Le Data Mesh propose un changement de paradigme : décentraliser la responsabilité des données vers les domaines métier, traiter la donnée comme un produit et fédérer la gouvernance. Cette formation de deux jours vous permet de comprendre les quatre piliers du Data Mesh, d'expérimenter les rôles de consommateur et de producteur de Data Products, et de concevoir une plateforme self-service adaptée à votre contexte. Vous repartirez avec une feuille de route concrète pour engager la transformation dans votre organisation.
Programme de formation Data Mesh : adopter le paradigme de l'architecture de données décentralisée.
Contexte et évolution des architectures data
– Data Warehouse, Data Lake, Data Lakehouse : forces, limites et raisons de l’essoufflement des approches centralisées
– Enjeux actuels des organisations data-driven : volume, diversité des cas d’usage et passage à l’échelle
– Naissance du Data Mesh : le changement de paradigme proposé par Zhamak Dehghani
– Les 4 piliers du Data Mesh : Domain Ownership, Data as a Product, Self-serve Infrastructure, Federated Governance
– Caractéristiques d’une donnée dans le Data Mesh : accessibilité, auditabilité, disponibilité, intégrité
**Exemples d’activités pratiques :**
– Cartographie des problématiques data rencontrées par les participants dans leur organisation
– Identification des limites de l’architecture data actuelle au regard des 4 piliers
Domain-Driven Ownership
– Domain-Driven Design (rappels) : bounded contexts, ubiquitous language et leur application aux données
– Domain-Oriented Ownership : décentraliser la responsabilité des données vers les domaines métier
– Alignement entre sources de données et domaines de données : critères de découpage
– Les 3 archétypes de data domain : source-aligned, aggregated et consumer-aligned
– Délimitation des domaines : s’assurer que les périmètres sont clairs et les responsabilités non chevauchées
**Exemples d’activités pratiques :**
– Découpage en domaines de données sur un cas d’entreprise fictif
– Atelier perspective consommateur : identifier les données nécessaires et leur provenance
Data as a Product
– Caractéristiques d’un Data Product : découvrabilité, adressabilité, fiabilité, interopérabilité, sécurité
– Les 3 archétypes de Data Products : source-oriented, aggregated et consumer-oriented
– Modèle de données versus protocole d’échange : définir les interfaces d’un Data Product
– Data Contracts (notions) : formaliser les engagements entre producteurs et consommateurs de données
– Intégration des Data Products dans un écosystème legacy : cohabitation avec l’existant
**Exemples d’activités pratiques :**
– Conception d’un Data Product à partir d’un besoin consommateur : spécification des interfaces et du contrat
– Atelier perspective producteur : modéliser un Data Product et ses garanties de qualité
Self-serve Data Infrastructure
– Platform thinking appliqué à la Data Mesh : fournir des capacités en libre-service aux domaines
– Data Mesh Experience Plane : portail de découverte et de consommation des Data Products
– Data Product Experience Plane : outils de création, publication et monitoring des Data Products
– Utility Plane : services transverses (stockage, compute, sécurité, observabilité)
– Principes de conception d’une plateforme self-service : abstraire la complexité technique sans réduire l’autonomie
**Exemples d’activités pratiques :**
– Modélisation des composants d’une plateforme self-service adaptée au contexte des participants
– Étude de cas : le contrôle d’accès comme capacité self-service
Federated Computational Governance
– Gouvernance centralisée vs fédérée : enjeux et limites de chaque modèle
– Principes de la gouvernance fédérée computationnelle : automatiser les politiques plutôt que les imposer manuellement
– Standards et interopérabilité : définir les règles globales que chaque domaine doit respecter
– Rôles clés : Data Steward, Data Owner et leur articulation dans un modèle fédéré
– Équilibrer autonomie des domaines et cohérence globale du système de données
**Exemples d’activités pratiques :**
– Définition de règles de gouvernance fédérée sur un cas concret (confidentialité, qualité, interopérabilité)
– Atelier : répartir les responsabilités entre domaines métier, data office et équipe plateforme
Feuille de route et conduite du changement
– Évaluer la maturité de son organisation face au Data Mesh : matrice d’évaluation
– Identifier les domaines métiers prioritaires pour un premier Data Product
– Étapes clés d’adoption : du MVP Data Mesh au déploiement à l’échelle
– Dimensions organisationnelles et culturelles : embarquer les équipes et les data owners
– Construire son plan d’action : jalons, parties prenantes et critères de succès
**Exemples d’activités pratiques :**
– Construction d’une feuille de route Data Mesh personnalisée pour l’organisation de chaque participant
– Identification des quick wins et des freins potentiels dans son contexte
Nos autres formations en Big Data .
Formation Airflow
Formation Apache Kafka
Formation Apache NiFi
Formation Bases de données NoSQL : introduction, enjeux et panorama des solutions
Formation Big Data – Sécurité des données
Formation Big Data : état de l’art
A travers sa Charte Engagement Qualité, Sparks s’engage à tout mettre en œuvre pour que chaque session de formation soit un succès et que votre satisfaction soit totale.
