SF34592
2 jours
En présentiel ou distanciel
- 14 heures de formation
- Exercices pratiques
- Prise en charge OPCO possible
Un renseignement ?
Contactez-nous !- En entreprise ou à distance
- Cadrage pédagogique gratuit
- Programme de formation sur mesure
- Formateur expert dédié
- Prise en charge OPCO possible
Formation DataGalaxy : gouvernance et catalogage des données d'entreprise.
Maîtrisez DataGalaxy pour structurer, cataloguer et tracer vos données à l'échelle de votre organisation.
DataGalaxy est la plateforme de référence pour la gouvernance et le catalogage des données d'entreprise. Cette formation de deux jours vous permet de prendre en main l'outil et d'en exploiter les fonctionnalités clés : modélisation, catalogage, data lineage et gestion de la qualité des données. Vous apprendrez à créer des catalogues de données robustes, à tracer les flux de données de bout en bout et à mettre en place des politiques de gouvernance adaptées à votre organisation. À l'issue de la formation, vous serez en mesure d'assurer la qualité et la sécurité de vos données au sein de DataGalaxy.
Programme de formation DataGalaxy : gouvernance et catalogage des données d'entreprise.
Découverte de DataGalaxy et de son écosystème
– Positionnement de DataGalaxy : rôle d’une plateforme de data governance dans l’écosystème data d’entreprise
– Interface et navigation : organisation de l’espace de travail, modules principaux et vues disponibles
– Concepts clés : objets, propriétés, métadonnées et liens au sein de la plateforme
– Cas d’utilisation typiques : scénarios de mise en œuvre selon les besoins métier et IT
– Philosophie collaborative : approche DataGalaxy pour impliquer les différents acteurs de la donnée
**Exemples d’activités pratiques :**
– Exploration guidée de l’interface et navigation dans un workspace de démonstration
– Identification des modules et de leur rôle dans un cas d’usage concret
Modélisation des données
– Glossaire et dictionnaire de données : structuration des définitions métier et techniques dans DataGalaxy
– Création de modèles de données : définition des entités, attributs et schémas
– Gestion des relations : liens entre objets, cardinalités et dépendances
– Diagrammes de modélisation : visualisation graphique des modèles pour faciliter la compréhension
– Bonnes pratiques de modélisation : conventions de nommage, granularité et maintenance des modèles
**Exemples d’activités pratiques :**
– Création d’un modèle de données à partir d’un cas métier (entités, attributs, relations)
– Construction d’un glossaire métier et liaison avec les objets techniques
Gouvernance des données
– Principes de gouvernance : enjeux, objectifs et bénéfices d’une politique de gouvernance structurée
– Politiques de gouvernance : définition et mise en place de règles adaptées au contexte de l’organisation
– Rôles et responsabilités : attribution des rôles (data owner, data steward) et périmètres associés
– Surveillance de la conformité : indicateurs et tableaux de bord pour suivre l’application des politiques
– Documentation : centralisation de la documentation métier et technique au sein de la plateforme
**Exemples d’activités pratiques :**
– Définition d’une politique de gouvernance et attribution des rôles sur un périmètre donné
– Mise en place d’un tableau de bord de suivi de la conformité
Catalogage des données
– Enjeux du catalogage : valeur d’un catalogue de données pour la découverte et la réutilisation de l’information
– Création et gestion de catalogues : alimentation manuelle et par import de fichiers en masse
– Classification et organisation : taxonomies, tags et regroupements pour structurer le catalogue
– Recherche et découverte : fonctionnalités de recherche avancée et filtres pour naviguer dans le catalogue
– Enrichissement par les métadonnées : ajout de descriptions, propriétaires et indicateurs de qualité
**Exemples d’activités pratiques :**
– Création d’un catalogue de données et import d’un jeu de données via fichier
– Recherche et découverte de données à partir de critères métier
Data lineage et traçabilité des flux
– Principes du data lineage : traçabilité de bout en bout des données, de la source à la consommation
– Visualisation des parcours : cartographie graphique des flux de données dans DataGalaxy
– Identification des sources et destinations : mapping des systèmes amont et aval
– Analyse d’impact : évaluation des conséquences d’une modification sur les données en aval
– Connecteurs : principe d’utilisation des connecteurs pour alimenter automatiquement le lineage
**Exemples d’activités pratiques :**
– Traçage d’un flux de données de bout en bout et visualisation du lineage
– Simulation d’une analyse d’impact suite à la modification d’une source
Qualité des données
– Dimensions de la qualité : complétude, exactitude, cohérence, fraîcheur et unicité des données
– Évaluation de la qualité : identification et mesure des problèmes de qualité dans le catalogue
– Règles de validation : définition et application de contrôles pour maintenir un niveau de qualité cible
– Monitoring : suivi continu de la qualité via indicateurs et alertes
**Exemples d’activités pratiques :**
– Définition de règles de validation sur un jeu de données et interprétation des résultats
– Configuration d’un tableau de bord de suivi de la qualité
Sécurité, confidentialité et personnalisation
– Gestion des accès et des permissions : configuration des droits utilisateurs et périmètres de visibilité
– Protection des données sensibles : classification des données sensibles et application de restrictions
– Conformité réglementaire : alignement avec les exigences RGPD et normes sectorielles
– Personnalisation de l’expérience : paramétrage des écrans, vues et tableaux de bord selon les profils
**Exemples d’activités pratiques :**
– Configuration des droits d’accès par rôle sur un espace de travail
– Personnalisation d’un tableau de bord adapté à un profil data steward
Nos autres formations en Intelligence Artificielle (IA) et Data Science .
Formation Acculturation IA pour le CODIR/COMEX
Formation AIOps Foundation℠, avec certification AIOF
Formation Analyse statistique et modélisation
Formation Analyste de données Microsoft Power BI (PL-300)
Formation Big Data, Data Science et Machine Learning : concepts et enjeux pour l’entreprise
Formation ChatGPT : les bases du prompt engineering
A travers sa Charte Engagement Qualité, Sparks s’engage à tout mettre en œuvre pour que chaque session de formation soit un succès et que votre satisfaction soit totale.
