Préface d’Émilie BEAU - Architecte technique chez Microsoft Ce support abondamment illustré consacré aux datamarts de Power BI de Microsoft, en mode autonome ou éventuellement en mode hybride avec Microsoft Fabric, s’adresse à toute personne amenée à traiter des données en entreprise (responsable data, décideurs informatiques, utilisateurs de Power BI) autant qu’aux étudiants en Data Analyse ou Data Architecture. Il a pour objectif de transmettre au lecteur les tenants et aboutissants des...
Préface d’Émilie BEAU - Architecte technique chez Microsoft
Ce support abondamment illustré consacré aux datamarts de Power BI de Microsoft, en mode autonome ou éventuellement en mode hybride avec Microsoft Fabric, s’adresse à toute personne amenée à traiter des données en entreprise (responsable data, décideurs informatiques, utilisateurs de Power BI) autant qu’aux étudiants en Data Analyse ou Data Architecture. Il a pour objectif de transmettre au lecteur les tenants et aboutissants des datamarts Power BI pour qu’il puisse les exploiter efficacement.
Après avoir défini les datamarts, l’auteur en expose l’architecture technique et fonctionnelle puis souligne les avantages et inconvénients. Il explique le périmètre de l’outil et compare les datamarts aux flux de données, aux modèles sémantiques et à Microsoft Fabric.
Le second chapitre permet au lecteur d’être guidé de bout en bout dans la création d’un datamart. Il explore ainsi l’ajout d’éléments pour la gestion du temps ou des lieux, la création d’une passerelle ou encore la création de premières tables indispensables. Un chapitre est ensuite consacré à l’outil d’extraction, de transformation et de chargement des données qu’est Power Query OnLine avec de très nombreux exemples pratiques et un comparatif avec Power BI Desktop. Les chapitres suivants s’intéressent à DAX et au modèle de données à mettre en place, ainsi qu’à toutes les façons de consommer un datamart, de Microsoft Excel à Azure Data Studio.
Pour finir, l’auteur présente dans les derniers chapitres la gestion des droits et du partage, la gouvernance et les pipelines de déploiement ainsi que la maintenance et la réponse aux messages d’erreur.
3.8 Un outil de déploiement qui fait gagner du temps
3.9 Une analyse Excel directe
4. Les points faibles du datamart
4.1 Les connecteurs absents
4.2 Un logiciel jeune
4.3 Le chargement des données
4.4 Une gestion des droits simple
4.5 Limites techniques
5. Les fonctions du datamart
5.1 Vue d'ensemble du périmètre
5.2 Processus à suivre
5.3 Sourcer les données
5.4 Traiter les données en Power Query
5.5 Modéliser les données
5.6 Administrer et supporter le dispositif
6. Coût des datamarts
6.1 Licence d'évaluation
6.2 Achat de licence
6.2.1 Licence Premium par utilisateur
6.2.2 Capacité Fabric
6.2.3 Licences Fabric
7. Comparatif Dataflow, Dataset et datamart
7.1 Datamart versus flux de données
7.2 Hiérarchie de l'information dans un Power BI avec flux de données
7.3 Datamart versus modèles sémantiques partagés
7.4 Datamart versus Fabric
8. Liens utiles
Initialiser votre datamart
1. Mettre en place les prérequis
1.1 Groupes Entra ID
1.2 Licence
1.2.1 Licence d'évaluation
1.2.2 Achat de licence
1.2.3 Droits requis
1.3 Nommage conseillé
1.3.1 Nom des espaces de travail
1.3.2 Nom des domaines Fabric
1.3.3 Nom des datamarts
1.3.4 Connexion nommée
1.3.5 Nom des tables
1.4 Espace de travail
1.4.1 Domaines
1.4.2 Mode opératoire
1.5 Initialisation pour le compte d'un tiers
1.6 Préparation des mesures
2. Conseils de mise en place et de conception
2.1 Outils complémentaires utiles
2.2 Les différents modèles de données
2.2.1 Modèle en synapse
2.2.2 Modèle en flocon
2.2.3 Modèle en étoile (modèle recommandé)
2.3 Recommandations sur les tables
2.3.1 Table de mesure
2.3.2 Tables de dimension
2.3.3 Table de fait
2.3.4 Exhaustivité
2.4 Considérations sur les droits d'accès
2.5 Considérations sur la performance
2.6 Recommandations d'administration sur DirectQuery
2.7 Les difficultés à prendre en compte
2.7.1 Données sources de mauvaise qualité
2.7.2 Table manquante dans le datamart
2.7.3 Les difficultés en cas de colonne ou de relation manquante dans le datamart
2.7.4 En cas de mesure manquante dans le datamart
3. Créer le datamart
3.1 Créer un nouveau datamart
3.2 Créer une table de mesure
3.2.1 Création en mode graphique no code
3.2.2 Table des mesures en code M
3.3 Tables de fait et de dimension
3.4 Ajouter la dimension temps
3.4.1 Ajout de dimension(s) temps en M
3.4.2 Ajout de dimension temps en T-SQL
3.4.3 Incorporation du calendrier Azure SQL dans le datamart
3.5 Ajouter la dimension géographique
3.6 Retrouver et modifier un datamart
3.7 Mettre en place une passerelle
4. Mise en application
Power Query Online
1. Principes de base
1.1 Utilité et plus-value de Power Query Online
1.2 Faiblesses de Power Query Online
1.3 Utiliser Power Query Online ou DAX ?
1.4 Outil externe
1.5 Documentation Power Query
1.6 Créer et transformer en mode graphique
1.7 Paramétrage préalable conseillé
1.8 Paramétrage postérieur impératif
2. Différence entre Power Query Online et Desktop
2.1 Écarts à prendre en compte
2.2 Points non supportés et limites dans PQO
2.2.1 Types et autres points non supportés
2.2.2 Limites de PQO
2.3 Améliorations apportées par PQO
2.3.1 Meilleure information sur les étapes
2.3.2 Affichage des dépendances
3. Importer des données avec les connecteurs
3.1 Importer une source SharePoint
3.1.1 Fichier stocké dans SharePoint
3.1.2 Liste SharePoint
3.2 Importer une source JSON
3.3 Fusionner des fichiers Excel depuis un compte de stockage
3.4 Importer une source Excel ou CSV dans Azure SQL DB
3.5 Importer une base SQL Azure DB
3.5.1 Cas de la base Eurostoxx
3.5.2 Exemple de la base Livres
3.6 Importer une source Excel depuis OneDrive
3.7 Importer un fichier depuis Microsoft Fabric OneLake
4. Les fonctions Power Query les plus utiles
4.1 Ajouter des tables spécifiques
4.1.1 Ajout de table en dur en interface graphique
4.1.2 Ajouter une table de mesure en langage M
4.1.3 Ajouter une série de 1 à 20 pour un choix du Top N
4.1.4 Ajout de table de date de dernier rafraîchissement en langage M
4.1.5 Scénarii d'inflation par code M modifiable
4.1.6 Ajout de tables d'analyse de qualité
4.1.7 Ajout de table de profil de table
4.2 Renommer ou supprimer une table
4.3 Filtrer les lignes
4.4 Ajouter des colonnes : points à éviter
4.5 Ajouter et supprimer des colonnes (méthode éprouvée)
4.5.1 Indicateur de week-end
4.5.2 Numéro de semaine
4.6 Transformer les colonnes de texte
4.7 Supprimer ou remplacer les erreurs
4.8 Supprimer ou remplacer les valeurs absentes
4.9 Fusionner des tables
4.10 Remplacer les erreurs de table ou de colonne
4.11 Réaliser une grille de prix de revient
4.12 Réaliser une fonction d'estimation de coût conditionnelle pour remplacer SWITCH
4.13 Utiliser la fonction conditionnelle en Power Query Online
4.14 Établir un rang sur une table
4.15 Convertir les images et autres binaires
4.16 Ajouter des paramètres
4.16.1 Créer un paramètre d'inflation
4.16.2 Créer un paramètre de langue
4.16.3 Créer des fonctions pour automatiser les traitements
5. Le Query Folding et ses indicateurs
5.1 Cas 1 : Query Folding complet et Plan de requête
5.2 Les étapes supportées
5.3 Cas 2 : Query Folding partiel
5.3.1 Source SQL
5.3.2 Sources SharePoint
5.4 Cas 3 : Query Folding bloqué
Modéliser les données et créer les mesures
1. Améliorer son modèle de données
1.1 Mesurer les tables
1.2 Fusionner les petites tables trop nombreuses
2. Marquer la table de dates
3. Formater et renommer les colonnes du modèle sémantique
4. Créer les relations
4.1 Analyse dimensionnelle
4.2 Analyse de dimension à dimension
4.2.1 Gérer les images de catégories
4.2.2 Modélisation des autres tables
4.3 Documenter les relations et créer des relations temporaires
5. Dénormaliser les tables
6. Définition du DAX
7. Spécificités du DAX de datamart
8. DAX et les relations
9. Documentation DAX
10. Ergonomie DAX Online
10.1 Mode d'emploi de DAX
10.2 Déplacement de mesures d'une table à l'autre
10.3 Dossier d'affichage
11. Ergonomie DAX Studio
12. Ergonomie ChatGPT
13. DAX au secours du modèle de données figé
14. Les fonctions DAX de rang
14.1 Rang des meilleurs commerciaux
14.2 Top 5 best-sellers
14.3 Rang des Top N catégories
15. Les fonctions DAX de moyenne mobile
16. Fonction DAX conditionnelle
16.1 Cas 1 : condition comparée sur une colonne
16.2 Cas 2 : élaborer une série de conditions logiques
Utiliser ou consommer le datamart
1. Vue d'ensemble
2. Utiliser les requêtes visuelles
2.1 Mode d'emploi des requêtes visuelles
2.1.1 Récupérer la source de données exemple au préalable
2.1.2 Aperçu de l'interface des requêtes visuelles
2.2 Transformer les requêtes visuelles en code SQL
3. Créer une requête SQL dans le datamart
3.1 Mode opératoire
3.2 Partager une requête
3.3 Liste des raccourcis de l'éditeur SQL
4. Exemples de requêtes SQL utiles
4.1 Mesurer la taille de la base du datamart
4.2 Lister les tables et leurs dates
4.3 Compter le nombre de lignes d'une table
4.4 Lire les relations entre les tables du datamart
4.5 Afficher le contenu des tables avec ChatGPT
5. Modalité d’authentification
6. Consommer depuis Excel
6.1 Requêter en Power Query Excel
6.2 Tableau croisé dynamique Excel
7. Consommer en ligne dans Power BI Service
7.1 Consommer les rapports en ligne
7.2 Calculer une tendance
7.3 Afficher les prévisions
7.4 Gérer les images
7.5 Consommer le datamart dans un tableau de bord
7.6 Consommer dans une application Power BI
7.7 Créer un état automatique - Insight
7.8 Créer un rapport paginé
8. Consommer depuis PowerPoint
9. Consommer depuis Power BI Desktop
9.1 Se connecter en Live Connect
9.2 Se connecter au point de terminaison SQL
10. Consommer depuis SSMS
11. Consommer depuis Azure Data Studio
12. Consommer depuis les outils de BI externes (DAX Studio, Tabular Editor...)
12.1 DAX STUDIO
12.2 Tabular Editor
13. Les explorations de données en ligne
Partager les datamarts
1. Introduction
2. Détail des droits par niveau
2.1 Droits niveau administration Power BI
2.2 Droits d’espace de travail Premium
2.3 Droits sur les datamarts
2.4 Droits sur les rapports du datamart
2.5 Datamart en cascade
2.6 Droits par filtrage par ligne (RLS)
2.6.1 Prérequis de la RLS
2.6.2 Limite de la RLS
2.6.3 Modalité d'usage
3. Gestion des droits d'accès aux datamarts
4. Le partage externe
5. Gérer les langues et la traduction
5.1 La localisation de l'expérience utilisateur
5.2 Traduire les contenus des dimensions à la source
5.3 Importer la traduction dans Azure SQL
5.4 Charger la table traduite dans le datamart
5.5 Mettre en place les relations pour la dimension traduite
5.6 Traduire le nom des mesures et les grouper par langue
5.7 Adapter le contenu des mesures à la langue
5.8 Ajout de localisation dans la dimension temps
5.9 Utiliser tables et mesures traduites dans les visuels des rapports
5.10 Traduire les dimensions sous Power Query
5.10.1 Méthode de traduction par une formule conditionnelle en Power Query
5.10.2 Méthode de traduction par glossaire multilingue
5.11 Créer une formule Power Query et utiliser un paramètre de langue dans la formule
5.12 Créer une table de langues à destination des consommateurs
5.13 Réutiliser la dimension multilingue non filtrée
5.14 Faire choisir la langue d'affichage par les utilisateurs
5.15 Localiser la table de fait
5.16 Traduire les titres de rapports
5.17 Traduire les entités visuelles dans les rapports du portail
5.18 Le RLS de traduction
Gouverner les datamarts
1. Introduction
2. Le rôle de l’IT et du pôle Data
3. Les rôles à prévoir pour les datamarts
4. Instituer des règles de conduite
4.1 Règles d'architecture
4.2 Règles d'attribution des licences
4.3 Règle des espaces de travail Premium
4.4 Règle de développement de datamart
5. Les processus à prévoir
5.1 Processus de gestion de projet BI agile
5.2 Processus de gestion de projet en V et W
5.3 Processus de certification, d'approbation et de découverte
6. Pipelines de déploiement métier
6.1 Mettre en place un pipeline de déploiement
6.2 Mettre en place des règles de déploiement
6.3 Organiser la recette
Maintenir un datamart
1. Maintenance préventive
2. Maintenance corrective et dépannage
2.1 Monitoring des datamarts
2.2 Monitoring des connexions
2.3 Messages d'erreur du portail Power BI
2.4 Les erreurs dans les requêtes visuelles
2.5 Les erreurs de passerelle
2.6 Les erreurs de consommation par Power BI Desktop
3. Corriger les erreurs dans Power Query Online
3.1 Erreur de version de datamart
3.2 Erreurs d'étape
3.3 Erreurs de niveau table
3.4 Erreur de niveau colonne
3.5 Gestion d'erreur pour les erreurs de niveau valeur
3.6 Les messages d’erreurs PQO et leurs causes
3.6.1 Vocabulaire nécessaire pour comprendre les messages
3.6.2 Tableau des erreurs PQO
3.7 Exemples d'erreurs usuelles dans Power Query Online
3.8 Prise de contrôle par un compte
4. Actualiser un datamart en global
5. Définir le périmètre du modèle sémantique du datamart
6. Actualiser les données en incrémentiel
7. Documenter les mises à jour des datamarts
8. Historiser les datamarts
Index
Didier MAIGNAN
Jeune retraité qui a fait carrière chez Microsoft dans les années 1990, Didier MAIGNAN a fondé ensuite deux cabinets de service en gestion de projet puis en ingénierie des data. Il est intervenu pendant plus de vingt ans pour de l’assistance et de la formation auprès des managers, responsables métiers et des directions IT sur les technologies Microsoft. Dénué de tout intérêt partisan, il aborde les solutions BI de Microsoft en toute transparence. Avec ce livre, il transmet au lecteur toute son expertise sur les datamarts issue de son expérience sur plus de vingt datamarts opérationnels qu’il a créés et de plus de 1300 heures passées sur une large panoplie de sources de données, de transformation et de mise en place dans un contexte totalement en ligne et multilingue.