La sécurité de la donnée
Introduction
Ce chapitre est centré sur la gestion de la donnée. Il aborde les sept domaines constitutifs de la gestion de la donnée, présente une méthodologie d’analyse de la maturité de la donnée au sein d’une entreprise et propose une description pour chaque problème identifié. Enfin, ce chapitre propose une architecture robuste pour avoir la capacité de sécuriser tout type de donnée produite.
Le Larousse introduit six contextes pour définir le terme "donnée" :
1. (Surtout pluriel.) Ce qui est connu ou admis comme tel, sur lequel
on peut fonder un raisonnement, qui sert de point de départ pour
une recherche : Les données actuelles de la biologie.
Synonymes : conjoncture - contexte
2. Idée fondamentale qui sert de point de départ, élément essentiel
sur lequel est construit un ouvrage : Les données d'une comédie.
3. (Surtout pluriel.) Renseignement qui sert de point d'appui :
Manquer de données pour faire une analyse approfondie.
Synonymes : information - précision - renseignement
4. Représentation conventionnelle d'une information en vue
de son traitement informatique.
5. Dans un problème de mathématiques...
Gestion de la donnée
1. Gouvernance de la donnée
La gouvernance de la donnée (ou data management) est le domaine de la définition de l’organisation en charge des données au sens large ; elle définit clairement les rôles et responsabilités des parties prenantes, et donc la comitologie associée. Toute donnée doit avoir une appartenance et une utilité en adéquation avec la stratégie de l’entreprise.
Par exemple, dans une société spécialisée dans l’édition de logiciels pour la gestion de la relation client, la donnée "Ventes mensuelles des services" fait apparaître un montant correspondant à une catégorie non identifiée dans le système d’information. Après analyse, il s’agit de services de type cyber-sécurité (conseil, pentests...). Il est donc tout à fait légitime de s’interroger et de comprendre pourquoi les commerciaux vendent des services qui ne sont pas dans la stratégie de l’entreprise. Même s’ils font de la marge, ils passent du temps à suivre un autre cap.
2. Architecture technique des SI
L’architecture technique des SI, ou plus exactement l’architecture data dans les SI, est le domaine qui permet de cartographier, identifier, modéliser les différents composants impliqués dans l’exploitation de la donnée : la collecte, le transport, le stockage, l’intégration, l’accès, le partage. C’est l’intégralité de l’usage de la donnée qui doit être définie, sa carte d’identité.
3. Rétention et archivage
Le domaine de la rétention et de l’archivage est essentiel dans le cycle de vie de la donnée : il permet de préciser les modalités de conservation et d’archivage des données. Il est nécessaire de tenir compte de l’exhaustivité des lieux de stockage de la donnée...
Le projet data
Au commencement de tout projet, il y a une histoire, une vision, une stratégie, un but… Et cela commence par la définition d’une note de cadrage simple puis par l’établissement d’une charte projet qui se veut, en premier lieu, souvent généraliste même si les objectifs doivent être clairs immédiatement.
1. Exemple de note de cadrage
"Dans un marché concurrentiel, l’entreprise MonBeauCloud a fait le choix de piloter son activité (commerce et technique) à l’aide d’indicateurs fiables et sécurisés afin de prendre toutes les décisions stratégiques et opérationnelles nécessaires avec efficience, étant entendu que cette dernière sera elle-même mesurée plusieurs fois par an afin de faire progresser tous les secteurs d’activité.
À cette fin, la direction générale a nommé M. X au poste de vice-président data afin de construire et exécuter la politique de gestion des données au travers d’une valorisation à 360 degrés des données. Un premier projet appelé "Data4Time" permettra dès la fin 2023 de lancer les premières étapes de ce chantier de transformation de la gouvernance et du pilotage de MonBeauCloud. M. X rendra compte directement au directeur...
L’organisation de l’équipe data
Afin de répondre aux différentes exigences imposées par les sept domaines de la gestion de données, une gestion organisationnelle doit être mise en œuvre avec des rôles parfaitement identifiés.
Généralement, en entreprise privée ou publique, il existe des directions métier en charge de la production des services métier délivrés aux clients/usagers selon le secteur d’activité et une direction des systèmes d’information en charge de la fonction ressources IT pour toutes les autres directions métier.
Centraliser la gestion de la donnée au sein de la seule DSI est une erreur fréquente qui consiste à ne pas impliquer les autres directions dans le projet data, qui se veut global par définition. La DSI incarne la maîtrise technologique de la gestion de la donnée, le maintien en conditions opérationnelles de la plateforme data, mais en aucun cas elle n’est propriétaire des données métier et donc de la qualité desdites données.
C’est la raison pour laquelle une organisation en mode "équipe data fédérée" semble indispensable.
1. La comitologie
La première étape consiste à instaurer un comité de pilotage data (Copil Data) en charge du sponsoring de la gouvernance de la donnée au sein de l’entreprise. Il œuvre à 360° afin de promouvoir la culture de la donnée et de prendre les décisions stratégiques telles que définies dans la politique de gestion de la donnée. Les membres de ce Copil Data sont bien souvent le sponsor, le VP data (Vice Président), le chief data officer, le DSI en tant que membres permanents, auxquels s’associent des experts (chef de projet, analystes data, clients, product owner...) selon le besoin.
2. Les rôles
a. Direction métier
Au sein des différentes direction métier (achats, production, commerce, avant-vente, immobilier, finances, RH...), trois grands rôles sont identifiés.
Propriétaire de la donnée (data...
Méthodologie de gestion de projet data
Avant tout lancement de projet data, il convient de mener une phase d’audit des métiers afin de mesurer l’état de maturité et de bâtir un plan d’action adapté. En effet, rien ne sert de lancer une action de constitution du référentiel de données si l’équipe n’est pas acculturée au sujet ou, pire, si les objectifs en termes de livrables ne sont pas clairement identifiés. Il est d’ailleurs conseillé de sous-traiter cette prestation auprès de sociétés spécialisées afin de disposer d’une cartographie la plus neutre et objective possible. Une bonne étude contient différentes phases :
-
Phase 1 : interview métier DSI
-
Phase 2 : interview directions métier
-
Phase 3 : définition des objectifs généraux (indicateurs, jalons, livrables)
-
Phase 4 : état de maturité des équipes et plan de progression
-
Phase 5 : définition des objectifs tactiques par direction métier (sensibilisation, formation, organisation, liste des données…)
-
Phase 6 : préconisations technologiques
Un livrable est toujours formalisé sous la forme coût-qualité-délai.
Mesure de la maturité Data
Pour chaque domaine d’activité de la gestion des données, il est proposé...
Schéma d’architecture MDM
De façon générale, une plateforme de gestion de la donnée (Master Data Management) est matérialisée par différents éléments dont le seul but est de rendre efficiente la gestion de la donnée tout au long de son cycle de vie. Le MDM permet de rassembler en un seul endroit les données de référence de l’entreprise au sein d’un référentiel unique où ces données sont qualifiées. Les éléments suivants sont des invariables :
-
Producteurs de données
-
Pipeline de données
-
Sources de données hétérogènes (base Oracle, tableau Excel, fichier CSV, base MongoDB…).
-
Collecte des données (ingestion/intégration dans le MDM).
-
Datawarehouse, Datalake
-
Consolidation / enrichissement
-
Nettoyage
-
Distribution
-
Datamart (entrepôt de données spécialisé par métier)
-
Rapports BI (BO, PowerBI…)
-
Couche de services partagés
-
Monitoring et contrôle
-
Gouvernance de la donnée
-
Métadonnées
-
Règles métier
-
Référentiel données (Master)
-
Qualité de la donnée
-
Services de sécurité
-
Archivage et rétention
-
Consommateurs de données
Plusieurs acteurs fournissent des plateformes prêtes à l’emploi : Blueway, Informatica, Tibco...