La gouvernance des données est devenue un sujet primordial au sein des entreprises, notamment du fait de leur prise de conscience sur le volume des données échangées, la variété de ces données ainsi que la vitesse avec laquelle elles transitent (Les fameux 3V du Big Data).
Mais que fait-on une fois que cette masse de données se trouve dans nos systèmes ? On parle alors de Smart Data et ses 2 V : véracité, pour une donnée cohérente, fiable ou exacte, et enfin le v auquel les entreprises cherchent à répondre, la valeur. Comment valoriser ma donnée pour valoriser mon entreprise ? C’est ce qui constitue les 5V du Big Data.
De ce fait, les entreprises cherchent à la comprendre, l’organiser et l’exploiter, c'est-à-dire à mettre en place une gouvernance des données. Il existe, bien sûr, différentes façons d’aborder une gouvernance et de la mettre en place, car il faut l'adapter à chaque organisation. Malgré ces différences, on peut trouver un tronc commun à tous ces projets Big Data et c’est ce qui m’a amené à partager mon expérience sur le sujet.
Lorsqu’il s’agit de parler de gouvernance, on parle souvent, de la façon de fédérer des équipes pluridisciplinaires, afin d'atteindre nos objectifs fixés, avec quelles ressources, quels outils et quelles méthodologies, mais surtout, avec quel soutien du management pour passer du Big Data au Smart Data.
Une première étape est de connaître ses process. Par exemple, si l’on prend le process “réception de la commande”, le départ de la commande est donné par le client, elle est réceptionnée par le fournisseur, elle traverse plusieurs étapes, services et systèmes. A chaque étape et lieu, la donnée est acheminée, voire transformée (mise à jour de stock, date de livraison, etc.) ou même des nouvelles données viennent s’ajouter, afin de répondre au processus.
En ayant cette connaissance, de quel type de donnée on possède, quel système la gère, on peut commencer à cartographier nos données, et faire un premier constat de la qualité de celle-ci. En se basant sur des critères comme l'unicité, la complétude, l’exactitude, la fraîcheur et la cohérence des données, les entreprises pourront prendre les bonnes décisions basées sur des données fiables et précises. C’est ce que l’on appelle la Data Quality Management (DQM).
Dans la gouvernance, il est aussi important, de prendre en compte, la gestion de risques et de la conformité réglementaire. Toute entreprise a pour responsabilité de sécuriser toute donnée entrante et sortante, de mettre en place des processus d’anonymisation, de définir des profils d’accès, de définir les finalités d’usage et un cycle de vie de la donnée pour être en conformité avec la RGPD, tracer, documenter et avoir des scénariis de protection en cas d’attaques ou fuite des données; ce sont des éléments que la CNIL vérifie lors des contrôles réglementaires.
Les architectures des systèmes d’information sont multiples et en perpétuelle évolution. De plus, il faut tenir compte du legacy qui ajoute une contrainte conséquente dans la gouvernance.
Ce qui est certain, dans une architecture de type Big Data ou qui tend, à devenir Big Data, c’est de compter sur des composants de collecte, de transformation et de transport de données multi sources, d’avoir un stockage adapté au besoin de l’entreprise, de bien savoir dimensionner les flux, en termes de volume et de fréquence d’exploitation, pour assurer une performance optimale à chaque niveau d’accès et d’utilisation de la donné.
Tout ce travail d'architecture est essentiel pour l’extraction, la transformation et la visualisation de la donnée. Les métiers doivent avoir à leur disposition, des moyens de mesurer, de comprendre, et de valoriser la donnée pour aller de plus en plus vers la Smart Data. Ceci passe par exemple, par des outils de data science, pour faire des modèles prédictifs et anticiper ainsi le besoin des consommateurs. Des outils de data visualisation que les Data Analystes utilisent dans leur quotidien, afin de donner des informations factuelles et claires, conforter dans les stratégies définies et prendre rapidement des décisions pour l’entreprise.
Comme on peut le voir, la gouvernance est répartie sur plusieurs expertises. Choisir les bons profils et définir les rôles de chacun est essentiel dans les projets.
Comme vous avez pu le lire, la gouvernance est l’affaire de tous, des personnes avec un même objectif, celui de valoriser la donnée.
Les responsabilités sont réparties entre chaque rôle et chacun apportera son expertise essentielle à une bonne gouvernance des projets Big/Smart Data.