À titre d'architecte chevronné chez Dun & Bradstreet, mon travail consiste à comprendre comment les tendances de l'industrie influencent nos clients et les solutions que nous leur offrons. Au cours des dernières années, il n'y a pas eu de tendance plus marquée que les données massives, et aucours de la dernière décennie, elles sont passé de l’obscurité à ce que IDC estime sera un marché de 203 milliards de dollars d’ici 2020. Bien que les données massives aient clairement dépassé le simple battage médiatique, j'affirmerais qu'un pourcentage significatif d'entreprises ne réalisent pas encore pleinement les avantages les plus larges possibles de leurs investissements dans les données massives. En fait, Gartner a récemment fait paraître une étude suggérant que les données massives demeurent principalement un effort de recherche et de développement pour la plupart des entreprises,avec seulement 15 % des personnes interrogées ayant déclaré avoir placé leurs plateformes de données massives en mode production. Cette initiative permet un soutien puissant à l'idée que la plupart des entreprises ont du mal à tirer des conclusions et un rendement du capital investi des données massives. Je suis d’avis que ce défi du rendement du capital investi est particulièrement aigu pour les grandes entreprises du commerce interentreprises (B2B). Une raison possible de ce défi est que plusieurs de ces entreprises ont du mal à intégrer leurs données massives dans les données maîtres.
Pour de nombreuses grandes entreprises du commerce interentreprises, la clé pour débloquer les informations clients capturées dans leurs environnements de données massives consiste à trouver un moyen de connecter des données massives non fiables et non structurées à des enregistrements maîtres de clients / comptes hautement fiables et structurées, chacun d’eux avec des identifiants uniques dans leurs bases de gestion de données maîtres. En surface, faire cette connexion peut sembler exiger un compromis que la plupart des chefs de l’information ne voudraient pas faire : sacrifier la qualité et la confiance inhérentes à un environnement de données maîtres entièrement géré, en autorisant potentiellement des milliards de lignes de données non maîtrisées dans leurs bases, ou dépenser des millions de dollars pour essayer d'appliquer plus de gouvernance dans un environnement complètement inadapté pour le soutenir.
Les fournisseurs de logiciels dans le monde de la gestion des données maîtres et des données massives souhaiteraient vous faire croire qu'ils ont résolu le problème de la gouvernance des données maîtres d'entreprise dans les environnements de données massives, mais en réalité, ces solutions sont des applications complètement distinctes de celles que la plupart des entreprises utilisent déjà pour la gestion des données maîtres. Si l'objectif de la gestion des données maîtres vise à avoir une seule source fiable de données maîtres, la mise en œuvre d'une application complètement distincte pour gérer et régir les données maîtres dans un environnement de données massives semblerait aller à l'encontre de l'objectif principal de la gestion des données maîtres.
Alors, le fait que les environnements de gestion des données maîtres et des données massives restent des infrastructures complètement distinctes signifie-t-il que les entreprises du commerce interentreprises qui s'appuient sur des données maîtres clients structurées auront du mal à réaliser la pleine valeur de leurs investissements dans les données massives? Cette question est explorée de manière beaucoup plus détaillée dans.
Un livre blanc récemment publié et disponible ici (en anglais).