• Recherchez-vous...

Quatre souhaits que les dirigeants inspérés par les données veulent voir se réaliser pendant les fêtes

Ce que chaque leader inspiré par les données a sur sa liste de souhaits

En pleine période des fêtes, tout le monde est occupé à établir ses listes et à les vérifier deux fois. Mais tandis que l’électronique et les jouets sont généralement en tête de la plupart de listes de souhaits, les leaders inspirés par les données du monde entier ont des désirs bein précis qui ne sauraient être achetés dans votre magasin préféré.

Que vous ayez été vilain (le site de rencontre en ligne pour les couples mariés a été piraté à l’aide d'un équipement de piratage, l'équipe d'impact et les informations personnelles de 37 M d'utilisateurs ont été rendues publiques, laissant de nombreux hommes sans voix) ou sage (Science des données au service du bien commun, un programme de l'Université de Chicago qui met en relation des spécialistes des données avec des gouvernements et qui œuvre pour prédire quand les responsables courent un risque d'inconduite afin de prévenir les incidents avant qu'ils ne se produisent), les responsables en chef des données, les spécialistes de données et tous les administrateurs de données aspirent tous à des méthodes de travail plus efficaces et plus sûres.

Plutôt que de jouer au Père Noël et de leur demander de s’asseoir sur mes genoux et de me dire ce qu'ils veulent pour les fêtes, je me suis dit que je partagerai simplement certaines des choses qui figuraient sur les listes de souhaits des spécialistes des données cette année.

1. Une meilleure façon de trouver la vérité dans les données

Pour reprendre de célèbres paroles de Mark Twain, « il existe trois types de mensonges : les mensonges, les sacrés mensonges et les statistiques ». L’un des plus gros problèmes auxquels nous sommes confrontés tous les jours consiste à essayer de donner un sens aux données que nous avons. Dans un monde parfait, la réponse à toutes nos questions se trouverait dans les données elles-mêmes, mais tel n’est pas le cas. L’hypothèse selon laquelle les données peuvent nous rapprocher davantage de cette version unique de la vérité est moins convaincante que la première. Cependant, cela ne nous a pas empêchés d’essayer de tirer des conclusions à partir des données qui nous sont présentées. Parfois, nous nous hâtons de tirer des conclusions face à la pression croissante des autres qui demandent des réponses.

Les bons scientifiques de données restent sceptiques et sont en quête de meilleurs moyens pour mesurer l’authenticité des données. Ils sont à la recherche d’une meilleure méthode pour aider à surmonter l'incertitude et le doute qui entourent les données.
Michael Goldberg, directeur monde, marketing de contenu
 

Ce dont nous avons vraiment besoin, c’est d'une source de vérité à laquelle nous pouvons les comparer. Autrement, il est très difficile de connaître la vérité. Malheureusement, il est généralement impossible d’atteindre ce but, car trouver la vérité dans un monde plein d'ambiguïtés n'est pas aussi simple que chercher un mot dans le dictionnaire. Si vous vous souvenez du vol 370 de la Malaysia Airlines qui a disparu tragiquement en 2014, de nombreux rapports contradictoires ont prétendu indiquer où se trouverait l’épave. Ces rapports s’appuyaient sur divers ensembles de données qui ont essentiellement donné lieu à plusieurs versions de la vérité proposée. Jusqu’à ce que des débris de l'appareil aient été finalement retrouvés, les chercheurs les recherchaient à différents endroits déconnectés indiqués par les « données ». Mais sans aucune source de données pour les comparer, il était impossible de savoir ce qui était vrai ou pas. Mais ce n’est qu'un exemple de la façon dont les données peuvent être utilisées pour obtenir une réponse que nous souhaitons tous avoir. La même chose se produit dans les affaires tous les jours; nous devons donc retenir que nous devons éviter les conclusions hâtives et essayer de comprendre premièrement le caractère, la qualité et les lacunes des données et ce qu’il y a lieu de faire. Les bons scientifiques en matière de données restent sceptiques et sont en quête de meilleurs moyens pour mesurer l’authenticité des données. Ils sont à la recherche d’un « compteur d'authenticité », si vous voulez, d'une meilleure méthode pour aider à surmonter l'incertitude et le doute qui entourent les données.

2. Une méthode pour appliquer une structure aux données non structurées

Les données non structurées, des informations qui ne sont pas organisées de manière prédéfinie, sont de plus en plus nombreuses par rapport aux données structurées. Les experts conviennent généralement que 80 à 85 % des données sont non structurées. Au fur et à mesure que la quantité de données non structurées augmente, la complexité et le coût lié à la tentative de découvrir, d’organiser et de donner un sens à ces données augmentent aussi. Cependant, la bonne gestion des données présente des avantages.

Cette explosion de données fournit aux organisations, des renseignements dont elles ne disposaient pas auparavant et qu’elles ne peuvent pas comprendre parfaitement. La première chose qui nous vient à l’esprit lorsque nous considérons des signaux de données provenant de nombreuses sources est d'éclater les parties qui sont comprises. Cette action est généralement appelée extraction d’entités. La compréhension de ces entités constitue la première étape de déduction de leur sens, mais les données non structurées peuvent parfois apporter des éléments nouveaux qui n’étaient pas appréhendés auparavant avec les données structurées. Des compétences supplémentaires sont donc nécessaires.

Les médias sociaux, par exemple, fournissent des possibilités inexploitées pour obtenir de nouvelles connaissances. Les réseaux sociaux qui fournissent des cotes et des avis d’utilisateurs offrent une mine de renseignements si vous parvenez à donner un sens à tout cela. Chez Dun & Bradstreet, nous développons des capacités qui nous donnent une idée du sens caché dans un texte non structuré. Les commentaires des clients fournissent de nouveaux détails sur le niveau de satisfaction d’une entreprise, qui peuvent n'avoir pas été précédemment appréhendés dans les données structurées. En comprenant comment mettre en corrélation les commentaires négatifs et positifs, ainsi que les cotes, nous espérons guider des décisions futures sur le risque global et l’ensemble des possibilités.

Les données non structurées faisant de plus en plus partie de l’équation, les responsables de données ont besoin de trouver une meilleure façon d'organiser les données non organisées sans s'appuyer sur les méthodes traditionnelles que nous avons utilisées dans le passé, car elles ne seront pas efficaces pour toutes les données. En haut de la liste de souhaits en matière de données se trouve sûrement un meilleur processus ou système permettant de gérer la majeure partie ou la totalité de nos données non structurées.

3. Une façon globale de partager des renseignements

De nombreux pays partout dans le monde envisagent d’adopter des lois pour s'assurer que certains types de données restent à l'intérieur de leurs frontières. Ils le font pour des raisons de sécurité qui sont certainement compréhensibles. Ils redoutent le cyberterrorisme et l’espionnage et veulent simplement protéger leur souveraineté. Il n’est pas surprenant de constater qu'il devient de plus en plus difficile de savoir ce que vous êtes autorisé à faire sur la scène mondiale. Nous devons veiller à ne pas créer de « silos » d’informations qui nuisent à l'avancement de notre capacité à utiliser ces informations tout en contrôlant minutieusement les comportements préjudiciables.

Dans la communauté scientifique, il existe une méthode selon laquelle, lorsque vous faites une découverte, vous publiez vos résultats dans un journal évalué par un comité de lecture pour que le monde entier les voient. Il s’agit là d'une manière de partager des connaissance dans l'intérêt du plus grand nombre. Bien sûr, toutes les connaissances ne sont pas partagées de cette façon. Certaines d’entre elles sont exclusives. Les données relèvent du domaine des connaissances qui ne sont pas généralement partagées. Mais il peut arriver que des données soient essentielles pour d’autres et qu'il faille les partager de manière appropriée.

Ce concept de publication des données demeure confus et fait l’objet de nombre de débats. Les données ouvertes en sont un exemple. Cependant, il existe de nombreuses autres approches nuancées. Le partage de données à l’échelle mondiale exige tellement de conseils et de consentements pour être fait de manière officielle. Les pays doivent faire preuve de maturité en permettant l’utilisation autorisée de données à travers les frontières de manière à ne pas saper nos inquiétudes en matière de malfaisance, mais aussi à ne pas nuire à la capacité de la race humaine à aller de l'avant dans l'utilisation de cet atout considérable qu'elle est en train de créer.

4. Développer une génération de penseurs analytiques

Si nous avons l’intention de créer un monde meilleur grâce à la puissance des données, nous devons nous assurer que nos successeurs peuvent reprendre là où nous nous sommes arrêtés et faire des choses que nous n'aurions jamais cru possibles. Alors que les données continuent de se multiplier à un rythme incroyable, nous serons confrontés à des problèmes complexes que nous ne pouvons même pas concevoir en ce moment, et nous aurons besoin des analystes les plus brillants et les mieux formés pour relever ces nouveaux défis. Pour ce faire, nous devons d’abord enseigner à la prochaine génération de responsables de données comment être perspicaces en ce qui concerne les analyses de données, en particulier des nouveaux types de données qui n'ont jamais été vues auparavant. Le cabinet spécialisé en recherches, McKinsey, a prédit qu’en 2018, les États-Unis seuls pourraient faire face à un écart de 50 % à 60 % entre l'offre et la demande de véritables talents en matière d'analyse.

Aujourd’hui, nous enseignons à nos futurs dirigeants les rudiments des statistiques. Nous leur enseignons par exemple ce qu’est la régression, qui est basée sur des séries de données longitudinales. Il s’agit certainement là de compétences fort utiles, mais cela ne leur enseigne pas comment être perspicaces en ce qui concerne les analyses de nouveaux types de données. Il faut des années de formation pour être en mesure d’observer des données et de raconter une histoire, une formation qui ne se fait tout simplement pas au niveau requis.

En tête de liste de souhaits de tous les gestionnaires de données et des organisations partout dans le monde, qu’ils le réalisent ou non, se trouve le besoin que nos établissements scolaires enseignent aux étudiants à être des penseurs analytiques, ce qui signifie devenir compétents dans le cadre des méthodes de découverte, de comparaison, d'évaluation et de synthétisation de l'information. Ce type de pensée permet aux utilisateurs de données amateurs de voir l’information dans de nombreuses dimensions, sous différents angles. Ces compétences jouent un rôle déterminant dans le développement de la prochaine génération de gestionnaires de données.

Cela reflète-t-il votre propre liste de souhaits en matière de données? J’espère que beaucoup d'entre eux se réaliseront en 2016 et au-delà. Jusque là, je vous présente à tous mes meilleurs voeux à l’occasion des fêtes.

 

Nous contacterContactez
Prenons contact
Veuillez remplir ce formulaire et nous vous contacterons bientôt.