Les caractéristiques déroutantes du langage – une introduction à la compréhension de ce qui se passe lorsque les ordinateurs regardent le langage.
Il y a de nombreuses années, j’emprunte un raccourci pour me rendre à l’école. Je traverse une partie de l’immeuble utilisée principalement pour les cours de dessin. Le silence plane sur les salles…tellement, que je m’efforce d’étouffer le bruit de mes pas pour ne pas déranger les étudiants tandis qu’ils peinent sur de grandes tables à dessin (ceci s’est passé bien avant l’arrivée d’AutoCad, hélas). Mes pensées vagabondent pendant que je marche. Puis, tout à coup, je remarque une affiche comme celles que l’on voit encore de nos jours et à laquelle on porte peu d’attention. On peut y lire : « Avertissement : Garder cette porte fermée en tout temps! » Malheureusement, dans ma rêverie, une pensée me traverse l’esprit et je la trouve incontrôlablement hilarante. C’est le point d’exclamation, comme si l’affiche n’est pas suffisamment catégorique. C’est ce qui me fait réfléchir : si la porte doit vraiment rester fermée EN TOUT TEMPS, pourquoi n’y a-t-il tout simplement pas un mur à la place de la porte? J’éclate de rire à ma petite pensée, ce qui attire l’attention d’un professeur qui sort dans le couloir et me demande d’aller ailleurs. Tout en offrant mes excuses, je me dirige vers la sortie. Bien sûr, l’affiche n’était pas drôle, c’est plutôt mon interprétation qui me fit rire.
Le souvenir de cet épisode m’est revenu lors d’un épisode récent de CXOTalk que j’ai eu le plaisir d’animer avec Dr. Stephen Wolfram au sujet de l’avenir de l’informatique et de l’intelligence artificielle durant lequel nous avons tenté d’analyser les tendances émergentes en matière d’intelligence artificielle, du traitement du langage naturel et de la numérisation rapide de presque tous les aspects de la vie.
Comme suivi de cette conversation et compte tenu de toute la médiatisation entourant ces sujets, j’ai cru bon de rappeler le concept si bien illustré par la mauvaise grammaire, la ponctuation manquante et les interprétations divergentes partout… ce que j’appelle les caractéristiques déroutantes du langage.
Traitement du langage naturel : Une science très peu naturelle
Le domaine de la linguistique informatique offre des possibilités incroyables. Nous avons développé la capacité de prendre des chaînes de mots parlés ou écrits et de les appliquer à toutes sortes d’interprétations algorithmiques. L’éventail des capacités va bien au-delà de l’étendue de ce texte, mais penchons-nous sur les outils de base de ce domaine. D’abord et avant tout, tout comme nous l’avons fait lorsque nous étions à l’école pour apprendre à lire et à écrire, nous apprenons aux ordinateurs à reconnaître les mots, les signes de ponctuation et la syntaxe de base.
La linguistique informatique a évolué au point où les analyses grammaticales très avancées sont possibles. À l’aide de techniques modernes, à condition que la grammaire soit bien comprise et le texte suffisamment bien rédigé, toutes sortes de capacités fascinantes sont possibles.
Bien sûr, il arrive parfois que ces mêmes algorithmes échouent de façon spectaculaire. Il y a cette histoire apocryphe à propos de l’un des premiers adjoints numériques activé par un utilisateur qui dit : « Appellez-moi une ambulance! » auquel l’adjoint aurait répondu : « Très bien, dorénavant je vous appellerai ambulance. » Ce qui crée ce genre de situation n’est pas la reconnaissance des mots, mais l’ambiguïté de l’articulation. La langue, avec toutes ses règles et sa grammaire, est une façon nuancée de communiquer.
La linguistique informatique et l’interprétation machine sont très évoluées, mais la façon dont le langage est utilisé par les humains contient de nombreuses nuances, la plupart d’entre elles pouvant être très difficiles à détecter complètement. Cette difficulté est l’un des principaux défis des formulations écrites et parlées.
Les outils : Transformer les mots en math
Il existe de nombreuses raisons pour la transformation informatique du langage ou de sa conversion en algorithme. Initialement, la capacité avait été conçue afin de servir comme interface avec les ordinateurs. En utilisant certains mots-clés, par exemple, il serait possible de rédiger des instructions qui pourraient, par la suite, se transformer en langage machine contrôlant le fonctionnement d’un ordinateur. Au fil de l’évolution de la capacité, nous sommes passés de l’utilisation du langage à la communication avec les ordinateurs, afin de leur permettre de réaliser des interprétations de base du langage et comprendre les interactions entre humains.
Les premiers exemples de ces interactions entre humains portent sur des capacités de traduction de base, des recherches au clavier pour des concepts semblables dans des portions considérables de texte et des analyses grammaticales qui tentent d’aider les rédacteurs à éviter des erreurs grammaticales courantes. De nos jours, ces outils sont devenus beaucoup plus évolués, offrant notamment des capacités comme l’analyse des sentiments pour laquelle les algorithmes servent à identifier l’humeur ou le sentiment dans un langage.
Arrêtons-nous aux trois phrases suivantes:
- Ceci est une pomme.
- C’est une bonne pomme.
- C’est une excellente pomme
On peut facilement imaginer un algorithme attribuant un score de 0 pour neutre à la première phrase et 1 et 2 respectivement pour les deux autres phrases, permettant de classer ces trois phrases selon la mesure dans laquelle le locuteur se sent bien. De plus, par l’utilisation de l’extraction d’entités, nous pouvons conclure que les trois phrases peuvent se référer au même sujet, une pomme.
On pourrait aller plus loin en attribuant un sentiment négatif comme -1 pour la phrase « C’est une mauvaise pomme. » et -2 pour « Cette pomme est horrible. »
En regardant les milliers ou les millions de formulations, il est facile d’imaginer des histogrammes de sujets éventuels, des listes de synonymes, etc. Imaginez faire quelque chose comme cela pendant un certain temps sur les réseaux sociaux et vous auriez l’essence de la science de « l’écoute sociale ». De telles capacités sont essentielles aux approches modernes afin de déceler les variations du sentiment quant à l’image organisationnelle, aux produits et autres sujets plus nuancés comme l’éthique et la responsabilité sociale.
Avant de s’arrêter, prenons un autre exemple : « Les pommes sont bonnes si elles sont fraîches. » On peut comprendre qu’un algorithme puisse attribuer un aspect positif à une telle phrase, mais il y a une importante nuance. Sans examiner le reste de la formulation, on ne peut pas savoir si l’énoncé est positif ou négatif. En fait, l’attribution d’un sentiment parvient souvent à différentes conclusions selon la longueur du texte soumis en une seule formulation. Plusieurs outils ne sont pas suffisamment évolués pour tenir compte d’une telle nuance, et ont tendance à l’hypersimplification. Un contre-argument typique est que si vous examinez une grande part du langage, de telles petites erreurs ne comptent pas vraiment. Cependant, la réalité est toute autre et démontre qu’un nombre de conditions préalables doivent être respectées avant de pouvoir ignorer la complexité aussi cavalièrement. À titre d’exemple, si vous avez une grande quantité de très petites formulations, notamment des gazouillis, un tel argument serait plus valide que si vous aviez une grande quantité d’évaluation d’hôtels.
Prenez garde d’utiliser des outils simples. Il est important de comprendre les conditions préalables à respecter afin de supposer que de tels outils sont valides.
De nos jours, nous utilisons des outils langagiers pour toutes sortes de situations en sachant que ces outils sont imparfaits, que le langage continue de changer et que nos suppositions doivent toujours être tempérées par la réalité que le cerveau humain comprend beaucoup mieux le langage que les outils que nous utilisons pour synthétiser ce langage.
J'espère que cette brève introduction aux meilleurs points de compréhension quant au fonctionnement des ordinateurs lorsqu’ils regardent le langage. Si nous améliorons cette capacité, nous pouvons faire un meilleur travail de compréhension des variations dans les sentiments et de l'impact que les dirigeants ont sur les organisations, ou peut-être des situations où les messages importants ne sont pas bien reçus. Nous pouvons améliorer notre compréhension des minorités importantes lorsqu’elles parlent dans de vastes foules en exprimant des choses quasi indétectables, mais essentielles à dire. La science de la compréhension des données non structurées, telles que les collections de mots dans toutes leurs formes variées, promet de nous aider à mieux nous comprendre, et peut-être d'ouvrir quelques nouvelles portes très importantes.
Cet article a été paru initialement sur LinkedIn dans son intégralité.