ChatGPT et Intelligences Artificielles génératives, quel impact pour ERDIL ?

L’intelligence artificielle (IA), au centre de nombreuses discussions depuis plusieurs années, est sur toutes les lèvres depuis qu’OpenAI a ouvert un accès gratuit à ChatGPT le 30 novembre 2022. Mais que penser réellement de cette technologie ? Comment fonctionne-t-elle et est-elle également indispensable pour l’analyse des verbatim ?

Les performances constatées et l’éventail de possibilités offertes par l’Intelligence Artificielle et notamment ChatGPT ont généré chez certain(e)s une vision idéalisée de ce qu’est l’IA aujourd’hui, et chez d’autres une appréhension très importante vis-à-vis des risques potentiels.

Signe que le sujet est pris au sérieux à tous les niveaux, des groupes d’experts continuent d’étudier les impacts de cette révolution technologique et formulent des recommandations à l’intention des particuliers, des entreprises et des gouvernements. Les éléments présentés dans cet article sont d’ailleurs en grande partie tirés de publications du Hub France IA1 (association regroupant de nombreux acteurs de l’IA à travers différents groupes de travail : ChatGPT, cybersécurité, environnement, éthique, santé…) et de l’Académie des Technologies2 (établissement public placé sous la tutelle du ministre chargé de la recherche qui vise notamment à améliorer la compréhension des enjeux technologiques par tous les publics).

(Vous pouvez retrouver les sources utilisées pour rédiger cet article à la fin de celui-ci.)

Par son activité d’analyse du langage naturel (en l’occurrence les verbatim clients/collaborateurs), ERDIL est directement concernée par l’IA et ses évolutions, qui constituent une part importante du travail de son équipe R&D. Vous avez notamment pu lire sur notre blog notre approche hybride quant à l’utilisation de l’intelligence artificielle, complété par un récent billet abordant l’état de la recherche sur ce sujet. Dans cet article, plus spécifiquement, nous vous présenterons de façon simple les principes de fonctionnement, les limites et les risques de l’IA Générative via l’exemple de ChatGPT, ainsi que les apports de ce type de technologie dans un secteur d’activité tel que celui d’ERDIL.

ChatGPT, comment ça marche ?

ChatGPT est un agent conversationnel, basé sur un modèle d’Intelligence Artificielle dite Générative, c’est-à-dire qu’il est entraîné à l’aide d’un nombre gigantesque de données (dans la version « ChatGPT 3 », Wikipedia dans son ensemble représente seulement 0,6 % de ces données d’apprentissage !), afin de produire de nouvelles données.
Comme pour un moteur de recherche, on interroge ChatGPT avec une « invite » (« prompt » en anglais). Mais il y a plusieurs grandes différences avec un moteur de recherche :

  • les requêtes sont formulées en langage naturel (comme si on interrogeait une vraie personne) plutôt que via des mots clés,
  • le résultat fourni par ChatGPT n’est pas une liste de liens vers des pages web mais une réponse probable à la demande formulée, rédigée elle aussi en langage naturel,
  • ChatGPT garde en mémoire la succession des prompts (d’une même « discussion ») qui deviennent à leur tour des données supplémentaires utilisées dans le traitement permettant de répondre aux éventuelles invites suivantes.

Une IA Générative, à quoi ça sert ?

Les utilisations potentielles sont très nombreuses et peuvent être particulièrement intéressantes :

  • rédaction d’articles, de newsletters, de livres dans des styles variés et en différentes langues,
  • rédaction de lignes de code dans différents langages informatiques,
  • classification de textes dans différentes catégories définies par l’utilisateur,
  • identification d’opinions positives, négatives ou neutres,
  • traduction de documents littéraires ou techniques,
  • synthèse de longs documents

L’Intelligence Artificielle est-elle vraiment intelligente ?

Les tests que chacun(e) a pu faire sur ChatGPT sont parfois si bluffants que l’on peut avoir l’illusion d’une réelle compréhension.

En réalité, cet agent conversationnel donne finalement la réponse la plus probable à l’interrogation qui est faite par l’utilisateur. Il s’agit donc d’un traitement, certes très avancé, mais qui reste purement statistique.

ChatGPT n’a aucune compréhension des données qui lui sont fournies ou des réponses qu’il produit, et de façon générale aucune compréhension du monde qui nous entoure.

Quels sont les risques associés à l’utilisation de ChatGPT ?

Il n’est pas question de rejeter par principe l’utilisation de ChatGPT, mais il est nécessaire d’avoir conscience des nombreux risques qu’elle comporte :

Risque juridique

Toutes les données fournies à ChatGPT sont recueillies et stockées par la société OpenAI, y compris les données personnelles que l’utilisateur peut communiquer via ses prompts. De plus, OpenAI ne respecte ni le RGPD, ni les droits d’auteur ou de propriété intellectuelle dans la phase d’apprentissage. En entreprise, il conviendra d’être particulièrement vigilant quant au risque de fuite d’informations confidentielles et/ou stratégiques. Ces fuites ont déjà été observées par des grandes entreprises telles que Samsung en avril 2023, par exemple3.

Risque éthique

La phase d’entraînement comprend notamment l’apprentissage du repérage des contenus discriminatoires ou violents. Pour cela, les sociétés telles qu’OpenAI ont recours à des « travailleurs du clic », faiblement rémunérés et confrontés de façon intense à des contenus traumatisants, sans accompagnement psychologique. Il est à noter que ce sujet préoccupant n’est pas nouveau. Il a déjà été dénoncé dans le cadre de la modération des réseaux sociaux, notamment.

Risque environnemental

L’entraînement des modèles d’IA Générative requiert de grandes quantités d’énergie. Mais c’est leur usage massif (100 millions d’utilisateurs de ChatGPT un mois après son lancement) qui entraîne la consommation énergétique la plus importante.

Selon l’Académie des Technologies, l’ajout d’un agent conversationnel tel que ChatGPT aux moteurs de recherche existants pourrait avoir un impact considérable sur la consommation électrique mondiale.

Risque social

  • Désinformation involontaire : bien que les réponses de ChatGPT soient presque toujours plausibles, elles ne sont ni vérifiées ni sourcées et peuvent se révéler inexactes (voire fausses) ou variables (réponses différentes à une même question posée plusieurs fois) ; elles sont de toute façon non neutres et biaisées car dépendantes des données utilisées lors de l’entraînement et des règles de « censure » implémentées par l’entreprise OpenAI.
    Remarque : depuis la parution des articles du Hub France IA et de l’Académie des Technologies, des extensions de ChatGPT ont été publiées, notamment dans le but de fournir des réponses de meilleure qualité et de citer des sources d’information.
  • Désinformation volontaire : la génération de « fake news » se trouve évidemment renforcée et simplifiée par un tel outil.

Y a-t-il un risque à ne pas intégrer les technologies d’IA génératives ?

Il est indéniable que ChatGPT et les IA génératives représentent un progrès dans de nombreux domaines. Pour une entreprise, leur fermer la porte reviendrait potentiellement à laisser la place à des concurrents qui vont proposer un service client plus rapide, réduire les coûts d’opération et de main d’œuvre, baisser les prix des produits et services…

Le gain de temps qu’apporte l’IA est évidemment un gain financier et un avantage compétitif.

Quelles sont les préconisations issues du groupe de travail constitué par le Hub France IA ?

  • Il est essentiel d’acculturer à tous les niveaux pour un usage raisonné de ces outils, loin des discours alarmistes mais de façon non naïve.
  • Il convient d’interdire exclusivement les actions inacceptables (fuite de données confidentielles, triche, etc.), mais de permettre les activités à valeur ajoutée en les encadrant soigneusement.

Bien sûr, il ne s’agit pas de refuser l’arrivée de l’IA dans notre quotidien, ce qui paraît inévitable de toute façon, mais d’être conscient des problématiques qu’elle pose.

La place de l’Intelligence Artificielle chez ERDIL, aujourd’hui et demain ?

Comme notre responsable R&D Linguistique & IA, Aurore, l’a présenté dans l’article « Une IA hybride pour analyser les messages clients », l’Intelligence Artificielle est bien présente chez ERDIL, sous la forme d’une IA hybride et de confiance. Nous avons en effet recours à une IA symbolique qui offre les atouts de la précision d’analyse et de l’explicabilité des résultats, tout en utilisant le Machine Learning comme un service interne destiné à optimiser les développements des expert(e)s linguistes.

Le récent essor des IA Génératives comme ChatGPT aura sans doute un impact sur l’activité d’ERDIL. Cette technologie sera attendue par certaines marques et ne manquera pas d’être mise en avant par de nombreux prestataires. Comme nous l’avons montré dans cet article, elle est pourtant loin de constituer une solution miracle. Par ailleurs, les tests que nous avons pu effectuer, portant sur la détection de thématiques et du sentiment dans des avis clients, ont montré un certain nombre de limites de ChatGPT. Parmi celles-ci, notons un manque de constance des résultats et des identifications de simple mots et non de réels sujets, autant d’écueils que la technologie ERDIL permet d’éviter.

L’IA occupe une place particulièrement importante dans les travaux de l’équipe R&D d’ERDIL, aussi bien pour étudier les potentiels apports dans la méthodologie d’analyse des verbatim, que pour envisager de nouvelles fonctionnalités au sein de l’interface web Esatis.

Comme cela a déjà été le cas pour d’autres tendances importantes, nous suivons de près les évolutions de ces technologies liées à l’IA, leurs bénéfices et potentiels inconvénients mais également l’impact de ces solutions sur l’humain et l’environnement. Nous continuerons d’intégrer les technologies qui offrent une véritable plus-value pour notre activité et qui respectent également la confidentialité, la sécurité et l’intégrité des données confiées par nos clients.

Date

27 juillet 2023

Auteur
Portrait collaborateur Guillaume (Illustration)

Guillaume Robardet