27 octobre 2023

Revenir sur les actualités

Partagez :

LinkedIn

IA générative : tout commence avec la qualité des données

La qualité des données, un préalable à la mise en place d’une IA générative en entreprise

La qualité des données constitue un enjeu important dans l’entreprise : analyses, prises de décisions, contrôle, évaluation… Nous le savons. Une nouvelle donne vient renforcer ce constat : l’intelligence artificielle générative dont Chat GPT constitue l’exemple le plus connu. Celle-ci nous fait passer brutalement du thème de la qualité des données à celui de la qualité de l’information. Vaste sujet.

Nous ne mesurons pas toujours que cet outil a été entraîné intensivement pour donner les résultats que nous connaissons. Dans sa version 4 Chat GPT aurait été entraîné avec 100 000 milliards d’exemples, affirme son éditeur Open AI. Des exemples publics, qui n’intègrent pas à priori de données privées.
Comment alors espérer utiliser un tel outil dans la sphère de l’entreprise, privée par excellence ? Beaucoup d’informations sont confidentielles à des degrés différents : vis-à-vis des clients, des fournisseurs, du public ou au sein même de l’entreprise. Par ailleurs, beaucoup d’informations sont volatiles – vraies à un moment donné, fausses à un autre moment. Enfin, le taux d’approximation, voire d’erreur d’une IA grand public, n’est pas toujours acceptable en environnement professionnel.

Katarina Krcunovic (Chief Data Officer, Eau de Paris), nous livre ses réflexions

« L’intégration de l’IA en entreprise et ses applications devraient concerner toutes les activités d’Eau de Paris. Il est possible de citer quelques exemples.
Un premier cas d’usage qui émerge assez spontanément porte sur la lecture, l’analyse et la rédaction de rapports. Par exemple, la sélection de candidats, que cela soit lors du process de recrutement d’un salarié ou celui de la passation d’un marché, se révèle assez chronophage. L’IA serait particulièrement appréciée pour réduire les temps de lecture des documents remis, l’élaboration de grilles d’analyse.
L’activité de veille devrait également être grandement facilitée en synthétisant l’information collectée et en détectant des tendances.
Un dernier exemple pourrait porter sur la gestion de projets afin d’identifier plus rapidement ceux dont les échéances entrent potentiellement en conflit avec d’autres projets (internes comme externes). Nous pourrions nous appuyer sur l’IA pour optimiser les plannings en fonction des priorités et des effets de bord entre projets. »

Un enjeu stratégique

L’amélioration des processus grâce à l’IA doit contribuer à nos enjeux stratégiques :

  • Un service public centré sur l’usager
  • L’excellence industrielle et la productivité
  • La compétence des équipes
  • La performance économique
  • La transition écologique, avec la contribution à la sobriété en eau

Le travail d’Eau de Paris sur la data nous a déjà permis d’atteindre des résultats importants. Je pense par exemple à l’amélioration de la mise à disposition de données, d’informations à destination des abonnés et des collaborateurs, mais aussi à l’amélioration des processus industriels avec le développement de modèles prédictifs. L’IA, notamment l’IA générative, représente une opportunité pour poursuivre ce mouvement.

L’IA générative peut être une aide considérable à condition de lever certains obstacles.

1 – Améliorer la qualité des données
Eau de Paris dispose d’un patrimoine informationnel important, issu en bonne partie des objets connectés déployés depuis plusieurs années. Nous réalisons toutefois que la qualité actuelle de nos données, qui répond parfaitement aux besoins au quotidien, n’est pas forcément adaptée à des usages plus poussés. Il y a ainsi un sujet de fond à adresser, préalable, voire concomitant, aux développements de modèles. Nous initions ainsi des actions pour procéder à des redressements/corrections automatisés. Si elles produisent des résultats prometteurs, elles ne permettent pas non plus de résoudre l’ensemble des problématiques rencontrées. Par ailleurs, chaque solution développée est spécifique au domaine métier traité.

2 – Créer une base de connaissances
Entraîner une IA générative nécessite donc de créer une base de connaissance fiable (ou fiabilisée). Outre la gestion de l’historique, cela implique une bonne coordination des différentes parties prenantes (internes, voire externes), que chacune adhère aux enjeux, accepte de partager certaines informations et adopte des schémas de données proches, à défaut d’être identiques.
La confidentialité de l’information, ainsi que l’utilisation qui en est faite, est également un enjeu de taille, vis-à-vis de l’externe, bien sûr, mais aussi de l’interne.

3 – Organiser la mise en œuvre
Initier la mise en place d’une telle base de connaissance suppose, pour une organisation, d’adopter une approche expérimentale. Il est en effet nécessaire de bien comprendre le fonctionnement de ces outils, l’usage qui pourrait en être fait au regard des problématiques métier rencontrées et l’impact qu’ils peuvent avoir ; que ce soit en termes techniques, d’organisation, de tâches, de fiabilité… Par ailleurs, le sujet peut s’avérer tellement vaste, qu’il est préférable de commencer par un cas métier concret et aux contours bien définis pour maximiser les chances de succès.

4 – Gérer un environnement en constante évolution
La base de connaissances de l’IA doit évoluer en permanence. Ce qui est vrai à un moment donné peut ne plus l’être à un autre moment. Le flux d’apprentissage doit donc être bien organisé.

Et après ?

En passant de la qualité de la donnée à la qualité de l’information, nous espérons franchir une étape importante dans la mise en œuvre de notre stratégie. L’émergence de l’IA devrait être une alliée de taille. L’intérêt de ma mission ne peut que croître.

Merci Katarina Krcunovic.

— Franck Gryson