🤖Je vois que l’IA générative “Albert” de l’Etat fait beaucoup parler, intéresse et est aussi critiquée/moquée. On retrace la genèse de ce projet, aujourd’hui testé à petite échelle auprès d’une soixantaine de conseillers des maisons France Services ⤵️
🤖Je vois que l’IA générative “Albert” de l’Etat fait beaucoup parler, intéresse et est aussi critiquée/moquée. On retrace la genèse de ce projet, aujourd’hui testé à petite échelle auprès d’une soixantaine de conseillers des maisons France Services ⤵️
Rappelons les bases : Albert n’est pas un grand modèle de langue créé de toutes pièces, mais une adaptation de Llama 2 (puis de Mistral), réentrainée sur des données administratives, pour en faire un modèle plus spécialisé pour le service public mais toujours très généraliste.
Par ailleurs, il n'a à voir avec le modèle Bert de Google.
Albert, c'est un socle technologique qui permet de décliner des LLM sur des cas d‘usages spécifiques de chaque administration, rééentrainés ou branchés sur des bases documentaires (RAG). Pour en faciliter la diffusion dans l'administration.
Cette approche a le mérite d’améliorer la fiabilité des réponses et de limiter les hallucinations. Et aussi le mérite de la “frugalité” : pas besoin d'immenses modèles de langue très gourmands en puissance de calcul, les GPU n'étant pas donnés.
Albert est présenté comme une “IA souveraine, libre et ouverte”, c’est bien joli mais ça veut dire quoi ? Que l’Etat a repris des modèles ouverts, s’est fait la main et développé toute une couche par-dessus pour utiliser des LLM open source dans le public, quel que soit le LLM.
Ca veut aussi dire que tout est mis sur des infrastructures sécurisées internes. Pas de risque de fuite de données confidentielles chez OpenAI ou chez Microsoft. L'Etat reste néanmoins dépendant des modèles existants.
Le projet a commencé il y a un an environ, quand la vague ChatGPT avait déjà bien déferlé. Les datascientists de l’Etat ont commencé à jouer avec des LLM ouverts et avec GPT. Puis le projet Albert a pris forme pour construire un socle techno mutualisé et réutilisable.
En parallèle un autre projet fait beaucoup plus de bruit : c’est l'expérimentation sur la plateforme ServciesPublics+. Le but, c’est de pré-rédiger des réponses aux avis laissés par les usagers sur ce TripAdvisor du service public. Toujours avec la validation de l’agent.
Voyez les résultats par vous-mêmes, rien d’extraordinaire, mais c’est le cas d’usage qui veut ça. Ça a le mérite d’être facile à développer/entraîner, de n’utiliser que des données publiques et anonymes, et de tester l’appétence des agents. plus.transformation.gouv.fr/experiences/43…
Et mine de rien, les résultats sont positifs : délais de réponse réduits de 19 jours à 3,3 jours en moyenne en quelques mois, et satisfaction des usagers supérieure pour les réponses générées par IA (de 11 points). L'outil va être ouvert aux 6 000 agents chargés de répondre.
De son côté, la DSI de l’Etat continue donc le développement d’Albert : elle réentraîne des (petits) modèles sur des corpus de textes administratifs et construit toute la tuyauterie pour reprendre ces modèles et les spécialiser.