Emile Marzolf @emile_marzolf, Twitter Profile

Emile Marzolf @emile_marzolf

2 weeks ago

🤖Je vois que l’IA générative “Albert” de l’Etat fait beaucoup parler, intéresse et est aussi critiquée/moquée. On retrace la genèse de ce projet, aujourd’hui testé à petite échelle auprès d’une soixantaine de conseillers des maisons France Services ⤵️

Emile Marzolf @emile_marzolf

2 weeks ago

8 99 220 136K 156

16 149 321 119K 259

Emile Marzolf @emile_marzolf

2 weeks ago

Rappelons les bases : Albert n’est pas un grand modèle de langue créé de toutes pièces, mais une adaptation de Llama 2 (puis de Mistral), réentrainée sur des données administratives, pour en faire un modèle plus spécialisé pour le service public mais toujours très généraliste.

1 2 17 5K 1

Emile Marzolf @emile_marzolf

2 weeks ago

Par ailleurs, il n'a à voir avec le modèle Bert de Google.

1 0 16 5K 0

Emile Marzolf @emile_marzolf

2 weeks ago

Albert, c'est un socle technologique qui permet de décliner des LLM sur des cas d‘usages spécifiques de chaque administration, rééentrainés ou branchés sur des bases documentaires (RAG). Pour en faciliter la diffusion dans l'administration.

3 2 20 6K 3

Emile Marzolf @emile_marzolf

2 weeks ago

Cette approche a le mérite d’améliorer la fiabilité des réponses et de limiter les hallucinations. Et aussi le mérite de la “frugalité” : pas besoin d'immenses modèles de langue très gourmands en puissance de calcul, les GPU n'étant pas donnés.

1 1 16 5K 0

Emile Marzolf @emile_marzolf

2 weeks ago

Albert est présenté comme une “IA souveraine, libre et ouverte”, c’est bien joli mais ça veut dire quoi ? Que l’Etat a repris des modèles ouverts, s’est fait la main et développé toute une couche par-dessus pour utiliser des LLM open source dans le public, quel que soit le LLM.

1 1 13 4K 0

Emile Marzolf @emile_marzolf

2 weeks ago

Ca veut aussi dire que tout est mis sur des infrastructures sécurisées internes. Pas de risque de fuite de données confidentielles chez OpenAI ou chez Microsoft. L'Etat reste néanmoins dépendant des modèles existants.

1 0 19 4K 1

Emile Marzolf @emile_marzolf

2 weeks ago

Le projet a commencé il y a un an environ, quand la vague ChatGPT avait déjà bien déferlé. Les datascientists de l’Etat ont commencé à jouer avec des LLM ouverts et avec GPT. Puis le projet Albert a pris forme pour construire un socle techno mutualisé et réutilisable.

1 0 13 4K 0

Emile Marzolf @emile_marzolf

2 weeks ago

En parallèle un autre projet fait beaucoup plus de bruit : c’est l'expérimentation sur la plateforme ServciesPublics+. Le but, c’est de pré-rédiger des réponses aux avis laissés par les usagers sur ce TripAdvisor du service public. Toujours avec la validation de l’agent.

1 0 13 4K 2

Emile Marzolf @emile_marzolf

2 weeks ago

Voyez les résultats par vous-mêmes, rien d’extraordinaire, mais c’est le cas d’usage qui veut ça. Ça a le mérite d’être facile à développer/entraîner, de n’utiliser que des données publiques et anonymes, et de tester l’appétence des agents. plus.transformation.gouv.fr/experiences/43…

2 4 19 7K 3

Download Image

Emile Marzolf @emile_marzolf

2 weeks ago

Et mine de rien, les résultats sont positifs : délais de réponse réduits de 19 jours à 3,3 jours en moyenne en quelques mois, et satisfaction des usagers supérieure pour les réponses générées par IA (de 11 points). L'outil va être ouvert aux 6 000 agents chargés de répondre.

2 10 50 7K 6

Emile Marzolf @emile_marzolf

2 weeks ago

De son côté, la DSI de l’Etat continue donc le développement d’Albert : elle réentraîne des (petits) modèles sur des corpus de textes administratifs et construit toute la tuyauterie pour reprendre ces modèles et les spécialiser.

1 0 10 4K 0