No. 11 · Technical

La pile technologique agentique

Les plateformes infonuagiques, les modèles, les passerelles et les contrôles qui sous-tendent les charges de travail agentiques de l'Alberta, et les principes pour les choisir.

Abstract. Dans la mise en œuvre de sa stratégie en matière d'IA, l'Alberta a mis à l'essai une vaste gamme d'outils de codage agentique et de plateformes d'IA générative. Le présent document expose la pile technologique actuelle et les principes qui la sous-tendent : le bon modèle, dans le bon environnement, pour le bon cas d'usage, avec une chaîne d'approvisionnement délibérément diversifiée et des couches d'abstraction qui préviennent la dépendance à un fournisseur. L'Alberta exploite un environnement hybride réparti sur les nuages de Google, d'Azure et d'AWS, une grappe de calcul sur place et trois centres de données hérités, en accédant aux modèles par l'entremise d'AWS Bedrock, de la Google Agent Platform et d'Azure AI Studio. L'information est classifiée d'« non classifié » jusqu'à « Protégé C », les données sensibles sont contrôlées au Canada et le calcul souverain est en cours de développement. L'usage est encadré par la politique d'utilisation de l'IA de l'Alberta, son cadre de gouvernance de l'IA et la Protection of Privacy Act. Le document aborde également les contrôles de sécurité et de chaîne d'approvisionnement entourant les agents, ainsi que le coût et l'échelle de l'exploitation de cette pile. La pile devrait évoluer au fil des outils.

Dans la mise en œuvre de la stratégie de l'Alberta, nous avons mis à l'essai une vaste gamme d'outils de codage agentique et de plateformes d'IA générative, et ce qui suit constitue notre pile actuelle. Nous nous attendons à ce qu'elle évolue à mesure que de nouveaux outils émergent, et nos choix sont guidés par un objectif simple : le bon modèle, dans le bon environnement, pour le bon cas d'usage. Nous avons délibérément diversifié notre chaîne d'approvisionnement en IA, tant pour la capacité que pour la variété nécessaires à couvrir un large éventail de travaux, et nous évitons de confier toutes les charges de travail à un seul fournisseur.


## §01 Choisir les bons outils

L'industrie évolue rapidement, et l'avance change de mains tous les deux mois environ. Google lance un modèle d'images comme Nano Banana 2 qui est stupéfiant, et quelques mois plus tard OpenAI livre GPT Image 2, un nouveau saut qualitatif. Nous demeurons flexibles et utilisons chaque plateforme là où elle convient. Au cours des dix-huit derniers mois, nous avons essayé une gamme de modèles, en naviguant entre Gemini, OpenAI et Anthropic, et en ce moment nous constatons que les modèles Claude d'Anthropic surpassent la plupart des autres. Nous nous attendons à ce que cela change, et la pile est conçue pour le permettre. Pour les travaux présentés dans ces documents de réflexion, nous nous sommes appuyés principalement sur Claude, les modèles Opus et Sonnet, passant de la version 3.5 jusqu'à l'Opus 4.8 d'aujourd'hui et au plus récent Sonnet, et Anthropic a livré des ajouts à Claude Code et aux applications Claude plus vite que nous ne pouvons suivre.

Une couche d'abstraction, comme la passerelle Bifrost, nous permet de déplacer une charge de travail d'un fournisseur à un autre, ou du nuage vers notre propre calcul, à mesure que les besoins et les prix changent. Elle maintient aussi les dépenses sous contrôle, avec des budgets par charge de travail afin que l'utilisation des jetons ne dérape pas. Nous ne conseillerions à aucun gouvernement de mettre tous ses œufs dans le même panier; l'industrie évolue trop rapidement pour cela.


## §02 La pile

L'Alberta exploite un environnement hybride. Nous utilisons les principaux nuages des hyperscalers, Google, Azure et AWS, aux côtés de plusieurs plateformes plus petites, et nous exploitons encore trois grands centres de données hérités qui portent du code, des systèmes et de l'infrastructure plus anciens. Nous exécutons des modèles à code source ouvert sur notre propre grappe de GPU, et nous accédons aux modèles hébergés par l'entremise d'AWS Bedrock, de la Google Agent Platform et d'Azure AI Studio. Nous mettons à l'essai de manière proactive presque tous les modèles qui paraissent : des modèles à code source ouvert sur notre propre matériel pour les charges de travail hors ligne et de niveau Protégé C, et d'autres sur des appareils Mac M5 locaux. Nos principales charges de travail passent par AWS Bedrock et la Google Agent Platform.

La plupart de nos charges de travail agentiques infonuagiques sont déployées dans Google Cloud, tandis que nos applications traditionnelles continuent de s'exécuter dans Azure et AWS. La conteneurisation qui sous-tend cela est décrite dans le document Nexus. Nous examinons également Red Hat OpenShift pour héberger davantage de charges de travail sur notre propre matériel et pour tirer pleinement parti de la capacité des centres de données dont nous disposons déjà.


## §03 Classification et résidence

Le gouvernement de l'Alberta classifie l'information comme non classifiée, Protégé A, Protégé B et Protégé C. Quelques systèmes atteignent le niveau Protégé C, bien que la grande majorité, probablement quatre-vingt-dix-neuf pour cent ou plus, se situe au niveau Protégé B au plus haut. Une grande partie du travail de construction en IA présenté dans ces documents utilise du code et de l'architecture hérités, non classifiés et appartenant au gouvernement, exempts de tout renseignement personnel dans les systèmes de production. Cela nous permet de repenser le fonctionnement du gouvernement, avec l'IA comme bâtisseuse des systèmes de demain, sans que l'IA ne touche ni n'observe jamais les données des citoyens, à moins que cela ne soit véritablement nécessaire.

Toutes les données liées à ces charges de travail sont contrôlées au Canada grâce à nos ententes d'entreprise et à nos garde-fous de plateforme. Selon la charge de travail, nous utilisons du calcul national ou de l'inférence depuis les États-Unis, ce qui est ce qu'offrent principalement les fournisseurs infonuagiques aujourd'hui. Nous travaillons avec chaque fournisseur infonuagique pour amener davantage de matériel au Canada et déplacer toujours plus de charges de travail dans un environnement souverain, et nous suivons de près les consortiums de calcul souverain de Google et de Telus. Nous avons publié une demande de préqualification en calcul souverain invitant des entreprises entièrement canadiennes à contribuer à nos travaux les plus sensibles, et nous appuyons l'objectif du gouvernement du Canada de faire croître l'espace du calcul souverain. Pour les charges de travail liées à la santé et à la sécurité, le contrôle exclusif des données par le gouvernement de l'Alberta est une position non négociable.


## §04 Gouvernance et protection de la vie privée

Nos décisions sont guidées par la politique d'utilisation de l'IA de l'Alberta et par notre cadre de gouvernance de l'IA, qui énoncent les considérations à l'intention de la fonction publique au moment d'adopter l'IA. La protection de la vie privée est encadrée par la Protection of Privacy Act de l'Alberta, qui définit où l'IA peut être utilisée et quand le gouvernement doit réaliser une évaluation des facteurs relatifs à la vie privée et l'enregistrer auprès du Commissariat à l'information et à la protection de la vie privée avant d'aller de l'avant.

Résistance à l'injection d'invites 95-98 %. Même les meilleurs modèles ne résistent au détournement que 95 à 98 pour cent du temps. Aucun modèle aujourd'hui n'est immunisé; l'IA destinée au public et tout ce qui touche aux renseignements personnels est donc évité ou conçu de façon sélective.

Nous sommes délibérément prudents avec l'IA destinée au public. Aucun modèle aujourd'hui ne résiste entièrement à l'injection d'invites, et même les meilleurs ne résistent au détournement que quatre-vingt-quinze à quatre-vingt-dix-huit pour cent du temps. Il existe des cas bien connus de plateformes manipulées et d'agents trompés pour accomplir un travail nuisible au profit d'un instigateur. Ainsi, l'IA destinée au public, et tout ce qui touche aux renseignements personnels, est soit évité, soit conçu de façon sélective, et à ce jour nous avons surtout utilisé des données synthétiques pour valider ce que ces systèmes pouvaient faire et pour donner aux partenaires ministériels un ensemble clair de considérations à soupeser.


## §05 Sécurité et chaîne d'approvisionnement

Nous avons fait preuve de prudence à l'égard des composants d'agents à code source ouvert, par pratique plutôt que par politique. Un harnais, même lorsqu'il ne s'agit que d'un ensemble de fichiers de compétences, est un logiciel, et il doit être vérifié avant utilisation. Il peut véhiculer une injection d'invites, ou une chaîne d'approvisionnement corrompue peut faire en sorte qu'un agent se comporte de façon erratique, et dans le pire des cas l'agent lui-même devient l'auteur de la menace. Nous sommes donc sélectifs quant à ce que nous téléchargeons, et nous l'évaluons au préalable.

Autour des modèles, nous exploitons des passerelles comme Bifrost pour l'abstraction des fournisseurs, la maîtrise des coûts et les contrôles des renseignements personnels, et nous recommandons Microsoft Defender et Purview, ou des équivalents, comme contrôles de prévention des pertes de données, aux côtés de l'outillage intégré de GitHub. Il reste du travail à faire. Nous collaborons avec l'industrie sur l'appareil de sécurité entourant les agents, sur la gestion de l'identité agentique, et sur le suivi et l'observation de l'activité des agents dans le réseau, et nous inviterons des entreprises solides à mettre des outils à l'épreuve des charges de travail gouvernementales par l'entremise du processus de calcul souverain et de futures demandes de propositions. Nous cherchons également des partenariats avec des pairs fédéraux, provinciaux, territoriaux et municipaux afin de maintenir une communauté de pratique active et d'apprendre de la façon dont d'autres gouvernements résolvent les mêmes problèmes.


## §06 Coût et échelle

Nous dépensons maintenant des dizaines de milliers de dollars par mois en jetons de calcul, et nous prévoyons que cela atteindra des centaines de milliers par mois à mesure que les quatre approches seront mises en œuvre et qu'un agent d'IA soutiendra chaque application pour la surveillance, la correction en cybersécurité et le développement. La capacité devient une contrainte : une pénurie d'infrastructure et de mémoire limite le calcul, et même nos ententes d'entreprise, à vingt-cinq à cinquante millions de jetons par minute, seront vraisemblablement dépassées bientôt; nous adoptons donc une approche diversifiée et à charge équilibrée pour le débit.

Une tâche de longue durée 250 agents · 50 jours. Le traitement d'environ 14 millions d'images et de dossiers historiques est évalué à un maximum de 250 agents simultanés s'exécutant pendant jusqu'à 50 jours, à un coût de plusieurs centaines de milliers de dollars, soit peut-être un pour cent du coût du même travail fait à la main.

Ces chiffres de coûts sont intéressants. L'effet le plus marquant de ces outils est qu'ils ouvrent la porte à des travaux que nous n'aurions tout simplement pas entrepris autrement, plus qu'ils ne réduisent le coût des travaux que nous faisons déjà. À mesure que les outils deviennent disponibles, l'appétit pour la création de nouveaux services utiles et le besoin de résorber la dette technique croissent de pair. Notre objectif est de moderniser à un rythme rapide et d'offrir des services bonifiés, avec des centaines de millions par année en coûts évités et un effectif stable, et de passer de technologies verrouillées par les fournisseurs vers des plateformes qui nous donnent de la latitude à mesure que nous prenons de l'ampleur. Nous explorons l'IA pour les raisons exposées dans L'impératif de la cybersécurité et le navire de Thésée à deux milliards de dollars, et nous prenons soin de ne pas échanger un problème contre un autre.

Tags: tech-stack, cloud, models, sovereign-compute, bifrost, security, governance, open-source

Open the interactive version