No. 07 · Technical

Les agents rouge, bleu, vert et jaune

Quatre agents de révision, intégrés au harnais, qui vérifient chaque application sur le plan de la qualité, de la cohérence et de la sécurité avant sa mise en service.

Abstract. Si l'IA écrit et répare le code, il faut bien que quelque chose vérifie l'IA. Quatre agents de révision se trouvent à l'intérieur du harnais, chacun surnommé d'après une couleur. Le vert vérifie la qualité et l'hygiène du code. Le jaune vérifie la façon dont les textes se lisent. Le rouge attaque l'application comme le ferait une personne de l'extérieur. Le bleu la défend, évalue le code par rapport à une norme de sécurité internationale et transforme les éléments de preuve en un verdict sur lequel un décideur peut s'appuyer. Ces agents sont intégrés au harnais à titre de freins et contrepoids : un travail ne peut être considéré comme terminé tant qu'il n'a pas réussi. La sécurité et la qualité cessent d'être quelque chose que l'on poursuit après coup pour devenir des préoccupations de premier plan.

Les documents précédents ont exposé deux moitiés d'un même problème. Nous pouvons maintenant repérer ce qui ne va pas dans l'ensemble du parc, de la pression cybernétique croissante à l'état de santé de chaque dépôt, et nous disposons de quatre façons de le reconstruire. Les deux moitiés s'appuient sur l'IA pour faire le travail. Cela soulève la question évidente. Si une IA écrit ou répare le code, qui vérifie l'IA? Quatre agents de révision, chacun nommé d'après une couleur, se trouvent à l'intérieur du harnais et inspectent chaque application sur le plan de la qualité, de la cohérence et de la sécurité. Ils sont les freins et contrepoids de tout ce que les bâtisseurs produisent.

## §01 Qui vérifie l'IA

Les couleurs proviennent de la pratique de la sécurité, où le rouge est l'attaquant et le bleu est le défenseur. Nous en avons ajouté deux autres. Le vert couvre la qualité et l'hygiène du code. Le jaune couvre la façon dont le contenu se lit. Chaque couleur est un agent distinct et examine le travail sous un angle que les autres n'ont pas. Un développeur exécute chaque agent tout au long du cycle de développement et à chaque jalon du projet.

Les quatre sont répartis à dessein entre le travail mécanique et le travail de jugement. Le vert et le jaune sont entièrement déterministes : donnez-leur le même code et ils retournent les mêmes constats chaque fois. La reconnaissance du rouge est déterministe elle aussi, avec une étape qui utilise Claude pour planifier le déroulement d'une attaque. Le bleu relève surtout du jugement, celui qu'apporte un réviseur chevronné. C'est le déterminisme qui permet à un agent d'agir comme une porte qui ne dérive jamais. C'est le jugement qui détecte le problème qu'une liste de vérification manquerait. Le harnais utilise chacun là où il convient.

## §02 Vert : qualité et hygiène

Le vert est le fondement, et il s'exécute en premier. Il lit le code et rapporte les faits bruts sur son état de santé. Quelles dépendances comportent des vulnérabilités connues. Si un mot de passe ou une clé a été intégré dans la source. Si des motifs dangereux sont présents. Quelle proportion du code les tests couvrent réellement. Il travaille en deux passes : la première lit le code sans l'exécuter, la seconde exécute les tests existants et observe ce qui se produit, y compris quelles parties du code les tests n'effleurent jamais.

Parce que le vert est déterministe, le même code produit toujours les mêmes constats. C'est ce qui en fait la base de données probantes sur laquelle chacun des autres agents s'appuie. Il ne devine pas; il compte. Lorsqu'il signale un fichier presque dépourvu de couverture de tests, ou un secret laissé dans la source, ce constat est un fait plutôt qu'une opinion, et il peut être vérifié deux fois de la même manière.

## §03 Jaune : la façon dont le contenu se lit

Le jaune lit le contenu de l'application. Les logiciels gouvernementaux comportent beaucoup de prose : la documentation, le contenu de l'interface, les notes de version, les messages qu'un citoyen voit réellement. Quand l'IA rédige cette prose, elle laisse des indices, ces tournures de phrase qui marquent un texte comme produit par une machine et érodent discrètement la confiance. On appelle souvent ces indices une « odeur d'IA ». Le jaune applique douze règles à chaque texte du projet et signale chaque indice avec la ligne fautive, une réécriture simple et une courte note expliquant pourquoi cela se lit comme si une machine l'avait écrit.

Ce sont les mêmes règles qui régissent les documents que vous lisez en ce moment. Un tiret cadratin, un cliché tout fait, une ouverture flagorneuse, un « ensure » tenant lieu d'un vrai verbe : chacun est détecté et nommé. Le principe est simple. Si le public doit le lire, cela devrait se lire comme si une personne l'avait écrit. Le jaune est le moins coûteux des quatre à exécuter, une affaire de secondes, et il fait en sorte que tout le parc sonne humain.

## §04 Rouge : l'attaquant

Le rouge est l'attaquant. Il regarde une application terminée comme le ferait une personne de l'extérieur animée de mauvaises intentions, de l'extérieur vers l'intérieur. Il cartographie le domaine et ses sous-domaines, recherche les ports ouverts, vérifie le chiffrement et les en-têtes de sécurité, et détermine quelles technologies sont utilisées. Cette reconnaissance repose sur des outils ordinaires et reproductibles, et elle s'exécute sur n'importe quelle machine sans configuration particulière.

Puis le rouge fait la partie qui exigeait autrefois un spécialiste. Il raisonne sur tout ce qu'il a trouvé et planifie comment il s'introduirait, en proposant des chemins d'attaque concrets : contourner une connexion, enchaîner un exploit à distance, faire sortir des données par une porte dérobée. Dans cette étape de planification, c'est Claude qui réfléchit, et c'est la seule partie du rouge qui varie d'une exécution à l'autre. Le rouge ne s'exécute jamais que contre des systèmes que le gouvernement possède et a autorisés aux fins de test. Son travail consiste à trouver la faille avant que quelqu'un d'autre ne le fasse, et à remettre à l'agent suivant une carte de la façon dont une attaque se déroulerait réellement. C'est l'adversaire qui aide à mettre à mal votre application bien avant qu'elle ne soit lancée dans le monde.

## §05 Bleu : le défenseur

Le bleu est le défenseur, et il s'exécute en dernier parce qu'il lit tout ce que les autres ont trouvé. Il bâtit une carte de l'application, classe le degré de sensibilité de chaque partie et rédige un modèle de menaces. Puis il parcourt chaque exigence de la norme OWASP Application Security Verification Standard au niveau 2, le référentiel international pour une application Web sérieuse, et consigne chacune comme réussie, en échec ou sans objet, avec les éléments de preuve derrière la décision. Il vérifie le même code par rapport à la norme d'architecture de cybersécurité de l'Alberta, intègre la reconnaissance du rouge dans une image étape par étape de la façon dont une attaque se déroulerait, et rédige des tests de sécurité qui prouvent que chaque correctif tient.

Le dernier geste du bleu est de rédiger le rapport sur lequel un décideur peut s'appuyer. Un sommaire exécutif. Les constats classés par gravité. Les normes respectées et manquées. Un plan de correction qui pointe vers les fichiers exacts. Là où le vert compte et le rouge sonde, le bleu juge, à la manière d'un architecte de sécurité chevronné, et transforme une montagne d'éléments de preuve en un verdict défendable qu'un vérificateur peut suivre.

## §06 Quatre agents, un seul système de freins et contrepoids

Pris séparément, chaque agent est utile. Ensemble, ils forment un système de freins et contrepoids. Le vert et le jaune s'exécutent en premier et rapidement, côte à côte. Le rouge attaque de l'extérieur. Le bleu prend les éléments de preuve déterministes du vert et l'image d'attaque du rouge et rend le jugement. Les agents déterministes fournissent des portes qui ne régressent jamais; le bleu fournit la lecture experte qu'une liste de vérification seule manquerait. Aucun agent à lui seul ne pourrait faire tous les travaux, alors le travail est divisé en quatre et recombiné à la fin.

Ce qui transforme ces révisions de conseils en application obligatoire, c'est qu'elles sont intégrées au harnais à titre de portes. Le harnais ne laissera pas un travail être considéré comme terminé si l'analyse de sécurité révèle un constat critique, si l'analyse est périmée ou si la révision n'a jamais été exécutée. Chaque « à faire absolument » est appuyé par une vérification qui échoue bruyamment lorsqu'elle est ignorée. Les portes sont mécaniques, et non aspirationnelles.

Réparties sur seize catégories, de l'authentification et de la gestion des sessions à la protection contre les requêtes intersites, la validation des entrées et l'hygiène de la chaîne d'approvisionnement. Le parc devient un peu plus sécuritaire à chaque passage, et la leçon est conservée plutôt que réapprise.

Contrôles de sécurité intégrés au gabarit par rapport auquel les agents vérifient ~95. Les quatre agents vérifient chaque application par rapport à ce référentiel à chaque passage.

"La sécurité et la qualité cessent d'être quelque chose que l'on poursuit après coup pour devenir une propriété de la façon dont le code est fabriqué." · Document 7 · Les agents rouge, bleu, vert et jaune

Les applications produites en collaboration avec ces quatre agents répondent aux défis critiques soulevés dans L'impératif cybernétique. Les méthodes de construction de Les quatre approches peuvent être exécutées en toute sécurité à grande vitesse. Les bâtisseurs obtiennent leur vitesse, et le public obtient un code qui a été attaqué, défendu et relu avant même de lui parvenir.

## §07 Sur quoi cela fonctionne : Claude, l'Agent SDK et Vertex

Tout cela fonctionne sur la plateforme Claude d'Anthropic. Les agents déterministes, le vert, le jaune et la reconnaissance du rouge, sont du code ordinaire qui n'a besoin d'aucun modèle. Les parties qui exigent du jugement, le planificateur d'attaque du rouge et l'ensemble de l'évaluation du bleu, sont bâties avec le Claude Agent SDK, la trousse d'outils permettant de faire fonctionner un modèle à travers de nombreuses étapes avec un ensemble fixe d'outils et un budget de tours. Le harnais fixe quel modèle fait quel travail et jusqu'où il est autorisé à aller, de sorte qu'une révision est reproductible et que son coût est connu avant qu'elle ne commence.

L'Alberta fait fonctionner ces modèles au moyen de Claude sur Google Vertex AI, désormais la Google Agent Platform. Cela maintient le travail à l'intérieur d'un nuage canadien encadré, le fournisseur du modèle étant tenu derrière une frontière nette afin qu'il puisse être changé à mesure que le domaine évolue. Cette même frontière permet de tester un modèle local ou ouvert par rapport au modèle commercial sur un travail identique, ce qui importe à mesure que l'économie change. Les agents ne se soucient pas du modèle qui répond, seulement que la réponse satisfait à la norme.

## §08 Ce que cela apporte aux bâtisseurs

Les quatre agents sont la façon dont l'Alberta fait de « l'IA l'a construit » une phrase à laquelle un réviseur de sécurité peut se fier. Ils détectent ce qu'une personne fatiguée manquerait, ils ne sautent jamais une étape, et ils transforment la qualité et la sécurité d'un espoir en une porte que le code doit franchir. Les bâtisseurs avancent plus vite parce que le filet de sécurité est automatique et toujours actif, et parce qu'un problème détecté devient une règle permanente plutôt qu'une surprise récurrente.

Avec le harnais et ses agents de révision en place, la question se tourne vers l'usine qui les met au travail sur chaque construction. Les prochains documents ouvrent cette usine : là où les applications sont conçues et spécifiées, là où les agents les construisent et les testent sous ces mêmes contrôles, et là où le travail est suivi et mesuré.

Tags: security, agents, harness, red-team, quality

Open the interactive version