Lexior Logo

Lexior Simulator

Papier de recherche

Modélisation de la Continuité Identitaire et Cohérence Décisionnelle dans les Systèmes Multi-Agents Complexes

L'Architecture Neuro-Symbolique PIE (Probabilistic Identity Engine) pour le Stress-Test de Stratégies Judiciaires
Date : Juin 2026 Classification : Papier de recherche Département : Intelliwork IA & Sciences Cognitives Appliquées

01. Résumé du Projet et Objectifs Scientifiques

Les architectures classiques d'agents autonomes basées sur des modèles de langage de grande taille (LLM) souffrent d'une absence inhérente de continuité comportementale et d'une uniformisation de leurs décisions. Face à des stimuli complexes et contradictoires, ces modèles tendent à converger vers des réponses lissées et neutres, conséquence directe des mécanismes d'alignement post-entraînement par rétroaction humaine (RLHF).

Ce projet de recherche introduit le Probabilistic Identity Engine (PIE), une architecture logicielle neuro-symbolique hybride visant à surmonter ces verrous en maintenant une cohérence décisionnelle stable à travers des cycles de simulation longs. Ce système résout l'absence de continuité comportementale par l'implémentation d'un espace d'états d'un système dynamique multi-agents régulé par des couches logiques symboliques persistantes, assurant la plasticité et la persistance des variables d'état sous contraintes de fenêtres de contexte limitées.

1.1 Hypothèses de Recherche

Nous postulons que l'absence de continuité comportementale des LLMs sous alignement RLHF peut être résolue par la superposition d'un moteur d'intégrité cognitive symbolique externe (PIE) régulant le flux contextuel par rétroaction d'états physiques (tensions, inertie mémorielle). Plus précisément, nous émettons l'hypothèse que :

  • Hypothèse Principale (Continuité) : L'expression de tensions internes persistantes régulées par un tenseur d'inertie logarithmique évite la dérive de comportement et force l'agent à maintenir une ligne logique stable même sous stimuli fortement contradictoires.
  • Hypothèse Secondaire (Non-Convergence) : L'introduction d'un puits de potentiel d'hystérésis prévient la convergence stochastique vers la neutralité standard des LLMs de base, préservant ainsi la singularité de la personnalité de l'agent.

02. Verrous Technologiques et État de l'Art

Dans l'état de l'art actuel, la modélisation de comportements d'agents simulés repose majoritairement sur des prompts système statiques couplés à des bases de connaissances vectorielles par génération augmentée par récupération (RAG) (Park et al., 2023 ; Li et al., 2023). Ces architectures conventionnelles se heurtent à trois verrous technologiques majeurs :

1. Nature Apatride (Stateless)

L'agent LLM ne dispose d'aucune dérive dynamique de son comportement basée sur son historique d'exécution. L'état d'évaluation mathématique s'effondre à chaque appel de l'API, interdisant toute trajectoire comportementale à long terme.

2. Saturation & Dérive de Mémoire

La mémoire vectorielle classique cherche à maximiser la restitution d'informations factuelles, sans modéliser les biais attentionnels restrictifs et les phénomènes d'atténuation requis pour simuler les limites de la rationalité humaine (Schacter, 1999).

3. Instabilité Décisionnelle Inter-Cycles (Effet Verdict Flip-Flop)

Lors de simulations de procès itératives, les modèles subissent des incohérences de verdict d'un round à l'autre (ex. coupable au round 1, non-coupable au round 2 sans fait nouveau significatif), causées par le manque de persistance structurelle de l'état logique.

03. Formalisation de l'Espace d'États Persistant (Neuro-Symbolique)

Pour surmonter ces verrous, nous modélisons l'identité et le profil décisionnel de l'agent à l'instant t par un vecteur d'état St évoluant dans un espace produit hybride continu-discret H :

St = ⟨ Tt, Pt, Mt ⟩ ∈ H

Où :

  • Tt ∈ ℜn : représente l'espace continu des variables de régulation logique internes de l'agent. Dans le cadre d'un procès judiciaire, ces variables modélisent les axes professionnels déontologiques : Procédure vs Équité, Offensive vs Négociation, Prudence vs Rapidité.
  • Pt ∈ Δk : représente l'espace des croyances sémantiques formalisé par des simplexes de probabilité. Ce formalisme s'appuie directement sur les modèles d'apprentissage bayésien et de structuration de l'esprit sous incertitude théorisé par Tenenbaum et al. (2011).
  • Mt ∈ Edisc : désigne l'espace discret des configurations d'état logique et de la posture de l'agent (ex. Coopératif, Méfiant, Paranoïaque, Isolé).

La trajectoire temporelle globale de l'agent s'exprime comme : S0 → S1 → ... → St.

04. Mécanisme de Transition et Stabilisation Algorithmique

4.1 Plasticité vs Inertie Logique

Afin de prévenir des oscillations erratiques sous l'effet de stimuli contradictoires, nous implémentons un tenseur d'inertie It. La mise à jour d'une variable de tension Ti suite à une action a obéit à l'équation différentielle discrète suivante, régissant la plasticité du système :

Ti(t+1) = clip( Ti(t) + αi • Δa • (1 - Ii(t)), -1, 1 )

αi désigne le coefficient de plasticité intrinsèque attribué à l'agent, et Δa représente le gradient d'influence sémantique de l'action choisie sur la tension.

4.2 Calcul de l'Inertie Mémorielle

L'inertie Ii(t) est dérivée symboliquement de la densité de connexions sémantiques et de l'activation des souvenirs persistants dans le graphe relationnel de l'agent :

Ii(t) = tanh( γ • ∑m ∈ Mactive wm(t) • cos(θm, Ti) )

L'utilisation de la fonction non linéaire tangente hyperbolique (tanh) agit ici comme un filtre de saturation à attracteur, évitant la divergence du système lorsque la densité mémorielle croît.

Stabilisation de la trajectoire comportementale : PIE vs Contrôle
1.0 (Offensif) 0.5 0.0 (Prudent) Initial Stimulus 3 Stimulus 7 Stimulus 11 Stimulus 15 Modèle Standard (Oscillations erratiques) Framework Lexior PIE (Inertie stabilisée)
Figure 1 : Simulation comparative de la dérive de tension comportementale. Le tenseur d'inertie de PIE prévient la versatilité en stabilisant la réponse de l'agent autour d'un attracteur décisionnel (amortissement par tanh).

05. Modélisation de la Dérive d'État par Hystérésis

L'état discret Mt évolue selon un processus de transition contrôlé par les écarts sémantiques mesurés par similarité cosinus (embeddings) lors d'interactions asynchrones.

Afin de simuler des attracteurs décisionnels persistants, certains états logiques agissent comme des puits de potentiel. La probabilité de sortie d'un état fortement contraint (ex. Paranoïaque) vers l'état Neutre sous l'effet d'une interaction collaborative c s'écrit :

P(Mt+1 = Neutre | Mt = Paranoïaque, c) = Pbase • (1 - λhyst) • eneg

λhyst représente le coefficient d'hystérésis logique du système et φneg représente la somme des forces d'activation des souvenirs d'interactions à connotation négative cumulées. Tant que les souvenirs négatifs restent actifs en mémoire, la barrière de potentiel pour modifier la décision de l'agent demeure infranchissable.

Cycle d'hystérésis comportementale : Transition émotionnelle asymétrique
Neutre Méfiant Paranoïaque Isolé R0 R1 (Attaque) R2 (Attaque) R3 (Impasse) R4 (Respect) R5 (Accord) R6 (Accord) Stress ➔ Potentiel d'Hystérésis ➔
Figure 2 : Cycle d'hystérésis décisionnel. Deux actions de stress suffisent à basculer l'état dans l'impasse délibérative, alors qu'il faut trois interactions positives consécutives pour vaincre l'attracteur négatif persistant.

06. Couche d'Interface Neuro-Symbolique

La nature stateless du LLM requiert une couche d'interface algorithmique pour intercepter les flux, calculer les états dynamiques et réinjecter les contraintes dans le cycle contextuel suivant.

La boucle de traitement s'articule comme suit :

  • Interception : Récupération de la sortie brute générée par le modèle au round t.
  • Extraction sémantique : Projection de l'action dans l'espace d'embedding et calcul de Δa par similarité cosinus.
  • Mise à jour logicielle : Application de l'équation de régulation symbolique pour actualiser les tensions logiques et l'inertie.
  • Injection de contraintes : Sérialisation de l'état logique mis à jour sous forme d'ancrages textuels immuables injectés directement dans le prompt système à l'étape t+1, forçant le modèle à s'aligner sur la trajectoire mathématique.

07. Architecture Système et Pipeline de Données

Le cycle décisionnel complet d'une simulation s'exécute selon les étapes logiques du pipeline de données :

  1. Génération d'Experts : Le modèle local génère en parallèle K propositions d'actions distinctes, représentant des axes stratégiques différents.
  2. Calcul de la Surprise Narrative : Le système évalue l'écart entre la croyance interne de l'agent Pt et chaque action proposée, en utilisant la divergence de Kullback-Leibler (DKL), opérationnalisant le principe d'énergie libre de Friston (2010) :
    S(a) = DKL( Pt || Q(a) ) = ∑ Pt(x) • log( Pt(x) / Q(a|x) )
  3. Filtrage Attentionnel : Pondération des propositions selon les tensions actives Tt et les biais psychologiques configurés.
  4. Stochastic Collapse : L'action finale est échantillonnée par une distribution de Boltzmann sur les énergies effectives calculées, éliminant les réponses stochastiques absurdes tout en favorisant la pertinence logique :
    P(ai) = exp(-E(ai)/τ) / ∑ exp(-E(aj)/τ)

08. Incertitudes Technologiques et Échecs Expérimentaux

8.1 Résolution du Phénomène de « Prompt Bleeding »

Défaillance constatée : Lors de simulations de longue durée, l'accumulation linéaire des souvenirs dans le contexte provoquait une saturation de la mémoire de travail active, entraînant des latences supérieures à 5 secondes par round et des hallucinations où les agents confondaient les identités.

Résolution : Implémentation d'un filtre d'attention cognitive adaptatif limitant les souvenirs injectés dans le prompt à ceux ayant un poids d'activation supérieur à un seuil wseuil. Les souvenirs secondaires sont sérialisés dans une base vectorielle froide, limitant le contexte à 2.5k tokens et réduisant drastiquement le temps d'inférence.

Analyse expérimentale : Impact du filtre attentionnel sur la latence locale
0s 2.5s 5.0s (Seuil critique) 10 souvenirs 50 souvenirs 100 souvenirs 200 souvenirs Sans filtre attentionnel (Prompt Bleeding) Avec Lexior Attention Filter (Stable)
Figure 3 : Latence d'inférence en fonction du volume de souvenirs accumulés. L'Attention Filter maintient la latence sous 1s en préservant le budget de tokens du modèle de langage.

8.2 Résolution du Verdict Flip-Flop

Défaillance constatée : Le Juge changeait de verdict de manière incohérente entre les rounds sans justification, dû au manque de mémoire structurelle entre les appels HTTP stateless.

Résolution : Conception d'une boucle symbolique Python réinjectant les conclusions du tour précédent sous forme d'ancrages factuels immuables en base persistante Kuzu DB, stabilisant les verdicts à moins qu'un stimulus ou élément de preuve majeur ne traverse la barrière énergétique d'hystérésis.

09. Données Métriques (Preuves d'Essais)

Des tests de validation systématiques ont été menés sur un ensemble de 100 simulations complètes pour mesurer l'efficacité pratique du modèle PIE face aux architectures d'agents autonomes classiques (Baseline) :

Modèle & Architecture Infrastructure Taille de Contexte Moyen Latence Moyenne / Round Taux de Cohérence (0-1)
Baseline (Gemini 2.5 Flash) API Cloud (Google) 4.0k tokens 1.37s 0.35 (Divergence rapide)
PIE Framework (Gemini 2.5 Flash) API Cloud (Google) 2.5k tokens (filtré) 1.21s 0.92 (Stabilité absolue)
Baseline (Qwen3 8B) Inférence Locale (Ollama) 4.0k tokens 9.40s 0.28 (Fluctuations verdict)
PIE Framework (Qwen3 8B) Inférence Locale (Ollama) 2.5k tokens (filtré) 6.79s 0.86 (Cohérence stable)

Note de test : Sous le PIE Framework, les latences d'inférence locale ont diminué de 28% grâce au filtrage de tokens. Le taux de cohérence décisionnelle et l'absence de flip-flop verdict s'améliorent de plus de 160% sur les simulations complexes de procès.

Analyse comparative du taux de cohérence identitaire
0.0 0.5 1.0 35% Gemini Baseline 92% Gemini PIE 28% Qwen Baseline 86% Qwen PIE
Figure 4 : Taux de cohérence identitaire et décisionnelle par modèle. Le framework PIE évite la dérive stochastique du comportement par rapport aux baselines non régulées.

9.1 Validation Expérimentale des Hypothèses

Les données métriques recueillies confirment de manière empirique nos hypothèses de recherche initiales :

  • Validation de l'Hypothèse de Continuité : Le taux de cohérence identitaire s'élève à 0.92 pour Gemini et 0.86 pour Qwen sous le framework PIE, contre respectivement 0.35 et 0.28 pour la baseline. L'injection d'ancrages de tensions psychologiques (Tt) et d'inertie (It) régulée par tanh empêche efficacement la dérive identitaire et stabilise les postures comportementales.
  • Validation de l'Hypothèse de Non-Convergence : La dynamique d'attracteur par hystérésis a permis d'éliminer totalement l'effet de lissage et de neutralisation décisionnelle induit par RLHF. Les agents simulés maintiennent des positions contradictoires fermes conformes à leur rôle (Défense vs Demandeur) sans converger vers un consensus artificiel neutre, validant la pertinence de la barrière énergétique modélisée.