|
|
Master Recherche Informatique |
|
|
||
Comme nous l'avons vu dans l'introduction, les outils de modélisation
mathématiques se révèlent parfois insuffisant dans l'analyse de systèmes
complexes où de forts liens d'interactions sont en jeu.
Nous étudierons ici les cas d'applications de la simulation à base de systèmes
multi-agents à des parties de la science économique qui s'y prêtent
particulièrement, la macroéconomie et la microéconomie.
Définitions paradigmatiques
La théorie des jeux simulée
Le dilemme du prisonnier
La négociation simulée
Le modèle de ségrégation de Schelling
Simulation du marché
Modélisation des échanges
De l'économie cognitive à la simulation par agents
Exemples conceptuels a partir de la plateforme Moduleco
Conclusion
La macroéconomie et la microéconomie sont des parties de la science
économique, nous allons ici en décrire les paradigmes afin de définir quels
modèles peuvent être appliqués aux simulations.
La macroéconomie étudie le comportement des agrégats, tels que le produit
national brut (PNB), le revenu, le taux de chômage, la balance des paiements ou
le taux d’inflation. Elle analyse la formation du revenu national à travers
celle de ses composantes : la consommation, l’investissement, les dépenses
publiques et les échanges avec l’étranger. Elle se distingue de la
microéconomie, qui analyse les comportements individuels des agents économiques
(entreprise, consommateur, entrepreneur individuel), dans leurs activités de
production, de consommation, d’investissement et d’épargne. Faisant de l’unité
économique individuelle l’objet privilégié de son étude, la microéconomie
s’inscrit pleinement dans la démarche des économistes de l’école classique et
de l’école marginaliste, qui suppose que les marchés sont en situation de
concurrence pure et parfaite, que les prix sont donnés, et que la variation des
grandeurs économiques ne peut être la résultante d’initiatives isolées.
La microéconomie se distingue de la macroéconomie, qui étudie les conditions
optimales d’utilisation des ressources disponibles et les conséquences de leur
variation en ne considérant que les grandeurs économiques agrégées. Cependant,
il existe des liens entre microéconomie et macroéconomie, dans la mesure où les
principales divergences entre les courants de la pensée macroéconomique
trouvent leur origine dans des différences de conceptions d’ordre
microéconomique. C’est par exemple le cas pour le rôle à accorder aux taux
d’intérêt dans la régulation de l’activité économique globale, ce qui constitue
un problème macroéconomique, mais dont la source est d’ordre microéconomique,
puisqu’il procède d’une différence de conception sur la motivation des agents
économiques dans leur demande de monnaie.
On comprends alors en quoi ces deux domaines sont a la fois duaux et
complémentaires.
![]()
La théorie des jeux est une branche de la science économique relative à la
description ou à la prévision de comportements économiques à l'aide de concepts
et de techniques tirés de la théorie des jeux née des mathématiques. De
nombreuses décisions économiques sont influencées par la réaction attendue de
la part d'autres agents économiques. Un exemple connu est le comportement des
entreprises sur un marché où chacune d'elles dispose d'une grande part de
marché (on parle alors d'un oligopole), de sorte que la politique de prix de
l'une quelconque des sociétés est fonction de la réaction attendue de la part
des autres. Par exemple, la société peut décider ou non de baisser son prix,
selon qu'elle s'attend à ce que ses concurrents la suivent où laisseront leurs
prix inchangés. De la même manière, la stratégie d'un syndicat négociant avec
la direction d'une entreprise dépend de la stratégie qu'il croit adoptée par la
direction.
L'observation des interactions entre agents économiques a fait entrer la
théorie des jeux dans la science économique. Cette théorie est née en 1944 avec
l'ouvrage de John von Neumann et Oskar Morgenstern, la Théorie des jeux et du
comportement économique. Ses applications s'étendent bien au-delà de l'économie
et constituent une théorie générale de choix rationnels, dans des conditions
d'incertitude sur les choix des autres « joueurs ». La théorie s'applique
également dans le domaine des relations internationales, par exemple lorsqu'on
analyse différentes stratégies possibles de défense nucléaire.
La théorie des jeux offre des analogies avec des jeux familiers tels que les
échecs ou le bridge, dans lesquels la stratégie de chaque joueur dépend des «
coups » ou des choix que les autres joueurs sont sensés effectuer. Mais
l'analogie s'arrête là. En effet, pour déduire une stratégie optimale avec
plusieurs suppositions sur les choix des autres agents économiques, la théorie
des jeux doit tenir compte d'objectifs variés, des conséquences de l'adoption
de différentes stratégies, de la possibilité ou non d'alliances entre les
joueurs, du degré de contrainte des contrats passés entre joueurs (les
fréquents échecs des pays membres de l'Organisation des pays exportateurs de
pétrole à respecter leurs quotas de production trahissent un « contrat » dont
la contrainte n'est pas absolue), de la probabilité pour un « jeu » d'être un «
coup unique » ou d'être répété, le premier coup fournissant dans ce cas à tous
les joueurs une information sur les stratégies adoptées, etc.
La théorie des jeux permet d'identifier des éléments importants caractérisant
certains types de situation. La construction d'une matrice de « gain » est un
outil d'analyse répandu. Dans le cas simple de deux joueurs, la matrice de gain
indique le gain ou la perte de chaque joueur pour chacune des combinaisons de
stratégies qu'ils peuvent adopter. Dans certains cas, la matrice de gain
comporte un « point d'équilibre », ou équilibre de « Nash ». Un point
d'équilibre apparaît lorsque, dans un jeu à deux joueurs X et Y, le choix de X
est le plus favorable pour lui étant donné le choix de Y et le choix de Y est
le plus favorable pour ce dernier étant donné le choix de X. Dans une telle
situation, les choix sont clairement indiqués et aucun joueur ne peut hésiter
sur la stratégie à adopter. Il peut exister un point d'équilibre qui ne mène
pas à une issue aussi souhaitable que dans le cas d'une coopération entre les
deux joueurs ; le fameux « dilemme du prisonnier » en est un exemple.
![]()
Deux individus suspectés d'avoir commis ensemble un
cambriolage sont isolés chacun dans une cellule par la police, qui leur propose
un marché. Chacun peut dénoncer son partenaire. Si aucun des deux n'accuse
l'autre, ils seront libérés et pourront se partager le butin. S'ils s'accusent
mutuellement, ils auront tous les deux une légère peine de prison. Si l'un des
deux accuse l'autre sans être dénoncé, il pourra profiter de l'intégralité du
butin, tandis que le prisonnier dénoncé purgera une forte peine. Le choix
rationnel pour chaque prisonnier consiste à dénoncer l'autre. Un équilibre de
Nash est atteint (chacun dénonce l'autre), mais cet équilibre ne correspond pas
au meilleur gain possible pour les deux joueurs, qui serait atteint s'ils
pouvaient coopérer (aucun prisonnier ne dénonce l'autre).
Ce genre de situations se rencontre fréquemment
dans la vie: concurrence entre deux entreprises. Ce modèle très simple de la
théorie des jeux semble appréhender en miniature les tensions entre cupidité
individuelle et intérêts de la coopération collective. Pour cette raison, il
est devenu un des modèles les plus utilisés en économie. Privatisation des
bénéfices, socialisation des pertes, le coût social est vu comme une
externalité: il n’est pas inclus dans le marché. Le dilemme du prisonnier
devient plus intéressant et plus réaliste lorsque la durée de l'interaction
n'est pas connue. On peut alors envisager de se souvenir du comportement d'un
joueur à son égard et développer une stratégie en rapport (caractère
adaptatif).
Bien que tous ces phénomènes théoriques ait fait l'objet de modélisation et d'études mathématiques approfondies, qu'il ait déduit des règles simples et isolées, la modélisation apporte un plus sur différents niveaux a variance d'échelle. Elle permet comme nous allons le voir par la suite d'introduire des éléments du type de la modélisation cognitive, de la modélisation statistique, des interactions d'agents, de la recherche ou de la découverte d'émergence. On parle souvent (Axelrod par exemple) de "la théorie des jeux sans la théorie".
![]()
Nous considèrerons ici, le cas de l'émergence de classe dans un jeu de négociation suivant le modèle établit par Axtell, Epstein et Young (2000).
Il s’agit d’étudier les déterminants « génératifs » (Axtell) ou « émergents » de la formation de groupes ou de « classes » parmi des joueurs (au sens des « jeux de population »). D'autre part, on cherche à déterminer la pérennité de tels groupes dans le temps (équilibres ponctués). D'un point de vue théorique, c'est un jeu de population de type « random pairwise», à savoir que tous les agents appariés aléatoirement, jouent à chaque pas de temps un jeu « one-shot» avec leur partenaire. Ils se construisent une représentation du monde basée sur une mémoire bornée des rencontres passées et choisissent à chaque étape la « meilleure réponse » à leur représentation du monde, avec une probabilité positive de déviation ( tembling hand). On a pu ainsi souligner le rôle - non trivial - des « signes » extérieurs dans le processus d’émergence d'états sociaux stables.
La négociation : un jeu de partage.
· La négociation (« one-shot» entre paires d’agents) porte sur la répartition (en %) d’un gâteau de « taille » 100.
· Seules les propositions dont la somme S <= 100 sont acceptées (jeu de demande de Nash à une étape : ultimatum) > « Jeu de partage »
· Problème : faire « émerger » un équilibre global des interactions décentralisées entre agents
|
|
H=70 |
M=50 |
L=30 |
|
H=70 |
0,0 |
0,0 |
70,30 |
|
M=50 |
0,0 |
50,50 |
50,30 |
|
L=30 |
30,70 |
30,50 |
30,30 |
Le processus du « jeu de population ».
A chaque pas de temps les agents appariés aléatoirement jouent le « jeux de partage » :
· avec une probabilité 1 - e :
o Les agents choisissent la stratégie qui correspond à leur meilleure réponse à leur croyance (anticipation) sur la demande.
· avec une probabilité e :
o Les agents choisissent leur stratégie aléatoirement avec équiprobabilité: (1/3) ; (erreur, expérimentation consciente, imitation...)
o Ils dévient donc de leur meilleur réponse avec une probabilité : (2.e)/3
· La croyance des agents sur la demande correspond à la moyenne des fréquences observées pour les différentes stratégies lors des m dernières confrontations (où m est la « longueur de la mémoire»)
· Les agents choisissent la stratégie qui maximise leurs gains (leur « meilleure réponse ») conditionnellement à leurs anticipations. Si plusieurs stratégies ont un gain anticipé équivalent, ils choisissent aléatoirement avec équiprobabilité.
La représentation dans un simplexe de l'état des croyances d'un agent.
(d'après Denis Phan)
· A chaque période, l’état d’un agent i peut être assimilé à ses croyances sur les stratégies jouées dans la population. Il peut être représenté par un triplet Si = (pi, qi, 1-pi-qi) qui correspond à la fréquence moyenne des stratégies (H, M, L) observées sur la période mémorisée de taille m.
· Ces croyances sont le produit de l’histoire de ses rencontres passées (hétérogénéité interactionnelle « historique »), limitée à cette période m.
· Cet état des croyances de l’agent peut être représentées sur un simplexe.

Hétérogénéité interactionnelle et normes sociales
· L’hétérogénéité des agents dépend (1) de leur état initial et (2) de leur expérience personnelle, bornée par la longueur m de leur mémoire.
· Il y a hétérogénéité interactionnelle dans la mesure où l’histoire des interactions diffère entre les agents.
· Un état social S est une matrice (Nx3) : S = (ps, qs, 1-ps-qs) qui contient les croyances des agents sur le comportement de leurs opposants.
· Dans ce modèle, une norme sociale est un état auto-entretenu dans lequel la mémoire des agents (et donc leur comportement de « meilleur réponse » resterait inchangée, si certains agents ne déviaient pas aléatoirement (avec une probabilité (2.e)/3). Une telle « norme sociale » apparaît alors comme un phénomène émergent des interactions.
Modèle avec deux types d’agents ( tag model)
· Les agents ont une « étiquette» (un signe extérieur observable) qui leur permet d’être identifié (gris et noir). AEY supposent que, bien que ce signe n’ait aucune signification intrinsèque (completely meaningless), les agents mémorisent le signe des opposants qu’ils ont rencontré et calculent le comportement moyen correspondant à chaque étiquette.
· Dans ce modèle à deux types, les caractéristiques précédemment observées (croyances, stratégies) peuvent maintenant se manifester entre les types (gris contre noir, à droite) comme à l’intérieur d’un type (gris contre gris ou noir contre noir, à gauche). On définit ainsi des comportements (et des équilibres) inter-groupes et intra-groupes.

Formation de classes
· La formation de « classes » (par définition) correspond à des croyances distinctes selon le groupe et un comportement équitable intra-groupe, mais à un comportement inégalitaire inter-groupes
![]()
En sciences sociales, il existait une étroite liaison entre la théorie des jeux et les calculateurs numériques depuis l'immédiate après Deuxième Guerre Mondiale. Commençant a RAND Corporation puis continuant avec les développements des premières études comportementales de sciences économiques chez Carnegie Mellon dans les années 50 (March et Simon, 1958), les premiers modèles étaient tellement contraints par la technologie de calculs qu'ils devaient se concentrer sur deux ou guère plus d'agents.
La conception moderne des agents est souvent créditée à Schelling (1978). Son modèle de ségrégation urbaine situait plusieurs douzaines d'individus avec des règles comportementales explicites sur un paysage spatial. Il a ainsi étudié les configurations typiques du modèle. Une importante contribution de son travail a été la démonstration que une population d'individus.

Dans le modèle de Schelling, la formation de clusters ou « amas » d’habitants de même type est un phénomène « émergent» des interactions locales entre les agents (habitants).
Motivation > il s’agit d’étudier :
· les déterminants « génératifs » (Axtell) ou « émergents » de la formation de groupes ou de « classes » parmi des joueurs (au sens des « jeux de population »)
· La pérennité de tels groupes dans le temps (« équilibres ponctués »)
Cadre théorique > jeu de population de type « random pairwise» :
· Tous les agents appariés aléatoirement, jouent à chaque pas de temps un jeu « one-shot» avec leur partenaire.
· Ils se construisent une représentation du monde basée sur une mémoire bornée des rencontres passées et choisissent à chaque étape la « meilleure réponse » à leur représentation du monde, avec une probabilité positive de déviation (tembling hand).
· Résultat : souligner le rôle - non trivial - des « signes » extérieurs dans le processus d’émergence d’états sociaux stables.
![]()
Cas du NASDAQ
La dynamique boursière résulte du comportement d'un grand nombre d'agents agissant les uns avec les autres, menant à des phénomènes émergents que l'approche par systèmes multi-agents. Il y a eu ces dernières années une croissance d'intérêt pour ce type de modélisation des marchés, stimulé par le travail de WB Arthur et ses collègues. Une application commerciale a été développée par Bios Group pour la National Association of Security Dealers Automated Quotation (NASDAQ).
En 1997, la bourse du NASDAQ était sur le point de mettre en application une
séquence de changements apparemment petit afin d'établir les réponses du marché
à l'application de nouvelles règles. Dans le passé, les cadres de NASDAQ ont
analysé le marché financier par des études économiques, des modèles financiers,
et la rétroaction des participants du marché. Le Comité de qualité du marché
établit des règlements en grande
partie en fonction du comportement des économistes, des avocats, des
lobbyistes, et des décisionnaires.
Pour évaluer l'impact des changements, le NASDAQ avait employé un modèle par agents qui simulait l'impact des changements de normalisation sur le marché des capitaux dans diverses conditions. Le modèle permettait à des régulateurs d'examiner et de prévoir les effets de différentes stratégies, d'observer le comportement des agents en réponse au changements, et de surveiller des développements, fournissant l'avertissement anticipé des conséquences fortuites nouvellement mise en application plus rapidement qu'en temps réel et sans risquer de premiers essais sur le marche. Dans leur modèle, les agents de teneur du marché et d'investisseur (institutionnels, caisses de retraite, commerçants et investisseur occasionnels) achètent et vendent des parts en employant diverses stratégies. L'accès des agents à l'information des prix et des volumes se rapprochent de celles du marché réel, et leur comportement varie du plus simple aux stratégies d'étude les plus compliquées. Des réseaux de neurones, l'apprentissage par renforcement et d'autre technique d'intelligence artificielle furent employées pour produire des stratégies pour les agents. Cet élément créateur est important parce que les régulateurs du NASDAQ sont particulièrement intéressés par des stratégies qui n'ont pas encore été découverte par des acteurs du marché réel, afin d'anticiper la normalisation et éviter les tentatives de détournement du marché.
Le modèle a produit quelques résultats inattendus. Spécifiquement, la simulation suggère qu'une réduction de la taille du marché permet de réduire la capacité du marché d’effectuer la découverte de prix, menant à une augmentation des demandes d'offre. Une augmentation de la diffusion en réponse à cette réduction de taille est contre intuitive parce que la taille du marché est la limite inférieure de la diffusion. Sans simulation de règles par ordinateur, les régulateurs sont coincés avec des arguments intuitifs pauvres en détails, jugeant l'interaction du marché par une simple mesure de concurrence (et donc des prix). Est-ce que de plus petites tailles de coutil rendront le marché plus nerveux et volatil ?
L'utilisation de modèles ou même de systèmes dynamiques (une populaire méthode de modélisation financière utilisant des ensembles d'équations différentielles) n'aurait pas pu produire des résultats aussi perspicaces et profonds que la simulation par agents, parce que le comportement du marché émerge hors des interactions des acteurs, qui alternativement peuvent changer leur comportement en réponse aux changements du marché. Les interactions entre les investisseurs, les teneurs du marché, et les règles d'exploitation de la bourse du NASDAQ rendent la dynamique du système entier difficile à comprendre. La prévision basée sur l'intuition et des techniques de modélisation classiques ne conviennent pas pour décrire les complexités de comportement des agents de la bourse. Par exemple, déterminer le rapport entre la taille de coutil et la diffusion peut être compris seulement en tenant compte des détails du comportement des investisseurs et des teneurs de marché pour modeler le processus de la découverte des prix.
Cas des shopbot
Les bourses ne sont pas les seuls marchés qui peuvent être mieux compris en
employant les multi-agents. Le cas des enchères électroniques peut en
bénéficier. EBay permet aux acheteurs d'utiliser un robot qui enchérira
automatiquement pour eux, mais on peut faire beaucoup plus sophistiqué en
utilisant des systèmes d'agents testant des variétés de comportement du robot.
Concevoir les agents intelligents qui ont les propriétés globales désirées
pourrait s'avérer faire de cette application la préférée des transactions
économiques du cybermonde. Les shopbots sont les agents d'Internet qui
recherchent automatiquement l'information qui concerne le prix et la qualité
des marchandises et des services. À mesure que la
prédominance des shopbots dans le commerce électronique augmente, la réduction
résultante du frottement économique en raison des coûts
diminués de recherche pourrait nettement changer le comportement du marché.
Certains prévoient que les agents intelligents par la suite
transformeront notre monde, qu'ils auront les moyens de commercer
l'information, recueillir l'information, traduire l'information, et
exécuter toutes les sortes de négociations pour nous à l'avenir.
On doit cependant faire attention au sujet de l'introduction de la technologie
d'agent, car leur comportement est encore mal compris. Par exemple, dans une
vente aux enchères tout agent, les prix tendent a monter, atteignent une crête,
et puis plongent soudainement nettement avant que le même processus recommence
encore. IBM's Kephart et ses collègues avaient exploré l'impact potentiel
des shopbots sur la dynamique du marché, en simulant et en analysant un modèle
tout agent de shopbot économiques, qui incorporent des représentations agent
des acheteurs et des vendeurs. Leur modèle est semblable a celui d'économistes,
par exemple pour les phénomènes de dispersion des prix, avec des prétentions et
une méthodologie fondamentale différente: ici le but est de concevoir des
agents logiciels économiques, plutôt que de simplement expliquer le
comportement économique humain. En particulier, il avaient examiné les
économies d'agents pour les lesquelles les coûts de recherches étaient non
linéaires; une partie de la population d'acheteur ne fait aucune utilisation
des mécanismes de recherche; et les shopbot sont économiquement motivés,
stratégiquement, ils évaluent leurs service d'information afin de maximiser
leur propres profits. Dans ces conditions, on a constaté que les marchés
peuvent montrer une variété de comportement dynamiques jusqu'ici inaperçus, y
compris les cycles complexes de limite et la coexistence de stratégies
multiples de recherche d'acheteur. Un shopbot qui charge des acheteurs pour
l'information des prix peut manoeuvrer les marchés à son propre avantage,
parfois par distraction bénéficiant des acheteurs et des vendeurs.
Une équipe d'Icosystem Corporation a simulé le marché des fournisseurs de service Internet (Internet Service Provider ou ISP) avec des systèmes d'agents. Chaque ISP est un agent et chaque client est un agent. Les offres d'ISP sont confrontées avec les besoins et les espérances des clients, les clients prennent des décisions (adopter, partir, changer) selon le rapport entre leur profil et les ISP. Un des attributs des ISP, parmi d'autre, est leur charge mensuelle pour les services. On élimine les ISP qui ne font pas assez d'argent après une sélection "évolutionnaire", ceux qui réussissent provoquent des "copycats" (c'est a dire des ISP ayant un modèle d'affaire semblable) et également certains avec leurs propres modèle d'affaire. Le système a produit deux résultats significatifs. D'abord les free ISP business model (sans frais mensuels). D'autre part, que ce modèle découvert est instable. La première ISP de ce type à émerger dans la simulation se différencie en fournissant des services sans charger les frais mensuels, ni faire de l'argent sur la publicité. Ces deux propriétés émergent hors de la dynamique d'interaction entre les ISP sur le marché. Comme les ISP apprennent et évoluent, il aurait été difficile d'obtenir cette connaissance en employant d'autres méthodes de simulation.
![]()
On trouvera reproduit dans cette partie un extrait de ACTION CONCERTEE
SYSTEMES
COMPLEXES EN SHS APPEL A PROPOSITIONS 2003:
"De manière complémentaire à la méthodologie bien éprouvée des simulation de Monte-Carlo par les physiciens, la modélisation informatique de systèmes d’agents hétérogènes en interaction sur des réseaux représente une voie privilégiée pour l’intégration des deux dimensions individuelles et collectives et de leurs interdépendances dans un même cadre formel. La modélisation multi-agents au moyen d’un langage objet (java) sur une plate-forme dédiée (Moduleco, Madkit) permet de plus de réaliser cette intégration de manière conviviale. Ces plates-formes permettent d’étudier les systèmes complexes adaptatifs au moyen d’expériences contrôlées et réplicables.
A l’aide d’une plate-forme, en effet, le modélisateur a peu de code à écrire et peut ré-utiliser les différents types d’objets préexistants (agents, structures de communication etc...) Ainsi, pour formaliser aussi bien les échanges sur les marchés que les interactions individuelles dans un cadre conceptuel à la fois général et opérationnel, les plates-formes multi-agents comme Madkit ou Moduleco, utilisent des composants de communications, ce qui permet d'isoler en tant qu'objet informatique l'ensemble des règles de gestion de la communication (ou de l'interaction) entre agents. On peut ainsi concrétiser la notion de marché par un composant qui en décrit les règles (enchères, halles au poisson, etc..), mais également médiatiser d'autres opérations complexes comme : un protocole de vote, un mécanisme d'émergence de consensus, des phénomènes de diffusion, etc….
De manière complémentaire, les travaux des économistes dans le domaine de la simulation constituent un champ privilégié d’application de cette approche (Phan 2003). Il est en effet possible de considérer un marché ou un groupe social comme un lieu de communication où des agents (économiques) interagissent selon des règles définies.
Moduleco, plate-forme développée conjointement par un chercheur en sciences humaines et un informaticien (Phan, Beugnard) a été conçue pour modéliser et simuler les processus de décision en interactions dans des réseaux de communication ou d’influence sociale, les marchés et les organisation. Dans le cadre des travaux du projet MIMOSA, il a été envisagé par Denis Phan et Jacques Ferber, concepteur de la plate-forme " Madkit " d’integrer Moduleco dans l’environnement MadKit, en anticipant sur les développements actuels de ce projet, important pour la mise en cohérence des plates-formes.
Pour tous les axes de recherche concernant les phénomènes non marchands, la simulation multi-agents permettra d’explorer des situations pour lesquelles on ne dispose pas de résultats analytiques, sauf dans des cas très simples. Un certain nombre de travaux en cours des membres de l’équipe ont déjà montré la fécondité du croisement de ces deux approches, en particulier par l’analyse critique de l’utilisation en sciences humaines et sociales des techniques issues de la physique statistique, des systèmes désordonnés (cf. travaux commun bi ou tri latéraux de Amblard, Deffuant, Dessalles Galam Gordon, Phan, Pajot, Nadal).
Les simulations permettront d'intégrer les différentes approches utilisées dans un cadre commun, et d'explorer les implications individuelles et collectives des modèles, comportements, règles de décision et de coordination issus des autres domaines d’investigation de ce projet. La plateforme Moduleco intégrée dans l’environnement Madkit servira de support à l’essentiel des simulations du projet, y compris pour la partie expérimentale réalisée sous la Constitution dossier "Systèmes complexes en SHS" direction de Bernard Ruffieux. De même, par exemple, Ballot et Arifovic (ERMES) construisent un modèle de simulation multi-agents, dans lequel un grand nombre d’entreprises essaient de déterminer leur organisation interne la plus performante, à travers des systèmes d’algorithmes génétiques et des systèmes de classification. Les travailleurs voient leurs compétences évoluer au sein de leur firme, comme une conséquence de leur organisation. Ces organisations, typiquement non marchandes, ont des conséquences, à la fois sur le degré de compétitivité du marché (compétition inter-entreprises) et sur la productivité des travailleurs qui affectent à son tour le type d’organisation et la sphère marchande (prix et quantités produites). Dans le cadre du présent projet on implémentera ce modèle sur Moduleco et on cherchera à élargir cette formalisation des relations comportements individuels / interactions sociales, à d’autres réseaux sociaux."
![]()
Pour l’essentiel, et en simplifiant, c’est dans les années 70 que le thème de l’information va tendre à devenir un objet de préoccupation important en économie. Cependant, cette préoccupation s’inscrira la plupart du temps dans la perspective d’une étude de marchés à information imparfaite d’inspiration néo-classique si bien que les conditions dans lesquelles les agents s’informent, au plan cognitif ou psychologique n’y sont pas véritablement prises en compte. Ce sont les conséquences du manque d’information qui sont étudiées, à partir le plus souvent d’une hypothèse d’anticipation rationnelle, plutôt que les conditions dans lesquelles les agents, par apprentissage ou d’une autre manière, peuvent accroître leur information. Finalement, c’est au cours des années quatre-vingt que l’on assiste au développement d’approches réservant une part significative à l’apprentissage, à la connaissance et aux croyances sous des formes moins triviales, et que l'on peut qualifier d'économie cognitive.
D'autre part, l'économie computationnelle orientée agent est défini par Leigh Tesfatsion comme " l'étude computationnelle de l'économie, modelée comme systèmes d’évolution d'agents autonomes agissants les uns sur les autre. A partir de conditions initiales, introduites par le modélisateur, l'économie computationnelle évolue avec le temps pendant que ses agents constitutifs agissent les uns sur les autre à plusieurs reprises et apprennent des ces interactions”. Nous étudierons dans la suite de cette partie, l'intérêt d'une telle approche dans des sciences économiques cognitives. Pour ce faire, et sans chercher a rentrer dans le détail et la complexité des possibilités, nous observerons quelques cas simples simulés en utilisant la plateforme Moduleco.
Tesfastion divise le domaine en huit secteurs de recherche: (i) L'étude et l'esprit incorporé; (ii) l'évolution des normes comportementales; (iii) modélisation ascendante des processus du marché; (iv) formation des réseaux économiques (v) modélisation des organisations, (vi) conception des agents informatiques pour les marchés automatisés; (vii) expériences parallèles avec agents réels et informatiques (viii) construction des agents computationnels.
Pourquoi Agents? Pour Axtell, il y a trois utilisations distinctes de
l'ECA: (1) simulations classiques, (2) comme complémentaires à la théorisation
mathématique et (3) comme produit de remplacement pour la théorisation mathématique.
Dans le premier cas, l'ECA est employé d'une part comme outil sympathique et
puissant pour présenter des processus ou des résultats, ou, de l'autre, comme
genre de simulateur de Monte-Carlo, afin de fournir des résultats numériques.
Le dernier cas est souvent employé par l'approche évolutionnaire (comme Dosi,
Marengo, Yildizoglu, entre autres.) dans le cas des modèles insurmontables,
particulièrement conçu pour des simulations informatiques. Nous nous
concentrons sur le cas moyen, quand l'ECA est employé comme complément à la
théorisation mathématique.
C'est, par exemple, le cas quand un équilibre existe mais est incalculable ou
n'est pas atteint par les agents raisonnables liés, ou est instable, ou réalisé
seulement asymptotiquement dans de (très) longue durée. C'est également le cas
quand quelques paramètres sont inconnus, rendant le modèle incomplètement
soluble.
L'économie cognitive est particulièrement concernée par la dernière utilisation, où la position d'équilibre est connue seulement pour un réseau simple d'interaction. C'est le cas, par exemple avec la mécanique statistique. Les résultats analytiques peuvent être possibles pour des cas réguliers et homogènes. Mais dans le cas mélangé (cas "petit monde") caractérisé par des raccordements désordonnés, des résultats (statistiques) numériques sont souvent la seule manière possible. D'un point de vue évolutionnaire, l'attention peut se focaliser sur de "classiques" systèmes dynamiques. Nous allons a présent étudier certains de ces concepts a partir d'exemple pris de Moduleco.
![]()
Quand différentes actions sont faites pour être interdépendantes, une dynamique
complexe peut surgir. C'est le cas, par exemple, quand
les agents localement agissent l'un sur l’autre. Afin d'illustrer un tel
phénomène, un modèle très simple du dilemme spatial de prisonnier est présenté
ici. La version la plus simple (sur un treillis périodique unidimensionnel)
montre seulement une transition de phase entre deux états symétriques:
dénoncer ou coopérer. Un comportement plus complexe peut surgir quand la
connectivité augmente, comme dans le modèle, où les agents agissent l'un sur
l'autre sur un treillis périodique bidimensionnel (tore), ou quand le réseau
n'est pas régulier. L'introduction du bruit aléatoire peut également produire
des résultats de différent, mais ici nous considérons seulement le mécanisme
déterministe.

Dans le modèle générique, les agents jouent un jeu symétrique (ici, un
dilemme de prisonnier) avec chacun de leur voisin sur le treillis. À une
période donnée, chaque agent joue la même stratégie (S1: coopération ou S2:
dénonciation) dans tous ces jeux bilatéraux. À la fin de la période, chaque
agent observe la stratégie de ses voisins et du gain cumulé de leur stratégie.
Mais l'agent n'a aucune information sur tous les aux autres jeux joués
par ses voisins. Il observe seulement le gain cumulé lié avec cette
stratégie.
À chaque période, les agents mettent à jour leur stratégie, donnée par le gain de leurs voisins. Le comportement myope, la règle la plus simple doit adopter la stratégie du dernier voisinage ayant le meilleur gain (cumulé). Une autre règle est adopter la stratégie du dernier voisin ayant le meilleurs gain (cumulé) moyen. Cette dernière règle est moins mimétique, parce qu'on peut interpréter cette règle de révision comme genre d'estimateur du gain cumulé prévu d'une stratégie donnée. En conclusion, les jeux bilatéraux plus la règle de révision constituent un genre spécial de jeu évolutionnaire.
Dans le modèle simple du schéma 4, les agents jouent un jeu symétrique (dilemme de prisonnier) avec chacun de leurs deux voisins sur un treillis de cercle (unidimensionnel, périodique). La règle de révision est le dernier voisinage au meilleur gain cumulé. Si le gain de la coopération contre eux-mêmes est haut (S1 contre S1 > 91), la dénonciation (S2) est contenu dans une “zone gelée“ de 3 agents. Dans d'autres cas (S1 contre S1 < 92), la population entière se tourne vers la dénonciation. Pour N >= 32 ce résultat est indépendant du nombre d'agents.
Dans le cas d'une population de coopérateurs sur un tore (bidimensionnel, périodique - dans notre exemple: 492 - 1 = 2400 coopérateurs). Chaque agent joue avec ses huit plus proches voisins (voisinage de Moore). L'algorithme de règle de révision tient compte du gain de la stratégie du joueur contre lui-même.


Comme dans l'exemple précédent, les marques une un agent deviennent
temporairement un dénonciateur. Pour un gain suffisamment haut de la
coopération contre soi-même (S1 contre S1 >=101) la
défection (S2) doit être contenue dans la zone centrale de 9 agents.
Pour 113 >=S1>=101, c'est " une zone congelée " de
dénonciateurs, pour 129 >=S1 >=114 un cycle de période 3
et avec 157 >= S1 >=130, un cycle de période 2. Ce résultat
tient à toutes les populations, à partir de 62 agents. Au contraire,
pour un gain faible de la coopération contre soi-même la population entière se
tourne vers la dénonciation après une transition dynamique courte. Par exemple,
avec (S1 contre S1 = 94) la dénonciation totale surgit
après 30 périodes. Pour un gain intermédiaire. (dans ce cas-ci 99-100), la
trajectoire dynamique devient quasi-chaotique et produit de belles figures
géométriques (Figure 5). Dans le cas particulier (S1 contre S1
= 100), la trajectoire converge (Figure 6) vers un cycle de période 4 après
277 itérations. Un tel phénomène surgit pour une population suffisamment
grande. Par exemple, pour cet ensemble de gain, 432 agents au moins sont nécessaires
afin d'induire un cycle de l'ordre 2, après 2138 itérations de comportement
chaotique.
Dans le cas spécial de ce modèle d'après May et
Nowak, les résultats ne semblent pas avoir vraiment de sens pour les sciences
économiques.
Néanmoins, trois phénomènes importants apparaissent dans ce cas simple. D'abord,
si les comportements d'agents sont liés entre eux, les agents
strictement déterministes et identiques ayant un comportement individuel très
simple peuvent produire l'hétérogénéité au niveau micro et une dynamique complexe
au niveau macro. Après, quelques valeurs critiques autour du point symétrique
(entre la phase coopérative et celle de dénonciation) jouent un rôle important
dans une telle dynamique. En conclusion, la nature de la dynamique dépend de la
topologie des
interdépendances.
![]()
On remarquera aisément que l'angle choisit dans cette étude ne fut pas (et de loin) exhaustif, ni technique. L'objectif fut surtout d'établir le cadre théorique pour en comprendre la thématique générale et les problématiques soulevées. On trouvera foison de thèse et de domaines d'études sur le sujet. On constatera la grande perméabilité de cette étude à d’autres domaines d'application des pratiques multi-agents, dont la simulation économique peut tirer partie. Nous avons au cours de cette étude établit la terminologie et le cadre de la micro et de la macroéconomie. Cependant, nous avons constaté que leur applications, aussi diverses soit elle ne suivait pas cette schématique stricte. Nous avons défini le domaine essentielle d'ou la simulation économique agent tirait sa part théorique, a savoir la théorie des jeux. De cette théorie nous avons extrait un exemple symbolique et emblématique, celui du dilemme du prisonnier, dont nous avons vu les applications pour extraire des phénomènes émergents complexes. Nous avons vu aussi de quelle façon il était possible de modéliser la négociation par des lois statistiques comportementales. Nous avons défini une théorie primordiale, celle de la ségrégation de Schelling basée sur des règles comportementales explicites et un paysage spatial pour aboutir a des clusters émergents. Nous avons étudié des méthodes visant à simuler les marchés, pour anticiper des comportements globaux et interagir avec dans le monde réel. Nous avons, enfin, défini ce qu'était l'économie cognitive, et en quoi elle pouvait se décliner en économie computationnelle orientée agent. Pour observer les application conceptuel, de façon simple sur une plate-forme destinée.
![]()
Sites web
Web site de L. Tesfatsion http://www.econ.iastate.edu/tesfatsi/ace.htm
Icosysteme http://www.icosystem.com/
Plates-formes multi-agents :
Ascape http://brook.edu/es/dynamics/models/ascape
Cormas http://cormas.cirad.fr/fr/outil/outil.htm
LSD http://www.business.auc.dk/~mv/research/topic_Lsd.html
MadKit http://www.madkit.org/
Moduleco, http://www-eco.enst-bretagne.fr/~phan/moduleco/
Swarm http://www.swarm.org/