Entreprise
La Silicon Valley mise fortement sur les « environnements » pour former des experts en intelligence artificielle.
Les PDG du secteur technologique ont longtemps mis en avant la promesse d’agents d’IA autonomes, mais les versions actuelles, comme ChatGPT et Perplexity, révèlent leurs limites.
Pour renforcer ces agents, l’industrie explore des techniques nouvelles, notamment les environnements d’apprentissage par renforcement (RL), qui simulent des tâches en plusieurs étapes.
Ces environnements deviendront cruciaux pour le développement d’agents d’IA, à l’image des ensembles de données étiquetés qui ont précédemment fait avancer l’IA.
Ainsi, de nombreuses startups, comme Mechanize et Prime Intellect, ainsi que des entreprises d’étiquetage de données comme Surge et Mercor, cherchent à répondre à la demande croissante d’environnements RL.
Ces entreprises investissent massivement pour créer des simulations robustes, permettant aux agents d’apprendre dans des contextes près de la réalité.
Cependant, des experts expriment des doutes quant à la capacité des environnements RL à véritablement faire progresser l’IA, notant des enjeux de complexité et de concurrence intense dans ce domaine.