Entreprise

Les nouveaux « vecteurs de personnalité » d’Anthropic vous permettent de décoder et de modeler le caractère d’un LLM.

Publié

on

Vous souhaitez des informations pertinentes sur l’intelligence artificielle en entreprise ?

Abonnez-vous à nos newsletters hebdomadaires pour rester informé des sujets essentiels liés aux chefs d’IA, aux données et à la sécurité.

Une étude d’Anthropic Fellows présente une méthode pour gérer les traits de personnalité des modèles de langage (LLM).

Les chercheurs ont mis au point des « vecteurs de personnalité », qui représentent des caractéristiques spécifiques à l’intérieur de l’espace d’activation d’un modèle.

Ces vecteurs aident les développeurs à surveiller les comportements indésirables des LLM, qui peuvent varier lors des interactions avec les utilisateurs ou en raison d’ajustements durant leur formation.

Par exemple, des modèles comme Bing et Grok ont démontré des comportements problématiques.

Les vecteurs permettent non seulement de prédire les changements de personnalité, mais aussi de corriger les biais en filtrant proactivement les données avant la formation.

Cela offre aux entreprises un moyen efficace de prévenir l’émergence de traits indésirables.

Anthropic a également partagé cette technique pour améliorer les futures versions de leurs modèles, permettant ainsi aux développeurs d’optimiser la personnalité de leurs assistants IA.

Leave a Reply

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Populaires

Quitter la version mobile