Connect with us

Non classé

Les LLM peuvent s’aligner avec la manière dont le cerveau humain perçoit les scènes quotidiennes.

Publié

on

Une étude menée par Ian Charest et ses collègues révèle comment les modèles de langage (LLMs) peuvent représenter des scènes visuelles, offrant une nouvelle façon de comprendre la perception humaine.

En analysant des descriptions de scènes naturelles à l’aide de ces LLMs, les chercheurs ont pu créer une « empreinte digitale » linguistique qui correspond étroitement aux réponses cérébrales observées par IRM lorsque les participants voyaient les mêmes scènes.

Par exemple, ils ont démontré que ces modèles permettent de décoder précisément les réactions du cerveau à divers stimuli visuels, tels que des paysages et des visages.

Les chercheurs ont également développé des réseaux de neurones artificiels capables de mieux prédire les réponses d’activité cérébrale que les meilleurs modèles de vision actuelle, malgré une capacité d’entraînement avec moins de données.

Cette découverte suggère que le cerveau humain représente les scènes de manière similaire aux LLMs.

Les résultats de l’étude ouvrent la voie à des avancées dans la décodification des pensées, l’amélioration des interfaces cerveau-ordinateur et la création de systèmes d’IA plus performants pouvant intégrer une compréhension visuelle humaine.

Les implications futures incluent des applications potentielles pour les véhicules autonomes et le développement de prothèses visuelles.

Non classé

L’IA identifie des catégories visuelles tout en s’adaptant à de nouveaux contextes.

Publié

on

Une récente étude menée par l’Université du Michigan propose une nouvelle méthode appelée « catégorisation ad hoc ouverte » (OAK), qui permet aux systèmes d’intelligence artificielle de réinterpréter dynamiquement les images selon le contexte de catégorisation.

Contrairement aux méthodes traditionnelles qui reposent sur des catégories rigides, OAK permet une analyse plus flexible où une même image peut être perçue différemment selon les objectifs ou le contexte.

Par exemple, une image d’une personne en train de boire peut être classée selon l’action réalisée, le lieu ou l’émotion.

L’approche OAK allie utilisation de données non marquées et étiquetées, ainsi que des jetons de contexte qui guident le traitement des images.

Ce modèle d’IA, basé sur le système CLIP d’OpenAI, a démontré sa capacité à identifier de nouvelles catégories d’objets, comme des chapeaux ou des bagages dans le cadre d’une vente de garage, même sans exemples d’apprentissage spécifiques.

Les chercheurs ont testé OAK sur des ensembles de données d’images, obtenant des résultats prometteurs qui montrent une précision supérieure dans la découverte de concepts par rapport aux méthodes existantes.

Cette innovation pourrait avoir des applications diverses, notamment en robotique, où une perception contextuelle est cruciale.

Continuer à lire

Non classé

L’IA a découvert l’avenir des batteries, et ce n’est pas le lithium.

Publié

on

L’intelligence artificielle (IA) a récemment facilité la découverte de nouveaux matériaux prometteurs capables de remplacer le lithium dans les batteries, offrant ainsi des alternatives plus abordables et durables au lithium-ion.

Des chercheurs du New Jersey Institute of Technology ont utilisé une IA générative pour identifier cinq matériaux innovants, principalement basés sur des éléments comme le magnésium et le zinc.

Ces nouvelles batteries multivalentes peuvent stocker davantage d’énergie grâce à des ions portant plusieurs charges, mais elles nécessitent des structures adaptées pour permettre leur efficacité.

L’équipe a développé une approche combinée utilisant un autoencodeur variationnel de diffusion cristalline et un modèle de langage finement ajusté pour explorer rapidement des milliers de matériaux.

Cela a conduit à la validation de cinq structures novatrices, promettant une amélioration significative des batteries de nouvelle génération.

Les implications de cette méthode ne se limitent pas aux batteries ; elle pourrait révolutionner la découverte de matériaux pour diverses applications technologiques.

Les chercheurs envisagent maintenant de collaborer avec des laboratoires pour expérimenter et tester ces nouvelles découvertes.

Continuer à lire

Non classé

Les jetons et les décodeurs facilitent l’édition et la désillusion sans l’utilisation de générateurs.

Publié

on

Des chercheurs du MIT ont développé une méthode innovante pour générer et manipuler des images sans utiliser de générateur traditionnel.

Leur approche repose sur un tokenizer unidimensionnel qui convertit des images en séquences de nombres compressées, permettant ainsi de modifier des images de manière plus efficace.

Plutôt que d’entraîner des modèles sur des milliers d’images, cette technique permet de générer des images nouvelles et d’éditer des images existantes grâce à un décodeur, en utilisant des indications fournies par un réseau neuronal.

Cette avancée pourrait transformer l’industrie de la génération d’images, avec le potentiel de réduire considérablement les coûts de calcul associés à la création d’images complexes.

Les implications de ces découvertes vont au-delà de la vision par ordinateur, avec des applications possibles dans d’autres domaines, tels que la robotique.

Les chercheurs explorent également la compression extrême des données, ce qui pourrait ouvrir de nouvelles voies dans divers secteurs.

Continuer à lire

Populaires