Non classé
Les jetons et les décodeurs facilitent l’édition et la désillusion sans l’utilisation de générateurs.
Leur approche repose sur un tokenizer unidimensionnel qui convertit des images en séquences de nombres compressées, permettant ainsi de modifier des images de manière plus efficace.
Plutôt que d’entraîner des modèles sur des milliers d’images, cette technique permet de générer des images nouvelles et d’éditer des images existantes grâce à un décodeur, en utilisant des indications fournies par un réseau neuronal.
Cette avancée pourrait transformer l’industrie de la génération d’images, avec le potentiel de réduire considérablement les coûts de calcul associés à la création d’images complexes.
Les implications de ces découvertes vont au-delà de la vision par ordinateur, avec des applications possibles dans d’autres domaines, tels que la robotique.
Les chercheurs explorent également la compression extrême des données, ce qui pourrait ouvrir de nouvelles voies dans divers secteurs.