Recherche
Les modèles d’images d’IA acquièrent un avantage créatif en renforçant les caractéristiques à basse fréquence.
Des chercheurs de l’Institut Coréen des Sciences et Technologies (KAIST) ont développé une méthode innovante pour améliorer la créativité des modèles d’IA génératifs, comme ceux basés sur la diffusion stable, sans nécessiter d’entraînement supplémentaire.
En amplifiant les caractéristiques internes des modèles, particulièrement celles des blocs peu profonds, ils ont facilité la création d’images plus originales, telles que des conceptions de chaises créatives.
Leur algorithme détermine automatiquement la valeur d’amplification optimale pour chaque bloc, permettant ainsi une production d’images diversifiées sans compromettre leur utilité.
Cette avancée a été quantifiée à l’aide de multiples indicateurs, confirmant une amélioration significative en matière de nouveauté.
Les résultats ont montré que cette technique atténue le problème de l’effondrement du mode, souvent rencontré dans les versions antérieures des modèles.
Présentée lors de la Conférence internationale sur la vision par ordinateur, cette recherche offre des perspectives prometteuses pour des applications pratiques dans le domaine de la conception créative, en tirant parti des capacités des modèles d’IA existants.