Recherche
Comment garantir des données synthétiques sans fil de haute qualité en cas de pénurie de données réelles ?
Alors que ces données sont essentielles pour former des modèles d’intelligence artificielle (IA), leur qualité est souvent insuffisante, négligeant des critères d’affinité et de diversité.
Ils ont développé un cadre analytique qui améliore l’utilisation des données synthétiques en filtrant celles de faible qualité tout en leur attribuant des pseudo-étiquettes, permettant ainsi aux modèles d’IA d’obtenir de meilleures performances.
Leurs travaux, qui ont remporté un prix lors de la Conférence internationale de Mobisys 2025, mettent en évidence les défis spécifiques liés à l’utilisation de données synthétiques dans les signaux sans fil.
Les chercheurs ont constaté que les données existantes présentent souvent une bonne diversité, mais manquent d’affinité, ce qui affecte la précision des tâches d’analyse.
Ils ont introduit un système appelé Syncheck, qui améliore de manière significative les performances des modèles lorsqu’il est utilisé pour l’apprentissage semi-supervisé.
Cette recherche propose donc une avancée vers l’obtention de données de qualité pour l’entraînement des modèles d’IA, cruciale pour des applications allant de la surveillance à domicile à la réalité virtuelle.