Aller au contenu

L’EPFL dévoile un modèle d’IA modulaire pour l’analyse de données diverses

Tech

12 mars 2024

Le modèle innovant de l'EPFL, qui se distingue par sa conception modulaire unique, promet un niveau de flexibilité inégalé dans les systèmes d'IA précédents, capable de traiter un éventail de données, y compris le texte, la vidéo, les images, le son et les données chronologiques, et de fournir un spectre complet de prédictions. Le modèle innovant de l’EPFL, qui se distingue par sa conception modulaire unique, promet un niveau de flexibilité inégalé dans les systèmes d’IA précédents, capable de traiter un éventail de données, y compris le texte, la vidéo, les images, le son et les données chronologiques, et de fournir un spectre complet de prédictions.

Des chercheurs de l’EPFL ont dévoilé un modèle d’apprentissage automatique inédit qui pourrait ouvrir une nouvelle ère dans la polyvalence et l’application de l’intelligence artificielle.

Contrairement aux grands modèles linguistiques (LLM) tels que ChatGPT d’OpenAI, qui sont construits sur de vastes bases de données textuelles, le nouveau modèle de l’EPFL, baptisé MultiModN, est conçu pour la sphère des modèles multimodaux (MM) de la prochaine génération. Ces MM excellent en apprenant à partir d’une variété de types de données, mais les modèles à plus petite échelle sont confrontés à des obstacles, notamment pour traiter les informations manquantes non aléatoires sans absorber des modèles biaisés. MultiModN se présente comme une solution inédite à ce défi.

Développé sous la direction des professeurs Mary-Anne Hartley et Tanja Käser, MultiModN est structuré autour de nombreux modules plus petits et autosuffisants. Cette architecture permet de sélectionner et de séquencer les modules en fonction des données disponibles, ce qui aboutit à un modèle hautement adaptable et interprétable. Testé dans le cadre de dix tâches réelles, notamment l’aide au diagnostic médical et la prédiction des résultats scolaires, MultiModN a démontré sa robustesse et sa capacité d’interprétation, en particulier dans des scénarios entachés de données manquantes non aléatoires (MNAR en anglais pour « Missing Not At Random »).

L’application inaugurale du modèle se concentre sur l’amélioration de la prise de décision clinique dans des environnements où les ressources sont limitées. La flexibilité inhérente à MultiModN et son mécanisme d’apprentissage résistant aux biais en font un outil idéal pour les environnements de soins de santé où les lacunes en matière de données sont fréquentes en raison de facteurs économiques ou de redondance. En exploitant les données cliniques du monde réel sans hériter de leurs biais, MultiModN vise à aider le personnel médical en ajustant ses prédictions sur la base des données disponibles.

Adapter les progrès de l’apprentissage automatique aux besoins de la société

Au-delà de la publication, des efforts sont en cours pour traduire MultiModN du laboratoire à l’utilisation pratique, avec des collaborations entre l’EPFL, le CHUV et l’hôpital universitaire de Berne, se concentrant sur le diagnostic de la pneumonie et de la tuberculose dans les régions à faibles ressources. Une initiative complète de collecte de données est également en cours, visant à former MultiModN avec des données multimodales réelles reflétant les conditions dans les régions à faibles ressources.

Ce développement représente l’engagement continu de l’EPFL à adapter les progrès de l’apprentissage automatique aux besoins de la société. Aux côtés de Meditron, un autre LLM open-source très performant pour l’aide à la décision clinique, MultiModN incarne la vision de l’EPFL pour une IA responsable qui favorise l’innovation technologique dans divers secteurs sociétaux, comme le souligne l’éthique du nouveau EPFL AI Center.