Ce billet fait partie d’une série sur les « Success stories » européennes liant Mathématiques et Industrie. Ces histoires ont été recueillies dans le cadre du projet intitulé Forward Look « Mathematics and Industry » coordonné scientifiquement par le Comité de Mathématiques Appliquées de l’EMS et financé par l’ESF. Nous les remercions, ainsi que les auteurs pour nous avoir autorisés à traduire ces textes en français. La traduction a été réalisée par Paul Vigneaux.
Auteur de la version originale : Magnus Fontes
Résumé
Les premiers pas vers la naissance en 2007 de l’entreprise du logiciel de bioinformatique Qlucore ont eu lieu à Lund, Suède, en 2001. Les chercheurs des départements de Mathématiques et de Génétique Médicale de l’Université de Lund se sont réunis pour s’attaquer aux défis que représentent les quantités gigantesques de données issues des puces à ADN, permettant l’analyse du niveau d’expression des gènes à haut débit 4NdT : ces puces basées sur des systèmes microfluidiques ont révolutionné la mesure et la visualisation très rapide des différences d’expression entre les gènes car elles permettent d’étudier un génome complet.. Assez tôt, il est devenu évident qu’un logiciel rapide et interactif était nécessaire pour visualiser et faire l’analyse statistique des données, afin de les explorer et d’en extraire des idées conceptuelles. Le projet a commencé comme un travail de recherche académique, mais s’est transformé quelques années après en la création de l’entreprise Qlucore. En 2010, Qlucore était un leader mondial en bioinformatique, fournissant son logiciel à des instituts de recherche prestigieux ainsi qu’à plusieurs des plus grandes entreprises pharmaceutiques internationales.
L’objectif
Grâce aux avancées technologiques des dernières décennies, il y a eu une augmentation phénoménale de la quantité de mesures « à haut débit » de ce que l’on nomme les « Omics-data » 5NdT : de l’anglais, en référence aux champs d’étude en biologie se terminant par « -omics », comme la génomique, la protéomique et la métabolomique.. Des entreprises telles que Illumina, Affymetrix et Roche fournissent des plate-formes pour collecter des millions de mesures sur des centaines ou des milliers de patients/échantillons, en une seule expérience. Le grand défi pour toute la communauté académique est de tirer des conclusions biologiques utiles à partir de ces ensembles de données qui s’accumulent rapidement.
Mise en œuvre de l’initiative
Le but du projet académique initial était de développer de nouveaux modèles et algorithmes pour explorer des ensembles de Omics-data qui avaient été générés en sciences de la vie. Peu à peu, le besoin de disposer d’un logiciel interactif s’est fait sentir. Un premier prototype du logiciel a été développé au sein du projet académique. Mais pour que le délivrable soit largement utile sur le long terme pour les communautés en recherches biologique et médicale, un logiciel commercial devait être mis au point. Une entreprise devait donc être créée pour assurer le développement continu et les fonctions support.
Le problème
L’idée sous-jacente dans le projet initial, et le logiciel Qlucore développé de façon commerciale, est de fournir un outil qui peut tirer parti au maximum des plus puissants algorithmes de reconnaissance de formes existants : c’est à dire ceux du cerveau. Ceci est rendu possible grâce à un outil de visualisation interactif très rapide. Pour assurer l’interactivité complète sur un ordinateur portable standard avec des ensemble de données contenant plus de 100 millions de points, une nouvelle architecture logicielle devait être conçue et de nouveaux algorithmes implémentés.
Résultats
Le résultat est un noyau logiciel qui utilise notamment l’analyse en composantes principales6NdT : en anglais, PCA, voir par exemple ici. pour visualiser interactivement les données en 3D et qui aide l’utilisateur à identifier des structures cachées ou des motifs particuliers au sein des données. Cette visualisation est combinée à des algorithmes statistiques et mathématiques puissants.
Contact
Magnus Fontes (fontes@maths.lth.se). Centre for Mathematical Sciences, Lund University. Suède.
Post-scriptum
Pour plus d’informations sur ces « Success Stories », on pourra consulter ce billet.