Publié le 21 février 2024 12:19:00. L’intelligence artificielle générative s’impose comme un outil prometteur dans la recherche médicale, capable d’analyser des données complexes à une vitesse inégalée et, dans certains cas, de surpasser les méthodes traditionnelles. Une étude de l’UC San Francisco et de la Wayne State University démontre son potentiel pour accélérer la découverte de traitements, notamment dans la lutte contre la prématurité.
- L’IA générative a permis de développer des modèles prédictifs de la prématurité en quelques mois, un processus qui aurait pris des années avec les méthodes classiques.
- Des chatbots IA ont généré du code informatique fonctionnel, réduisant considérablement le temps de développement et les besoins en expertise humaine.
- Bien que nécessitant une surveillance attentive, l’IA pourrait libérer les chercheurs des tâches chronophages liées à l’analyse des données, leur permettant de se concentrer sur l’interprétation des résultats et la formulation de nouvelles hypothèses.
Dans une première application concrète de l’intelligence artificielle à la recherche en santé, des scientifiques ont mis en évidence la capacité de l’IA générative à traiter des ensembles de données médicales volumineux beaucoup plus rapidement que les équipes informatiques habituelles. Dans certains cas, les résultats obtenus ont même été supérieurs à ceux obtenus par des experts humains ayant consacré des mois à l’analyse des mêmes informations.
Pour évaluer précisément les performances, les chercheurs ont divisé le travail en plusieurs groupes. Certains se sont appuyés uniquement sur l’expertise humaine, tandis que d’autres ont collaboré avec des outils d’IA. Le défi consistait à prédire les risques de naissance prématurée à partir des données de plus de 1 000 femmes enceintes.
L’étude a révélé des résultats particulièrement encourageants. Même une équipe réduite, composée d’un étudiant en master de l’UCSF, Reuben Sarwal, et d’un lycéen, Victor Tarca, a réussi à développer des modèles de prédiction performants grâce à l’assistance de l’IA. Le système a généré du code informatique opérationnel en quelques minutes, une tâche qui aurait normalement demandé plusieurs heures, voire plusieurs jours, à des programmeurs expérimentés.
Cette efficacité repose sur la capacité de l’IA à produire du code analytique à partir d’instructions courtes mais précises. Si tous les systèmes testés n’ont pas été performants – seuls 4 des 8 chatbots IA ont produit du code utilisable – ceux qui ont réussi n’ont pas nécessité l’intervention constante d’équipes de spécialistes pour les guider.
Cette rapidité a permis aux jeunes chercheurs de mener à bien leurs expériences, de valider leurs conclusions et de soumettre leurs résultats à une revue scientifique en quelques mois seulement.
« Ces outils d’IA pourraient éliminer l’un des principaux obstacles à la science des données : la construction de nos chaînes d’analyse. »
Marina Sirota, professeure de pédiatrie et directrice par intérim du Bakar Computational Health Sciences Institute (BCHSI) à l’UCSF et chercheuse principale du centre de recherche sur la prématurité March of Dimes à l’UCSF.
L’accélération de l’analyse des données est particulièrement cruciale dans le domaine de la prématurité, principale cause de mortalité néonatale et facteur important de troubles moteurs et cognitifs à long terme chez l’enfant. Aux États-Unis, environ 1 000 bébés naissent prématurément chaque jour.
Les causes exactes de la prématurité restent mal comprises. Pour identifier les facteurs de risque potentiels, l’équipe de Sirota a rassemblé des données sur le microbiome d’environ 1 200 femmes enceintes, dont les résultats ont été suivis dans neuf études distinctes.
« Ce type de travail n’est possible que grâce au partage ouvert des données, qui permet de combiner les expériences de nombreuses femmes et l’expertise de nombreux chercheurs. »
Tomiko T. Oskotsky, co-directrice du dépôt de données sur les naissances prématurées de March of Dimes, professeure agrégée à l’UCSF BCHSI et co-auteure de l’article.
L’analyse d’un ensemble de données aussi vaste et complexe s’est avérée difficile. Pour surmonter cet obstacle, les chercheurs ont participé à un concours mondial de crowdsourcing appelé DREAM (Dialogue on Reverse Engineering Assessment and Methods). Sirota a co-dirigé l’un des trois défis DREAM axés sur la grossesse, en se concentrant spécifiquement sur les données relatives au microbiome vaginal. Plus de 100 équipes du monde entier ont participé, développant des modèles d’apprentissage automatique pour détecter les schémas associés à la naissance prématurée. La plupart des groupes ont terminé leur travail dans le délai de trois mois du concours, mais il a fallu près de deux ans pour consolider les résultats et les publier.
Intrigués par la possibilité de réduire ce délai, le groupe de Sirota s’est associé à des chercheurs dirigés par Adi L. Tarca, professeur au Centre de médecine moléculaire et de génétique de la Wayne State University à Detroit, Michigan. Ensemble, ils ont demandé à huit systèmes d’IA de générer indépendamment des algorithmes à partir des mêmes ensembles de données utilisés dans les trois défis DREAM, sans intervention humaine directe.
Les chatbots IA ont reçu des instructions détaillées en langage naturel, similaires à celles utilisées pour guider les participants originaux de DREAM. Leur objectif était d’analyser les données du microbiome vaginal pour identifier les signes de naissance prématurée et d’examiner des échantillons de sang ou de placenta pour estimer l’âge gestationnel. La datation de la grossesse, bien qu’approximative, est essentielle pour déterminer les soins appropriés tout au long de la grossesse. Des estimations inexactes peuvent compliquer la préparation à l’accouchement.
Les chercheurs ont ensuite exécuté le code généré par l’IA à l’aide des ensembles de données DREAM. Seuls 4 des 8 outils ont produit des modèles comparables aux performances des équipes humaines, et dans certains cas, les modèles d’IA ont même été plus performants. L’ensemble du processus, de la création à la soumission de l’article, n’a pris que six mois.
Les scientifiques soulignent que l’IA nécessite une surveillance constante. Ces systèmes peuvent produire des résultats trompeurs et l’expertise humaine reste indispensable. Cependant, en triant rapidement d’énormes ensembles de données sur la santé, l’IA générative pourrait permettre aux chercheurs de consacrer moins de temps au débogage du code et davantage à l’interprétation des résultats et à la formulation de questions scientifiques pertinentes.
« Grâce à l’IA générative, les chercheurs ayant une expérience limitée en science des données n’auront pas toujours besoin de former de vastes collaborations ou de passer des heures à déboguer du code. Ils pourront se concentrer sur la réponse aux bonnes questions biomédicales. »
Adi L. Tarca, professeur au Centre de médecine moléculaire et de génétique de la Wayne State University.
Les auteurs de l’étude incluent Reuben Sarwal, Claire Dubin, Sanchita Bhattacharya et Atul Butte (UCSF), Victor Tarca (Huron High School, Ann Arbor, MI), Nikolas Kalavros et Gustavo Stolovitzky (Université de New York), Gaurav Bhatti (Université d’État de Wayne) et Roberto Romero (Institut national de la santé infantile et du développement humain (NICHD)).
Ce travail a été financé par le centre de recherche sur la prématurité March of Dimes de l’UCSF et par ImmPort. Les données utilisées dans cette étude ont été générées en partie avec le soutien de la branche de recherche sur la grossesse du NICHD.