Une analyse massive de données de laboratoire, portant sur plus de 2 milliards de résultats, pourrait révolutionner la médecine personnalisée. Des chercheurs israéliens ont développé un modèle d’apprentissage profond capable de définir des valeurs de référence individualisées, offrant ainsi aux cliniciens un outil sans précédent pour le suivi de la santé et la détection précoce des maladies.
La plupart des patients subissent régulièrement des analyses de sang qui mesurent divers marqueurs métaboliques. Les résultats, généralement exprimés en chiffres ou en texte, sont accompagnés de plages de référence dites « normales ». Ainsi, un taux de cholestérol sérique inférieur à 200 mg/dL ou un taux d’hormones thyroïdiennes entre 4,5 et 12,0 mcg/dL sont traditionnellement considérés comme rassurants. Cependant, cette approche universelle pourrait bientôt devenir obsolète. En effet, ce qui est normal pour une personne peut ne pas l’être pour une autre, suggérant qu’une plage de référence unique ne reflète pas adéquatement la santé de chaque individu.
Des études récentes ont déjà mis en lumière cette disparité, révélant que pour plus de la moitié des résultats d’analyses de laboratoire courants, les plages de référence standards diffèrent lorsque les caractéristiques personnelles des patients sont prises en compte. Forts de ce constat, des chercheurs de l’Institut Weizmann et du Centre médical Sourasky de Tel Aviv ont entrepris une analyse de grande envergure. Ils ont extrait 2,1 milliards de mesures de laboratoire issues des dossiers médicaux électroniques de 2,8 millions d’adultes, couvrant 92 tests différents.
L’objectif de cette initiative était de créer des « gammes de référence basées sur les données, qui prennent en compte l’âge, le sexe, l’ethnicité, l’état de maladie et d’autres caractéristiques pertinentes ». Pour y parvenir, ils ont eu recours à l’apprentissage automatique et à la modélisation computationnelle afin de segmenter les patients en différents groupes (« bacs ») en fonction de leur état de santé, de leurs traitements médicamenteux et de leurs maladies chroniques. Au terme de ce processus, l’équipe disposait d’environ un demi-milliard de résultats de laboratoire pour modéliser un ensemble de valeurs de référence plus fidèles à la réalité des personnes en bonne santé. Ces nouvelles gammes pourraient ensuite servir à prédire les anomalies futures et l’évolution des maladies.
Poussant leurs recherches plus loin, les scientifiques ont appliqué leurs algorithmes pour évaluer le risque de troubles spécifiques chez des individus en bonne santé. En examinant des indicateurs d’anémie tels que l’hémoglobine et le volume globulaire moyen (une mesure de la taille des globules rouges), leurs nouveaux modèles de risque ont permis de distinguer les patients souffrant d’anémie microcytaire ou macrocytaire de ceux qui ne présentaient pas de risque particulier, les plaçant à un niveau de risque comparable à celui de la population générale non anémique. Des avancées similaires ont été observées lors de l’application de ces modèles au prédiabète. « En utilisant un modèle de risque personnalisé, nous pouvons améliorer la classification des patients prédiabétiques et identifier ceux à risque deux ans plus tôt par rapport à une classification basée uniquement sur les niveaux actuels de glucose », ont-ils souligné.
Au sein de la Mayo Clinic, l’importance de ce type d’analyse de données a été rapidement reconnue. Le Dr William Morice, président du département de médecine de laboratoire et de pathologie, a déclaré : « À l’ère du big data et de l’analyse, il est presque inconcevable que nous utilisions encore des ‘gammes de référence normales’ qui manquent de données contextuelles, et potentiellement de puissance statistique, pour guider les cliniciens dans l’interprétation clinique des résultats quantitatifs de laboratoire. »
Dans ce contexte, le Dr Piero Rinaldo, généticien médical et pionnier dans ce domaine, se concentre sur l’application de ces approches au dépistage des erreurs innées du métabolisme. Il a développé un outil novateur, le Collaborative Laboratory Integrated Reports (CLIR), désormais utilisé à l’échelle mondiale pour cette application spécifique.
Le Dr Rinaldo a expliqué que la Mayo Clinic adopte une approche plus personnalisée des tests de laboratoire depuis 2015, et que CLIR est un logiciel « prêt à l’emploi pour la création collaborative de gammes de référence de précision ». Cette application web a été utilisée pour générer plusieurs ensembles de données personnalisés capables d’améliorer l’interprétation des résultats d’analyses par les cliniciens. Le Dr Rinaldo et son équipe l’ont notamment déployée pour améliorer le dépistage néonatal de l’hyperthyroïdie congénitale. Le logiciel CLIR, qui intègre les résultats ajustés en fonction de covariables issus de sept programmes et de plus de 1,9 million de résultats de tests, est capable d’agréger des données de différents tests en un ensemble d’outils d’interprétation personnalisés, aidant ainsi les médecins à mieux distinguer les faux positifs des résultats de tests réellement significatifs.