La Mayo Clinic repousse les limites de la protection de la vie privée des patients en matière de recherche médicale. Sa nouvelle plateforme, Orchestrate, permet aux entreprises pharmaceutiques et biotechnologiques d’accéder à des données de santé riches et standardisées, tout en garantissant une confidentialité renforcée grâce à une approche innovante de la désidentification.
Maneesh Goyal, directeur des opérations de Mayo Clinic Platform, critique l’approche traditionnelle de l’anonymisation des données, souvent basée sur la méthode HIPAA Safe Harbor. « De nombreuses organisations se contentent d’anonymiser les données des patients, ce qui les exclut de la portée de la loi HIPAA, mais nous pensons que ce n’est pas suffisant pour les protéger, surtout avec la quantité croissante de données disponibles », explique-t-il.
Orchestrate offre un accès à des données standardisées et réelles sur le cancer, ainsi qu’à celles des participants à la plateforme Connexion de la clinique Mayo, à partir du 11 février. Mais comment la Mayo Clinic assure-t-elle la confidentialité des patients lorsqu’elle partage ces informations avec des acteurs externes ?
La solution réside dans une méthode de désidentification plus sophistiquée que le simple effacement des identifiants directs. « Nous ne nous contentons pas de supprimer les informations qui pourraient révéler l’identité d’un patient, nous les modifions », précise M. Goyal. Il illustre cette approche avec l’exemple de son propre dossier médical : « Nos outils remplacent les données personnelles par des informations fictives, tout en conservant les notes cliniques. Nous décalons également les dates de l’ensemble du dossier, rendant ainsi l’identification beaucoup plus difficile. »
La Mayo Clinic dispose d’environ 100 pétaoctets de données de santé structurées et non structurées, dont 28 pétaoctets ont été anonymisés selon cette méthode. Les données non structurées, issues des notes cliniques, sont particulièrement précieuses car elles fournissent le raisonnement du médecin lors d’un diagnostic ou d’une décision thérapeutique.
Ces données anonymisées sont stockées dans un « conteneur cloud » sécurisé. « L’accès est fourni dans un environnement isolé, un bac à sable, au sein de notre infrastructure contrôlée. Aucun dossier patient individuel n’est visible et toutes les données extraites du système sont vérifiées », assure M. Goyal. Ce système, qualifié d’« environnement de salle blanche », est également conforme aux réglementations internationales.
Un autre concept clé est l’« apprentissage fédéré », appliqué aux partenaires de la Mayo Clinic, comme l’hôpital Israelita Albert Einstein au Brésil. « L’apprentissage fédéré consiste à envoyer une question à différents ensembles de données et à agréger les réponses, sans que les données brutes ne quittent jamais leur environnement sécurisé », explique-t-il.
Grâce à Orchestrate, les entreprises pharmaceutiques peuvent effectuer des analyses complexes, former des modèles d’intelligence artificielle ou simplement obtenir une meilleure compréhension des maladies. Elles peuvent par exemple poser des questions telles que : « Quelle est l’évolution de la maladie X chez les patients répondant aux critères Y, et quelles comorbidités sont associées ? » ou « Comment ce médicament fonctionne-t-il chez les patients diabétiques par rapport aux non-diabétiques ? »
Cette plateforme permet également de valider les hypothèses avant de lancer des essais cliniques coûteux et chronophages. « Nos partenaires pharmaceutiques utilisent Orchestrate pour créer des essais cliniques synthétiques et évaluer la reproductibilité des résultats sur une population de patients plus large », précise M. Goyal. « Cela permet de réduire le gaspillage d’argent et d’efforts dans le développement clinique. »
Orchestrate simplifie également le processus de recrutement de patients pour les essais cliniques. « Nous pouvons identifier un ensemble de patients à partir de nos données anonymisées, faire appel à un spécialiste de la maladie, constituer une cohorte, obtenir l’approbation d’un comité d’éthique et recruter rapidement des participants pour la collecte d’échantillons de tissus », détaille M. Goyal. « Nous profilons ensuite ces échantillons, en effectuant des analyses génétiques, protéomiques et épigénétiques, et nous intégrons ces données dans le dossier médical anonymisé du patient avant de les remettre à nos partenaires pharmaceutiques. »
L’accès à la plateforme Orchestrate est proposé sur un modèle d’abonnement.