Publié le 2025-10-09 14:34:00. Une étude menée par la UK Biobank a exploré l’impact du régime alimentaire et de la prédisposition génétique sur le risque de cancer du sein chez près de 100 000 femmes, en utilisant des données détaillées sur l’alimentation, la génétique et les antécédents médicaux.
- L’étude a exclu un grand nombre de participants pour affiner son échantillon, ne retenant finalement que 96 195 femmes issues de la UK Biobank.
- Un indice alimentaire spécifique (DI-GM) a été calculé pour évaluer l’adhésion à un régime alimentaire favorable au microbiote intestinal.
- Un score de risque polygénique (PRS) a été développé pour quantifier la prédisposition génétique au cancer du sein.
La conception de cette étude s’appuie sur la vaste base de données de la UK Biobank, dont les méthodologies ont déjà fait l’objet de publications détaillées. Pour cette analyse, une sélection rigoureuse des participants a été effectuée. Ont ainsi été écartés les individus n’ayant pas complété un questionnaire alimentaire de 24 heures (291 290 personnes), ceux déjà diagnostiqués d’un cancer au départ de l’étude (17 957), les personnes n’étant pas d’ascendance européenne blanche (9 253), ainsi que ceux dont les données génétiques étaient incomplètes pour la construction du PRS (3 621). Des critères stricts concernant l’apport énergétique total ont également été appliqués, excluant les participants dont l’apport était jugé peu plausible (hommes < 800 ou > 5 000 kcal/jour ; femmes < 500 ou > 4 000 kcal/jour), soit 876 personnes. Enfin, les participants masculins (82 940) ont été exclus, aboutissant à un échantillon analytique final de 96 195 femmes. L’étude a été conduite sous le numéro de demande 211 772 auprès de la UK Biobank.
L’indice alimentaire du microbiote intestinal (DI-GM) a été défini à partir des données alimentaires collectées par la UK Biobank entre avril 2009 et septembre 2010, complétées par quatre enquêtes de suivi en ligne. Pour les participants ayant fourni plusieurs évaluations alimentaires, l’apport nutritionnel moyen a été calculé selon la méthodologie de Kase et al., servant de base à un score DI-GM unique et habituel, considéré comme une exposition fixe.
Ce score DI-GM repose sur 14 éléments alimentaires ou nutritionnels identifiés par Kase et al. Il comprend 10 facteurs bénéfiques, tels que les produits laitiers fermentés, les pois chiches, le soja, les céréales complètes, les fibres, les canneberges, les avocats, le brocoli, le café et le thé vert. À l’inverse, 4 facteurs sont considérés comme défavorables : les céréales raffinées, la viande rouge, la viande transformée et un apport énergétique quotidien dont plus de 40% provient des matières grasses. Le calcul du score attribue 1 point aux individus consommant au-dessus de la médiane pour les facteurs bénéfiques ou en dessous de la médiane pour les facteurs défavorables, et 0 point dans les autres cas. Le score total varie de 0 à 14, un score plus élevé signifiant une plus grande adhésion à un régime alimentaire bénéfique pour le microbiote intestinal. Les participantes ont été réparties en trois groupes : faible (0 à 4), modéré (5 à 6) et élevé (≥ 7).
Pour évaluer la prédisposition génétique au cancer du sein, un score de risque polygénique (PRS) a été construit. Il se base sur 168 polymorphismes mononucléotidiques (SNP) ayant atteint une signification à l’échelle du génome dans les populations d’ascendance européenne. Ces SNP ont été extraits d’études primaires et leurs informations détaillées sont disponibles dans le tableau supplémentaire. Le PRS est calculé comme la somme des allèles de risque pondérés par leurs tailles d’effet respectives. Les participantes ont ensuite été classées en trois groupes de risque génétique : faible (tertile inférieur), intermédiaire (tertile médian) et élevé (tertile supérieur).
L’objectif principal de cette étude était d’évaluer l’incidence du cancer du sein. Les cas ont été vérifiés grâce à la liaison électronique des enregistrements avec les registres centraux du National Health Service et les registres de décès. Le suivi a pris fin au moment du premier diagnostic de cancer du sein, du décès, ou à la date de fin du suivi (31 octobre 2022 pour l’Angleterre, 31 mai 2022 pour le Pays de Galles et 31 août 2022 pour l’Écosse). Le cancer du sein a été défini selon la Classification internationale des maladies, dixième révision (CIM-10), code C50.
Diverses covariables confusionnelles potentielles ont été évaluées, basées sur la littérature antérieure et des associations biologiquement plausibles. Celles-ci incluent l’âge au recrutement, le revenu annuel du ménage (catégorisé), le niveau d’éducation, l’indice de défavorisation de Townsend, les mesures anthropométriques (taille, poids, IMC), les antécédents familiaux de cancer du sein, ainsi que des facteurs liés au mode de vie et au comportement tels que l’apport énergétique total, le tabagisme, la consommation d’alcool, le niveau d’activité physique, le statut ménopausique, la parité, les antécédents d’utilisation d’hormones et de contraceptifs oraux, et l’âge à la ménarche. Les données manquantes pour les covariables continues ont été imputées par la moyenne, tandis que les covariables catégorielles manquantes ont été attribuées à une catégorie « inconnu/manquant ».
L’analyse statistique a débuté par la description des caractéristiques de base des participantes, stratifiées par groupes DI-GM, à l’aide de moyennes et écarts-types pour les variables continues, et de fréquences pour les variables catégorielles. Des tests de Kruskal-Wallis et du chi carré ont été employés pour évaluer les différences.
L’hypothèse des risques proportionnels a été vérifiée sans violation observée. Des modèles de régression de Cox multivariés ont été utilisés pour analyser les associations entre le DI-GM et le risque de cancer du sein, exprimés sous forme de rapports de risques (HR) avec intervalles de confiance (IC) à 95%. Trois modèles ont été construits : un modèle brut, un modèle ajusté pour l’âge, l’IMC et l’apport énergétique, et un modèle incluant des ajustements pour de nombreuses autres covariables (revenu, tabagisme, éducation, alcool, activité physique, antécédents familiaux, indice de Townsend, statut ménopausique, parité, usage d’hormones et de contraceptifs oraux, âge à la ménarche). Le DI-GM a été analysé comme variable catégorielle et continue. De plus, une analyse par splines cubiques restreintes (RCS) a permis d’explorer d’éventuelles relations non linéaires entre le DI-GM, le PRS et le risque de cancer du sein.
Les effets combinés du PRS et des facteurs génétiques sur le risque de cancer du sein ont été évalués en classant les participantes en neuf groupes selon les catégories du PRS. L’interaction additive a été quantifiée via le risque relatif excessif dû à l’interaction (RERI) et la proportion attribuable (AP), tandis que l’interaction multiplicative a été examinée par des tests de rapport de vraisemblance.
Afin d’évaluer si les associations entre le DI-GM et le risque de cancer du sein variaient selon les sous-groupes, des analyses stratifiées ont été réalisées pour l’âge, l’IMC, le niveau d’éducation, l’indice de privation de Townsend, le statut tabagique, la consommation d’alcool, le revenu annuel du ménage, le statut ménopausique, la parité, les antécédents d’utilisation d’hormones, les antécédents d’utilisation de contraceptifs oraux et l’âge à la ménarche.
Plusieurs analyses de sensibilité ont été menées pour confirmer la robustesse des résultats. Celles-ci comprenaient la reconstruction du DI-GM sans les canneberges et les pois chiches, l’exclusion des participantes diagnostiquées de cancer du sein dans les deux premières années de suivi pour minimiser la causalité inverse, l’élimination des personnes ayant rempli un seul questionnaire alimentaire pour garantir une évaluation précise de l’apport habituel, et enfin, l’exclusion des individus présentant des covariables inconnues ou manquantes.
Toutes les analyses statistiques ont été effectuées à l’aide du logiciel R, version 4.3.1. Une valeur de P inférieure à 0,05 (bilatérale) a été considérée comme statistiquement significative.