Introduction
Imaginez un essai clinique en orthopédie sur une nouvelle prothèse de genou. Parmi les participants, certains patients souffrent d’arthrose des deux genoux et sont donc traités de manière bilatérale. Faut-il considérer chaque genou comme une observation indépendante, ou chaque patient comme une seule observation globale ? Ce dilemme méthodologique, loin d’être anodin, peut influencer considérablement les conclusions d’une étude. Ignorer la particularité des patients bilatéraux (ayant deux membres affectés) peut introduire des biais statistiques subtils mais importants. En effet, analyser deux genoux d’un même patient comme s’il s’agissait de deux personnes distinctes viole l’hypothèse d’indépendance des données, fondement de nombreuses méthodes statistiques. Dès lors, comment fiabiliser l’analyse de telles données ?
Un récent travail de Carry et coll. intitulé « Re-Evaluating the Impact of Including Patients with Bilateral Conditions in Orthopaedic Clinical Research Studies: When 1 + 1 Does Not Equal 2 » apporte un éclairage quantitatif sur ce problème. Cet article de blog propose une analyse critique de leurs résultats, en les replaçant dans le contexte de la littérature scientifique existante. Nous aborderons les risques de biais et de surestimation du signal lorsqu’on traite des membres bilatéraux comme indépendants, comparerons plusieurs approches analytiques (naïve, sélection aléatoire et modèle linéaire mixte), discuterons de l’impact sur la validité externe et la reproductibilité des essais, et conclurons sur les bonnes pratiques à adopter pour les chercheurs en orthopédie.
Risques de biais et surestimation du signal
En statistique, la notion d’indépendance signifie que chaque observation n’est pas influencée par une autre. Or, cette indépendance est rompue lorsqu’un même patient contribue plus d’une donnée à l’analyse (par exemple, deux hanches ou deux genoux). Considérer chaque membre bilatéral comme un cas distinct revient à compter deux fois certains patients, introduisant une corrélation interne aux données. Concrètement, le fait de ne pas prendre en compte cette dépendance peut fausser les résultats de plusieurs manières :
- Inflation du risque alpha (faux positifs) : Les tests statistiques reposent sur l’indépendance des échantillons. Si cette hypothèse est violée, le test peut détecter à tort une différence significative (on parle d’erreur de type I). La littérature méthodologique souligne que négliger la corrélation intrapatient peut entraîner des inférences incorrectes, avec des effets paraissant plus significatifs qu’ils ne le sont réellement. Par exemple, une étude a montré que des facteurs de risque semblaient beaucoup plus fortement associés à l’arthrose de hanche lorsque les deux hanches d’un patient étaient analysées comme indépendantes : les intervalles de confiance autour des odds ratios se rétrécissaient jusqu’à 2,68 fois par rapport à une analyse tenant compte de la dépendance. Ce rétrécissement artificiel des intervalles de confiance signifie une surestimation de la précision des résultats – on croit le « signal » (effet du traitement ou du facteur étudié) plus net qu’il ne l’est en réalité.
- Biais d’estimation : Outre la précision, on peut craindre un biais dans l’estimation de l’effet lui-même. Heureusement, dans certains cas, le fait d’inclure des données bilatérales n’introduit pas forcément de biais systématique sur la moyenne observée du groupe (c’est ce qu’ont noté Carry et coll., le biais moyen restant similaire entre méthodes dans leur simulation). Cependant, si l’on choisit arbitrairement un côté (par exemple toujours le membre le plus atteint), on peut introduire un biais de sélection. De plus, si les patients bilatéraux diffèrent des unilatéraux en termes de gravité de la maladie ou de réponse au traitement, une analyse naïve risque de sur-représenter ces patients particuliers et donc de biaiser l’effet global mesuré.
En somme, traiter 1 patient = 2 données sans précaution peut donner l’illusion de résultats plus probants qu’ils ne le sont. C’est ce qu’illustrent de nombreux travaux : plus de 80 % des études d’orthopédie comportant des observations dépendantes ne corrigeaient pas ce problème dans les années 2010, conduisant potentiellement à des estimations biaisées et trop optimistes. Le risque est alors de conclure à tort qu’un traitement est efficace ou qu’une différence existe, à cause d’un artefact méthodologique plutôt qu’une réalité clinique.
Trois approches pour analyser les données bilatérales
Plusieurs stratégies existent pour gérer la présence de cas bilatéraux dans les analyses. Carry et coll. ont comparé trois méthodes principales dans leur étude :
- Approche naïve (toutes les données traitées indépendamment) : C’est l’option la plus simple et malheureusement la plus trompeuse. Elle consiste à considérer chaque membre (chaque côté) comme une observation distincte, sans ajustement. Par exemple, un patient avec deux genoux opérés contribue deux lignes de données dans l’analyse, comme s’il s’agissait de deux patients différents. Cette approche augmente artificiellement la taille de l’échantillon, mais pas l’information réelle, ce qui conduit à sous-estimer la variabilité réelle des données. Conséquence directe : des intervalles de confiance plus étroits et des p-valeurs plus petites qu’elles ne devraient l’être, donc un risque accru de faux positifs. Carry et coll. ont confirmé que dans une situation sans véritable différence de traitement (scénario témoin), l’approche naïve produisait un taux d’erreur de type I d’environ 11 % au lieu des 5 % attendus. Autrement dit, elle double pratiquement la probabilité de conclure à tort à un effet significatif.
- Sélection aléatoire d’un seul membre par patient : Ici, on décide que chaque patient ne contribuera qu’une seule mesure à l’analyse. S’il a deux membres affectés, on en choisit un au hasard (ou selon un critère prédéfini, par exemple toujours le côté droit, ou le premier chronologiquement traité, etc.). Cette méthode a le mérite de rétablir l’indépendance des observations (chaque patient = une observation), éliminant ainsi le biais statistique induit par l’approche naïve. Dans la simulation de Carry et coll., analyser un seul membre par patient a ramené le taux de faux positifs à environ 5 %, conforme à l’erreur alpha nominale. De même, la couverture des intervalles de confiance est redevenue correcte (~95 %) alors qu’elle chutait à ~88 % avec l’approche naïve. L’inconvénient de la méthode est évident : on perd la moitié des données chez les patients bilatéraux, ce qui peut réduire la puissance statistique (diminuer la capacité à détecter un effet réel). Néanmoins, en l’absence d’outils plus sophistiqués, c’est une solution simple pour éviter les écueils majeurs de l’analyse.
- Modèle linéaire mixte (LMM) : C’est une approche plus avancée qui appartient à la famille des modèles à effets mixtes (ou modèles hiérarchiques). Elle permet d’inclure toutes les mesures bilatérales tout en modélisant la corrélation entre deux membres d’un même patient. Techniquement, on ajoute un effet aléatoire par patient (ou on utilise une structure de corrélation intra-individu) de sorte que le modèle sache que deux observations proviennent d’une même personne. Le LMM utilise ainsi l’ensemble des données sans les sur-pondérer indûment. Les résultats de Carry et coll. montrent que le LMM aboutit, tout comme la sélection aléatoire, à un taux d’erreur de type I contrôlé (~5 %) et à des intervalles de confiance avec la couverture attendue (~95 %). En d’autres termes, le LMM corrige le problème à la source en ajustant la taille effective de l’échantillon (via l’erreur standard) plutôt que d’éliminer des données. C’est statistiquement la solution la plus élégante et la plus efficace, bien qu’elle requière des compétences en modélisation un peu plus pointues. Notons que dans la simulation, le LMM et la sélection d’un seul côté ont donné des performances quasi équivalentes en termes de biais et de puissance – ce qui est rassurant quant à la validité des deux approches. Des travaux dans d’autres disciplines (par ex. en ophtalmologie, où l’on analyse deux yeux par patient) confirment que les modèles mixtes offrent un meilleur contrôle de l’erreur I comparés à d’autres techniques, tout en exploitant pleinement les données disponibles.
Il ressort de ces comparaisons que « 1 + 1 ne fait pas 2 » dès lors qu’il s’agit d’un même patient. Ajouter sans précaution une seconde mesure du même individu ne double pas l’information scientifique, et doit s’accompagner de méthodes statistiques appropriées. L’approche naïve, hélas encore trop répandue historiquement, entraîne une sous-estimation des erreurs standards. À l’inverse, des méthodes simples (choisir un côté au hasard) ou sophistiquées (LMM) permettent de conserver la validité de l’analyse sans introduire de biais majeur.
Impact sur la validité externe et la reproductibilité
Au-delà des considérations statistiques internes, le choix d’inclure ou non les patients bilatéraux – et la manière de le faire – peut influencer la validité externe des travaux et la reproductibilité des résultats. La validité externe concerne la généralisation des conclusions à la population réelle des patients et aux autres contextes cliniques. Or, en pratique, de nombreux patients orthopédiques présentent des atteintes bilatérales (deux hanches arthrosiques, deux genoux valgum, etc.). Une étude qui exclurait systématiquement les cas bilatéraux pourrait restreindre la portée de ses conclusions, qui s’appliqueraient surtout à des patients « idéalement » unilatéraux. À l’inverse, inclure ces patients enrichit l’échantillon et le rend plus représentatif de la vraie vie, à condition d’en tenir compte correctement dans l’analyse.
Si l’on n’y prend garde, l’inclusion de données bilatérales mal analysées peut compromettre la reproductibilité des résultats. En effet, des résultats « trop beaux pour être vrais » (par ex. des p-valeurs artificiellement basses) risquent de ne pas se reproduire dans une étude ultérieure plus rigoureuse ou sur un autre échantillon. Le faux signal détecté initialement s’avère alors introuvable lors de la tentative de réplication – un problème malheureusement bien connu dans la crise de la reproductibilité en science. En corrigeant le tir avec un modèle adapté ou en limitant à un membre par patient, on obtient des conclusions plus robustes, qui auront plus de chances d’être confirmées par d’autres équipes. Carry et coll. insistent d’ailleurs sur l’importance de ces pratiques méthodologiques rigoureuses pour une meilleure transposition de la recherche vers la clinique. En d’autres termes, la fiabilité interne de l’étude (absence de biais statistique) est un prérequis pour une transposition fidèle des preuves scientifiques dans la pratique quotidienne.
Notons également que du point de vue de l’interprétation clinique, donner un poids disproportionné aux patients bilatéraux peut poser question. Imaginons une étude sur une technique de rééducation où 30 % des patients ont les deux épaules touchées. Si on traite chaque épaule séparément, ces patients représenteront presque 50 % des données analysées, influençant fortement le résultat global. Peut-on généraliser ce résultat à une population où seulement 30 % des patients ont des atteintes bilatérales ? Le doute est permis. En revanche, une analyse par patient (ou ajustée par patient) restitue à chaque individu son poids égal dans l’essai, améliorant la généralisabilité des conclusions. De plus, cela évite qu’un même patient – qui pourrait avoir un profil particulier – domine l’analyse par sa double contribution. Ainsi, les choix méthodologiques autour des données bilatérales impactent non seulement la statistique, mais aussi la crédibilité clinique des résultats auprès de la communauté scientifique.
Recommandations de bonnes pratiques
Face à ces constats, quelles bonnes pratiques les chercheurs et méthodologistes en orthopédie devraient-ils adopter ? Voici quelques recommandations clés :
- Planifier à l’avance le traitement des cas bilatéraux : Dès la conception de l’étude ou du protocole d’essai, définir comment les patients ayant des atteintes bilatérales seront pris en compte. Les comités d’éthique et les registres d’essais apprécient que ces choix soient justifiés en amont.
- Utiliser des méthodes statistiques appropriées : Idéalement, privilégier des modèles statistiques qui intègrent la corrélation intra-patient, tels que les modèles linéaires mixtes à effets aléatoires (ou, pour des données non linéaires, des approches équivalentes comme les équations d’estimation généralisées – GEE). Ces techniques permettent de tirer profit de toutes les données sans fausser les taux d’erreur.
- En cas de doute, limiter une observation par patient : Si l’équipe ne maîtrise pas les modèles mixtes, la solution conservative est de n’analyser qu’un seul côté par patient. Il est recommandé que ce choix soit fait au hasard ou selon une règle fixe préétablie (par exemple toujours le côté droit), et surtout pas en fonction du résultat (ne pas choisir toujours le côté le plus sévère ou le mieux réussi a posteriori, ce qui introduirait un biais). Cette approche simple élimine le risque de faux positifs induit par la non-indépendance.
- Réaliser des analyses de sensibilité : Si l’on dispose des deux côtés, pourquoi ne pas effectuer deux analyses ? Par exemple, analyser les données avec un seul côté choisi aléatoirement, puis avec un LMM sur les deux côtés, pour vérifier que les conclusions concordent. Une telle double analyse rassure sur la robustesse des résultats.
- Collaborer avec un biostatisticien : Les études ont montré que la majorité des articles n’ajustant pas correctement les données dépendantes ne comptaient pas de statisticien parmi les auteurs. S’entourer d’un méthodologiste familier de ces questions est un atout pour assurer la qualité de l’analyse et éviter les écueils involontaires.
- Transparence dans le rapport des résultats : Il est impératif de mentionner clairement dans les publications comment les données bilatérales ont été traitées. Que l’on ait choisi un modèle mixte ou d’exclure un côté, le lecteur doit pouvoir le savoir afin d’interpréter correctement les résultats et de les reproduire le cas échéant.
En appliquant ces bonnes pratiques, la communauté orthopédique gagnera en fiabilité et en crédibilité de ses recherches. Rappelons qu’un essai clinique bien conduit méthodologiquement n’est pas qu’une exigence académique : c’est ce qui conditionne la confiance que l’on peut avoir dans ses conclusions, et donc in fine les décisions thérapeutiques qui en découlent pour les patients.
Conclusion
L’inclusion de patients aux atteintes bilatérales dans les études cliniques orthopédiques est à la fois une nécessité (pour refléter la réalité clinique) et un défi méthodologique. Comme nous l’avons vu, analyser naïvement chaque membre comme un patient peut conduire à des surestimations d’effet et à un excès de faux positifs, compromettant la validité des conclusions. À l’ère où la précision de la médecine fondée sur les preuves est primordiale, de tels écueils statistiques ne doivent plus être ignorés. Heureusement, des solutions existent et ont fait leurs preuves : du simple tirage au sort d’un côté par patient aux modèles statistiques avancés comme les LMM, il est tout à fait possible d’inclure les patients bilatéraux sans biais et sans perdre en puissance analytique.
Le message de fond de l’étude de Carry et coll. (2025) pourrait se résumer ainsi : en recherche clinique orthopédique, « 1 + 1 ne fait pas 2 » lorsque ces 1 représentent deux membres d’un même individu. Il incombe aux chercheurs de faire preuve de vigilance et de rigueur pour adapter leurs analyses en conséquence. Cette vigilance méthodologique renforcera non seulement l’intégrité scientifique de nos publications, mais aussi la confiance des cliniciens dans les recommandations qui en découlent. En évitant le piège de la non-indépendance des données, on contribue à des études plus solides, des résultats plus reproductibles, et ultimement à de meilleurs soins pour nos patients, fondés sur des preuves fiables.
Références
- Carry P.M. et al. Re-Evaluating the Impact of Including Patients with Bilateral Conditions in Orthopaedic Clinical Research Studies: When 1 + 1 Does Not Equal 2. J Bone Joint Surg Am. 2025; Online ahead of print (7 mai 2025). DOI: 10.2106/JBJS.24.01234
- Park M.S. et al. Statistical consideration for bilateral cases in orthopaedic research. J Bone Joint Surg Am. 2010;92(8):1732-7. PMID: 20660236
- LeBrun D.G. et al. Statistical Analysis of Dependent Observations in the Orthopaedic Sports Literature. Orthop J Sports Med. 2019;7(1):2325967118818410. PMID: 30637265
- Li M. & Kong X. Comparing Generalized Estimating Equation and Linear Mixed Effects Model for Bivariate Continuous Outcomes (Eye studies). Ophthalmic Epidemiol. 2023;30(3):307-316. DOI: 10.1080/09286586.2022.2098984