Etude
de non infériorité
Lorsqu’une étude ne montre pas de supériorité d’un médicament ou d’un traitement par rapport à un autre, ses conclusions ne permettent pas de conclure à leur équivalence. Dans ce type de recherche « absence de preuve de différence ne veut pas dire preuve d’équivalence ». L’absence de différence observée entre deux produits peut correspondre à trois situations : les deux traitements sont également efficaces, les deux traitements sont également inefficaces ou l’étude manque de puissance pour montrer une différence entre ces deux traitements, par exemple parce que la population incluse dans l’étude est trop petite, le nombre de « cas » est trop faible pour montrer une différence, elle également très faible.
Ce type de réponse d’une étude est peu satisfaisant. Nous désirons, soignant comme patient, savoir si un médicament est plus efficace, plus sûr, que ceux qui sont déjà utilisés ou s’il est, au moins, aussi bon (1,2).
Le caractère non éthique de la mise sur pied d’une étude comparant un nouveau médicament à un placebo dans une pathologie donnée, pour lequel un traitement efficace et suffisamment sûr existe, conduit à élaborer de plus en plus fréquemment un autre type d’étude : les études de non infériorité. Ces études sont souvent aussi parfois appelées, à tort, études d’équivalence. Il existe, en effet, quelques distinctions entre ces deux types d’études. Il est impossible de prouver une équivalence parfaite entre deux traitements, la probabilité que la différence (delta) soit nulle est… elle-même nulle. Un traitement A sera dit non inférieur à un traitement B si l’efficacité de A est au moins équivalente à celle de B, c’est-à-dire si l’efficacité de A est soit équivalente à celle de B, soit non équivalente et supérieure à celle de B. Deux traitements A et B seront dits équivalents si la différence delta entre ces deux traitements est inférieure à une borne clinique. Une borne d’équivalence clinique (ΔC) appelée borne de non infériorité dans des études de non infériorité, résulte d’un consensus entre experts basé sur une étude de la littérature, de préférence une méta-analyse, si elle existe. Elle doit être inférieure à la borne de supériorité considérée comme notable et cliniquement signifiante ; une valeur représentant la moitié de la borne de supériorité est généralement choisie, parfois les deux tiers (3).
Schéma - exemple à découvrir dans LLG n° 52
En termes statistiques, l’hypothèse nulle est la base de l’analyse des résultats. Les tests statistiques utilisés pour analyser les résultats d’une étude ne peuvent que rejeter l’hypothèse nulle (et non la prouver). Dans une étude de supériorité, rejeter une hypothèse nulle signifie rejeter l’absence de différence. Dans une étude de non infériorité, rejeter l’hypothèse nulle signifie rejeter une différence entre les deux (ou trois) traitements évalués (4,5). Ici aussi, l’absence de preuve d’une différence n’est pas la preuve de l’absence d’une différence (1).
La méthodologie d’une étude d’infériorité nécessite quelques conditions supplémentaires par rapport à celle des études de supériorité. McAlister et Sackett (6) mentionnent comme différences nécessaires pour une étude de non infériorité : une analyse par protocole (résultats des patients qui ont réellement pris le médicament) en plus de l’analyse en intention de traiter (résultats de tous les patients inclus dans l’étude), la preuve de l’efficacité du médicament choisi comme contrôle, des patients et des critères d’évaluation similaires à ceux d’études précédentes montrant une efficacité, une application stricte du protocole, une hypothèse nulle appropriée, une marge d’équivalence spécifiée dans le protocole initial. Il faut particulièrement insister sur la nécessité que les médicaments comparés aient, par ailleurs, prouvé leur efficacité.
Eléments particuliers
La marge d’équivalence ou borne d’équivalence clinique ΔC doit être soigneusement déterminée dans le protocole d’étude (suivant les critères décrits plus haut) et ne peut être fixée a posteriori. Pour qu’il y ait non infériorité, la limite inférieure de l’intervalle de confiance des résultats observés ne peut dépasser la valeur DC fixée.
L’échantillon d’une étude de non infériorité doit être plus important que celui d’une étude de supériorité. Certains experts citent des chiffres de 10% (4) mais d’autres (3) sur base d’un calcul d’une borne de non infériorité choisie comme étant égale à la moitié de la borne de supériorité, mentionnent un rapport de 1 (supériorité) à 4 (non infériorité). Si des chercheurs anticipent une supériorité de leur (nouveau) traitement par rapport à un ancien, ils ot ont donc tout intérêt à réaliser une étude de supériorité. Dans une étude de non infériorité, des co-traitements doivent être absolument évités.
Si une analyse en intention de traiter est nécessaire pour une étude de supériorité, pour une étude de non infériorité, c’est l’analyse par protocole (« on treatment ») qui est valide. Dans ce cas, une analyse en intention de traiter peut, en effet, conduire à une conclusion faussement négative d’absence de non infériorité.
Le médicament de référence doit, ici aussi, avoir une efficacité prouvée, de préférence dans l’étude en question, d’où l’intérêt capital d’un troisième bras d’étude avec un placebo.
Passage d’une analyse de supériorité à non infériorité ou l’inverse
Pour analyser les résultats d’une étude, passer d’un protocole de supériorité à un protocole de non infériorité est possible pour autant qu’une marge d’équivalence ait été fixée dans le protocole de départ et que les autres critères de validité soient rencontrés. E même, pour passer d’un protocole de non infériorité à un protocole de supériorité est possible pour autant que plusieurs conditions soient respectées : le protocole de non infériorité initial doit être correct, la valeur p pour montrer la supériorité doit être calculée et le résultat statistiquement significatif et l’analyse doit, cette fois, être faite en intention de traiter (2).
Prenons un exemple : dans une étude évaluant l’efficacité d’un traitement kinésithérapique bref versus kinésithérapie habituelle pour des cervicalgies (7) le protocole initial était en non infériorité. En raison de l’absence d’atteinte d’une population d’étude suffisante, donc avec une puissance non respectée pour une analyse en non infériorité, les auteurs analysent les résultats en étude de supériorité. Pour ce faire, ils respectent les conditions de validité nécessaire : protocole de non infériorité initial correct, calcul de p et résultats significatifs. Ils observent ainsi une supériorité du traitement kinésithérapique habituel à douze mois.
Validité des études de non infériorité
Une publication récente analyse 8 études (9 publications) de non infériorité dans le domaine cardiovasculaire (8). Selon les auteurs de ces recherches, une non infériorité était montrée pour 7 de ces publications. Une ré analyse des données ne confirme une non infériorité que pour 4 des 8 études, après une analyse fouillée des marges de non infériorités choisies.
Pour conclure
La complexité de la lecture de cet article illustre bien la difficulté d’analyse des résultats d’une étude de non infériorité. Il est donc important pour une forte majorité des praticiens, de pouvoir se référer à des experts dans le domaine qui peuvent certifier leur absence de conflits d’intérêt mais également traduire les résultats en terme de pertinence clinique.
Pierre Chevalier.
Références
1. Sackett DL. Superiority trials, non-inferiority trials, and prisoners of the 2-sided
null hypothesis. http://www.evidence-basedmedicine.com
2. Committee
for proprietary medicinal products (CPMP). Points to consider on switching
between superiority and non-inferiority. EMEA CPMP/EWP/482/99.
3. Grouin JM et Coste M. Essais de non-infériorité et d’équivalence: méthodologie et analyse. In Essais cliniques : théorie, pratique et critique. Médecine-Sciences Editions Flammarion 2006.
4. Djulbegovic B, Clarke M.
Scientific and ethical issues in equivalence trials. JAMA 2001;285(9):1206-8.
5. D’Agostino
Sr RB, Massaro JM, Sullivan LM. Non-inferiority trials: design concepts and
issues – the encounters of academic consultants in statistics. Statist
Med 2003;22:169-86.
6. McAlister FA, Sackett DL. Active-control
equivalence trials and antihypertensive agents. Am J Med 2001;111:553-8.
7. Klaber Moffett J A, Jackson D A,
Richmond S, Hahn S, Coulton S, Farrin A, Manca A, Torgerson D J. Randomised
trial of a brief physiotherapy intervention compared with usual physiotherapy
for neck pain patients: outcomes and patients’ preference. BMJ 2005;330:75-80.
8. Kaul S, Diamond GA. Good enough:
a primer on the analysis and interpretation of noninferirity trials. Ann Intern
Med 2006;145:62-9.