Les courbes de survie

Accueil > Sommaire > Courbe de survie

1       Introduction

L’objet de ce document est de présenter l’intérêt et l’interprétation des courbes de survies (« survival curve »). Nous ne rentrerons pas dans le détail des calculs statistiques que le lecteur trouvera dans de nombreux ouvrages de statistiques (1, 2), mais nous insisterons sur l’analyse des courbes de survie et des tests qui leur sont rattachés, et sur les risques d’interprétations erronées.

Dans de nombreuses situations, l’un des objectifs thérapeutiques envisageables est de retarder la survenue d’un événement clinique. Dans le cas du décès, cet objectif revient à vouloir augmenter la durée de survie des patients. Dans la suite, nous n’envisagerons que le cas du décès et du temps de survie, mais la totalité de ce qui sera présenté s’applique aussi à tout autre type d’événements cliniques (infarctus, greffes, hospitalisation, etc.). On parle alors de survie sans événement.

En cancérologie, les survies sans progression de la maladie («progression-free survival ») ou sans rechute (« recurrence-free survival », « relapse-free survival ») sont couramment utilisée.

Cet objectif revient à montrer qu’un traitement augmente la durée moyenne de survie des patients traités par rapport à celle des patients contrôles. L’importance de l’effet du traitement s’apprécie alors par l’augmentation de la durée moyenne de survie qu’il engendre, mesurée de façon absolue ou relative.

En pratique, cependant, l’estimation des durées moyennes de survie se révèle impossible dans de nombreuses situations car il est rare de suivre tous les patients jusqu’à la survenue de l’événement considéré. Pour pallier cette difficulté les techniques d’analyse de survie ont été développées. Elles n’apportent cependant qu’une réponse indirecte et partielle à la question posée, celle de la détermination de l’effet d’un traitement sur la durée moyenne de survie. Les techniques d’analyse de survie décrivent aussi la dynamique de survenue des décès.

Exemple

Dans un essai, la survie moyenne obtenue sans traitement dans le groupe contrôle a été de 24 mois. Dans le groupe recevant le traitement étudié, la durée moyenne de survie a été de 28 mois. Le traitement a donc apporté un gain en durée moyenne de survie de 28-24 = 4 mois. Ce gain absolu peut aussi être exprimé en gain relatif : (28-24)/24 = 16,7%. Le traitement augmente l’espérance de vie de 17%, c’est à dire que le traitement la multiplie par 1,17 (=28/24).

2       Suivi partiel des patients

La mesure de la durée de survie moyenne d’un groupe de patients nécessite de suivre tous les sujets jusqu’à la survenue de leur décès. Ceci n’est que rarement envisageable car le plus souvent cela nécessiterait une durée d’étude parfois très longue et reculerait de façon non acceptable le moment d’obtention de la réponse à la question posée. Pour des pathologies de gravité moyenne, il serait nécessaire de suivre les patients durant des dizaines d’années ou de n’inclure que des sujets très âgés.

Une censure survient lorsque l’on arrête de suivre un patient avant la survenue de l’événement.

En pratique, certains patients sont toujours vivants à la fin de l’étude. Leur suivi est dit « censuré » (« censured ») dans la terminologie statistique et par abus de langage, ces patients sont appelés « patients censurés ». Cependant, dans certains domaines médicaux où les taux de mortalité sont extrêmement élevés, comme avec certains cancers ou dans certaines situations de réanimation, il est possible de déterminer la durée de survie de presque tous les patients.

L’existence de censure empêche le calcul de la durée de survie moyenne, car toutes les durées de survie ne sont pas connues.

Exemple

Cinq patients ont été inclus dans une étude, leur survie respective est de : 6 mois, 7 mois, 9 mois, 11 mois, 18 mois. La survie moyenne est donc de 10.2 mois. Si l’étude n’avait durée que 12 mois, la survie du dernier patient n’aurait pas été connue. La moyenne des survies disponibles à 12 mois (4 premiers patients), 8.25 mois, n’a aucun sens et sous estime fortement la survie moyenne réelle.

2.1      Origine des censures

Dans un essai thérapeutique, les censures surviennent dans deux circonstances.

La première correspond aux patients qui sont toujours vivants au terme de la durée de l’essai (cf. section suivante). Cette censure est inévitable et provient uniquement du fait que, chez ces patients, la durée de suivi dans l’essai est inférieure à la durée de survenue du décès. Ces censures n’entraînent pas de biais.

L’autre circonstance conduisant à une censure concerne les patients perdus de vu en cours d’essais (ou retirés de l’essai avec un arrêt de leur suivi). Le suivi de ces patients est interrompu avant la survenue du décès et, à ce titre, il s’agit d’une censure. Cependant, ces censures sont susceptibles d’introduire des biais comme tous perdus de vue ou retraits de l’essai en général (cf. chapitre Analyse en intention de traiter), car leur survenue n’est peut-être pas aléatoire. Ce type de censure correspond aisni à une donnée manquante.

Les censures liées aux patients perdus de vue ou aux retraits de l’essai sont prises en considération par les méthodes statistiques de la même façon que celles correspondant aux patients n’ayant pas présenté l’événement durant la durée de l’essai, mais elles sont susceptibles d’introduire un biais. Ces deux types de censures ne doivent donc pas être confondus. Ce n’est pas parce que les méthodes d’analyses de survie permettent d’exploiter les censures correspondant aux perdus de vue, qu’elles évitent que ces perdus de vue biaisent les résultats (cf. infra). Avec les techniques d’analyse des données de survie, les patients perdus de vue doivent être considérés comme tels et non pas comme de simples censures. Leur nombre doit être donné dans le rapport, et lors de la réalisation de l’essai tout doit être fait pour les éviter.

Figure 1 – Illustration des différents types de censures rencontrées dans un essai. Dans le cas 1, le décès survient durant la période de suivi de l’essai. Dans le cas 2, le décès survient au-delà de la fin de l’essai. À la fin de la période de suivi, le patient est vivant. Il est pris en considération comme un censuré vivant. Il ne gênera pas l’estimation de la courbe de survie durant la période de l’essai. Le cas 3 est celui d’un patient qui est décédé durant la période de suivi mais ce décès n’est pas connu car le patient a été préalablement perdu de vue. Il s’agit aussi d’une censure, mais celle-ci soustrait de l’information et fausse l’estimation de la courbe de survie durant la période de l’essai.

2.1      Étalement des inclusions

Les inclusions dans un essai thérapeutique s’étalent sur une période plus ou moins longue. Il est exceptionnel que tous les patients soient inclus le même jour. La durée de la période de recrutement est variable en fonction du nombre de centres investigateurs participants, de la rareté de maladie.

La fin du suivi d’un patient peut être définie de deux façons : à une date fixe ou après une durée de suivi déterminée.

Lorsque l’essai est arrêté à une date donnée (appelée date de point), la durée de suivi des patients est variable : le premier patient inclus dans l’essai a la durée de suivi la plus importante, le dernier patient la plus courte. Pour caractériser la durée pendant laquelle les patients ont été suivis, il convient alors de préciser la durée moyenne de suivi accompagnée des valeurs du suivi le plus court et de celui le plus long.

Figure 2 – Essai à date de point

Le suivi d’un patient peut aussi se terminer au bout d’une période de temps donnée, identique pour tous les patients. Par exemple, le suivi des patients prend fin lors de la visite réalisée à 1 an. Cette visite permet de mesurer le critère de jugement et met un terme à la participation du patient à l’essai. Dans ce type d’essai, tous les patients ont la même durée de suivi.

Figure 3 – Essai assurant la même durée de suivi pour tous les patients.

Assez souvent, l’attitude adoptée combine c’est deux possibilités. Une date de point est choisie de telle façon qu’elle assure pour tous les patients le suivi minimum recherché, par exemple 1 an. Les premiers patients sont alors pris en considération avec des durées de suivi plus importantes. Les résultats de cet essai pourront ainsi être évalués à deux moments différents : au bout du suivi recherché (résultat à 1 an par exemple) et à la fin de l’essai (avec des suivis variables pour les patients). Le résultat en fin d’étude se rapporte à la durée moyenne de suivi.

Exemple

Enrollment in the trial began on February 17, 1983, and ended on June 30, 1986.The patients underwent a final evaluation after the study’s completion (cutoff date, June 30, 1987). All the patients were followed for at least 12 months, to a maximum of 52 months; the average duration of follow up was 25 months”.

Note : Attention a ne pas confondre la durée moyenne de suivi et la durée moyenne de survie. Le suivi est la durée pendant laquelle un patient est suivi dans l’essai (de sa date d’inclusion à la date de fin de l’étude ou à sa date de  décès). La survie est la durée qui s’écoule entre la date d’inclusion et la date de son décès (Évidement si le patient est toujours vivant à la fin de l’étude, sa survie est inconnue).

L’utilisation des courbes de survie permet de calculer l’effet du traitement pour des reculs où seulement une partie des patients a été suivie aussi longtemps. Par exemple, dans un essai où la durée de suivi moyenne est de 1,9 ans il est possible de calculer l’effet à 2 ans, à 3ans. Environ la moitié des patients sont « complètement » informatifs pour le calcul de l’effet à 2 ans, et seulement une faible proportion pour celui à 3ans. La précision de ces estimations diminue donc au court du temps. Pour cette raison, les représentations graphiques des courbes de survie doivent rapporter l’évolution du nombre de patients exposés au risque au cours du temps (cf. figure 15).

Ainsi, l’effet du traitement à 3 ans donné par l’analyse des courbes de survie d’un essai où les durées de suivi s’étalent entre 2 et 4 ans, n’a pas la même précision, et donc, pas la même valeur, que l’estimation apportée par un essai où tous les patients ont été suivis 3 ans. En d’autres termes, il convient de toujours analyser la proportion des patients qui ont apporté de l’information pour le calcul d’un effet traitement à un moment donné.

3       Distribution asymétrique des temps de survie

La distribution des durées de survie est asymétrique dans presque tous les cas (cf. figure 6). La durée de survie étant une variable continue, sa distribution peut être caractérisée par les paramètres de position et de dispersion habituels tels que : moyenne, médiane, écart-type ou étendue. Cependant le caractère asymétrique des distributions des durées de survie incite à préférer la médiane et la distance inter-quartile à la moyenne et à l’écart type.

4       Représentations graphiques des données de survie

Plusieurs types de courbes permettent de représenter les données de survie et de décrire la dynamique d’apparition des événements au cours du temps.

4.1      Définitions

4.1.1      Courbe de survie

Le taux de survie au temps t représente la proportion de patients toujours vivants après une durée de suivi t.

La courbe de survie est la représentation la plus employée pour décrire la dynamique de survenue au cours du temps des décès. Elle représente en fonction du temps le taux de survie (« survival rate »), c’est à dire la proportion des sujets initialement inclus dans l’essai toujours vivants au temps t. C’est la probabilité de survivre au moins jusqu’au temps t.

Figure 4 – Exemple de courbe de survie. Le taux de survie S(t) est la proportion des sujets initialement inclus dans l’essai toujours vivant au temps t.

D’autres représentations de la dynamique d’apparition des événements sont également disponibles qui présentent d’une manière différente la même information.

4.1.2      Courbe des taux cumulés d’événements

La courbe de survie S(t) est le complément à 1 du taux cumulé d’événements en fonction du temps F(t) (figure 5). En effet, si, à un temps t le taux de survie est de 20%, le taux d’événement (décès) à ce temps est de 1-20% = 80%. Le taux cumulé d’événement n’est rien d’autre que le risque.

 

Figure 5 – Courbe du taux cumulé d’événements correspondant à la courbe de survie de la figure 4.

 

4.1.3      Distribution des temps de survie

Une autre représentation de la même information est la distribution f(t) des temps de survie. La distribution cumulative correspondante est la courbe F(t).

Figure 6 – Distribution des durées de survie correspondant à la courbe de survie de la figure 4.

 

4.1.4      Courbe du risque instantané

Le risque instantané (« hazard ») h(t) est le taux de décès observé sur une courte période du suivi entre t et Dt. Bien que mathématiquement il corresponde au risque de décéder durant une période de temps infinitésimale, en pratique, on peut l’associer, par exemple, au risque de décéder durant 1 jour ou 1 semaine ou 1 mois, en fonction de la gravité de la pathologie.

Le nombre de patients qui décèdent entre t et t+dt est donc égal au nombre de survivants en début de période multiplié par le risque instantané de cette période xt=nt*h(t).

 

Figure 7 – Représentation graphique du risque instantané.

4.1.5      Exemple numérique

Le tableau 1 représente ces différents indicateurs dans un exemple numérique où le temps est découpé en années. Pour la clarté de l’illustration, le risque instantané est assimilé au risque annuel.

Tableau 1 – Exemple numérique illustrant les différents paramètres utilisés pour décrire la dynamique de survenue des événements. De plus amples informations sont données par le texte.

Le nombre de survivants n(t) est le nombre de sujets toujours vivants en début d’année. Pour la première année ce nombre est le nombre de sujets inclus dans l’étude. À chaque début d’année, ce nombre diminue du nombre de décès survenus durant l’année écoulée.

Le risque instantané h(t) qui représente le taux de décès annuel est ici constant au cours du temps et égal à 10%. Cette situation est celle d’une maladie chronique où le risque de décéder varie peu au cours du temps. La simplicité de cette situation a été choisie pour simplifier la compréhension des mécanismes cachés derrière une courbe de survie. Dans la réalité des formes plus complexes de courbe de risque instantané sont observées.

Le nombre de décès dans l’année diminue au fil du temps étant donné qu’il est proportionnel au nombre de sujets toujours vivants en début d’année et que ce dernier diminue au cours des années. Ainsi, sans que la gravité de la maladie ne diminue (le risque instantané est toujours le même) la pente de décroissance de la courbe de survie se réduit. Cette situation, où le risque instantané est constant au cours du temps, est appelée modèle exponentiel car il conduit à une décroissance exponentielle du nombre de survivants. Par analogie avec la pharmacocinétique, elle peut être représentée par un modèle compartimental. A chaque instant, la « quantité » de sujets qui quittent la population observée (qui décèdent) est proportionnelle au nombre de sujets présents dans cette population. Le coefficient représentant la vitesse de « sortie » de la population est le risque instantané. La dynamique de ce système est représentée par l’équation différentielle :

Le nombre de décès cumulés est obtenu en cumulant le nombre de décès survenus durant les années précédentes.

Le taux cumulé d’événements est le rapport du nombre cumulé de décès divisé par l’effectif initial. Le taux de survie est le complément à 100% du taux d’événements cumulés.

 

Risque annuel

Le risque annuel ou taux annuel de mortalité ne s’obtient pas en divisant le taux cumulé observé à un moment donné par la durée de suivi. Dans notre exemple, le taux cumulé de décès à 10 ans est de 65,5%, ce qui pourrait laisser penser que le taux annuel de décès est de 65,5%/10=6,55%, valeur sousestimant la vraie valeur qui est 10%. L’écart est dû au fait qu’une interpolation linéaire est utilisée sur une exponentielle. En fait, l’interpolation linéaire n’est pas trop fausse que lorsque le taux de décès est faible. Par exemple à deux ans, le calcul donne 19%/2=9,5.

 

Modèle probabiliste de survie

Un modèle probabiliste représente bien la variabilité des durées de survie observée dans la réalité. Avec ce modèle, deux sujets de mêmes caractéristiques auront le même risque instantané. C’est le hasard qui fera que l’un décédera précocement et l’autre beaucoup plus tardivement. Ainsi dans le tableau 1 où tous les patients ont exactement le même risque instantané, certains décèdent dans la première année et d’autres au bout de 15 ans. Certains favorisés par le hasard sont d’ailleurs survivants à cette date. Ce n’est plus les durées de survie, trop empreintes de variabilité structurelle, qu’il convient d’expliquer par des covariables, mais le risque instantané

5       Calcul des courbes de survie en pratique

En pratique, il convient d’estimer les courbes de survie à partir de données censurées.

L’estimation des courbes de survie fait appel principalement à la technique de Kaplan Meier. Le taux de survie est réactualisé à chaque temps de survenue d’un décès, ce qui donne un aspect en marche d’escalier aux courbes (figure 8). Comme tout estimateur, la courbe estimée de « Kaplan Meier » est connue avec une certaine imprécision qui doit être prise en compte dans son analyse.

Une autre technique, la méthode actuarielle, consiste à découper le temps en intervalles réguliers de largeur fixée arbitrairement. Avec cette technique, la courbe est composée d’une série de segment de droite et non plus de marche d’escalier. Cette technique rend les calculs plus simples, mais elle n’est plus guère d’actualité en raison de la généralisation des moyens de calculs modernes.

Figure 8 – Exemple d’une courbe de survie estimée avec la méthode de Kaplan-Meier.

5.1.1      Le calcul des courbes

Si au temps t , survient un décès parmi 123 patients (qui représentent 68,33% des patients inclus (n=180), c'est-à-dire que le taux de survie juste avant t est de 68,33%), la survie après ce décès est de 0,6833*(122/123)=0,677745 soit 67,7745%. En effet après ce décès la proportion des patients vivants avant t qui reste vivant après t est de 122/123=99.187%. Après le temps t il reste vivants 99,187% des patients vivants juste avant t, comme juste avant t il restait vivants 68,33% des patients initialement inclus, la proportion des patients initialement inclus toujours vivants après t est 99,187% de 68,33% soit 67,7745%.

Si maintenant, une censure s’est produite entre la date t de survenu du décès qui nous intéresse et le décès précédent, le nombre de patient à risque au moment du décès du temps t (donc potentiellement informatif pour estimer la survie à ce temps) est de 123-1=122. A l’issu de ce décès, seul 121/122=99,18% des patients vivants avant t l’est toujours. Par rapport au nombre initialement inclus, le taux de survie est 99,18% de 68,33% soit 67,7699%. Soit une valeur légèrement inférieure à celle obtenu en l’absence de censure.

5.2      Représentation des censures

Les moments où surviennent des censures sont souvent représentés par une croix sur les courbes de survie. Le nombre de censures et leur répartition le long des courbes permettent d’apprécier leurs conséquences sur la quantité d’information et un éventuel biais.

 

Figure 9 – Visualisation des censures par des croix sur une courbe de survie estimée.

Les conséquences des censures ne sont pas les mêmes suivants qu’il s’agit de censure liée à un suivi partiel ou de censure introduite par des perdus de vue (cf. tableau 2).

Tableau 2 – Conséquences des deux types de censures sur l’interprétation des courbes de survie.

Type de censure

Conséquences

Censures liées à l’interruption du suivi avant le décès de tous les patients

w ces censures sont regroupées à la fin de la courbe

w elles ne faussent pas la partie de la courbe où il n’y a pas de censure

w elles ne soustraient pas d’information sur la partie de la courbe que l’on veut estimer (correspondant à la durée de l’essai)

Censures survenant durant la période de suivi, induites par des patients perdus de vue (censure non aléatoire))

w elles entraînent une perte d’information en soustrayant un certain nombre de décès concernant la partie de la courbe à laquelle on s’intéresse

w elles faussent potentiellement l’estimation de la courbe de survie

w elles faussent la comparaison de deux traitements si elles sont liées à l’effet du traitement

w elles limitent l’interprétation des courbes

5.2.1      Censures survenant à la fin de la période de suivi

Les censures qui correspondent aux patients toujours vivants à la fin de la durée de suivi prévu par l’essai apparaissent vers la fin de la courbe de survie. Ces censures s'étendent à la fin de la courbe sur une période reflétant l’étalement des inclusions dans le temps. Elles ne perturbent pas la majeure partie de la courbe, en particulier celle que l’essai cherche à estimer.

 

Figure 10 – Les censures survenant à la fin de la période de suivi correspondent à des patients vivants à la fin de l’essai. Elles ne perturbent pas la partie initiale de la courbe de survie. La durée minimale de suivi a été de 12 mois, la courbe obtenue estime donc correctement la survie durant les 12 premiers mois. La courbe obtenue en l’absence de toute censure est représentée en pointillé.

5.2.2      Censures correspondant à des perdus de vue

Les censures survenant durant la période de suivi de l’essai et correspondant à des perdus de vue sont en général en nombre limité. Lorsqu’elles surviennent au hasard, ces censures n’entraînent qu’une perte de puissance statistique, mais ne fausse pas l’estimation. Par contre si leur survenue n’a pas lieu au hasard, (on dit qu’elles sont informatives), elles faussent l’estimation de la courbe de survie (figure 11).

 

Figure 11 – Censure informative. La probabilité de survenue d’une censure dépend de l’état du patient, donc de son risque de décédé durant la période d’observation. La courbe obtenue en l’absence de toute censure est représentée en pointillé.

5.2.3      Essai à date de point

Dans un essai « à date de point », les censures s’étalent tout le long de la période d’observation, mais, contrairement au cas précédent, elles correspondent à l’étalement des inclusions et non pas à des perdus de vue. Les derniers patients inclus sont suivi de façon brève. Ces censures ne faussent pas l’estimation de la courbe de survie, mais réduisent la précision de l’estimation (cf. ci-dessous).

La description du suivi s’effectue à l’aide de la médiane des temps de suivi (jusqu’au décès ou à la censure) accompagnée des durées minimale et maximale. Le nombre de perdu de vue doit être précisé. Fréquemment, pour ne pas surcharger les graphiques, les censures ne sont pas représentées sur les courbes de survie. Le seul moyen alors disponible pour se faire une idée du suivi est cette description numérique.

 

Figure 12 – Répartition des censures dans un essai « à date de point ». La fin de l’essai survenant très rapidement après l’inclusion du dernier patient, les censures reflètent l’étalement des inclusions. La courbe obtenue en l’absence de toute censure est représentée en pointillé.

Durée de suivi (mois) médiane (min-max) : 5,9 (1,4-14,9)

Perdus de vue : 2

 

5.3      Précision de l’estimation

Comme avec toutes estimations statistiques, la précision de l’estimation d’une courbe de survie est représentée par un intervalle de confiance (le plus souvent à 95%). La figure 13 représente une courbe de survie estimée, entourée de son intervalle de confiance à 95%. Cet intervalle prend la forme de deux courbes correspondant à la limite supérieure et à la limite inférieure. Cet intervalle a une probabilité de 95% d’inclure la vraie courbe de survie.

Figure 13 – Courbe de survie (en trait plein) estimée entourée de son intervalle de confiance (trait pointillé).

La survenue de censures réduit la précision de l’estimation comme en témoigne la figure 14, où sont représentées les même données avec et sans censures. En présence de censures (sous-figure de droite), l’intervalle de confiance en fin de courbe est plus large que celui obtenu en l’absence de censure (sous-figure de gauche).

Figure 14 – Conséquence des censures sur la largeur de l’intervalle de confiance. Les deux courbes représentent les mêmes données. Celle de gauche est estimée à partir de l’ensemble des données, tandis que pour celle de droite certains suivis ont été censurés.

 

Il est utile de trouver sur un graphique de courbe de survie l’évolution du nombre de patients exposés au risque ainsi que le nombre d’événements. Ces données numériques permettent d’apprécier la quantité d’information disponible à un temps donné, et donc d’apprécier la précision et la fiabilité de l’estimation de la survie à ce temps.

Figure 15 – Graphique présentant l’évolution du nombre de patients exposés au risque (3). Cette information est aussi véhiculée par la représentation des censures ou par la représentation des intervalles de confiances.

Exemple

La figure suivante montre une estimation de la DFS (disease free survival) durant 5 ans. Cependant cette DFS n’est vraiment estimée avec précision que durant la 1er – 2ème année. En effet, par exemple dans le groupe letrozole, il ne reste plus que 2964 sujets à risque à la fin de la 2ème année alors que le taux de survie est de 95.1%. En l’absence de censure, le nombre à risque devrait donc être 4003*95.1%=3807. Il y a donc eu 3807-2964=843 censure durant les 2 premières années (21%). A partir de la fin de la 3ème année, le taux de censure dépasse les 60%, ce qui limite fortement l’informativité de la courbe au-delà de la 2ème – 3ème année.

6       Risque instantané

6.1      Risque instantané et gravité de la maladie

Le risque instantané représente la gravité de la maladie à un moment donné. Le taux de survie mesuré après un temps de suivi donné est la conséquence du cumul des risques instantanés de chaque instant.

Dans les maladies chroniques le risque instantané peut être considéré comme constant au cours du temps. C’est par exemple le cas, du risque instantané d’AVC mortel chez les patients porteurs d’une sténose carotidienne. À chaque moment, un sujet a la même probabilité de décéder de cette pathologie.

Dans les maladies aiguës, le risque immédiat (instantané) est particulièrement élevé en début d’évolution de la maladie puis s’amenuise. Dans les maladies qui guérissent, il redevient nul après la guérison. Dans les maladies qui laissent des séquelles, le risque immédiat diminue après la phase aiguë mais ne disparaît pas. Par exemple, à la phase aiguë de l’infarctus du myocarde, le risque immédiat est le plus élevé au cours des 24 premières heures, puis il diminue régulièrement lors de la première semaine, puis encore au cours du premier mois. À distance, il demeure supérieur à celui d’un sujet comparable sans antécédent.

Le risque est la proportion d’événements survenus dans un groupe au bout d’un temps t de suivi. Le risque est le reflet de l’exposition cumulative au risque instantané au cours de la période de suivi. Mathématiquement , la relation entre risque instantané et nombre de décès sur une période est donc complexe. Il est donc quasiment impossible de déduire l’évolution du risque instantané à partir de l’observation de la courbe de survie.

7       Comparaison de deux traitements

Le bénéfice d’un traitement est assez souvent recherché à travers la comparaison de la courbe de survie du groupe traité à celle du groupe contrôle. Des tests statistiques existent, comme le test du logrank, pour montrer qu’il existe une différence statistiquement significative entre ces courbes, témoignant alors de l’effet du traitement. En effet, l’effet du traitement ne peut pas être recherché en comparant directement les durées de survie. Ni le test t, ni les tests non-paramétriques ne prennent en compte les censures. De plus les distributions des temps de survie étant fortement asymétriques, l’hypothèse de normalité nécessaire au test t n’est pas vérifiée.

7.1      Test du logrank

Le test du Logrank est le test standard de comparaison de deux courbes de survie. Lorsqu’il est significatif, il permet de rejeter l’hypothèse que les deux courbes sont superposées. Il analyse si, globalement au niveau de chaque décès, la distance entre les deux courbes est plus grande que ce que pourrait expliquer le hasard. C’est-à-dire si le cumul des écarts entre les courbes mesurés chaque fois qu’un décès survient est plus grand que la valeur attendue uniquement du fait du hasard. Ainsi, le test du Logrank analyse les courbes dans leur globalité. Il peut être significatif même si les deux courbes se rejoignent en fin de suivi, aboutissant ainsi au même nombre de décès dans chaque groupe. Cependant le test perd de son efficacité lorsque les deux courbes n’évoluent pas de façon proportionnelle, en particulier lorsque les courbes se croisent. L’analyse visuelle des courbes doit donc toujours accompagner l’interprétation d’un test du Logrank.

D’autres tests existent, comme le test de Gehan (appelé aussi test de Wilcoxon) ou le test de Peto et Prentice plus sensibles aux décès précoces qu’aux décès tardifs. Le test du logrank est équivalent au test de Mantel Haenszel de combinaison de données stratifiées. C’est un test non paramétrique. Le test du Logrank est plus puissant que le test du risque relatif qui ne tient pas compte des censures.

7.2      Quantification de l’effet du traitement

7.2.1      Indices d’efficacité

Les données de survie conduisent à des indices d’efficacité spécifiques. La taille de l’effet traitement est mesuré le plus souvent à l’aide du rapport des risques instantanés (« hazard ratio »). Le hazard ratio (HR) est le rapport du risque instantané dans le groupe traité (h1) divisé par le risque dans le groupe contrôle (h0).

Dans le cas général, le risque instantané est une fonction du temps. Le HR est donc lui aussi une fonction du temps :

Cette fonction décrit l’évolution de l’effet « instantané » du traitement.

Souvent on souhaite caractériser la taille d’un effet par un seul nombre (comme avec le risque relatif par exemple). Avec le hazard ratio, cela nécessite de faire l’hypothèse que ce rapport est constant au cours du temps, même si les risques instantanés varient :

Cette hypothèse est appelée « hypothèse de proportionnalité des risques instantanés » et s’avère assez fréquemment vérifiée. Cela signifie que les courbes de risques instantanés doivent être parallèles au cours du temps. Le risque instantané peut évoluer au cours du temps mais il doit rester proportionnel entre les deux groupes. L’effet du traitement doit donc rester constant au cours du temps.

 

Le HR peut être interprété comme un risque relatif. C’est le facteur multiplicatif caractérisant l’effet du traitement, mais ce facteur s’applique sur les risques instantanés et non pas sur les risques. Dans les publications, le HR est parfois présenté comme un risque relatif dont il est souvent proche numériquement.

Par exemple, dans un essai de mortalité versus placebo, un hazard ratio de 0,5 signifie que, sous traitement, le risque instantané de décès est seulement la moitié du risque (instantané) sans traitement. En d’autres termes, chaque jour les patients sont exposés à un risque de décès dans la journée réduit de moitié.

Le hazard ratio correspond tout le temps au risque de survenue de l’événement. Un effet bénéfique se traduit donc par une valeur inférieure à 1.

Figure 16 – Exemple d’article rapportant le hazard ratio comme principale mesure de l’effet du traitement. Dans cet essai, le risque (instantané) de récurrence de cancer controlatéral avec Exemestane est 0.68 fois celui sous Tamoxifen (reproduit d’après N Engl J Med 2004;350:1081-92.).

 

En pratique, à partir des données de survie, le HR est estimé soit à partir de la statistique du logrank, soit en utilisant le modèle de Cox.

7.2.2      Modèle de Cox

Le modèle de Cox est une technique de régression multiple adaptée aux données de survie. Dans un essai thérapeutique, le modèle de Cox est utilisé pour rechercher l’effet traitement en ajustant ou pas sur des covariables. Le modèle de Cox, comme toutes les méthodes multivariées, permet de corriger la mesure le l’effet du traitement des effets qu’auraient pu induire d’éventuelles différences existant au niveau de covariables pronostiques (cf. section : Ajustement chapitre : statistiques avancées). Le modèle de Cox estime le « hazard ratio » lié au traitement.

Le tableau 3 rapporte le résultat de la quantification de l’effet de la pravastatine sur la mortalité totale, dans l’essai 4S (4), obtenue par le calcul direct du risque relatif et par l’utilisation d’un modèle de Cox ajusté. En raison de l’importance de l’effectif et du très faible taux de censures avant la fin de l’essai, les valeurs obtenues sont identiques.

Tableau 3 – Calcul de l’effet traitement par le risque relatif ou à l’aide d’un modèle de Cox ajusté dans l’essai 4S (comparaison de la simvastatine au placebo en prévention secondaire).

Mesure de l’effet du traitement sur la mortalité totale

Estimation (IC 95%)

par le risque relatif mesuré en fin d’essai

RR = 0,71 (0,59 ;0,85)

par un modèle de Cox

(ajusté sur les caractéristiques de base)

HR = 0,70 (0,58 ;0,85)

Il a été montré qu’il y avait un intérêt à ajuster systématiquement sur les variables pronostiques, même si aucun déséquilibre existe entre les groupes. L’estimation ajustée du HR est toujours plus exacte et plus précise que celle obtenue sans ajustement (5-7). Les variables utilisées pour l’ajustement doivent cependant être choisie a priori et non pas en fonction des liens observés sur les données (cf. chapitre Statistiques avancées).

Le test du Logrank permet aussi d’estimer le rapport HR des risques instantanés. Il procède à la façon d’une méta-analyse, en calculant un HR combiné, non pas à partir d’estimations fournies par différents essais, mais à partir d’estimations effectuées à chaque temps où survient un décès. Comme le HR est considéré comme constant au cours du temps, sa meilleure estimation possible est obtenue en combinant tous les HR mesurés chaque fois que cela est possible, c’est-à-dire à chaque décès. Comme dans une méta-analyse, la combinaison est effectuée en pondérant chaque HR individuel par l’inverse de sa variance.

7.3      Les deux modes de lecture d’une courbe de survie

Il est abusif de dire qu’un traitement évite 5 décès pour 1000 patients traités durant 5 ans. Il repousse seulement, en moyenne, au-delà de 5 ans le décès de 5 patients pour 1000 patients traités.

Quand un essai de mortalité d’un nouveau traitement produit un résultat positif, la presse médicale et grand public proclament souvent que « ce nouveau traitement sauve des vies ». L’utilisation des indices comme le NNT conduit à employer des termes comme « nombre de décès évités ». Cette formulation est quelque peu abusive, car tout individu est mortel (8). Les traitements n’évitent pas les décès, ils les retardent simplement. La meilleure façon serait de mesurer leur effet en termes d’augmentation de la durée de survie. Mais, nous avons vu, que cette mesure n’est pas réaliste car très rarement mesurable directement. La difficulté a été contournée en raisonnant sur les probabilités de décès à un moment donné, mais il s’agit que de probabilités (de risque) qui ne peuvent pas être traduites en termes de vies sauvées. Un traitement n’évite pas, stricto sensu, 5 décès pour 1000 patients traités durant 5 ans. Il repousse seulement, en moyenne, au-delà de 5 ans le décès de 5 patients pour 1000 patients traités. À la rigueur, il est possible de dire que 5 décès prématurés ont été évités en moyenne sur une période de 5 ans.

7.3.1      Lecture verticale

La lecture verticale des courbes de survie consiste à mesurer de façon verticale la distance qui sépare deux courbes de survie. Cette mesure s’effectue à un temps donné. La lecture verticale revient à comparer des risques (qui sont égaux à 1 - taux de survie). C’est donc le mode de lecture implicite réalisé lorsque l’on raisonne en termes d’indices d’efficacité : risque relatif, odds ratio, différence de risque ou NNT.

 

Figure 17 – Lecture verticale des courbes de survie

Ce mode de lecture est utilisable même si la durée de suivi n’a pas été suffisante pour enregistrer le décès de tous les patients.

7.3.1.1             Limitations de la lecture verticale

La figure 18 représente l’évolution au cours du temps des principaux indices d’efficacité RR, OR et DR. La sous-figure a représente les deux courbes de survie avec le groupe contrôle en trait pointillé. La sous-figure c montre la relation entre le RR et la survie dans le groupe contrôle.

Il apparaît qu’aucun de ces indices n’est constant au cours du temps, bien que le vrai effet traitement représenté par le hasard ratio (rapport des risques instantanés) soit constant. Les différences ne sont cependant très importante que pour des différence de durées de suivi elles aussi très importantes.

Figure 18 – Évolution en fonction de la durée de suivi des indices d’efficacité. a : courbes de survie des deux groupes comparés ;b : évolution du risque relatif au cours du temps ; c : évolution de la différence des risques ; d : évolution de l’odds ratio ; e : représentation du risque relatif en fonction du taux de survie (et non plus du temps).

graph1

7.3.2      Lecture horizontale

La lecture horizontale des courbes de survie consiste à mesurer de façon horizontale la distance qui sépare deux courbes de survie. Cette lecture s’effectue à un niveau de survie donné, par exemple, 50%. À ce taux de survie de 50% correspond un temps qui est la médiane des temps de survie. En effet, la durée de survie de la moitié des sujets de la population d’origine a été inférieure à cette valeur, puisqu’à ce temps il n’y a plus que 50% des sujets survivants. Pour refléter l’imprécision des estimations, les médianes de survie doivent être rapportées accompagnées de leur intervalle de confiance.

Figure 19 – Lecture horizontale des courbes de survie

 

La lecture horizontale permet alors de mesurer l’effet du traitement en terme d’augmentation de la médiane de survie. L’unité de cet effet est l’unité de temps. Par exemple une augmentation de 2,3 mois de la médiane de survie (IC 95% = [1,1 ; 3,7]).

Figure 20 – reproduit d’après N Engl J Med 2004;350:2335-42

 

Lorsque la durée de suivi a été insuffisante pour atteindre un taux de survie d’au moins 50% dans les deux groupes, l’effet du traitement se mesure en terme d’augmentation d’un autre percentile de survie, par exemple le 75ème percentile. Dans ce cas, la signification de cet effet devient moins intelligible et ne présente pas d’avantage par rapport à la lecture verticale.

De façon similaire à ce qui est observé avec la lecture verticale, la lecture horizontale produit des mesures de l’effet traitement variant en fonction du niveau vertical où est effectuée la lecture. L’augmentation du 90ème percentile de survie est plus importante que l’augmentation de la médiane de survie (cf. figure 21). Par contre, l’expression sous forme relative de la différence horizontale est constante et ne dépends pas du percentile mesuré (pour un risque instantané constant).

Figure 21 – Évolution de la différence entre les courbes mesurée horizontalement pour différents niveau de percentile. Par contre l’expression sous forme relative de cette différence horizontale est constante  (67% dans ce cas).

7.3.3      Exemple de présentation complète des résultats d’une analyse de survie

The median duration of overall survival, the primary end point, was significantly longer in the group given studied treatment than in the group given placebo (20.4 months vs. 15.7 months), which corresponds to a hazard ratio for death of 0.66 (P<0.001) (Table 3 and Fig. 1), or a reduction of 34 percent in the risk of death in the studied treatment group. The one-year survival rate was 74.3 percent in the group given studied treatment and 63.4 percent in the group given placebo (P<0.001)

 

 

7.4      Gain en durée de survie

7.4.1      Durée de survie

En démographie, l’espérance de vie est la moyenne des durées de survie d’un groupe de sujets de même âge. Par exemple, l’espérance de vie des hommes de 40 ans est de 30 ans signifie que la moyenne des durées de survie futures d’un groupe de sujets âgés de 40 ans est de 30 ans.

La durée moyenne de survie est égale à l’aire sous la courbe de survie. Un traitement bénéfique en diminuant le risque instantané augmente l’aire sous la courbe. Le bénéfice apporté par un traitement peut être exprimé en gain de durée moyenne de survie (ou gain en espérance de vie) (9). Ce gain est la surface de la zone comprise en les deux courbes de survie. Souvent ce gain est appelé « gain en espérance de vie ». Le terme espérance de vie est alors utilisé dans une acception différente de celle de l’espérance de vie démographique (cf. rappel) et correspond à la durée de suivi moyenne du groupe considéré.

En pratique, l’utilisation de l’aire sous la courbe se heurte à la même difficulté que le calcul direct de la moyenne des temps de survie : celle de devoir suivre les patients jusqu’au décès de tous. Deux voies sont envisageables pour contourner cette difficulté. Celle d’utiliser un modèle mathématique pour compléter la partie manquante des courbes et celle de calculer un gain en durée de survie sur la durée de l’essai. Ces deux techniques présentent des limites.

7.4.1.1             Modélisation

L’utilisation de la modélisation permet de compléter la partie manquante des courbes de suivie. Un modèle paramétrique, comme le modèle de Gompertz, est ajusté sur la partie disponible de courbes. Il permet ensuite le calcul de la totalité de l’aire sous la courbe. Cette approche nécessite de faire des hypothèses sur la queue de la distribution des durées de survie, hypothèses qui sont très difficile à vérifier.

7.4.1.2             L’extension de survie

Un gain en espérance de vie est parfois calculé au terme d’un essai, même si la totalité des durées de survie ne sont pas disponibles (10). Ce calcul n’a cependant pas beaucoup de sens et il est d’interprétation hasardeuse.

Par exemple, le gain en espérance de vie a été calculé pour les 3 grands essais de statines WOSCOPS, 4S et CARE. Dans l’essai de prévention secondaire 4S, au terme du suivi de 5 ans, la simvastatine est associée avec un gain en espérance de vie de 24 jours sur une durée de 5,4 ans (11).

Quoiqu’ils semblent parlants et proches de ce que l’on cherche à faire avec l’utilisation des statines, ces résultats n’ont que peu de valeur. En effet, que signifie une moyenne de durées de survie ne concernant qu'une petite proportion de tous les sujets. Par exemple le résultat avancé pour WOSCOPS doit s'interpréter de la façon suivante : le traitement durant 5 ans par la pravastatine allonge en moyenne de 3 semaines la durée de survie des 4% de patients qui décèdent avant 5 ans. Le gain en espérance de vie des 96% de survivants à plus de 5 ans n'est pas connu.

Il apparaît que l'extension de survie partielle mesurée à la fin d'un essai sous-estime fortement le réel gain en espérance de vie. Par exemple, pour WOSCOPS il est possible d'estimer ce gain à environ 2 ans.

Par contre dans les essais comme CONCENSUS où il est possible d'observer la totalité des courbes de survie, le calcul du gain en espérance de vie est possible et représente parfaitement ce que l'on cherche à mesurer (8).

7.4.2      Interprétation d’un gain de survie

Des pièges sont à éviter dans l’interprétation d’un gain en « espérance de vie » (12). Ce gain peut être perçu comme un temps supplémentaire de durée de vie gagné en fin de vie. Ainsi pour certaines personnes, étant donné son caractère lointain, cette augmentation peut paraître de peu d’intérêt : « il est préférable de gagner 1000 euros maintenant que dans 10 ans ». Cependant, un gain en espérance de vie, même minime, traduit en fait un bénéfice immédiat qui est une diminution du risque de décéder à tout moment (risque instantané). Il s’ensuit un décalage dans la distribution des temps de survie (figure 22) avec une diminution de la fréquence des durées de survie courtes et augmentation de celle des survies prolongées.

De même, il ne faut pas concevoir le gain en espérance de vie comme une prolongation de la durée de survie de chaque sujet. Il est inexact de dire que « sous traitement, la durée de survie de chaque sujet est augmentée de x mois ». En effet, si cette assertion était correcte, cela devrait se traduire par l’apparition d’un plateau initial dans la courbe de survie, prolongeant le taux de survie de 100% sur une durée égale au gain en « espérance de vie ». Le gain en « espérance de vie » est une valeur moyenne : la moyenne du groupe est augmentée, mais en raison de la variabilité, les valeurs individuelles peuvent être inchangées, augmentées ou diminuées.

 

Figure 22 – Illustration de la modification de la distribution des temps de survie induite par un effet traitement (courbe en trait plein). La courbe en pointillée représente la distribution des temps de survie sans traitement.

8       Bibliographie

1.         Collet D. Modelling survival data in medical research. London: Chapman & Hall; 1994.

2.         Hill C, Com-Nougué C, Kramar A, Moreau T, O'Quigley J, Senoussi R, et al. Analyse statistique des données de survie. Paris: Flammarion; 1990.

3.         Turrisi AT, Kim K, Blum R, Sause WT, Livingston RB, Komaki R, et al. Twice-Daily Compared with Once-Daily Thoracic Radiotherapy in Limited Small-Cell Lung Cancer Treated Concurrently with Cisplatin and Etoposide. NEJM 1999;340(4):265-271.

4.         Scandinavian Simvastatin Survival Study Group. Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the Scandinavian Simvastatin Survival Study (4S). Lancet 1994;344:1383-89.

5.         Chastang C, Byar DP, Piantadosi S. A quantitative study of the bias in estimating the treatment effect caused by omitting a balanced covariate in survival models. Stat Med 1988;7:1243-1255.

6.         Edwards D. On model prespecification in confirmatory randomized studies. Stat Med 1999;18:771-785.

7.         Ford I, Norrie J, Ahmadi S. Model inconsistency, illustrated by the cox proportional hazards model. Stat Med 1995;14:735-746.

8.         Tan LB, Murphy R. Shifts in mortality curves: saving or extending lives? Lancet 1999;354:1378-81.

9.         Wright JC, Weinstein MC. Gains in life expectancy from medical interventions - standardizing data on outcomes. NEJM 1998;339:380-6.

10.        Yusuf S, Zucker D, Peduzzi P, Fisher LD, Takaro T, Kennedy JW, et al. Effect of coronary artery bypass graft surgery on survival: overview of 10-year results from randomised trials by the Coronary Artery Bypass Graft Surgery Trialists Collaboration. Lancet 1994;344(8922):563-70.

11.        Krut LH. On the statins, correcting plasma lipid levels, and preventing the clinical sequelae of atherosclerotic coronary heart disease. Am J Cardiol 1998;81(8):1045-6.

12.        Naimark D, Naglie G, Detsky AS. The meaning of the life expectancy: what is a clinically significant gain? Journal of General Internal Medicine 1994;9:702-707.

 

 

 

 

Interprétation des essais cliniques pour la pratique médicale

www.spc.univ-lyon1.fr/polycop

Michel Cucherat

Faculté de Médecine Lyon - Laennec

Mis à jour : aout 2009