生存分析の基礎

疫学統計の基礎

生存分析は臨床研究で頻繁に用いられる分析手法です。生存分析の一つであるKaplan-Meier曲線は論文に頻回に登場するので、みなさんにもなじみがあるのではないでしょうか。
アウトカムを評価する際に時間軸を考慮する場合に生存分析を使います。

生存分析の前提

生存分析を行う場合、アウトカムは名義変数(2値数)であることが必須です。また、図1のようにKaplan-Meier曲線が途中で交差してしまうような場合は、2群の差をみるLog-rank test、一般化Wilcoxson検定は適しません。これらの検定については後述します。

図1 交差するKaplan-Meier曲線

生存分析の考え方

6人の胃癌術後の患者さんを例にとってみてみましょう。ここではエンドポイントを胃癌再発とします。2010年から2020年まで胃癌に対して手術をした患者をフォローします。

図2 胃癌術後フォローの例

Aさんは手術をして3年の観察期間を経た後に再発しました。
Bさんは術後4年間は再発がないのが確認できていますが、その後受診がなく、フォローできなくなっています。
Cさんは術後10年フォローでき、観察期間を終了しました。
Dさんは術後3年で再発はありませんでしたが、他の理由で死亡しました。
Eさんは術後6年間フォローし、再発なく観察期間を終了しました。
Fさんは術後7年後に再発しました。

整理するとこのようになります。

図3 整理すると

生存分析を行うのに必要な情報は各患者の①観察期間 ②エンドポイントの有無の2点です。
観察期間はエンドポイントを迎えるまで、死亡するまで、フォロー中断するまで、研究終了を迎えるまでの一番短いものを指します。説明するとややこしくなってしまいますが、図でいうと黄色の矢印の期間です。Aさんは再発するまでの3年間、Dさんは死亡するまでの3年間、Bさんはフォロー中断するまでの4年間、Cさんは研究終了までの10年間となります。
エンドポイントはここでは再発の有無です。Aさん、Fさんが再発というエンドポイントを迎えたのに対し、エンドポイントを迎えずに観察終了(死亡、フォロー中断、研究終了など)となった場合はセンサー(打ち切り)と言います。

Kaplan-Meier曲線から読み取れること

この6人でKaplan-Meier曲線を描いてみると図4のようになります。

図4 Kaplan-Meier曲線

Kaplan-Meier曲線からは○年生存率中央生存時間(累積生存率が50%の生存期間)を読み取ることができます。
この例ではエンドポイントは死亡ではなく、再発ですので、死亡を再発に置き換えてみてください。10年の研究期間を迎えても生存率は50%以上なので、ここでは中央生存(非再発)時間は10年以上としか読み取ることができません。5年生存率(非再発率)は生存率表とも合わせて83.3%と読むことができます。曲線が垂直に下がっている3年時、6年時では曲線が下がった下のほうを読みます。3年時では83.3%、6年次では55.6%です。
3年の時点での累積生存率の下がりはAさんの再発によるもの、6年時点での下がりはFさんの再発によるものです。実践の途中にある+はセンサー(打ち切り)を示しています。2人の再発ですが、3年時のAさんの再発よりも6年時のFさんの再発のほうが下がり幅が大きいことがわかります。これはAさんが再発した時点では母数が6(3年時点での再発率は1/6)、その後再発や打ち切りで観察人数が減少し、Fさんが再発した時点では母数が3(6年時点での再発率は1/3)であることに起因しています。つまり、時間経過に伴って母数が少なくなるため、1人のエンドポイントの影響が大きくなるわけです。
Kaplan-Meier曲線をみる場合には線の下がりだけではなく、+(センサー/打ち切り)にも注目する必要があります。特に観察の早期に打ち切りが多い研究はあまり信頼性が高いものとは言えません。

比例ハザード比 2群の比較

2群の比較を行う場合には比例ハザード比を用います。比例ハザードとは時間tの時点での死亡リスクで、2群の比が比例ハザード比です。Log-rank test一般化Wilcoxson検定で算出できます。例でみたように通常であれば後半のエンドポイントの影響が大きくなりますが、後半の影響が大きくならないように補正している(生存率による重みづけを行っている)のが一般化Wilcoxson検定です。そのため、Log-rank testは観察期間の後期に生存率の差が大きくなるような場合、一般化Wilcoxson検定は早期に差が大きくなる場合に有意差が出やすくなります。
多変量解析を行う場合は、Cox比例ハザードモデルを使います。

コメント

タイトルとURLをコピーしました