サイエンス

国立がん研究センター公表の「がん5年生存率データ」から年齢・進行度などの影響を取り除いたリアルなデータを作成した強者が現れる


国立がん研究センターが2017年8月9日に全国188の病院を対象にした、がん患者の5年後生存率データを初めて公表しました。しかし、生存率データは単に各施設の生存率のみを表示しており、年齢や進行度(ステージ)などがんの5年後生存率に大きく関わる要素によって分類されていないため、単純な比較ができない状態でした。この不便を解消するために、統計モデリングを用いることで年齢やステージなどの影響を取り除いた調整済みデータをStatModelingさんが公開してます。

統計モデリングで癌の5年生存率データから良い病院を探す - StatModeling Memorandum
http://statmodeling.hatenablog.com/entry/best-hospitals-for-cancers

国立がん研究センターが公開した、全国のがん診療連携拠点病院におけるがん患者の5年後生存率に関する報告書「がん診療連携拠点病院院内がん登録生存率集計」は、以下のページで公開されています。

がん診療連携拠点病院院内がん登録生存率集計:[国立がん研究センター がん登録・統計]
https://ganjoho.jp/reg_stat/statistics/brochure/hosp_c_reg_surv.html

ただし、データはあくまで単純な生存率のみを算出したもので、がんの生存率は年齢や進行度など様々な因子に影響されるため、生存率だけで単純に施設の治療の善し悪しを判断できないのは注釈にあるとおり。


それならば、統計モデリングを用いて各因子の影響度を排除した状態での5年後生存率を調べて病院の善し悪しを論じようというのがStatModelingさんの狙いです。なお、StatModelingさんの出した結果も仮定に基づく推定結果であり、真実と断定しているわけではない点には注意が必要です。

最初に影響度を取り除く前の各がん別の5年生存率をヒストグラムにすると以下の通り。調整なしの状態では、大きな病院ほど生存率が高いのですが、これは患者の平均年齢や進行度が低い可能性をStatModelingは指摘しています。


そこで、病院ごとの生存率や手術率を平均年齢や平均進行度を固定して生存率の推定値をヒストグラムにすると以下のようになるとのこと。胃がん、大腸がん、肺がんではほとんどばらつきがなく、病院による差はほぼなし。他方で肝がん、乳がんはわずかに病院による差が見られます。


ややばらつきが出た2種類のがんについては、成績の優秀な病院トップ10が発表されています。

肝がんは以下の通り。黒点は中央値、横に延びる線はベイズ信頼区間です。なお、トップだった大垣市民病院は、データに「4.肝(C22)は切除症例に限る。」との注釈があり、切除していない患者が除外されているのでフェアではなく正しい結果とは言えないとのこと。


乳がんは以下の通り。1位の愛知県がんセンター中央病院は手術率、手術以外の影響(病院による効果)も1位と非常に優秀な成績だとのこと。


次に、統計モデリングを用いる原因となった、がん患者の「年齢」や「進行度」などの要素が各がんに与える影響度はどれくらいか?についても算出されています。

以下の図は、「性別」「年齢」「進行度」「手術率」「小細胞」の要素に関して、各がんの「5年後生存率」に与える影響を調べたもの。黒点は中央値、横に伸びる線はベイズ信頼区間で、点線が倍率1を表しており、右に行くほど生存率が高まることを意味します。


上のグラフからは、胃がんの「年齢(10)」の影響度は約「0.5」となっており、「患者の平均年齢が10歳上がると生存率/死亡率が0.5倍になる」ことを意味するとのこと。つまり、年齢が若ければ若いほど助かりやすいがんといえ、「胃がんは年齢の影響が大きい」とわかります。

他にも、肝がんは年齢や進行度が与える影響が大きいこと、肺がんは年齢や進行度が与える影響が大きいこと、乳がんでは進行度の影響が非常に大きいことなどがわかります。なお、ほとんどのがんにおいて性別はほとんど影響しないこともわかります。

「性別」「年齢」「進行度」「手術率」「小細胞」の要素が「手術率」に与える影響度についても算出されています。


グラフからは、「肺がんはステージが上がるほど手術が選択されていない」という傾向がわかります。なお、StatModelingさんは「肝癌において進行度の影響が低そうなのが意外」だと指摘しています。

なお、StatModelingのブログには、今回の統計モデリングで使ったモデルや、データ取り扱い上の難点やその解決法などについて詳しく書かれています。


また、「難癖つけて公表しなかった残念な病院一覧」も公開されています。

王子総合病院
岩手県立中部病院
岩手県立胆沢病院
秋田県厚生農業協同組合連合会秋田厚生医療センター
秋田県厚生連 由利組合総合病院
山形市立病院済生館
公立富岡総合病院
埼玉医科大学国際医療センター
国保直営総合病院君津中央病院
都立駒込病院
帝京大学医学部附属病院
杏林大学医学部付属病院
福井大学医学部附属病院
国立病院機構岩国医療センター
山口県厚生農業協同組合連合会周東総合病院

・関連記事
ガン治療にGoogleの人工知能「DeepMind」を使用する病院が登場 - GIGAZINE

運動は13種類ものがん発症リスクを減少させる - GIGAZINE

「ガン検診で死亡率が低下しているデータはない」と研究者が発表 - GIGAZINE

人工知能に「患者がいつ死ぬのか」を予測させることが可能に - GIGAZINE

平均寿命にも地域間格差が厳然とあり、その差は徐々に広がっている - GIGAZINE

日本全国の市区町村の中で平均寿命が最も短いのは大阪市西成区 - GIGAZINE

in サイエンス, Posted by logv_to