プログラ生活

プログラム初学者のためのポイントを書いていこうと思います。たまに脇道それた記事もありますが、息抜きだとおもって気長にお付き合いください。

【統計】分類問題は当たればよい!!というものではない。

PCR検査の精度 (2020年7月末のデータ)

統計を教えている受講者に、混同行列の説明をした際にPCR検査の話をしたので紹介します。

コロナ関連のニュースを見てもPCRを拡大すべきか、否かという話題がつきない。
これについて一つの考え方を示してみる。

もし東京都民全員を検査するのであればと仮定する。
・都民は1400万人
 →https://www.metro.tokyo.lg.jp/tosei/hodohappyo/press/2020/07/02/01.html
・陽性者は7%程度いる
 →https://stopcovid19.metro.tokyo.lg.jp/
  7月31日都内の感染状況より陽性率を参考にしている。
・感度は70%(陽性者のうち検査で正しく陽性と判定できる割合)
 →https://www.primary-care.or.jp/imp_news/pdf/20200311.pdf
・特異度は99%(陰性者のうち検査で正しく陰性者と判定できる割合)
 →https://www.primary-care.or.jp/imp_news/pdf/20200311.pdf

これを表にした混同行列をみてもらいたい。
f:id:hanabusa-snow:20201114090249p:plain

検査で正しく評価されているのは、
陽性-感染者   686,000
陰性-非感染者  128,89,800
合計       13,575,800
上記合計を都民1400万人で割ると、約97%になる。

正解率約97%の検査を都民全員にすべきかどうかということを単純に考えてしまいますが、このような分類問題において正解率は鵜呑みにしてはいけない。

真陽性者686,000人は要治療だろうし、真陰性者12,889,800人は治療不要である。それより、3%の誤りの内訳を考えた方がよい。
A.偽陽性者は130,200人で本当は陰性なのに、治療を行うことになる。
B.偽陰性者は294,000人は本当は陽性なのに、治療を行わないことになる。

Aはよくニュースで耳にする「医療崩壊」の要因になってしまうだろう。Bはそもそもの感度からして生じる可能性がわかっているので、複数回の検査をして減らしていくしかないだろう。いずれにしても検査数が増えるので、医療負担は増すことになる。

全員検査とか、希望者検査とか、持病持ちの人検査とかさまざまなフレーズを聞くが、データを解釈して最善を判断するのは人の仕事だ。政治力に期待したい。

分類問題について考える。

7月末に、東京で緊急地震速報の誤報があった。
地震速報がなったが、実際は相当する揺れはなく誤報であったという。
本当にあったときに速報されれば、ないときの誤報は許されるとの意見が身近にあったが、もしそれが頻発すればオオカミ少年的になっても困るが、ひとまずはそんな心配もいらないといったところなのだろうか。

でもやはり予測システムでは「正解率をあげろ!!」という意見もあろう。
さて、ここで本当に上げるのは正解率でよいのだろうか!!

では、極端な例をあげよう。
Aさんは、地震速報のシステムをつくって、ある周波数を検知して通知を出すか出さないかを判定させる構造である。3か月運用した結果が図の通りであるとしたときに、正解率は95%でした。みなさんが地震速報システムを買う都合があったとき、このシステム買いますか!?

f:id:hanabusa-snow:20201114090631p:plain

上記PCR検査でも書きましたが、解釈は人間がするものなので正解はそれぞれでしょうが、私なら100%買いません。1番の理由はならすべきタイミングでアラートが鳴るのが10分の5、つまり50%・・・。

そもそも、アラートを流した場合と流さない場合が15、285と差が大きいこのデータは不均衡データとも呼ばれ、このような場合正解率のはあまり意味をなさなくなります。

この場合、0~1の範囲で値をとる、適合率、再現率、またこれらを用いたF値を使って評価することがあります。ちなみに今回の表のF値は0.4と決して高くはありません。

冷静に考えてみると、アラートが鳴って地震が起きる、アラートが鳴らなくて地震が起きないとでは、定性的にみても1回の価値が違いますよね。
このように分類問題とは、さまざまな見方があるのだ。