ゆるゆる独学

ゆるゆる独学

ゆるゆると気まぐれに更新していきます

「ROC曲線」を理解する

こんにちは!

 

今回は「ROC曲線」についてまとめていきます。

 

では、国試の過去問をベースにROC曲線を理解していきましょう!

 

取扱う問題は第70回午後95です。

f:id:Yuru-yuru:20191224024920j:image

(第70回診療放射線技師国家試験より引用)

 

恐らく国試参考書の解説だけを読んでもいまいちピンと来なかったのではないでしょうか。

この問題を理解するにはROC曲線の描き方を理解する必要があります。

まず、上図に示された条件付き確率密度関数から見ていきましょう。

 

条件付き確率密度関数

この図を見たときにはじめに考えるべきは

「どこを境界値として陽性・陰性と判断するか」
です。

この図の横軸は例えば、信号があるという確信度を0~100%で示したもの(連続確信度法)などがあります。

この横軸上で境界値を決めることにより、真陽性率(TPF)および偽陽性率(FPF)が求まります。

TPFは信号がある画像を正しく信号ありと判断する確率であるため、境界値を雑音像の分布の中心に置いた場合、下図の斜線部の面積になります。

f:id:Yuru-yuru:20191224025200j:image

この境界値ではTPF≒0.99となります。

 

続いてFPFは信号がない(雑音のみ)画像を間違えて信号ありと判断する確率であるため、先程と同じ値に設定した場合、下図の斜線部の面積になります。

f:id:Yuru-yuru:20191224025219j:image

この境界値ではFPF≒0.5となります。

 

このように、どこに陽性・陰性の境界値を置くかによって真陽性率(TPF)・偽陽性率(FPF)も変化します。

 

すなわちROC曲線とはこの境界値を変化させながらそのときのTPFおよびFPFを求め、曲線に示したものです!

 

まず、ここまで理解できたでしょうか?

 

では、横軸をFPF、縦軸をTPFとしたとき、このROC曲線は何を意味するでしょうか?

このROC曲線の意味について理解していきましょう。

 

ROC曲線の意味

ROC解析において最も良い結果とは、今回の場合、
信号+雑音像→陽性
雑音像→陰性
と100%分離されるケースです。
図で示すと以下のようになります。

f:id:Yuru-yuru:20200201021053j:image

しかしここまで完全に分離されることは少なく、2つの分布は重なりを持ちます。

この重なりが小さいほど、その境界値におけるFPFに対するTPFは大きくなります。
以下にその具体例を示します。

f:id:Yuru-yuru:20200201021104j:image

これらを見て分かるように重なりが小さいほど、FPFが小さいときからTPFが1に近い値を取ります。すなわち、

“FPFが小さいときからTPFが1に近い値を取る”

場合に良い結果であると言えます。

これはROC曲線の曲線下面積(AUC)が大きいほど良いことともリンクしています。

 

どうでしょうか?
大体全体像が掴めてきたかと思います。

では、最後に問題を解いていきましょう!

 

問題演習

先程例示したように、ある境界値を決め、その時点におけるFPF、TPFを求めることでおおよそROC曲線の形が推定できます。

TPF、FPFの説明で使用した設定ではFPF≒0.5のときTPF≒0.99程度と読み取れます。

この条件に合うグラフはあるでしょうか?

 

 

 

 

 

 

 


正解は“C”です。

境界値の設定で誘導があれば解きやすいですが、自分で設定して読み取らなければならないため少し難しい問題に見えたかと思います。

しかし、答えのある問題ですから、主観によって答えが変わるようになってはいないのでポイントとしては、
①各分布の中央の値(正規分布の場合は平均値)
②各分布が全て入りきる値
を境界値にしてみると分かりやすいですね。

 

さて、理解できたでしょうか?
理解しにくい点や誤りがあった場合は優しくご指摘ください笑

 

最後に、選択肢aのROC曲線を示す条件付き確率密度関数の分布はどうなるでしょうか?

ぜひ考えてみてください。