PCR検査の精度が70%、というような話を聞くと、検査をしたら10人のうち7人は正解なんだろうな、とか、なんとなくわかった気になりますが、こういう検査の精度って実は意外と難しいんです。ちなみに、検査をして10人のうち7人が検査結果通りというのは、一般には正答率と言われるもので、精度とは違うものなんです。
どう違うのか、できるだけ簡単に説明をしてみます。
たとえば不良品の検査です。
不良品率が1%のとある工場でAIを導入して検査をしようと計画したとします。
「AIを作ったら、正答率99%になりました!」
という報告を受けたとして、あなたは喜びますか?
これは、絶対に喜んではいけないパターンです。全部を良品と答えたら、100個のうち99個が良品なのですから、正答率は99%になります。不良品を見つけるという目的からは全然ダメ、ということになります。
100個のうち、90個は正常で、10個を不良品とAIが判断したとすると、全体の正答率は90%(*1)に落ちますが、その10個の中に本当の不良品があれば、これはとても優秀なAIだと言えます。これまで100個全部を人間が検査していたものを、10個だけ検査すれば済むようになります。
このように、不良品を見つける場合、ミスには2種類あります。
①良品を不良品と判断してしまうミス
②不良品を良品と判断してしまうミス
どちらが重大なミスでしょうか?
もちろん、②不良品を良品と判断してしまうミスの方が重大なミスです。
こういう場合、AIでは全体の正答率以外の指標、下記の2指標(*2)を使います。
再現率 = 全体の不良品のうち、何%を見つけられたか?(*3)
この指標はとても大切です。全体の不良品が10個あったうち、9個を見つけられれば、再現率90%となります。ただ、この数値は、良品も含めてすべて不良品と判断してしまえば、再現率100%となるので、再現率を上げようとしすぎると、良品を不良品と誤判断することが増えてしまいます。
病気を見逃さないという観点からも、再現率は重要です。再現率を高めると、健康な人を病気と誤判断してしまうこともありますが、健康診断でもそうですよね、あやしい場合は精密検査を受けますよね。なぜそういうことが起きるかというと、再現率を高めているわけです。再現率を高めることで、見逃しを防止しています。
PCR検査の再現率が70%だとしたら、10人の陽性の人のうち、7人を見つけることができる、という意味になります。
精度 = 不良品と判断したもののうち、何%が本当に不良品だったか?(*4)
PCR検査の精度、という場合も、これを指していると思われます。
つまり、PCR検査の精度が70%としたら、10人陽性と判断した人のうち、7人が本当の陽性という意味になります。
新型コロナウイルスのPCR検査の精度は、今のところわからない、正確にわかるのは収束してから、ということが書かれている記事を見ましたが、統計学的にはベイズ理論というものがあり、一般的なPCR検査の精度を事前確率として与えて、精度を計算するということも可能です。
精度、というと、一般的な用法としては、正確性というような意味で使われていますが、検査の精度、という場合、精度とは統計学的な意味であって、一般的な意味とは違う、また、検査においては、精度だけでなく再現率というものも重要、というお話でした。
本文中、精度についてわかりやすいように不良品と陽性を例に出しましたが、誤解のないよう説明します。
もちろん不良品と陽性が同じようなものというわけではなく、工場では不良品を、PCR検査では陽性の人を見つける必要があるため、両方とも見つけたい対象である例として取り上げました。
(*1)本当は89%もしくは91%ですがわかりやすく90%にしました。不良品1個が不良品グループにあれば91%、良品グループにあれば、89%です。
(*2)そのほかに、再現率と精度から計算される、F値という数値を用いることもあります。
(*3),(*4)日本疫学会では、再現率を感度、精度を陽性反応的中度と呼んでいます。https://jeaweb.jp/covid/glossary/index.html#kensa