製薬会社が新型コロナウイルスのワクチン開発に成功したニュースは、世界中の人々に希望を与えている。各社のワクチンの有効性を示すデータをもとにさまざまな議論が展開されているが、その意味を正しく理解できているだろうか。有効性が「94.5%以上」のワクチンは「90%以上」のワクチンよりも優れているのか。データの読み方を間違えると、意思決定の質が大きく低下する可能性がある。本稿では、ワクチンの臨床試験のデータを題材に、ビジネスパーソンがデータを活用するうえで重要な3つの教訓を示す。


 2020年は、未知の深刻な感染症が世界の活動を停止させた年として、歴史に記憶されるだろう。

 製薬各社は、新型コロナウイルスの感染拡大を防ぐために、ワクチンの研究・開発に乗り出している。11月には、いくつかの製薬会社が相次いで、自社で開発中のワクチン候補の有効性に関する発表を行った。

 これらの発表の内容は、2021年の世界経済にとってきわめて大きな意味を持つだけではない。そこには、データを活用して意思決定の質を高めたいと考えるマネジャーにとって貴重な教訓も含まれている。

教訓1
ビッグデータはしばしば、見かけほど「ビッグ」ではない

 米国東部時間の11月9日午前6時45分。米国のファイザーとドイツのビオンテックは、さまざまな属性を持つ4万3000人を超す参加者を対象にしたランダム化比較試験(RCT)のはじめての中間解析結果を発表した。それによれば、両社が開発中のワクチンは、臨床試験で90%を上回る有効性が示されたという。

 90%以上というのは、目を見張る数字と言ってよい。この数値は、平均的なインフルエンザ・ワクチンより高く、新型コロナウイルス感染症のワクチンを有効と認める基準として世界保健機関(WHO)が示した50%も上回っている。

 このデータをどのように評価すべきなのか。

 ファイザーとビオンテックの臨床試験の参加者は、4万3000人を上回っている。一見すると、サンプルの規模はきわめて大きいように思えるかもしれない。概して、サンプルの規模が大きいほど、データの信頼性は高い。

 しかし、ワクチンの有効性を示すパーセンテージの数値は、誤解を招きやすい。臨床試験結果のデータを適切に評価し、その信頼性を正しく認識するためには、その数値がどのように計算されるのかを知っておく必要がある。

 計算の方法はいたってシンプルだ。まず、ワクチンを接種したグループの中で発症した人の数と、プラセボ(偽薬)を接種したグループの中で発症した人の数をそれぞれ集計する。そして、前者を後者で割り、その数値を1から引くことで、ワクチンの有効性を導き出せる。

 この臨床試験の場合、新型コロナウイルス感染症を発症した人は、ワクチン接種群では8人。プラセボ接種群では86人だった。これを前述の計算方法に当てはめると、8÷86=0.093となる。1-0.093=0.907。つまり、ワクチンの有効性は90.7%となる。したがって、このワクチンの有効性は「90%以上」という結論を導き出せる。

 ここで見落としてはならない点がある。この数値を導き出すに当たって計算の対象になっているのは、臨床試験の参加者すべてではない、という点だ。これは、新型コロナウイルス感染症を発症した参加者だけに関わる数値なのである。

 その意味では、臨床試験の規模が4万人だろうと、4000人だろうと、極端に言えば400人だろうと大して関係ない。この数値を算出する際に意味を持っていたのは、確認された発症者が合計94人だったということだけだ。

 94人の発症者のデータだけで適切な結論を導き出せるのかと、疑問に思う人もいるかもしれない。しかし、これで十分だ。ランダム化比較試験で90.7%という数値が偶然の結果により生じることは、きわめて考えにくい。また、ワクチン以外の理由でこのような結果になる可能性も著しく小さい。

 そこで、この臨床試験の結果は、ワクチンの有効性がWHOの基準である50%を上回っているという強い自信を持つことができる。人々は「ビッグ」に思えるデータに強い印象を受ける半面、「スモール」なデータの価値を過小評価しがちだ。