油断していると陥りがちなデータ分析の罠

データ分析

一般的に、何か大切な決定を下すときは、まずそれに関する情報を集めて徹底的に調べ上げる、いわゆる「データ分析」が行われます。

このデータ分析の際に忘れてはいけないのが、集めたデータだけを判断の元にして結論を出すのではなく、目の前にないデータまでも入れ込み考慮する必要がある、ということです。

今回は、このことを考える良いきっかけとなる、ある数学者が関わった実際の事例を紹介させていただきます。

その数学者の名は、エイブラハム・ウォルド。ウォルドは、アメリカ軍からある問題を解決するよう依頼されていました。

爆撃機

第二次世界大戦の真っ只中、爆撃機のパイロットは、死と隣り合わせの状態で敵国の上空を飛んでいました。当時、爆撃機のパイロットが生き残れる確率は、だいたい50%と言われていたほどです。

さすがにこの生存確率はまずいので、軍司令部は敵の砲撃からパイロットを守るため、爆撃機に装甲を施すことにしました。

爆撃機全体を装甲で覆えると良いのですが、全体を覆ってしまうと機体が重くなりすぎて操縦に支障が出てしまいます。

そこで軍司令部は、ウォルドに装甲が必要な箇所の優先順位を調べる任務を与えました。

それを調べるために必要なデータは、すでにある程度溜まっていました。空軍は無事に帰還できた爆撃機の損傷具合を確認し、データ化していたのです。

データ化してみると、損傷箇所にはあるパターンが浮かび上がってきました。

翼や胴体には無数の穴が開いていることが多かったのですが、コックピットと尾翼には砲撃を受けた形跡があまり見受けられなかったのです。

このことから当時の軍司令部は当初、

「たくさんの穴が開いていた箇所が敵の砲撃を食らいやすい部分だ。」

「その部分に優先的に装甲を施していけばいい。単純な話だ。」

こう判断しました。この判断は一見すると問題ないように思えますが、ある非常に大切な点を見逃していたのです。

ウォルドはこの判断が間違いであると、恐れることなく軍司令部に指摘しました。

「帰還した爆撃機のデータだけで判断するのではなく、撃ち落とされて帰還できなかった爆撃機、つまり今まだ我々が持っていないデータまでも含めて考慮しなくてはならない。」

「帰還した爆撃機のコックピットと尾翼に穴がなかったということは、裏を返せば、そこに少しでも命中すると帰還できない可能性が高い。」

結果的に、ウォルドの洞察は正解でした。

最初に軍が装甲を施そうとした箇所は「撃たれても耐えられる部分」を示していたのです。優先的に補強しようとしたところは、実は最も優先順位が低いところでした。

まさに真逆、最悪の判断です。

この一件に対する軍司令部とウォルドの決定的に違った点は、目の前にないデータまで想像して考慮する姿勢を持っていたかどうかです。

現実的に、全てのデータを集めるのには無理があります。目の前にあるデータだけにとらわれるのではなく、他に何か重要な要素を見逃していないか疑い続ける姿勢が大切なのだと思います。

Kenta

1992年生まれ、兵庫県在住。本業は個人事業主で、小規模団体の会計請負事業をやっています。ニュースや書籍を読むことが大好きなので、それらで得られた生き方に役立つであろう情報を皆さんとシェアできればと思います。

未分類