今日はこんな記事が。
「40代ひとり暮らしが日本を滅ぼす」なんていうセンセーショナルな話題を振りまいてあちこちで炎上した、NHKスペシャルの件ですね。
「5000を超える公共データを「AI」に入力して関連性を調べたら、意外なことの間に関係があることがわかった」といった感じの番組。(私は前半の放送だけ見ました)
各種データの関連性をAIに分析させた結果を、番組冒頭で次のようにまとめていました。
「AIの分析結果から読み解いた提言」
- 健康になりたければ病院を減らせ
- 少子化を食い止めるには結婚よりもクルマを買え
- ラブホテルが多いと女性が活躍する
- 男の腎性のカギは女子中学生の"ぽっちゃり度"
- 40代ひとり暮らしが日本を滅ぼす
……。
このまとめ方がいけなかったのだと思います。
相関関係と因果関係。
相関関係がみられたに過ぎないのに、それを因果関係があるかのようなキャッチーな表現にしてしまったのが失敗ですね。
(おそらく特定の地域内で)「病床数が減ったというデータ(結果、事実)と、各種死亡率が下がったというデータ(結果、事実)に相関関係があった」と言うのであれば、そのこと自体は問題ないでしょう。
それを、「病床数が減れば→死亡率が下がる」という因果関係、未来についての推論にしてしまうと問題なわけです。
そのあたりの、「相関関係と因果関係は違う」という点については、番組冒頭で触れられていたようにも思いますが、番組のメインはそうなっておらず、「因果関係がわかった」と思わせるような流れになっていた。それで、トンデモな話になってしまったんです。
でも相関関係自体は、研究の出発点になるのでは。
番組冒頭で、出演者の一人が「通常の研究ではせいぜい数十のデータ群しか使用しないいところを、今回は5000種類ものデータを使用した」と言っていました。
もちろんそのデータも玉石混淆なのでしょうが(バナナの販売量とか)、
「相関関係があるなら因果関係がある」が誤りである一方で、
「因果関係があるなら相関関係がある」は正しいのではないでしょうか。
なので、一見無関係に見えるデータの間の相関関係を調べたこと自体は、面白い試みだったのではないかと思うのです。それを短絡的に因果関係と捉えるのでなければ。
いままで気付かなかった、あるいは顧みられなかった相関関係の中に、社会的に有用な因果関係を見つけられるかもしれない。そのための出発点として、普通は行われないようなこういう大量のデータ処理を使えばよかったのでしょう。
細菌がまだ知られていなかった時代のコレラ対策や産褥熱対策では、原因(=細菌)がわからないのに、相関関係に着目することで成果を上げることができました。それは、相関関係から推測した対策を実際に試みることで、因果関係を証明できたからでしょう。
社会的なことがらで「実験」をするわけにはいかないでしょうが、単にトンデモと切って捨てて終わりではなく、今回のような相関関係から何かの研究につながることがあってもいいんじゃないかなあと感じました。