14/01/04 01:22
シグナルとノイズ

新年あけましておめでとうございます。
本年もさらに成長できるよう努力していくつもりです。
昨年と同様本年もどうぞよろしくお願いいたします。

最近「シグナル&ノイズ 天才データアナリストの「予測学」」という本を少しずつ読んでいます。分厚い本なのでなかなか読み切れないのですが、いろいろな分野の話がそれぞれ軽いタッチで書かれているので、部分的に読んでも楽しく話題に入り込むことができます。
シグナルを追い求めているつもりがノイズを拾ってしまうという事例がいくつも紹介されています。
その中でもリーマンショックが起きた経緯やメジャーリークの話題などに興味を感じました。筆者がメジャーリーグの対戦データを眺めるのが好きだったという話を見て、自分も子供のころはプロ野球が大好きだったので家でとっていたスポーツ新聞の打者、投手成績欄などをよく見ていたのを思い出しました。通常の新聞に比べてスポーツ新聞では、打率やホームランなどの代表的なデータだけではなく、もっと詳しいデータが掲載されており、そういったものにも興味を持っていました。筆者が野球は昔からデータをよく活用してきた、という主張にはうなずくばかりでした。
よく、新記録でホームラン数や勝ち星の数はわかりやすいのですが、連続なんとか記録とか特定の一つについての新記録などよく数えるものだと思うことがあります。それだけ野球は数字と深い関わりを感じます。
こんな軽い気持ちで読んでいてふと思うことがありました。
データが活用されているからといっても、いや逆にデータを活用しているからかもしませんが、よく外人ブレーヤー(外人とは最近あまりいわないのですが、野球についてはなんかしっくりくるので・・)が日本で活躍することき、最初すごい活躍してもすぐにダメになるケースをいくつも思い出しました。
また、ペナントレース以外のたとえばオリンピックや海外との親善試合などでは、意外な選手が活躍したり、いつも大活躍している選手が全く成績をあげられなかったりすることがあります。
これらは、逆説的ですが通常のゲームではデータはうまく活用されているということを意味しているではと思うのです。

新年にあたり「今年の予想」なるものがたくさん見かけますが、多くは希望というバイアスがかかっています。これもノイズなのかもしれませんが、未来をデータを予測するなんていうものは、クールにみえてもともと人間くさいものなのかもしれませんね。