★★★☆☆
容易にデータを収集できるITと結びつき、ますますそのリテラシーが求められる統計学について書かれた本。
最近良く聞くビッグデータという言葉。イメージとしては簡単にたくさんのデータを集め、解析できるようになり凄い、みたいな感じでいたが、そもそもたくさんのデータは必要なのか、という話は、なるほどな、と思った。
そこから統計学の歴史や紹介が始まるのだが、このあたりはかなり面白かった。特にフィッシャーの「ランダム化比較実験」の考え方は感心した。
「諸条件をランダム化してしまえば、平均的に比較したい両グループ間で同じになる」
p117
つまり全てのデータを集めなくても、ある程度のサンプルを抽出して統計を取れば、かなり信頼できるデータが集められるということ。なので、ビッグデータを収集、蓄積、解析するということは、その精度を高めるということだが、僅かな誤差を取り除くために、全てのデータを収集するだけの価値があるのか、という事になる。
解析はそれ自体価値があるものではなく、それを活かして何を行ない、どれだけの価値を得られそうなのかによって異なるのである。
p55
簡単にたくさんのデータを収集することはできるが、とは言ってもコストもかかるわけだから、それに見合う価値があるかどうかをまず見極める必要がある。
後半も様々な種類の統計方法の紹介が続いていくのだが、段々ついていけなくなり、飽きてきた。一通り読んだ感想としては、最強の学問、というよりも、何するにしても必要となってくる、基本の学問なんだな、という印象。
それから、恐らく安易にビッグデータを導入したがるような、裁量権のある年代の人達を指して「おっさん」と言っているのだろうが、こういう本で30過ぎたおじさんが「おっさん」を連呼している箇所が萎えた。まぁ若いっちゃ若いけど、30代もおっさんじゃないの?そのあたり、統計学的にどうなの?と聞いてみたくなる。
著者 西内啓
- 作者: 西内啓
- 出版社/メーカー: ダイヤモンド社
- 発売日: 2013/01/24
- メディア: 単行本(ソフトカバー)
- 購入: 11人 クリック: 209回
- この商品を含むブログ (127件) を見る
登場する作品
- 作者: チャールズダーウィン,Charles Darwin,渡辺政隆
- 出版社/メーカー: 光文社
- 発売日: 2009/09/20
- メディア: 文庫
- 購入: 9人 クリック: 119回
- この商品を含むブログ (34件) を見る