Dora_PaPa_san's_Pages

アクセスカウンタ

zoom RSS 西内啓「統計学が最強の学問である」は、なかなかいい。

<<   作成日時 : 2013/12/15 05:38   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

西内氏は医療の世界から統計にはいったらしい。 EBMでも統計解析の必要性が大きいからだろうか。 最近の流行としてピックデータがあるが、統計解析という言葉が魅力的でないから「ビッグデータ」とかBIと名付けるのではないか?と語る。  そんな大量のデータでなくとも、ランダムサンプリングでもいいのではないか? とも主張されるが、それはどうだろうか。  全データだから意味を持つようなものもあるような気がする。

「ランダム化」比較実験の例として最近Web界で流行りのA/Bテストやランダム化の限界も示す。ランダム化ができないとき、「一般化線形モデル」として、t検定、カイ二乗検定、回帰分析、重回帰分析をまとめているのは、目あたらしいことなのだろうか。 いろんな統計手法を次々に挙げる本もあるが、それだけで、統計学が嫌いになる。


高校生のころから統計学が苦手で、いまだによくわからない。 その頃の教科書よりは理解しやすいが、「重回帰分析とロジスティック回帰」あたりから、やっぱり苦手だとおもった。 筆者の統計学を愛する気持ちはたいへんよく伝わった。



其の他、興味を引いた箇所をフレーズだけ引用しておく

・「マネーボール」で話題になった「セイバー・メトリクス」
・「科学的根拠のある研究」に基づいた教育施策を求める「No Child Left Behind法
・WWC(What Works Clearinghouse)プロジェクト
・フラミンガム研究(心臓病の原因を探る疫学研究
・マイクロソフトがあげる今後の専門性・・・
  ・データマイニング、機械学習、人工知能、自然言語処理
  ・ビジネスインテリジェンス、競合分析
  ・分析、統計・・・特にウェア分析、A/Bテスト、統計解析
・一回、数回しかチャンスのないものについては、ランダム化を問わず、統計学は無力
・「データ間の関係性を記述する、あるいは一方のデータから他方のデータを予測する数式を推定するのが回帰分析という考え方」
・ゴルトン「平凡への回帰」「平均値への回帰」
・「バラツキを持つ現象に対する理論的な予測がそれほどうまくいかない」
・一般化線形モデル
・「重回帰分析は、説明変数すなわち予測したい結果に影響する要因が複数ある状況へ拡張された回帰分析」
・シンプソンのパラドックス「全集団同士での単純比較は、その内訳となる小集団同士との比較の結果と矛盾することもある」
・統計学の6つの分野
@ 実態把握を行う社会調査法
A 原因究明のための疫学・生物統計学
B 抽象的なものを測定する心理統計学
C 機械的分類のためのデータマイニング
D 自然言語処理のためのテキストマイニング
E 演繹に関心を寄せる計量経済学

・バスケット分析よりもカイ二乗分析の方が、相関の強いものを探しやすい
・予測それ自体がゴールなのであればデータマイニングは有効、予測事態ではなく、予測モデルから今後何をすべきかを議論したいのであれば、回帰モデルの方が役に立つ
・テキストマイニングの王道「形態素解析」、Googleを支える「N-Gram」
・ベイズ統計・・迷惑メールの判別に威力





西内啓「統計学が最強の学問である」( ダイヤモンド社 2013.1.24)☆☆☆☆
第1章 なぜ統計学が最強の学問なのか?
01. 統計リテラシーのない者がカモられる時代がやってきた
02. 統計学は最善最速の正解を出す
03. すべての学問は統計学のもとに
04. ITと統計学の素晴らしき結婚
第2章 サンプリングが情報コストを激減させる
05. 統計家が見たビッグデータ狂想曲
06. 部分が全体に勝るとき
07. 1%の精度に数千万円をかけるべきか?
第3章 誤差と因果関係が統計学のキモである
08. ナイチンゲール的統計の限界
09. 世間にあふれる因果関係を考えない統計解析
10. 「60億円儲かる裏ワザ」のレポート
11. P値5%以下を目指せ!
12. そもそも、どんなデータを解析すべきか?
13. 「因果関係の向き」という大問題
第4章 「ランダム化」という最強の武器
14. ミルクが先か、紅茶が先か
15. ランダム化比較実験が社会科学を可能にした
16. 「ミシンを2台買ったら1割引き」で売り上げは上がるのか?
17. ランダム化の三つの限界
第5章 ランダム化ができなかったらどうするか?
18. 疫学の進歩が証明したタバコのリスク
19. 「平凡への回帰」を分析する回帰分析
20. 天才フィッシャーのもう1つの偉業
21. 統計学の理解が劇的に進む1枚の表
22. 重回帰分析とロジスティック回帰
23. 統計学者が極めた因果の推論
第6章 統計家たちの仁義なき戦い
24. 社会調査法vs疫学・生物統計学
25. 「IQ」を生みだした心理統計学
26. マーケティングの現場で生まれたデータマイニング
27. 言葉を分析するテキストマイニング
28. 「演繹」の計量経済学と「帰納」の統計学
29. ベイズ派と頻度論派の確立を巡る対立
終章 巨人の肩に立つ方法
30. 「最善の答え」を探せ
31. エビデンスを探してみよう







「それ、根拠あるの?」と言わせない データ・統計分析ができる本
日本実業出版社
柏木 吉基

ユーザレビュー:

amazon.co.jpで買う
Amazonアソシエイト by 「それ、根拠あるの?」と言わせない データ・統計分析ができる本 の詳しい情報を見る / ウェブリブログ商品ポータル

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
西内啓「統計学が最強の学問である」は、なかなかいい。 Dora_PaPa_san's_Pages/BIGLOBEウェブリブログ
文字サイズ:       閉じる