BOOK SEARCH
はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―
豊田 秀樹(著)
内容紹介
統計学への入門の最初からベイズ流で講義する画期的な初級テキスト。有意性検定によらない統計的推測法を高校文系程度の数学で理解。〔内容〕データの記述/MCMCと正規分布/2群の差(独立・対応あり)/実験計画/比率とクロス表/他
編集部から
■お知らせ: 配布データについて
(2020/3/24)【New】
スクリプトを更新しました(Stan2.19, rstan 2.19.3対応版)
(2017/8/31)
スクリプトを更新しました(Stan2.16, rstan 2.16対応版)
(2017/5/19) スクリプトを更新しました(Stan2.15, rstan 2.15.1対応版)
(2017/3/21) スクリプトを更新しました(Stan2.14+rstan 2.14 対応版)
(2016/9/29) スクリプトを更新しました(Stan2.12+rstan 2.10 対応版)
(2016/7/12) 2016年6月24日にリリースされた rstan 2.10 への対応版スクリプトを追加しました.あわせて Q & A の増補を掲載しました.
(著者より)
統計的方法を学ぶことは、これまで、すなわち有意性検定を学ぶことでした。長期に渡りこの大前提はゆるぎなく盤石で、無条件に当たり前で、無意識的ですらありました。しかし、ときは移り、有意性検定やp値の時代的使命は終わりました。アメリカ統計学会ASAは、2016年3月7日に、p値の誤解や誤用に対処する6つの原則に関する声明をだしました。この声明は「『ポストp < 0.05 時代』へ向けて研究方法の舵を切らせることを意図している」(R. Wasserstein) ものだと言明されています.
本書は、有意性検定やp値によらない統計学の教科書です。初めて統計学を学ぶ学生のための最初歩の入門書であり、独習書です。統計データ分析に関する予備知識はいっさい仮定せず、数学的説明には微分・積分・シグマ記号・行列・ベクトル演算を使わずに、統計的推測の世界にご招待いたします。
(序文より抜粋)
この本は初めて統計学に入門する学生のための教科書です.統計データ分析に関する予備知識はいっさい仮定していません.目次が示すように「データの記述」「正規分布」「独立した2 群の差」「対応ある2 群の差」「実験計画」「比率・クロス表」に各1 章ずつをあてています.統計学の入門的教材としては初等的定番です.このため読者の専攻分野を問いません.
本書の最大の特徴は,統計学の最初歩の教科書でありながら,ベイズ流のアプローチのみで教材が展開されることです.多くの統計学の入門書とは異なり,有意性検定やp 値にはまったく言及せずに統計的推測を行います.t 分布・F 分布・カイ2乗分布など,数学的に高度な標本分布は一切登場しません.分散の分母にn - 1を置くなどという分かりにくいこともしません.
著者は大学で統計学の授業を担当し,長らく有意性検定を講義してきました.学生はみな熱心でしたが,有意性検定は教えにくい単元でした.学生たちは有意性検定を習得しても,そして使い続けてさえいても,理論を誤解し,直ぐにその本来の意味は忘れてしまうようでした.有意性検定の理論体系は,その利用者に不自然な思考を強いるからです.また数学的に高度であり,文科系の学生には理解ではなく,暗記を強いるからです.
対して研究仮説が正しい確率を直接計算するベイズ流の推論は考え方がとても自然です.だから誤解が生じる余地がありません.また生成量を使った分析は汎用的で強力です.その点で本書はとてもユニークであり,長く統計分析に係わられてきた方が,統計学に再入門するときの独習書としても利用していただけます.再入門のためには付録Q & A から先に読んでください.
数学的説明には,微分・積分・シグマ記号・行列・ベクトル演算を使いません.ほぼ高校数学I の範囲からの旅立ちです.だからといって,数学的説明を割愛したり,説明のレベルを下げたりということはありません.なぜそんな魔法のようなことが可能なのでしょうか.それはベイズ流のアプローチが,MCMC の発達によって必ずしも高度な数学を必要としなくなったからです.
本書のキーワードは研究仮説が正しい確率と生成量です.この2 つの考え方を武器にして,読者の皆様を新しい時代のデータ解析に御招待いたします.ベイズ流のアプローチは21 世紀の統計学の中心です.若い方(そして年齢によらず心の若い方) は,是非,ベイズ流のアプローチで統計学に(再) 入門して下さい.
本書の内容は,web から入手できるR とStan のコードによってすべて再現できますから,すぐに実践に供していただけます.ただし紙面の都合でR やStanの文法の解説は割愛しました.
目次
目次
1. データの整理とベイズの定理
1. 1 データ分布
1. 1. 1 度数分布表とヒストグラム
1. 1. 2 データの要約的記述
1. 2 理論分布
1. 2. 1 正規分布
1. 2. 2 一様分布
1. 2. 3 理論分布の2 種類の使用法
1. 2. 4 データ分布と理論分布(データ生成分布) との関係
1. 3 理論分布の性質
1. 3. 1 同時分布
1. 3. 2 条件付き分布
1. 3. 3 事後の母数の分布の必要性
1. 4 ベイズの定理
1. 4. 1 尤度 f(x|θ)
1. 4. 2 事前分布 f(θ)
1. 4. 3 正規化定数 f(x)
1. 4. 4 事後分布 f(θ|x)
1. 5 事前分布によせて
1. 5. 1 批判1:主観的な事前分布を利用することは科学的でない
1. 5. 2 批判2:事前分布は変数変換に対して不変ではない
1. 6 モンティホール問題
1. 7 章末問題
2. MCMC と正規分布の推測
2. 1 マルコフ連鎖モンテカルロ法
2. 1. 1 乱数による事後分布の近似
2. 1. 2 事前分布の設定
2. 1. 3 乱数列の発生
2. 1. 4 乱数列の視覚的評価
2. 1. 5 乱数列の数値的評価
2. 1. 6 MCMC 法の欠点
2. 2 事後分布
2. 2. 1 EAP・MED・MAP
2. 2. 2 事後分散・事後標準偏差
2. 2. 3 事後期待値の標準誤差
2. 2. 4 確信区間
2. 3 予測分布
2. 3. 1 事後予測分布
2. 3. 2 条件付き予測分布
2. 4 母数と予測分布に関するベイズ的推測
2. 4. 1 μ に関する推測
2. 4. 2 確信区間と信頼区間
2. 4. 3 σに関する推測
2. 4. 4 x* に関する推測
2. 5 生成量
2. 5. 1 分散
2. 5. 2 変動係数
2. 5. 3 効果量
2. 5. 4 分位点・%点
2. 5. 5 予測分布の特定区間の確率
2. 5. 6 基準点との比
2. 6 研究仮説が正しい確率
2. 7 論文レポートでの報告文例
2. 8 章末問題
3. 独立した2 群の差の推測
3. 1 独立した2 群のデータ
3. 1. 1 データの要約
3. 1. 2 研究上の問い
3. 1. 3 標準偏差が共通した正規分布モデル
3. 2 母平均の差
3. 2. 1 基準点より大きい母平均の差
3. 3 効果量
3. 3. 1 基準点より大きい効果量
3. 4 非重複度
3. 4. 1 基準確率より大きい非重複度
3. 5 優越率
3. 5. 1 基準確率より大きい優越率
3. 6 閾上率
3. 6. 1 基準確率より大きい閾上率
3. 7 分析
3. 7. 1 母平均の差
3. 7. 2 効果量
3. 7. 3 非重複度
3. 7. 4 事後予測分布
3. 7. 5 優越率
3. 7. 6 閾上率
3. 8 標準偏差が異なる正規分布モデル
3. 8. 1 効果量
3. 8. 2 非重複度
3. 8. 3 優越率
3. 8. 4 閾上率
3. 8. 5 分析
3. 8. 6 モデル選択とWAIC
3. 9 章末問題
4. 対応ある2 群の差と相関の推測
4. 1 対応ある2 群のデータ
4. 1. 1 データの要約
4. 1. 2 共分散
4. 1. 3 相関係数
4. 1. 4 相関係数の範囲
4. 2 2 変量正規分布
4. 2. 1 標準偏差が共通した2 変量正規分布モデル
4. 2. 2 研究上の問いI
4. 2. 3 分析I
4. 3 相関を考慮した個人内変化の分析
4. 3. 1 研究上の問いII
4. 3. 2 相関のある差得点の標準偏差
4. 3. 3 差得点の効果量
4. 3. 4 差得点の優越率
4. 3. 5 差得点の閾上率
4. 3. 6 相関
4. 3. 7 同順率
4. 3. 8 分析II
4. 4 標準偏差が異なる2 変量正規分布モデル
4. 4. 1 分析III
4. 5 章末問題
5. 実験計画による多群の差の推測
5. 1 独立した1 要因の推測
5. 1. 1 独立した1 要因モデル
5. 1. 2 全平均と水準の効果
5. 1. 3 効果の評価
5. 1. 4 水準の効果の有無
5. 1. 5 要因の効果の大きさ
5. 1. 6 水準間の比較
5. 1. 7 連言命題が正しい確率
5. 1. 8 特に興味のある2水準間の推測
5. 2 独立した2 要因の推測
5. 2. 1 独立した2 要因モデル
5. 2. 2 水準とセルの効果の有無
5. 2. 3 要因の効果の大きさ
5. 2. 4 セル平均の事後分布
5. 2. 5 特に興味のある2セル間の推測
5. 3 章末問題
6. 比率とクロス表の推測
6. 1 カテゴリカル分布
6. 1. 1 ベルヌイ分布
6. 1. 2 2 項分布
6. 1. 3 多項分布
6. 2 比率の推測I (1 つの2 項分布)
6. 2. 1 オッズ(生成量)
6. 2. 2 仮説が正しい確率
6. 3 比率の推測II(1 つの多項分布)
6. 3. 1 カテゴリ間の比較
6. 3. 2 連言命題が正しい確率
6. 4 独立したクロス表の推測(複数の2 項分布)
6. 4. 1 2 × 2 のクロス表の推測
6. 4. 2 比率の差・比率の比・オッズ比(生成量)
6. 4. 3 g × 2 のクロス表の推測
6. 4. 4 連言命題が正しい確率
6. 5 対応あるクロス表の推測(1 つの多項分布に構造が入る)
6. 5. 1 2 × 2 のクロス表の推測
6. 5. 2 独立と連関
6. 5. 3 ピアソン残差・クラメルの連関係数(生成量)
6. 5. 4 a × b のクロス表の推測
6. 5. 5 連言命題が正しい確率
6. 6 章末問題
Q & A
A. 付録1 章末問題解答例