意思決定のためのアルゴリズム I ―確率的推論と逐次意思決定の基礎―

Mikel J. KochenderferTim A. WheelerKyle H. Wray(著)/林田 智弘西﨑 一郎(訳)

Mikel J. KochenderferTim A. WheelerKyle H. Wray(著)/林田 智弘西﨑 一郎(訳)

定価 6,930 円(本体 6,300 円+税)

B5判/256ページ
刊行日:2025年11月01日
ISBN:978-4-254-12309-8 C3004

ネット書店で購入する amazon e-hon 紀伊國屋書店 丸善ジュンク堂書店 Honya Club Rakutenブックス くまざわ書店

書店の店頭在庫を確認する 紀伊國屋書店

内容紹介

Algorithms for Decision Makingを2分冊で全訳.不確実性下での意思決定のための,数理計画問題の定式化とそれを解くためのアルゴリズムを解説.I巻では,不確実性を確率分布として表現するための推論,行動の結果が不確実となる確率的環境における逐次的意思決定問題を解説.豊富な例と演習,Juliaによる実装.オールカラー.

編集部から

目次

1 序章
 1.1 意思決定
 1.2 アプリケーション
  1.2.1 航空機の衝突回避
  1.2.2 自動運転
  1.2.3 乳がん検診
  1.2.4 金融消費とポートフォリオの割当て
  1.2.5 分散型山火事監視
  1.2.6 火星科学探査
 1.3 手法
  1.3.1 明示的プログラミング
  1.3.2 教師あり学習
  1.3.3 最適化
  1.3.4 プランニング
  1.3.5 強化学習
 1.4 歴史
  1.4.1 経済学
  1.4.2 心理学
  1.4.3 神経科学
  1.4.4 計算科学
  1.4.5 工学
  1.4.6 数学
  1.4.7 オペレーションズリサーチ
 1.5 社会的な影響
 1.6 概略
  1.6.1 確率的推論
  1.6.2 逐次問題
  1.6.3 モデルの不確実性
  1.6.4 状態の不確実性
  1.6.5 マルチエージェントシステム
第 I 部確率的推論
2 表現
 2.1 信念度と確率
 2.2 確率分布
  2.2.1 離散確率分布
  2.2.2 連続確率分布
 2.3 同時分布
  2.3.1 離散同時分布
  2.3.2 連続同時分布
 2.4 条件付き分布
  2.4.1 離散的条件付きモデル
  2.4.2 条件付きガウスモデル
  2.4.3 線形ガウスモデル
  2.4.4 条件付き線形ガウスモデル
  2.4.5 シグモイドモデル
  2.4.6 決定論的変数
 2.5 ベイズネットワーク
 2.6 条件付き独立性
 2.7 要約
 2.8 演習
3 推論
 3.1 ベイズネットワークにおける推論
 3.2 単純ベイズモデルにおける推論
 3.3 和積変数除去
 3.4 信念伝播
 3.5 計算複雑性
 3.6 直接サンプリング
 3.7 尤度重み付きサンプリング
 3.8 ギブスサンプリング
 3.9 ガウスモデルにおける推論
 3.10 要約
 3.11 演習
4 パラメータ学習
 4.1 最尤パラメータ学習
  4.1.1 カテゴリカル分布のための最尤推定
  4.1.2 ガウス分布のための最尤推定
  4.1.3 ベイズネットワークのための最尤推定
 4.2 ベイズパラメータ学習
  4.2.1 二項分布のためのベイズ学習
  4.2.2 カテゴリカル分布のためのベイズ学習
  4.2.3 ベイズネットワークのためのベイズ学習
 4.3 ノンパラメトリック学習
 4.4 データ欠測がある場合の学習
  4.4.1 データ補完
  4.4.2 期待値最大化
 4.5 要約
 4.6 演習
5 構 造 学 習
 5.1 ベイズネットワークの評価
 5.2 有向グラフ探索
 5.3 マルコフ等価クラス
 5.4 部分有向グラフ探索
 5.5 要約
 5.6 演習
6 単純な意思決定
 6.1 合理的な選好に関する制約
 6.2 効用関数
 6.3 効用導出
 6.4 期待効用最大化原理
 6.5 意思決定ネットワーク
 6.6 情報の価値
 6.7 非合理性
 6.8 要約
 6.9 演習
第 II 部逐次的問題
7 厳 密 解 法
 7.1 マルコフ決定過程
 7.2 方策評価
 7.3 価値関数方策
 7.4 方策反復
 7.5 価値反復
 7.6 非同期価値反復
 7.7 線形計画の定式化
 7.8 二次関数型報酬をもつ線形システム
 7.9 要約
 7.10 演習
8 近似価値関数
 8.1 パラメトリック表現
 8.2 最近傍
 8.3 カーネル平滑化
 8.4 線形補完
 8.5 シンプレックス補完
 8.6 線形回帰
 8.7 ニューラルネットワーク回帰
 8.8 要約
 8.9 演習
9 オンライン計画
 9.1 後退時間区間計画
 9.2 ロールアウトによる先読み
 9.3 前方探索
 9.4 分枝限定法
 9.5 スパースサンプリング
 9.6 モンテカルロツリー探索
 9.7 ヒューリスティック探索
 9.8 ラベル付きヒューリスティック探索
 9.9 開ループ計画
  9.9.1 決定論的モデル予測制御
  9.9.2 ロバストモデル予測制御
  9.9.3 多予想モデル予測制御
 9.10 要約
 9.11 演習
10 方 策 探 索
 10.1 方策評価近似
 10.2 局所探索
 10.3 遺伝的アルゴリズム
 10.4 交差エントロピー法
 10.5 進化戦略
 10.6 等方性進化戦略
 10.7 要約
 10.8 演習
11 方策勾配推定
 11.1 有限差分
 11.2 回帰勾配
 11.3 尤度比
 11.4 未来報酬
 11.5 基準値減算
 11.6 要約
 11.7 演習
12 方策勾配最適化
 12.1 勾配上昇更新
 12.2 制限された勾配更新
 12.3 自然勾配更新
 12.4 信頼領域の更新
 12.5 クランプされた代理目的
 12.6 要約
 12.7 演習
13 アクター・クリティック法
 13.1 アクター・クリティック
 13.2 一般化アドバンテージ推定
 13.3 決定論的方策勾配
 13.4 モンテカルロツリー探索を用いたアクター・クリティック
 13.5 要約
 13.6 演習
14 方 策 検 証
 14.1 パフォーマンス指標の評価
 14.2 希少事象に対するシミュレーション
 14.3 ロバスト性分析
 14.4 トレード分析
 14.5 敵対的分析
 14.6 要約
 14.7 演習
訳者あとがき
文献
索引

執筆者紹介

関連情報

ジャンル一覧

ジャンル一覧

  • Facebook
  • X
  • 「愛読者の声」 ご投稿はこちら 「愛読者の声」 ご投稿はこちら
  • EBSCO eBooks
  • eBook Library