BOOK SEARCH
内容紹介
音声情報処理の入門書。音声コミュニケーションの機構・原理と、コンピュータでの再現・実装を豊富な実習例とともに学ぶ。〔内容〕発声のしくみ/音声のスペクトルの基礎/音声の生成/聴取のしくみ/音声の特徴抽出/母音の認識/子音と音節の認識/韻律の認識/意図・態度・感情の認識/音声対話の生成
編集部から
目次
1.は じ め に
1. 1音声コミュニケーションのしくみ
1. 2本書の構成
1. 3コンピュータによる音声の観察
1. 3. 1音声データの録音
1. 3. 2音声データの可視化
章 末 問 題
2.発声のしくみ
2. 1音声による情報伝達
2. 1. 1音声波形の個人性の比較
2. 1. 2母音と子音の観察
2. 2声帯と声道の生理学的構造
2. 2. 1声帯と基本周波数
2. 2. 2声道と音色
2. 3日本語の音素体系とその発音方法
2. 3. 1母音
2. 3. 2子音
2. 3. 3拗音
2. 3. 4特殊な音素
章 末 問 題
3.音声のスペクトルの基礎
3. 1複合波のスペクトル
3. 2音波のスペクトル
3. 3音声のスペクトル
3. 3. 1振幅スペクトル
3. 3. 2フレーム処理
3. 3. 3対数振幅スペクトルと対数パワースペクトル
3. 4スペクトログラムによる音声の観察
3. 5母音生成の音源フィルタ理論
章 末 問 題
4.母音の生成
4. 1物理モデルによる母音発声のモデル化
4. 1. 1均一な断面積の気柱の振動
4. 1. 2均一な断面積の気柱の周波数応答
4. 2声道フィルタを用いた母音の合成
4. 2. 1声帯振動モデル
4. 2. 2母音の合成
4. 2. 3異なる断面積の気柱を接続した気柱
4. 3フォルマントと調音位置
章 末 問 題
5.聴取のしくみ
5. 1聴覚器官の構造
5. 1. 1耳介~中耳
5. 1. 2内耳
5. 1. 3聴覚器官の音声信号処理
5. 2プリエンファシス
5. 3聴覚フィルタ
5. 3. 1ERB 尺 度
5. 3. 2メ ル 尺 度
5. 4メル周波数フィルタバンク
5. 4. 1フィルタバンク
5. 5メル周波数スケール変換(メルスペクトル)
章 末 問 題
6.音声の特徴抽出
6. 1音声のスペクトルから得られる情報
6. 2聴覚末梢の情報処理
6. 3音素の特徴をあらわす声道関数
6. 4ケプストラム分析
6. 4. 1算 出 方 法
6. 4. 2ケプストラムに基づく成分の分離
6. 4. 3ケプストラムを用いた音声の分析
6. 4. 4ケプストラム距離尺度
6. 5メル周波数ケプストラム係数(MFCC)
章 末 問 題
7.母音の認識
7. 1母音の分布の特徴
7. 1. 1フォルマントと F1/F2 平面
7. 1. 2フォルマントの多様性
7. 2母音の分布のモデル化
7. 2. 1母音のデータの構築
7. 2. 2正規分布による表現
7. 2. 3混合正規分布による表現
章 末 問 題
8.子音と音節の認識
8. 1子音の調音方法と弁別素性
8. 1. 1破裂音(plosive)
8. 1. 2摩擦音(fricative)
8. 1. 3破擦音(affricate)
8. 1. 4鼻音(nasal)
8. 1. 5はじき音(Flap)
8. 1. 6接近音(approximant)
8. 2調音結合とフォルマント遷移
8. 3MFCC による音韻の認識
8. 4動的特徴量
章 末 問 題
9.韻律の認識
9. 1日本語のイントネーションとアクセント
9. 2基本周波数検出
9. 2. 1自己相関を用いる方法
9. 2. 2スペクトルを用いる方法
9. 2. 3ケプストラムを用いる方法
9. 3歌声と楽器音の情報処理
章 末 問 題
10.発話が伝えるさまざまな情報の認識
10. 1発話の基本単位
10. 2文と言葉の意味
10. 3談 話 行 為
10. 4話者の内的状態
10. 4. 1感情
10. 4. 2態度
10. 5スピーチスタイル
10. 6話者の個人性
10. 6. 1x-vector の学習
10. 6. 2話 者 照 合
10. 6. 3話者ダイアライゼーション
章 末 問 題
11.発話の生成
11. 1波形ベースの音声合成法
11. 2テキスト音声変換(TTS)
11. 2. 1ボコーダによる発話速度と音高の加工
11. 2. 2ボコーダによる歌声の加工
11. 2. 3ボコーダによるピッチと音色の加工
11. 3音声テキスト変換(STT)
11. 4発話タイミングの推定
11. 5音声対話システムのしくみ
章 末 問 題
文献
索引
コラム
1.録音とサンプリング周波数
2.音素と音韻
3.音声コーパス
4.音声表記と音素表記
5.振幅スペクトルと位相スペクトル
6.対数とデシベル
7.深層学習と音声情報処理
8.線形予測符号化
9.フォルマント解析のツール
10.音節とモーラ
11.雑音・残響下での音声処理