網路價≠最低優惠價!記得登入會員看看唷!

75折

Hey Siri及Ok Google原理 - AI語音辨識專案真應用開發 楊學銳, 晏超, 劉雪松

產品編號:9786267569795
促銷 下單就送小禮物
購物每消費滿300元,可獲得1元購物金

網路價 NT${{ commaFormat(product.price_actu) }} NT${{commaFormat(product.price_sugg)}}

專屬特惠價 NT${{ commaFormat(product.group_price) }}

優惠價 NT${{ commaFormat(product.member_price) }} NT${{ commaFormat(product.group_price) }}

商品組合
{{k_row.name}} x {{k_row.qty}}
{{k_row.intro}}
贈品 (買就送)

{{ pItem.title }}

備註 ⭐此書較長備貨,下單後約7-10個工作日(不含例假日)寄出
此商品不適用
付款方式

轉帳/匯款/無摺存款 / LinePay付款 / 超商代碼付款(綠界金流) / 信用卡一次付清(綠界金流) / AFTEE 先享後付 / [圖書專用] 7-11取貨付款

配送方式

7-11超商取貨 / 全家超商取貨 / 宅配到家 / 校園門市店到店取貨(需7~10個工作天,急用勿選)

標籤: #

超值加購


作者: 楊學銳, 晏超, 劉雪松
出版社:深智數位
出版日期:2025/05/19
語言:繁體中文

【內容】
\\好評再版//

  ★語音前端處理,語音辨識
  ★語者自動分段標記演算法原理
  ★基於WebRTC,Kaldi和gRPC,從零建構穩定、高性能、可商用的語音服務
  ★前端演算法完整介紹
  ★語音活動檢測、語音降噪、回聲消除、波束形成
  ★WebRTC和Kaldi最佳化處理流程
  ★形成語音演算法SDK
  ★微服務建構的RPC遠端呼叫框架和SDK

  本書從語音辨識的概要談起,並且介紹了目前市場概況及常用的工具包括WebRTC及技術人最愛的Kaldi。接下來說明了語音訊號的聲學基和數位化、時頻變換的原理。語音技術中最重要的演算法也有說明,包括了各種VAD、單通道降噪、回聲消除等濾波器、波束形成的介紹。重點部分包括了語音辨識中最重要的特徵提取和聲學模型,如傳統及神經網路基礎的實作法。

  在了解原理之後,即開始建立真正專案,包括使用Kaldi實作一個國語的模型。最近流行的語者自動分段標記在本書中也有實作,大量應用了深度學習的模型及音訊庫、函數庫等。如使用了CNCeleb的聲紋資料當作訓練集。在Kaldi的進階應用方面,也實作了其SDK的音訊特徵提取及WebRTC的語音活動檢測。

  本書的收尾之作就是使用了gRPC進行一個完整的語音識別服務實作,使用了現在最好用的ProtoBuf的協定進行運作,完成了伺服器/客戶端應用開發,可以說是目前市面上最完整的語音辨識中文圖書。

Chapter 01 語音辨識概述
▌1.1 語音辨識發展歷程

▌1.2 語音辨識產業與應用

1.2.1 消費級市場

1.2.2 企業級市場

▌1.3 常用語音處理工具

1.3.1 WebRTC

1.3.2 Kaldi

1.3.3 點對點語音辨識工具套件



Chapter 02 語音訊號基礎

▌2.1 語音訊號的聲學基礎

2.1.1 語音產生機制

2.1.2 語音訊號的產生模型

2.1.3 語音訊號的感知

▌2.2 語音訊號的數位化和時頻變換

2.2.1 語音訊號的採樣、量化和編碼

2.2.2 語音訊號的時頻變換

▌2.3 本章小結



Chapter 03 語音前端演算法

▌3.1 語音前端演算法概述

▌3.2 VAD

3.2.1 基於門限判決的VAD

3.2.2 基於高斯混合模型的VAD

3.2.3 基於神經網路的VAD

▌3.3 單通道降噪

3.3.1 譜減法

3.3.2 維納濾波法

3.3.3 音樂雜訊和參數譜減法

3.3.4 貝氏準則下的MMSE

3.3.5 雜訊估計

3.3.6 基於神經網路的單通道降噪

▌3.4 回音消除

3.4.1 回音消除概述

3.4.2 線性自我調整濾波

3.4.3 分區塊頻域自我調整濾波器

3.4.4 雙邊對話檢測

3.4.5 延遲估計

3.4.6 殘留回音消除

3.4.7 基於神經網路的回音消除

▌3.5 麥克風陣列與波束形成

3.5.1 麥克風陣列概述

3.5.2 延遲求和波束形成

3.5.3 最小方差無失真回應波束形成

3.5.4 廣義旁波瓣對消波束形成

3.5.5 後置濾波

3.5.6 基於神經網路的波束形成

▌3.6 聲源定位

3.6.1 GCC-PHAT

3.6.2 基於自我調整濾波的聲源定位

3.6.3 SRP-PHAT

3.6.4 子空間聲源定位演算法

3.6.5 基於神經網路的聲源定位

▌3.7 其他未盡話題

▌3.8 本章小結



Chapter 04 語音辨識原理

▌4.1 特徵提取

4.1.1 特徵前置處理

4.1.2 常見的語音特徵

▌4.2 傳統聲學模型

4.2.1 聲學建模單元

4.2.2 GMM-HMM

4.2.3 強制對齊

▌4.3 DNN-HMM

4.3.1 語音辨識中的神經網路基礎

4.3.2 常見的神經網路結構

▌4.4 語言模型

4.4.1 n-gram 語言模型

4.4.2 語言模型的評價指標

4.4.3 神經語言模型

▌4.5 WFST 解碼器

4.5.1 WFST 原理

4.5.2 常見的WFST 運算

4.5.3 語音辨識中的WFST 解碼器

4.5.4 權杖傳遞演算法

4.5.5 Beam Search

▌4.6 序列區分性訓練

4.6.1 MMI 和bMMI

4.6.2 MPE 和sMBR

4.6.3 詞圖

4.6.4 LF-MMI

▌4.7 點對點語音辨識

4.7.1 CTC

4.7.2 Seq2Seq

▌4.8 語音辨識模型評估

▌4.9 本章小結



Chapter 05 中文漢語模型訓練-- 以multi_cn 為例

▌5.1 Kaldi 安裝與環境設定

▌5.2 Kaldi 中的資料格式與資料準備

▌5.3 語言模型訓練

▌5.4 發音詞典準備

▌5.5 特徵提取

▌5.6 Kaldi 中的Transition 模型

▌5.7 預對齊模型訓練

5.7.1 單音素模型訓練

5.7.2 delta 特徵模型訓練

5.7.3 lda_mllt 特徵變換模型訓練

5.7.4 語者自我調整訓練

▌5.8 資料增強

5.8.1 資料清洗及重分割

5.8.2 速度增強和音量增強

5.8.3 SpecAugment

▌5.9 I-Vector 訓練

5.9.1 對角UBM

5.9.2 I-Vector 提取器

5.9.3 提取訓練資料的I-Vector

▌5.10 神經網路訓練

5.10.1 Chain 模型

5.10.2 Chain 模型態資料準備

5.10.3 神經網路設定與訓練

▌5.11 解碼圖生成

▌5.12 本章小結

▌5.13 附錄

5.13.1 xconfig 中的描述符及網路設定表

5.13.2 Chain 模型中的egs

5.13.3 Kaldi nnet3 中迭代次數和學習率調整



Chapter 06 基於Kaldi 的語者自動分段標記

▌6.1 語者自動分段標記概述

6.1.1 什麼是語者自動分段標記

6.1.2 語者自動分段標記技術

6.1.3 語者自動分段標記評價指標

▌6.2 聲紋模型訓練-- 以CNCeleb 為例

6.2.1 聲紋資料準備

6.2.2 I-Vector 訓練

6.2.3 X-Vector 訓練

6.2.4 LDA/PLDA 後端模型訓練

6.2.5 語者自動分段標記後端模型訓練

▌6.3 本章小結



Chapter 07 基於Kaldi 的語音SDK 實現

▌7.1 語音特徵提取

7.1.1 音訊讀取

7.1.2 音訊特徵提取

▌7.2 基於WebRTC 的語音活動檢測

▌7.3 語者自動分段標記模組

7.3.1 I-Vector 提取

7.3.2 X-Vector 提取

7.3.3 語者自動分段標記演算法實現

▌7.4 語音辨識解碼

▌7.5 本章小結



Chapter 08 基於gRPC 的語音辨識服務

▌8.1 gRPC 語音服務

▌8.2 ProtoBuf 協定定義

▌8.3 基於gRPC 的語音服務實現

8.3.1 gRPC Server 實現

8.3.2 gRPC Client 實現

8.3.3 gRPC 語音服務的編譯與測試

▌8.4 本章小結



Appendix A 參考文獻

【關於教科書訂購說明】

☆ 單本即有折扣,將商品放入購物車就可以看見優惠價唷!五本以上團購更便宜!加入會員訂購,還可累積購物金!

★ 若有急需用書,可先LINE私訊詢問庫存呦~

☆ 出貨時間:有現貨的,2個工作日內出貨;無現貨,約3~5個工作日 出貨


【寄送方式說明】

實體門市取貨

全台麗文校園書局皆可取貨,貨到書局將會以簡訊通知。


超商取貨

提供7-11及全家超商取貨(需先付款,無貨到付款)。


一般宅配

本公司主要與黑貓宅急便配合,送達到您指定的地址。


※當您於本網站消費交易完成後,電子發票將會以電子郵件給您;如需紙本發票請於下訂時於備註欄位說明。


【付款方式說明】

 ATM轉帳、匯款

銀行│第一銀行-三民分行

代號│007

戶名│麗文文化事業股份有限公司

帳號│704-10-051861

※實體ATM每日轉帳最高限額為3萬,若訂購金額超過3萬元,請分兩天或是使用不同的銀行帳戶轉帳。

 信用卡(可分期,需負擔手續費)

凡各家銀行的VISA、MASTER、Union Pay、JCB信用卡皆可使用。

 超商代碼

系統會發送繳費代碼至您的電子信箱,需自行至「超商機器ex:iBon」輸入代碼,產生繳費單後前往櫃檯繳費。


❼ 免卡分期

麗文校園購與「zingala銀角零卡」「第一資融」以及「皮路後支付」合作,讓您免用信用卡就可以購物
如有使用上的問題,可以先與揪小編聯絡唷!。

※請注意:超過7天未付款之訂單則訂單自動失效;免卡分期訂單成立起7天內未主動聯繫亦同。


【其他說明】

關於出貨

1.商品為不缺貨前提下,訂單完成付款後2-4個工作天將會出貨(不含例假日及國定假日);若商品缺貨則須等待1-2週。

2.麗文校園揪來玩保留訂單接受與否權利,若因交易條件有誤或有其他情形導致我們無法接受您的訂單,將以E-mail發送取消訂單通知給您,造成不便敬請見諒。


關於退貨

1.非門市現場消費享有七天猶豫期,收到商品當天往後算七天內若是決定不買,則協助不要拆封,一拆封視同願意購買。

2.若真的決定不購買商品要退貨,請聯繫我們LINE線上客服,我們會盡速為您處理。


關於新品瑕疵與維修保固

1.全新商品享有購買七日內,新品瑕疵的換新保障;但新品瑕疵與否,是由商品代理商或原廠所判定,麗文校園揪來玩僅能依據判定的結果給予協助。若是原廠判定非新品瑕疵則無法換新,需改為維修的方式處理。

2.新品瑕疵換新的作業時間,將依各廠商的流程而定,最快2個工作天,慢的話也可能需要到15個工作天。

3.購買超過七日後,維修服務由原廠提供。如有需要維修,麗文校園揪來玩可以代為送修,但送修如需運費時(EX:原廠沒有提供免費收件服務),則需由您負擔送修的運費(運費約為100元起,因商品大小而異)。


【華碩的維修服務】

華碩維修保固說明

三大禮遇及完美保固電商素材-5_Page2_09.jpg