生成式AI開發實作|使用Transformers與擴散模型
網路價
NT${{ commaFormat(product.price_actu) }}
NT${{commaFormat(product.price_sugg)}}
專屬特惠價 NT${{ commaFormat(product.group_price) }}
優惠價
NT${{ commaFormat(product.member_price) }}
NT${{ commaFormat(product.group_price) }}
商品組合
贈品 (買就送)
{{ pItem.title }}
付款方式
轉帳/匯款/無摺存款 / LinePay付款 / 超商代碼付款(綠界金流) / 信用卡一次付清(綠界金流) / AFTEE 先享後付 / [圖書專用] 7-11取貨付款
配送方式
7-11超商取貨 / 全家超商取貨 / 宅配到家 / 校園門市店到店取貨(需7~10個工作天,急用勿選)
超值加購
{{ pItem.title }}
型號:{{ pItem.model }}
加購價 NT${{pItem.extra_price}}
(原價NT${{pItem.price_orig}})
作者:Omar Sanseviero/ Pedro Cuenca/ Apolinário Passos/ Jonathan W
譯者:賴屹民
出版:美商歐萊禮股份有限公司台灣分公司
出版日期:2025/11/26
【內容】
探索生成式人工智慧的無限可能!
「如果你是開發者,想要掌握過去十年來最大規模的AI革命背後的工具及概念,本書是必備的指南。」
—Lewis Tunstall,Hugging Face機器學習工程師及《Hugging Face and coauthor of Natural Language Processing with Transformers》一書共同作者
「本書包含學習生成式AI的一切資源,包括全面的解說、深思熟慮的技巧,與DIY練習,可謂應有盡有。」
—Luba Elliott,AI藝術策展人,elluba.com
深入的理論解析與實用的程式碼範例,帶您掌握生成文本、圖像和音訊的最新技術。無論您是數據科學家還是軟體工程師,本書都將助您輕鬆上手,創造出令人驚豔的AI生成作品。立即開啟您的生成式AI之旅,讓創意與技術完美融合!
本書將教導資料科學家和軟體工程師,如何使用生成式媒體技術和人工智慧來創造新穎的圖像或音樂。書中介紹了理論概念,並提供豐富的程式碼範例和插圖,讓讀者能夠在Google Colaboratory、Kaggle或Hugging Face Spaces等服務上執行這些範例,並學習使用開源庫。
本書還探討了從頭開始訓練和使用大型預訓練模型之間的權衡,如何建立能夠修改圖像風格的模型,以及調整變形模型以達到創意目的。內容涵蓋了文本、圖像和音頻等多種數據類型的生成模型,並詳細講解了Transformer和擴散模型等先進技術的構建和訓練方法。最後介紹了如何訓練一個能夠根據個人風格撰寫文字的模型,以及如何部署模型作為互動展示或服務。
--------------------------------------------------
透過這本實作指南,學習運用生成式AI技術來建立奇妙的文本、圖像、音訊,甚至音樂。你將瞭解最先進的生成模型如何運作、如何微調與調整它們來滿足需求,以及如何結合現成的基礎模組來建立新模型,並在不同領域中開發創新的應用程式。
這本首選指南透過豐富的範例程式與容易瞭解的插圖來介紹理論概念,並帶你實際應用它們。
你將學習如何透過開源的程式庫來應用transformers和擴散模型,並探索程式、研究幾個既有的專案,藉以完成你的專案。
• 建立並自訂文本與圖像生成模型
• 瞭解「使用預訓的模型」與「微調自有的模型」之間的取捨
• 做出能夠以任意風格生成、編輯與修改圖像的模型,並運用它們
• 為各種創意用途量身打造transformer和擴散模型
• 訓練能夠反映獨特風格的模型
前言
【第一部分 利用開放模型】
第一章 生成媒體導論
生成圖像
生成文本
產生一段聲音
倫理與社會影響力
我們的過去與現狀
生成式AI模型是怎麼創造出來的?
總結
第二章 transformer
語言模型的實際運作
transformer區塊
transformer模型的發展譜系
預訓的威力
transformer回顧
專案時間:使用語言模型來生成文本
總結
練習題
挑戰題
參考文獻
第三章 壓縮資訊與表示資訊
AutoEncoders
Variational AutoEncoders
CLIP
CLIP的替代方案
專案時間:語義圖像搜尋
總結
練習題
挑戰題
參考文獻
第四章 擴散模型
關鍵洞察:逐步修正
訓練擴散模型
深入探討:雜訊排程
深入探討:UNet與替代方案
深入探討:擴散目標
專案時間:訓練你的擴散模型
總結
練習題
挑戰題
參考文獻
第五章 穩定擴散和條件生成
加入控制手段:條件擴散模型
提升效率:Latent Diffusion
Stable Diffusion:深入瞭解組件
綜合所有內容:註解採樣迴圈
開放資料,開放模型
專案時間:使用Gradio 建立互動式ML Demo
總結
練習題
挑戰題
參考文獻
【第二部分 運用遷移學習來建構生成模型】
第六章 微調語言模型
文本分類
生成文本
指令
適配器簡介
量化簡介
綜合所有內容
深入探討模型評估
專案時間:檢索增強生成
總結
練習題
挑戰題
參考文獻
第七章 微調Stable Diffusion
完整的Stable Diffusion微調
DreamBooth
訓練LoRA
賦予Stable Diffusion新能力
專案時間:自己訓練一個SDXL DreamBooth LoRA
總結
練習題
挑戰題
參考文獻
【第三部分 進一步探索】
第八章 文字轉圖像模型的創意應用
圖像轉圖像
圖像修補
提示詞加權與圖像編輯
透過反轉來編輯真實圖像
ControlNet
圖像提示與圖像變體
專案時間:你的創意畫布
總結
練習題
參考文獻
第九章 音訊生成
音訊資料
使用transformer-based 構來將語音轉為文字
從文字轉語音到音訊生成
評估音訊生成系統
下一步呢?
專案時間:完整的對話系統
總結
練習題
挑戰題
參考文獻
第十章 生成式AI的快速發展領域
偏好優化
極長的前後文
Mixture of Experts
優化與量化
資料
One Model to Rule Them All
電腦視覺
3D電腦視覺
影片生成
多模態
社群
附錄 A 開源工具
附錄 B LLM記憶體需求
附錄 C 全流程檢索增強生成
索引
【關於教科書訂購說明】
☆ 單本即有折扣,將商品放入購物車就可以看見優惠價唷!五本以上團購更便宜!加入會員訂購,還可累積購物金!
★ 若有急需用書,可先LINE私訊詢問庫存呦~
☆ 出貨時間:有現貨的,2個工作日內出貨;無現貨,約3~5個工作日 出貨
【寄送方式說明】
❶ 實體門市取貨
全台麗文校園書局皆可取貨,貨到書局將會以簡訊通知。
❷ 超商取貨
提供7-11及全家超商取貨(需先付款,無貨到付款)。
❸ 一般宅配
本公司主要與黑貓宅急便配合,送達到您指定的地址。
※當您於本網站消費交易完成後,電子發票將會以電子郵件寄給您;如需紙本發票請於下訂時於備註欄位說明。
【付款方式說明】
❶ ATM轉帳、匯款
銀行│第一銀行-三民分行
代號│007
戶名│麗文文化事業股份有限公司
帳號│704-10-051861
※實體ATM每日轉帳最高限額為3萬,若訂購金額超過3萬元,請分兩天或是使用不同的銀行帳戶轉帳。
❷ 信用卡(可分期,需負擔手續費)
凡各家銀行的VISA、MASTER、Union Pay、JCB信用卡皆可使用。
![]()
❺ 超商代碼
系統會發送繳費代碼至您的電子信箱,需自行至「超商機器ex:iBon」輸入代碼,產生繳費單後前往櫃檯繳費。
❼ 免卡分期
麗文校園購與「zingala銀角零卡」「第一資融」以及「皮路後支付」合作,讓您免用信用卡就可以購物。
如有使用上的問題,可以先與揪小編聯絡唷!。
※請注意:超過7天未付款之訂單則訂單自動失效;免卡分期訂單成立起7天內未主動聯繫亦同。
【其他說明】
❶關於出貨
1.商品為不缺貨前提下,訂單完成付款後2-4個工作天將會出貨(不含例假日及國定假日);若商品缺貨則須等待1-2週。
2.麗文校園揪來玩保留訂單接受與否權利,若因交易條件有誤或有其他情形導致我們無法接受您的訂單,將以E-mail發送取消訂單通知給您,造成不便敬請見諒。
❷關於退貨
1.非門市現場消費享有七天猶豫期,收到商品當天往後算七天內若是決定不買,則協助不要拆封,一拆封視同願意購買。
2.若真的決定不購買商品要退貨,請聯繫我們LINE線上客服,我們會盡速為您處理。
❸關於新品瑕疵與維修保固
1.全新商品享有購買七日內,新品瑕疵的換新保障;但新品瑕疵與否,是由商品代理商或原廠所判定,麗文校園揪來玩僅能依據判定的結果給予協助。若是原廠判定非新品瑕疵則無法換新,需改為維修的方式處理。
2.新品瑕疵換新的作業時間,將依各廠商的流程而定,最快2個工作天,慢的話也可能需要到15個工作天。
3.購買超過七日後,維修服務由原廠提供。如有需要維修,麗文校園揪來玩可以代為送修,但送修如需運費時(EX:原廠沒有提供免費收件服務),則需由您負擔送修的運費(運費約為100元起,因商品大小而異)。
【華碩的維修服務】






