LLM × 網路爬蟲終極實戰:n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent 陳會安
網路價
NT${{ commaFormat(product.price_actu) }}
NT${{commaFormat(product.price_sugg)}}
專屬特惠價 NT${{ commaFormat(product.group_price) }}
優惠價
NT${{ commaFormat(product.member_price) }}
NT${{ commaFormat(product.group_price) }}
商品組合
贈品 (買就送)
{{ pItem.title }}
付款方式
轉帳/匯款/無摺存款 / LinePay付款 / 超商代碼付款(綠界金流) / 信用卡一次付清(綠界金流) / AFTEE 先享後付 / [圖書專用] 7-11取貨付款
配送方式
7-11超商取貨 / 全家超商取貨 / 宅配到家 / 校園門市店到店取貨(需7~10個工作天,急用勿選)
超值加購
{{ pItem.title }}
型號:{{ pItem.model }}
加購價 NT${{pItem.extra_price}}
(原價NT${{pItem.price_orig}})
作者:陳會安
出版社:旗標科技股份有限公司
出版日期:2025/11/27
【內容】
身處 LLM 時代的必備技能
AI 爬蟲與資料檢索的全本機工作流
你還在用傳統的方法爬取網路資料嗎?
還在手動分析 HTML 網頁結構、逐一定位網頁元素、再手刻爬蟲程式嗎?
身處 AI 世代,是時候該學習更聰明、更高效的資料收集方法,
讓你坐在電腦前,喝著咖啡、悠閒地看著 AI 為你自動爬取網路資料。
在 AI 飆速發展的今天,傳統網路爬蟲技術正迎來全新的變革。
過去,Python 爬蟲程式的開發者必須自行剖析 HTML 網頁結構,撰寫繁瑣複雜的資料擷取規則與步驟;如今,隨著 LLM 的普及,AI 已能協助我們理解 HTML 網頁結構、定位網頁資料,甚至能夠自動化建立整個爬取流程,大幅提升開發效率。
本書從 HTML 結構解析入門,循序講解 BeautifulSoup + CSS 選擇器、lxml + XPath 表達式、正規表達式等核心技術,再深入 Selenium 模擬瀏覽器互動及 Scrapy 爬蟲框架的專業應用,帶領讀者全面掌握靜態與動態網頁擷取技術。更進一步結合 Playwright 自動化瀏覽器、以及 AI 驅動的爬蟲框架 Crawl4AI 和 ScrapeGraphAI,讓 LLM 成為理解與提取網頁資料的主力。
不只如此,本書採用 n8n × Ollama 全本機架構,無需 API Key、無需 Docker,即可整合 SearXNG 搜尋引擎、Crawl4AI API 資料爬取、Qdrant 向量資料庫與 RAG 知識檢索生成,最終打造出 MCP + AI Agent 自動化流程 ⸺ 從搜尋、爬取到資料處理與知識生成一手包辦!
本書特色:
用 AI 分析 HTML 結構建立 Python 網路爬蟲
▸全面掌握靜態與動態 HTML 網頁擷取技術,CSS Selector、XPath 一次上手
▸實戰演練 BeautifulSoup、Selenium、Scrapy 經典 Python 爬蟲框架
Python × LLM 建立 AI 網路爬蟲
▸整合 OpenAI、Gemini、Groq、Ollama 等多種 LLM,打造智慧爬蟲系統
▸運用 AI 驅動的爬蟲技術 Crawl4AI 與 ScrapeGraphAI,自動理解並提取網頁內容
▸結合非同步程式設計,提升資料抓取效率與彈性
整合 Python × AI 網路爬蟲的 AI 工作流程:n8n
▸以視覺化介面建立自動化流程,輕鬆整合搜尋、爬取與資料處理
▸結合 Qdrant 向量資料庫 × RAG 技術,打造個人化知識檢索系統
▸構建全本機 AI Agent 工作流,實現從資料擷取到生成的自動化流程
▌第 1 章 HTML、JSON 與網路爬蟲的基礎
1-1 網路爬蟲的基礎
1-2 網路爬蟲的相關技術
1-3 HTML 標籤語法與結構
1-4 CSV 與 JSON
1-5 Python × AI 網路爬蟲的相關函式庫
▌第 2 章 從網路取得資料
2-1 認識 HTTP 標頭與 httpbin.org 服務
2-2 使用 Requests 送出 HTTP 請求
2-3 取得 HTTP 回應內容
2-4 送出進階的 HTTP 請求
2-5 錯誤 / 例外處理與檔案存取
▌第 3 章 擷取靜態 HTML 網頁資料
3-1 在 HTML 網頁定位目標資料
3-2 使用 BeautifulSoup 剖析 HTML 網頁
3-3 分析靜態 HTML 網頁
3-4 使用 find() 函式搜尋 HTML 網頁
3-5 使用正規表達式搜尋 HTML 網頁
▌第 4 章 使用 CSS 選擇器爬取資料
4-1 認識 CSS 層級式樣式表
4-2 使用 CSS 選擇器定位 HTML 標籤
4-3 Google Chrome 開發人員工具
4-4 ChatGPT 應用:找出定位 HTML 標籤的 CSS 選擇器
4-5 在 BeautifulSoup 使用 CSS 選擇器
▌第 5 章 走訪 HTML 網頁取出資料與資料儲存
5-1 如何走訪 HTML 網頁
5-2 走訪 HTML 網頁取得資料
5-3 修改 HTML 網頁來爬取資料
5-4 資料清理
5-5 將取得資料儲存成 CSV 和 JSON 檔案
5-6 從網路下載圖檔
▌第 6 章 使用 XPath 表達式與 lxml 套件建立爬蟲程式
6-1 XPath 與 lxml 套件的基礎
6-2 使用 Requests 和 lxml 套件
6-3 XPath 資料模型
6-4 XPath 基本語法
6-5 XPath 運算子與函式
6-6 ChatGPT 應用:學習 XPath 表達式查詢 HTML 標籤
▌第 7 章 Selenium 表單互動與動態網頁擷取
7-1 認識動態網頁
7-2 安裝 Selenium
7-3 Selenium 的基本使用
7-4 定位網頁資料與例外處理
7-5 與 HTML 表單進行互動
7-6 JavaScript 動態網頁擷取
▌第 8 章 Scrapy 爬蟲框架
▌第 9 章 Python × ChatGPT 網路爬蟲
▌第 10 章 在 Python 使用 LLM 大型語言模型
▌第 11 章 Python × AI 網路爬蟲(一):非同步程式設計 + Crawl4AI
▌第 12 章 Python × AI 網路爬蟲(二):ScrapeGraphAI
▌第 13 章 視覺化 AI 工作流程:n8n
▌第 14 章 爬取知識庫的資料:SearXNG + Crawl4AI API
▌第 15 章 建立你自己的知識庫:Qdrant 向量資料庫
▌第 16 章 打造你自己的客製化 LLM:AI Agent、MCP 與 RAG 系統
▌附錄 A Python 開發環境:Anaconda 與
【關於教科書訂購說明】
☆ 單本即有折扣,將商品放入購物車就可以看見優惠價唷!五本以上團購更便宜!加入會員訂購,還可累積購物金!
★ 若有急需用書,可先LINE私訊詢問庫存呦~
☆ 出貨時間:有現貨的,2個工作日內出貨;無現貨,約3~5個工作日 出貨
【寄送方式說明】
❶ 實體門市取貨
全台麗文校園書局皆可取貨,貨到書局將會以簡訊通知。
❷ 超商取貨
提供7-11及全家超商取貨(需先付款,無貨到付款)。
❸ 一般宅配
本公司主要與黑貓宅急便配合,送達到您指定的地址。
※當您於本網站消費交易完成後,電子發票將會以電子郵件寄給您;如需紙本發票請於下訂時於備註欄位說明。
【付款方式說明】
❶ ATM轉帳、匯款
銀行│第一銀行-三民分行
代號│007
戶名│麗文文化事業股份有限公司
帳號│704-10-051861
※實體ATM每日轉帳最高限額為3萬,若訂購金額超過3萬元,請分兩天或是使用不同的銀行帳戶轉帳。
❷ 信用卡(可分期,需負擔手續費)
凡各家銀行的VISA、MASTER、Union Pay、JCB信用卡皆可使用。
![]()
❺ 超商代碼
系統會發送繳費代碼至您的電子信箱,需自行至「超商機器ex:iBon」輸入代碼,產生繳費單後前往櫃檯繳費。
❼ 免卡分期
麗文校園購與「zingala銀角零卡」「第一資融」以及「皮路後支付」合作,讓您免用信用卡就可以購物。
如有使用上的問題,可以先與揪小編聯絡唷!。
※請注意:超過7天未付款之訂單則訂單自動失效;免卡分期訂單成立起7天內未主動聯繫亦同。
【其他說明】
❶關於出貨
1.商品為不缺貨前提下,訂單完成付款後2-4個工作天將會出貨(不含例假日及國定假日);若商品缺貨則須等待1-2週。
2.麗文校園揪來玩保留訂單接受與否權利,若因交易條件有誤或有其他情形導致我們無法接受您的訂單,將以E-mail發送取消訂單通知給您,造成不便敬請見諒。
❷關於退貨
1.非門市現場消費享有七天猶豫期,收到商品當天往後算七天內若是決定不買,則協助不要拆封,一拆封視同願意購買。
2.若真的決定不購買商品要退貨,請聯繫我們LINE線上客服,我們會盡速為您處理。
❸關於新品瑕疵與維修保固
1.全新商品享有購買七日內,新品瑕疵的換新保障;但新品瑕疵與否,是由商品代理商或原廠所判定,麗文校園揪來玩僅能依據判定的結果給予協助。若是原廠判定非新品瑕疵則無法換新,需改為維修的方式處理。
2.新品瑕疵換新的作業時間,將依各廠商的流程而定,最快2個工作天,慢的話也可能需要到15個工作天。
3.購買超過七日後,維修服務由原廠提供。如有需要維修,麗文校園揪來玩可以代為送修,但送修如需運費時(EX:原廠沒有提供免費收件服務),則需由您負擔送修的運費(運費約為100元起,因商品大小而異)。
【華碩的維修服務】






