AI Vision × LLM 電腦視覺應用聖經：OpenCV × YOLO × Ollama 解鎖多模態全攻略陳會安

Name: AI Vision × LLM 電腦視覺應用聖經：OpenCV × YOLO × Ollama 解鎖多模態全攻略 陳會安
SKU: 9789863128311
Price: 880 TWD
Availability: InStock
Rating: 5 (14 reviews)

產品編號：9789863128311

促銷團購優惠-旗標出版社

促銷下單就送小禮物

購物每消費滿300元，可獲得1元購物金

網路價 NT${{ commaFormat(product.price_actu) }} NT${{commaFormat(product.price_sugg)}}

專屬特惠價 NT${{ commaFormat(product.group_price) }}

優惠價 NT${{ commaFormat(product.member_price) }} NT${{ commaFormat(product.group_price) }}

商品組合

{{k_row.name}} x {{k_row.qty}}

贈品 (買就送)

付款&配送

付款方式

轉帳/匯款/無摺存款 / LinePay付款 / 超商代碼付款(綠界金流) / 信用卡一次付清(綠界金流) / AFTEE 先享後付 / [圖書專用] 7-11取貨付款

配送方式

7-11超商取貨 / 全家超商取貨 / 宅配到家 / 校園門市店到店取貨(需7~10個工作天，急用勿選)

超值加購

ISBN13：9789863128311
出版社：旗標出版社
作者：陳會安
出版日：2025/06/02
裝訂／頁數：平裝／544頁
規格：23cm*17cm*2.8cm (高/寬/厚)
重量：995克

【內容】

⛧⛦ 一本搞定 LLM 看圖說故事與即時影像分析 ⛦⛧

⛧⛦ 十款熱門模型實際解決生活中 AI Vision 問題 ⛦⛧

⛧⛦ 用「自己的」資料集在本地端訓練 YOLO 模型 ⛦⛧

⛧⛦ 無痛設計 Web 互動介面，輕鬆部署 AI 模型 ⛦⛧

『AI Vision × LLM』劃開多模態應用的新時代
從輸入文字生成圖片，到上傳照片讓 LLM 看圖說故事，AI 電腦視覺技術結合 LLM 的多模態應用正席捲全球。但這些令人驚豔的應用背後，其實倚賴多項核心技術——包含物體偵測、人臉辨識、情緒與年齡分析、或是影像文字識別，以及對於文字的理解與生成，這才賦予 AI 真正「看懂」影像內容的能力。

實際解決現實生活中的 AI Vision 問題
帶領讀者以多款熱門模型如 YOLO、OpenCV DNN、MediaPipe、CVZone 3D、DeepFace、Dlib、LiteRT、EasyOCR，打造刷臉門禁系統、即時口罩偵測、微笑自拍、手勢操控投影片、AI 健身教練、車牌辨識、結帳櫃台人流與高速公路車流分析等多項實用專案，讓讀者親身體驗 AI Vision 在真實場景中的應用價值。

不僅會用，還能自行訓練專屬 AI 模型
讓你不只會活用現成的模型，還能自己動手標註資料並訓練屬於你的 YOLO 模型。並且透過 Streamlit 設計 Web 互動介面，將訓練成果部署為具備即時偵測與辨識功能的 Web 應用程式，實現從標註資料、模型訓練到應用上線的完整流程。

親手打造多模態 AI 應用，收穫滿滿成就感
整合前述 AI Vision 技術與大型語言模型（LLM），或運用 Ollama 的多模態工具 Llama-Vision，再搭配 Streamlit，即可實作出讓 LLM 分析影像內容或情境的 Web 智慧應用，例如路況分析或圖片描述，讓 AI 真正具備視覺理解與語意回應的能力。

零基礎也能無痛入門
本書主打「從做中學」的實作導向，即使沒有深厚的理論基礎，也能快速掌握 Python 的 AI 模型與實用套件。至於不熟悉的語法、函式用法、AI 模型原理，或是特定功能的程式碼編寫與修改，則交由 ChatGPT 給予我們即時協助，讓學習更有效率。

無論你是 AI 初學者還是開發者，本書都能帶你輕鬆入門、快速上手，從零開始打造專屬的 AI 專案，成為 AI Vision × LLM 的超酷玩家！🎉
本書特色:
➢ 精選多款熱門 AI 模型，打造貼近生活情境的 AI Vision 實務應用
➢ 提供客製化 WinPython 可攜式套件，快速建立與書中一致的開發環境
➢ 支援 CPU / GPU，完整教學從資料標註到訓練與測試你自己的 YOLO 物體辨識模型
➢ 使用 LabelImg 工具，以人性化的方式進行影像資料集的標註作業
➢ 透過 Streamlit 快速打造 Web 互動介面，無需前端技能即可部署 AI 模型
➢ 整合 Llama-Vision，讓 LLM 在 Web 介面中看圖說故事、回答問題或分析影像內容
➢ 搭配 OpenCV 電腦視覺套件，實作物體、人臉、文字、車牌等偵測與辨識
➢ 探索 Mediapipe × CVZone 3D，實現 3D 視角的手勢辨識與姿態評估

▍第 1 章使用 Python 虛擬環境建立開發環境
1-1 建立與管理 Python 虛擬環境
1-2 使用 Python 虛擬環境建立本書的開發環境
1-3 安裝本書客製化的 WinPython 可攜式套件
1-4 使用 Thonny 的 Python IDE
1-5 使用 VS Code 的 Python IDE

▍第 2 章 OpenCV 基本使用與 Numpy
2-1 OpenCV 安裝與基本使用
2-2 OpenCV 影像處理
2-3 OpenCV 視訊處理與 Webcam
2-4 OpenCV 影像資料：NumPy 陣列
2-5 OpenCV 影像處理：負片和馬賽克效果

▍第 3 章 OpenCV DNN電腦視覺與文字識別
3-1 OpenCV 哈爾特徵層級式分類器
3-2 OpenCV DNN 模組與預訓練模型
3-3 OpenCV DNN 影像分類與人臉偵測
3-4 OpenCV DNN 物體偵測與文字區域偵測
3-5 Tesseract-OCR 文字識別

▍第 4 章 Mediapipe × CVZone：人臉與臉部網格偵測
4-1 Google MediaPipe 機器學習框架
4-2 CVZone 電腦視覺套件與 MediaPipe
4-3 CVZone 人臉偵測
4-4 CVZone 臉部網格
4-5 CVZone 辨識臉部表情：張嘴/閉嘴與睜眼/閉眼

▍第 5 章 Mediapipe × CVZone：3D 手勢偵測與 3D 姿態評估
5-1 Mediapipe × CVZone 3D 多手勢追蹤
5-2 MediaPipe × CVZone 3D 辨識手勢：剪刀、石頭與布
5-3 MediaPipe × CVZone 3D 辨識手勢：OK 手勢
5-4 MediaPipe × CVZone 3D 人體姿態評估
5-5 MediaPipe × CVZone 3D 辨識人體姿勢：仰臥起坐
5-6 MediaPipe × CVZone 3D 辨識人體姿勢：伏地挺身

▍第 6 章 LiteRT × Dlib × Deepface 電腦視覺應用
6-1 認識與安裝 LiteRT（TensorFlow Lite）
6-2 LiteRT 影像分類與物體偵測
6-3 Dlib 人臉偵測、臉部網格與特徵提取
6-4 face-recognition 人臉識別
6-5 Deepface 情緒辨識與年齡偵測
6-6 OpenCV DNN 預訓練模型：情緒辨識

▍第 7 章 YOLO 電腦視覺應用：物體偵測與追蹤
7-1 認識 YOLO
7-2 YOLO 物體偵測
7-3 YOLO 物體追蹤
7-4 YOLO 電腦視覺應用：即時計算視訊的人數和車輛數
7-5 YOLO 電腦視覺應用：繪出視訊的車輛追蹤線

▍第 8 章 YOLO 電腦視覺應用：影像分類 / 分割與姿態評估
8-1 YOLO 影像分類
8-2 YOLO 影像分割
8-3 YOLO 姿態評估
8-4 YOLO 電腦視覺應用：影像分割的背景替換
8-5 YOLO 電腦視覺應用：辨識人體姿勢

▍第 9 章訓練你自己的 YOLO 物體偵測模型
9-1 安裝 GPU 版的 YOLO
9-2 取得訓練 YOLO 模型所需的圖檔資料
9-3 使用 LabelImg 標註影像建立資料集
9-4 整理與瀏覽 Roboflow 取得的資料集
9-5 建立 YAML 檔訓練與驗證你的 YOLO 模型

▍第 10 章 Streamlit 的 AI 互動介面設計
10-1 認識與安裝 Streamlit
10-2 建立你的 Streamlit 應用程式
10-3 輸出網頁內容
10-4 繪製圖表與地圖
10-5 建立表單介面的互動元件
10-6 佈局、狀態與聊天元件
10-7 使用快取機制與網頁配置設定
10-8 Streamlit 互動介面設計：建立 YOLO 的 AI 互動介面

▍第 11 章 AI 電腦視覺實戰：刷臉門禁管理、微笑拍照與變臉化妝
11-1 AI 電腦視覺實戰：刷臉門禁管理
11-2 AI 電腦視覺實戰：YOLO 臉部情緒偵測
11-3 AI 電腦視覺實戰：微笑拍照
11-4 AI 電腦視覺實戰：變臉與化妝

▍第 12 章 AI 電腦視覺實戰：手勢操控與 AI 健身教練
12-1 pywin32 套件：Office 軟體自動化
12-2 AI 電腦視覺實戰：手勢操控 PowerPoint 簡報播放
12-3 AI 電腦視覺實戰：AI 健身教練

▍第 13 章 AI 電腦視覺實戰：EasyOCR 車牌辨識與車道偵測系統
13-1 AI 電腦視覺實戰：Tesseract-OCR 車牌辨識
13-2 EasyOCR 的安裝與使用
13-3 AI 電腦視覺實戰：EasyOCR 車牌辨識
13-4 AI 電腦視覺實戰：YOLO 車牌偵測
13-5 AI 電腦視覺實戰：OpenCV 車道偵測系統

▍第 14 章 AI 電腦視覺實戰：YOLO 人流與車流控制
14-1 找出熱區域座標
14-2 判斷目標物體是否進入熱區域
14-3 結帳櫃台的人數控制
14-4 道路的車流控制
14-5 AI 電腦視覺實戰：多個結帳櫃台的人數控制
14-6 AI 電腦視覺實戰：南下 / 北上高速公路的車流控制

▍第 15 章 AI 電腦視覺實戰：打造自己的 AI 模型與整合應用
15-1 使用 Teachable Machine 訓練機器學習模型
15-2 AI 電腦視覺實戰：LiteRT 識別剪刀、石頭或布
15-3 AI 電腦視覺實戰：建立 YOLO 即時口罩偵測

▍第 16 章 AI 電腦視覺實戰：本機 LLM Vision 整合應用
16-1 認識生成式 AI 與 LLM
16-2 LLM API 服務：Groq API
16-3 使用 Ollama 打造本機 LLM
16-4 AI 電腦視覺實戰：Llama-Vision 視覺分析助手
16-5 AI 電腦視覺實戰：Llama-Vision 車牌辨識
16-6 AI 電腦視覺實戰：Llama-Vision 路況分析

▍附錄 A 電子書 Anaconda 開發環境與 Python 程式設計
A-1 建立 Anaconda 的 Python 開發環境
A-2 變數、資料型態與運算子
A-3 流程控制
A-4 函式、模組與套件
A-5 容器型態
A-6 類別與物件

【關於教科書訂購說明】

☆ 單本即有折扣，將商品放入購物車就可以看見優惠價唷！五本以上團購更便宜！加入會員訂購，還可累積購物金！

★ 若有急需用書，可先LINE私訊詢問庫存呦~

☆ 出貨時間：有現貨的，2個工作日內出貨；無現貨，約3~5個工作日出貨

【寄送方式說明】

❶ 實體門市取貨

全台麗文校園書局皆可取貨，貨到書局將會以簡訊通知。

❷ 超商取貨

提供7-11及全家超商取貨(需先付款，無貨到付款)。

❸ 一般宅配

本公司主要與黑貓宅急便配合，送達到您指定的地址。

※當您於本網站消費交易完成後，電子發票將會以電子郵件寄給您；如需紙本發票請於下訂時於備註欄位說明。

【付款方式說明】

❶ ATM轉帳、匯款

銀行│第一銀行-三民分行

代號│007

戶名│麗文文化事業股份有限公司

帳號│704-10-051861

※實體ATM每日轉帳最高限額為3萬，若訂購金額超過3萬元，請分兩天或是使用不同的銀行帳戶轉帳。

❷ 信用卡（可分期，需負擔手續費）

凡各家銀行的VISA、MASTER、Union Pay、JCB信用卡皆可使用。

❺ 超商代碼

系統會發送繳費代碼至您的電子信箱，需自行至「超商機器ex：iBon」輸入代碼，產生繳費單後前往櫃檯繳費。

❼ 免卡分期

麗文校園購與「zingala銀角零卡」「第一資融」以及「皮路後支付」合作，讓您免用信用卡就可以購物。
如有使用上的問題，可以先與揪小編聯絡唷！。

※請注意：超過7天未付款之訂單則訂單自動失效；免卡分期訂單成立起7天內未主動聯繫亦同。

【其他說明】

❶關於出貨

1.商品為不缺貨前提下，訂單完成付款後2-4個工作天將會出貨(不含例假日及國定假日)；若商品缺貨則須等待1-2週。

2.麗文校園揪來玩保留訂單接受與否權利，若因交易條件有誤或有其他情形導致我們無法接受您的訂單，將以E-mail發送取消訂單通知給您，造成不便敬請見諒。

❷關於退貨

1.非門市現場消費享有七天猶豫期，收到商品當天往後算七天內若是決定不買，則協助不要拆封，一拆封視同願意購買。

2.若真的決定不購買商品要退貨，請聯繫我們LINE線上客服，我們會盡速為您處理。

❸關於新品瑕疵與維修保固

1.全新商品享有購買七日內，新品瑕疵的換新保障；但新品瑕疵與否，是由商品代理商或原廠所判定，麗文校園揪來玩僅能依據判定的結果給予協助。若是原廠判定非新品瑕疵則無法換新，需改為維修的方式處理。

2.新品瑕疵換新的作業時間，將依各廠商的流程而定，最快2個工作天，慢的話也可能需要到15個工作天。

3.購買超過七日後，維修服務由原廠提供。如有需要維修，麗文校園揪來玩可以代為送修，但送修如需運費時（EX:原廠沒有提供免費收件服務），則需由您負擔送修的運費（運費約為100元起，因商品大小而異）。

【華碩的維修服務】

三大禮遇及完美保固電商素材-5_Page2_09.jpg

AI Vision × LLM 電腦視覺應用聖經：OpenCV × YOLO × Ollama 解鎖多模態全攻略陳會安

網路價 NT${{ commaFormat(product.price_actu) }} NT${{commaFormat(product.price_sugg)}}

專屬特惠價 NT${{ commaFormat(product.group_price) }}

優惠價 NT${{ commaFormat(product.member_price) }} NT${{ commaFormat(product.group_price) }}

商品組合

贈品 (買就送)

付款方式

配送方式

超值加購

{{ pItem.title }}

{{ dyrow.header_text }}

{{ dyrow.title }}

{{ dyrow.header_text }}

{{ dyrow.title }}

{{ pItem.title }}

推薦一起買

{{ dyrow.header_text }}

{{ dyrow.title }}

推薦購買

{{ dyrow.header_text }}

{{ dyrow.title }}

AI Vision × LLM 電腦視覺應用聖經：OpenCV × YOLO × Ollama 解鎖多模態全攻略 陳會安

網路價 NT${{ commaFormat(product.price_actu) }} NT${{commaFormat(product.price_sugg)}}

專屬特惠價 NT${{ commaFormat(product.group_price) }}

優惠價 NT${{ commaFormat(product.member_price) }} NT${{ commaFormat(product.group_price) }}

商品組合

贈品 (買就送)

付款方式

配送方式

超值加購

{{ pItem.title }}

{{ dyrow.header_text }}

{{ dyrow.title }}

{{ dyrow.header_text }}

{{ dyrow.title }}

推薦一起買

{{ dyrow.header_text }}

{{ dyrow.title }}

推薦購買

{{ dyrow.header_text }}

{{ dyrow.title }}

AI Vision × LLM 電腦視覺應用聖經：OpenCV × YOLO × Ollama 解鎖多模態全攻略陳會安