AI Engineering: Building Applications with Foundation Models

**本書核心論點：**

本書的核心論點圍繞著一個新興且快速發展的工程學科——**人工智慧工程（AI Engineering）**。作者 Chip Huyen 將 AI 工程定義為**利用現成的基礎模型（Foundation Models）來建構、部署和維護實際應用程式的過程與實踐**。這本書旨在為專業人士提供一個全面、結構良好且著重實務的指南，幫助他們在這個由基礎模型驅動的新時代中，成功開發出可靠、可擴展且有價值的人工智慧應用。

**主要論點詳述：**

1. **AI 工程的興起與基礎模型的關鍵作用：**
* **典範轉移：** 本書開宗明義指出，以 ChatGPT 為代表的大型語言模型（LLM）和更廣泛的基礎模型（包括大型多模態模型 LMM），已經徹底改變了人工智慧領域。 AI 不再是少數專家才能涉足的深奧學科，而是轉變為一個強大的開發工具，甚至讓沒有 AI 背景的開發者也能輕鬆上手。
* **基礎模型作為基石：** 基礎模型（如 GPT 系列、 Claude 、 Llama 等）是 AI 工程的核心。這些模型經過大規模資料預訓練，具備了廣泛的通用能力（如文本生成、理解、翻譯、摘要、程式碼編寫、圖像理解等）。 AI 工程師的主要工作不再是從零開始訓練模型，而是**適應（adapt）**這些現有的強大模型，使其滿足特定應用的需求。
* **降低門檻與增加需求：** 基礎模型的易用性（通常透過 API 提供服務）大幅降低了開發 AI 應用的門檻，同時，其強大的能力也催生了爆炸性的新應用場景，從而極大地增加了市場對 AI 應用的需求和投資。這共同推動了 AI 工程成為一個獨立且高速成長的工程領域。

2. **AI 工程與傳統機器學習工程（ML Engineering）的區別與聯繫：**
* **焦點轉移：** 傳統機器學習工程更側重於模型的建模、訓練、特徵工程和底層演算法。而 AI 工程則更側重於**利用、適應和評估現有的基礎模型**。其核心活動包括提示工程（Prompt Engineering）、檢索增強生成（RAG）、模型微調（Finetuning，特別是參數高效微調 PEFT）、代理（Agents）設計、資料集工程（Dataset Engineering）以及推理優化（Inference Optimization）。
* **技能重疊與演進：** 儘管焦點不同，許多傳統 ML 工程的原則（如系統性實驗、嚴謹評估、自動化、監控、可維護性）在 AI 工程中仍然適用且至關重要。然而，AI 工程也引入了新的挑戰和解決方案，例如處理大型模型的計算資源消耗、高延遲問題、評估開放式生成任務的困難度、以及應對提示攻擊等安全問題。
* **資料重要性提升：** 在 AI 工程中，雖然模型本身可能來自外部，但高品質、針對特定任務的資料集對於模型適應（尤其是微調）和評估變得更加關鍵。資料集工程（包括資料策劃、標註、合成、清洗過濾等）成為 AI 工程的核心環節之一。

3. **AI 工程的完整生命週期與實踐框架：**
* **端到端流程：** 本書涵蓋了從規劃到部署、再到維護的整個 AI 應用開發流程。這包括：
* **規劃與評估 (Ch 1, 4)：** 如何評估一個 AI 應用想法的可行性、是否需要 AI 、是自建還是購買、設定合理的期望、定義成功指標（商業指標與模型指標的結合）、規劃里程碑以及考量維護問題。
* **理解基礎模型 (Ch 2)：** 了解基礎模型的訓練資料、架構（尤其是 Transformer）、規模、後訓練（Post-Training）對齊過程以及其固有的機率性（probabilistic nature），這有助於解釋幻覺（hallucination）和不一致性（inconsistency）等行為，並為模型選擇和適應提供基礎。
* **評估方法學 (Ch 3, 4)：** 評估是 AI 工程中最具挑戰性的環節之一。書中深入探討了評估開放式生成模型的挑戰與方法，包括傳統語言模型指標（如困惑度 Perplexity）、功能正確性、基於參考的相似度量（如 BLEU, ROUGE）、語義相似度（基於嵌入 Embedding）、以及新興的「AI 作為評審」（AI as a Judge）和比較評估（Comparative Evaluation）方法。強調建立可靠、系統化的評估流程（Evaluation Pipeline）的重要性。
* **模型適應技術 (Ch 5-8)：**
* **提示工程 (Ch 5)：** 如何設計有效的提示（Prompt）來引導模型行為，涵蓋上下文學習（In-Context Learning）、零樣本/少樣本學習、系統提示與使用者提示、提示最佳實踐、以及防禦性提示工程（應對提示注入、越獄等攻擊）。
* **RAG 與代理 (Ch 6)：** 深入探討兩種主要的上下文建構（Context Construction）模式。 RAG 通過從外部知識源（如資料庫、文件）檢索相關資訊來增強模型的回答能力。代理則賦予模型使用外部工具（如搜尋引擎、計算器、 API）和進行規劃（Planning）的能力，以完成更複雜的多步驟任務。
* **微調 (Ch 7)：** 何時以及為何需要微調模型（改善特定能力、遵循特定格式風格、降低延遲成本等），介紹了參數高效微調（PEFT）技術（如 LoRA 及其變體 QLoRA），討論了模型合併（Model Merging）等實驗性方法，並解釋了記憶體瓶頸問題。
* **資料集工程 (Ch 8)：** 強調資料在 AI 工程中的核心地位，討論資料策劃（品質、覆蓋度、數量）、資料獲取與標註、資料增強與合成（AI 生成資料）、以及資料處理（清洗、去重、格式化）等關鍵步驟。
* **推理優化 (Ch 9)：** 如何讓模型運行得更快、更便宜。討論了模型級別（如量化 Quantization 、蒸餾 Distillation 、剪枝 Pruning）和服務級別（如批處理 Batching 、快取 Caching 、並行 Parallelism）的優化技術，以及 AI 加速器（如 GPU, TPU）在其中的作用。
* **架構與使用者回饋 (Ch 10)：** 整合所有技術，提出一個逐步演進的 AI 工程架構，從最簡單的查詢-生成模式開始，逐步添加上下文建構、防護欄（Guardrails）、模型路由（Router）與閘道（Gateway）、快取（Caches）以及代理模式。同時，強調使用者回饋作為持續改進模型和應用的關鍵數據來源，探討了如何設計有效的回饋機制。

4. **強調基礎原理與實用性：**
* **超越工具：** 本書著重於 AI 工程的基礎原理和經過驗證的技術，而非介紹瞬息萬變的特定工具或 API 。目標是提供持久的知識，幫助讀者理解不同解決方案之間的權衡，並做出明智的技術選擇。
* **實戰導向：** 雖然包含必要的理論解釋，但本書本質上是一本實用指南，旨在幫助讀者解決真實世界的問題，建構成功的 AI 應用。書中包含案例研究、最佳實踐，並引用了大量學術研究和業界經驗。
* **面向技術受眾：** 主要面向 AI 工程師、 ML 工程師、資料科學家、工程經理和技術產品經理等技術角色，但也對希望了解 AI 能力與局限性的非技術人員有益。

**總結：**

《AI Engineering: Building Applications with Foundation Models》一書的核心論點是，隨著基礎模型的普及，AI 開發進入了一個新的工程階段——AI 工程。這個階段的核心不再是從頭訓練模型，而是**如何有效地適應、評估、優化和部署這些現成的強大模型，以建構可靠、可擴展且能解決實際問題的應用程式**。本書提供了一個涵蓋規劃、評估、模型適應（提示工程、 RAG 、代理、微調、資料集工程）、推理優化以及系統架構與使用者回饋的完整框架和實踐指南，強調基礎原理、系統性方法和嚴謹評估在應對這一新興領域挑戰中的重要性。它旨在賦能開發者和團隊，在這個充滿機遇和挑戰的 AI 新時代中取得成功。