AI Engineering: Building Applications with Foundation Models

**本書核心論點:**

本書的核心論點圍繞著一個新興且快速發展的工程學科——**人工智慧工程(AI Engineering)**。作者 Chip Huyen 將 AI 工程定義為**利用現成的基礎模型(Foundation Models)來建構、部署和維護實際應用程式的過程與實踐**。這本書旨在為專業人士提供一個全面、結構良好且著重實務的指南,幫助他們在這個由基礎模型驅動的新時代中,成功開發出可靠、可擴展且有價值的人工智慧應用。

**主要論點詳述:**

1. **AI 工程的興起與基礎模型的關鍵作用:**
* **典範轉移:** 本書開宗明義指出,以 ChatGPT 為代表的大型語言模型(LLM)和更廣泛的基礎模型(包括大型多模態模型 LMM),已經徹底改變了人工智慧領域。 AI 不再是少數專家才能涉足的深奧學科,而是轉變為一個強大的開發工具,甚至讓沒有 AI 背景的開發者也能輕鬆上手。
* **基礎模型作為基石:** 基礎模型(如 GPT 系列、 Claude 、 Llama 等)是 AI 工程的核心。這些模型經過大規模資料預訓練,具備了廣泛的通用能力(如文本生成、理解、翻譯、摘要、程式碼編寫、圖像理解等)。 AI 工程師的主要工作不再是從零開始訓練模型,而是**適應(adapt)**這些現有的強大模型,使其滿足特定應用的需求。
* **降低門檻與增加需求:** 基礎模型的易用性(通常透過 API 提供服務)大幅降低了開發 AI 應用的門檻,同時,其強大的能力也催生了爆炸性的新應用場景,從而極大地增加了市場對 AI 應用的需求和投資。這共同推動了 AI 工程成為一個獨立且高速成長的工程領域。

2. **AI 工程與傳統機器學習工程(ML Engineering)的區別與聯繫:**
* **焦點轉移:** 傳統機器學習工程更側重於模型的建模、訓練、特徵工程和底層演算法。而 AI 工程則更側重於**利用、適應和評估現有的基礎模型**。其核心活動包括提示工程(Prompt Engineering)、檢索增強生成(RAG)、模型微調(Finetuning,特別是參數高效微調 PEFT)、代理(Agents)設計、資料集工程(Dataset Engineering)以及推理優化(Inference Optimization)。
* **技能重疊與演進:** 儘管焦點不同,許多傳統 ML 工程的原則(如系統性實驗、嚴謹評估、自動化、監控、可維護性)在 AI 工程中仍然適用且至關重要。然而,AI 工程也引入了新的挑戰和解決方案,例如處理大型模型的計算資源消耗、高延遲問題、評估開放式生成任務的困難度、以及應對提示攻擊等安全問題。
* **資料重要性提升:** 在 AI 工程中,雖然模型本身可能來自外部,但高品質、針對特定任務的資料集對於模型適應(尤其是微調)和評估變得更加關鍵。資料集工程(包括資料策劃、標註、合成、清洗過濾等)成為 AI 工程的核心環節之一。

3. **AI 工程的完整生命週期與實踐框架:**
* **端到端流程:** 本書涵蓋了從規劃到部署、再到維護的整個 AI 應用開發流程。這包括:
* **規劃與評估 (Ch 1, 4):** 如何評估一個 AI 應用想法的可行性、是否需要 AI 、是自建還是購買、設定合理的期望、定義成功指標(商業指標與模型指標的結合)、規劃里程碑以及考量維護問題。
* **理解基礎模型 (Ch 2):** 了解基礎模型的訓練資料、架構(尤其是 Transformer)、規模、後訓練(Post-Training)對齊過程以及其固有的機率性(probabilistic nature),這有助於解釋幻覺(hallucination)和不一致性(inconsistency)等行為,並為模型選擇和適應提供基礎。
* **評估方法學 (Ch 3, 4):** 評估是 AI 工程中最具挑戰性的環節之一。書中深入探討了評估開放式生成模型的挑戰與方法,包括傳統語言模型指標(如困惑度 Perplexity)、功能正確性、基於參考的相似度量(如 BLEU, ROUGE)、語義相似度(基於嵌入 Embedding)、以及新興的「AI 作為評審」(AI as a Judge)和比較評估(Comparative Evaluation)方法。強調建立可靠、系統化的評估流程(Evaluation Pipeline)的重要性。
* **模型適應技術 (Ch 5-8):**
* **提示工程 (Ch 5):** 如何設計有效的提示(Prompt)來引導模型行為,涵蓋上下文學習(In-Context Learning)、零樣本/少樣本學習、系統提示與使用者提示、提示最佳實踐、以及防禦性提示工程(應對提示注入、越獄等攻擊)。
* **RAG 與代理 (Ch 6):** 深入探討兩種主要的上下文建構(Context Construction)模式。 RAG 通過從外部知識源(如資料庫、文件)檢索相關資訊來增強模型的回答能力。代理則賦予模型使用外部工具(如搜尋引擎、計算器、 API)和進行規劃(Planning)的能力,以完成更複雜的多步驟任務。
* **微調 (Ch 7):** 何時以及為何需要微調模型(改善特定能力、遵循特定格式風格、降低延遲成本等),介紹了參數高效微調(PEFT)技術(如 LoRA 及其變體 QLoRA),討論了模型合併(Model Merging)等實驗性方法,並解釋了記憶體瓶頸問題。
* **資料集工程 (Ch 8):** 強調資料在 AI 工程中的核心地位,討論資料策劃(品質、覆蓋度、數量)、資料獲取與標註、資料增強與合成(AI 生成資料)、以及資料處理(清洗、去重、格式化)等關鍵步驟。
* **推理優化 (Ch 9):** 如何讓模型運行得更快、更便宜。討論了模型級別(如量化 Quantization 、蒸餾 Distillation 、剪枝 Pruning)和服務級別(如批處理 Batching 、快取 Caching 、並行 Parallelism)的優化技術,以及 AI 加速器(如 GPU, TPU)在其中的作用。
* **架構與使用者回饋 (Ch 10):** 整合所有技術,提出一個逐步演進的 AI 工程架構,從最簡單的查詢-生成模式開始,逐步添加上下文建構、防護欄(Guardrails)、模型路由(Router)與閘道(Gateway)、快取(Caches)以及代理模式。同時,強調使用者回饋作為持續改進模型和應用的關鍵數據來源,探討了如何設計有效的回饋機制。

4. **強調基礎原理與實用性:**
* **超越工具:** 本書著重於 AI 工程的基礎原理和經過驗證的技術,而非介紹瞬息萬變的特定工具或 API 。目標是提供持久的知識,幫助讀者理解不同解決方案之間的權衡,並做出明智的技術選擇。
* **實戰導向:** 雖然包含必要的理論解釋,但本書本質上是一本實用指南,旨在幫助讀者解決真實世界的問題,建構成功的 AI 應用。書中包含案例研究、最佳實踐,並引用了大量學術研究和業界經驗。
* **面向技術受眾:** 主要面向 AI 工程師、 ML 工程師、資料科學家、工程經理和技術產品經理等技術角色,但也對希望了解 AI 能力與局限性的非技術人員有益。

**總結:**

《AI Engineering: Building Applications with Foundation Models》一書的核心論點是,隨著基礎模型的普及,AI 開發進入了一個新的工程階段——AI 工程。這個階段的核心不再是從頭訓練模型,而是**如何有效地適應、評估、優化和部署這些現成的強大模型,以建構可靠、可擴展且能解決實際問題的應用程式**。本書提供了一個涵蓋規劃、評估、模型適應(提示工程、 RAG 、代理、微調、資料集工程)、推理優化以及系統架構與使用者回饋的完整框架和實踐指南,強調基礎原理、系統性方法和嚴謹評估在應對這一新興領域挑戰中的重要性。它旨在賦能開發者和團隊,在這個充滿機遇和挑戰的 AI 新時代中取得成功。