生成式 AI:現況、原理與未來

  1. 什麼是現在大家都在討論的生成式人工智慧?它和過去的 AI 技術有什麼不同?
    過去的 AI 技術,例如 Google 翻譯,主要是針對單一任務設計的專才。而現在爆紅的生成式人工智慧,像是 ChatGPT,則是通才,它可以處理非常多不同的任務,包括翻譯、寫作、繪圖等等。它與過去 AI 最大的不同在於其通用性,能夠在給予明確指令(prompt)後,執行多樣化的工作。 Prompt Engineering,也就是如何有效地對生成式 AI 下指令,成為了當今非常重要的技能。
  2. 生成式 AI(如 ChatGPT)是如何理解並回應我們的指令的?它的運作原理是什麼?
    生成式 AI 背後的原理是語言模型。簡單來說,語言模型的核心功能是做文字接龍。當我們輸入一個未完成的句子或問題時,模型會預測接下來最有可能出現的字或詞。這個預測的依據是模型在大量文本資料上學習到的語言規律和模式。模型並非直接產生一個確定的答案,而是為每一個可能的接續符號(token)賦予一個機率,然後根據這個機率分佈來「擲骰子」,選取下一個 token 。這個過程不斷重複,直到產生一個表示結束的符號,所有產生的 token 組合起來就是我們看到的答案。
  3. 為什麼每次問生成式 AI 相同的問題,它給出的答案可能都不一樣?
    這是因為在文字接龍的過程中,語言模型會產生一個機率分佈,決定下一個 token 的選擇。雖然機率高的 token 比較容易被選中,但機率低的 token 也有可能被選中。實際產生哪個 token 的過程就像擲骰子一樣帶有隨機性。因此,即使是相同的問題,每次「擲骰子」的結果可能不同,導致模型產生的答案也會有所差異。
  4. 生成式 AI 除了產生文字外,是如何做到繪圖、唱歌等看似不同的任務的?
    令人驚訝的是,繪圖和唱歌等任務在底層原理上也可以用接龍的方式來完成。例如,繪圖可以看作是像素接龍,一個個地預測圖像中的顏色。而唱歌則是取樣點接龍,預測聲音訊號中的每一個取樣點。然而,直接進行像素或取樣點接龍的計算量非常龐大。實際應用中,模型通常會先將圖像和聲音進行壓縮編碼,將複雜的資訊轉換成一系列的符號(token)。然後,模型在這些代表圖像或聲音特徵的 token 上進行接龍。這些壓縮後的 token 再通過解碼器還原成圖像或聲音。因此,不管是文字、圖像還是聲音,在生成式 AI 的眼中,都是 token 的序列,模型學習的是 token 的接龍。
  5. 既然我們無法直接訓練大部分的 AI 模型,那麼如何才能讓 AI 更好地為我們服務,甚至產生獨特的結果?
    雖然我們一般使用者無法直接改變大型 AI 模型的訓練方式和文字接龍能力,但我們可以通過巧妙地引導(prompting)來強化 AI 的能力。關鍵在於清晰地表達我們的需求和前提,就像對第一天認識的網友溝通一樣,提供足夠的背景資訊和具體要求。更進一步,我們可以利用範例學習(in-context learning),通過提供少量的輸入-輸出範例,讓模型理解我們期望的輸出格式和風格。此外,針對特定的需求,我們可以進行客製化設定,例如在 ChatGPT 中設定偏好、使用記憶功能,或者建立自訂的 GPT(gpts)。這些方法都能在不改變模型核心能力的前提下,使其更好地適應我們的特定需求。
  6. 生成式 AI 有時會產生不實資訊(hallucination),例如編造不存在的活動或網址。我們應該如何應對這個問題?
    這是因為語言模型的核心是文字接龍,它旨在產生聽起來連貫和合理的文本,並不總是保證資訊的真實性。當模型缺乏足夠的相關知識或資訊時,可能會根據已有的模式進行推測,產生看似真實但實際上是錯誤的資訊。應對這個問題的方法之一是搭配搜尋引擎。通過讓 AI 在回答問題前先進行網路搜索,獲取最新的和相關的資訊,可以顯著提高答案的準確性。這種技術稱為檢索增強生成(Retrieval-Augmented Generation, RAG)。然而,即使搭配了搜尋引擎,AI 仍然可能受到網路資訊品質的影響,或者在整合多個來源資訊時出現錯誤,因此我們仍然需要保持批判性思考。
  7. 未來 AI 技術有哪些值得關注的發展趨勢?它將如何影響我們的生活和工作?
    未來 AI 技術的發展趨勢非常令人期待。我們可以預見 AI Agent 的興起,即具備自主發現和解決問題能力的 AI 。目前的 AI 多數是被動地回應指令,而 AI Agent 則可能更主動地完成複雜的任務,甚至在遇到錯誤時自行修正。另一個重要的趨勢是 AI 之間的協作,未來我們可能會看到多個 AI 組成團隊,共同完成大型專案,每個 AI 扮演不同的角色,發揮各自的專長。此外,AI 將不再僅限於數位世界,它們將具備操控物理世界的能力,例如通過控制滑鼠、鍵盤甚至機械手臂與環境互動。這些發展將深刻地影響我們的生活和工作方式,提高生產力,改變人機協作的模式。
  8. 在 AI 快速發展的時代,我們應該抱持什麼樣的心態學習和面對這項技術?
    面對 AI 的快速發展,我們應該抱持積極開放的心態去學習和理解它。不必過於擔心被 AI 取代,更重要的是思考如何利用 AI 來提升自己的能力和效率。學習 AI 不一定需要深入了解其底層技術,掌握如何有效地使用 AI 工具,例如撰寫清晰的指令、利用其進行資訊檢索、內容生成和問題解決等,對於各領域的人來說都將變得越來越重要。同時,我們也需要關注 AI 帶來的倫理和社會影響,例如資訊安全、能源消耗等問題,並以負責任的態度來使用和發展 AI 技術。