好的,這段影片提供了金融時報(Financial Times, FT)在新聞編輯室中使用人工智慧(AI)的多個主要論點和實例。以下是這些論點的詳盡解釋:
主要論點一:將 AI 作為增強記者工作效率和內容創作的內部工具
- AI Playground 的設立宗旨: FT 設立了一個名為「AI Playground」的內部工具,這是一個基礎設施,將現有的(已發布或草稿中的)內容與大型語言模型(LLM)連接起來。其核心設計理念是「安全」,確保內容不會被發送到不受控的地方,從而保護新聞機構的敏感資訊和智慧財產權。
- 賦能記者實驗與探索: AI Playground 的主要目的是賦能新聞編輯室的每個人去實驗不同的 Prompt(提示詞),並找到真正對他們工作有幫助的 AI 用例。這不是一個由技術團隊單方面決定的工具,而是透過讓記者親身嘗試來發掘潛力。
- 支援不同類型的內容處理:
- 廣泛研究與資訊提取 (RAG Pipeline): 工具支援基於 RAG (Retrieval-Augmented Generation) 管線的廣泛搜尋功能。例如,記者可以查詢「川普在過去 20 年裡對格陵蘭說過的一切」,AI 會從 FT 的內容庫中提取相關的文章和特定段落。記者可以使用這些材料作為基礎,測試不同的 Prompt,例如產生時間線,從而加速背景研究和資料整理過程。
- 針對特定文章的協助: 記者也可以輸入正在撰寫的特定文章,要求 AI 提供協助。這包括幫助進行文本修訂、檢查文章中的不一致之處,或在文章完成或發布後,將其轉換成不同格式的版本,例如簡化版、較短的版本、用於社交媒體的摘要等。
- 結論: FT 認為 AI 首先應作為一個安全、可控的內部工具,用於支援和加速記者在內容研究、寫作輔助和多格式內容製作等環節的工作,從而提升整體生產效率。透過讓使用者(記者)參與到用例的發現過程中,確保工具的實用性和品質。
主要論點二:利用 AI 增強讀者參與度和社群互動
- 社群互動的重要性: FT 意識到新聞媒體的價值不僅在於內容本身,社群(即讀者的互動和討論)也極為重要。數據顯示,與評論互動的讀者對內容的投入程度更高,也更有可能持續訂閱。因此,讀者社群是品牌價值和讀者價值主張(與他人交流)的重要組成部分。
- 評論區的能見度問題: 儘管評論區很重要,但一個主要問題是其能見度不高。據估計,約有 60% 的讀者甚至不知道有評論區的存在。
- AI 驅動的討論提示: 為了提高評論區的能見度並促進有意義的討論,FT 開發了一個 AI 驅動的功能:在文章中插入討論提示(Discussion Prompt)。這是一個即將上線的功能。
- AI 的具體作用: AI 會閱讀文章內容,然後根據文章建議一個與該文章相關的「問題」。這個問題會被插入到文章的大約三分之二處。點擊這個問題會將讀者引導至評論區。
- 風險規避與人性化審核: 最初,FT 曾考慮過讓 AI 總結現有評論或選擇最重要評論等方式,但這些方法感覺風險較高,需要大量人工監督,難以規模化。因此,他們選擇了讓 AI 產生「問題」,將討論引導到一個新的、與文章直接相關的方向,而不是處理現有使用者生成內容的複雜性。此外,生成的討論問題並非直接發布,而是提供給受眾參與團隊(Audience Engagement Team),由他們從 AI 提供的三種選項中選擇最合適的一個進行發布,確保了人工的品質控制。
- 目標: 透過這種方式,FT 希望提高評論區的參與率,並提升討論的品質,使其更具建設性。
主要論點三:應對讀者行為的變化,提供內建的 AI 功能以維持平台價值
- 讀者的 AI 使用行為: FT 意識到一個無法迴避的事實是,讀者正在複製貼上其文章內容到其他的 AI 平台(如 ChatGPT)進行處理,其中「總結」是最常見的用例。
- 提供內建解決方案: 與其假裝這種行為不存在,FT 選擇在自己的平台內提供這種功能,即「內容轉換」(Content Transformation),目前作為一個實驗項目提供單篇文章的子彈點總結。
- 品質控制與低幻覺率: 實驗證明,對於單篇文章進行總結,AI 的「幻覺」(即產生不準確或編造資訊)程度相當低,這得益於原文內容的結構清晰和緊湊。 FT 也花費了大量精力迭代和優化 Prompt,確保總結的準確性和簡潔性,並進行了雙重檢查。
- 人性化審核: 雖然 AI 生成的總結準確性高,但 FT 仍然採用了人工審核流程。 AI 生成的總結草稿會進入內容管理系統,由編輯檢查後再發布給讀者,確保最終呈現內容的品質和信賴度。
- 重新思考參與度指標: 提供總結功能挑戰了傳統的「閱讀深度」(即讀者在文章中向下捲動的程度)作為衡量參與度的主要指標。讀者可能只需閱讀總結。因此,FT 需要更廣泛地衡量參與度,例如單次會話時長、單次會話閱讀的文章數量、以及讀者的長期習慣養成等。實驗結果顯示,提供總結對閱讀深度並未產生顯著負面影響,反而對讀者的整體參與度有輕微的正面影響。
- 優化使用者體驗 (UX): FT 從實驗中學到了使用者體驗的重要性。最初的設計是顯示部分總結並需要點擊展開,但這效果不佳。後來的改進是讓讀者明確點擊一個小按鈕來生成和顯示總結,這使得功能對於不想使用它的讀者而言更不具干擾性,同時為需要它的讀者提供了更清晰的入口。
- 高度準確的 AI 輸出: 最令人振奮的結果是,經過幾個月的實驗,編輯在審核 AI 生成的總結時,幾乎不需要對事實內容進行任何修改,只需要進行一些風格上的微調。這顯示了在特定、精心設計的任務中,AI 能夠產生高度準確的輸出。
- 結論: FT 透過在內部提供讀者需求的 AI 功能(如總結),不僅滿足了讀者的使用習慣,也將讀者的互動和內容處理留在自己的平台內,同時透過嚴格的品質控制(Prompt 優化和人工審核)確保輸出的準確性,並積極探索新的指標來評估 AI 功能對讀者整體行為的影響。
貫穿所有論點的核心原則:以人為本的 AI 應用與人工監督(Human in the Loop)
從 AI Playground 的記者賦能,到討論提示的人工審核,再到文章總結的編輯確認,金融時報在使用 AI 時始終強調「以人為本」和「人工在環」(Human in the Loop)。 AI 被視為一個強大的工具,用於協助人類工作,但最終的決策、品質把關和內容的呈現仍然由人類編輯和團隊負責。這確保了新聞內容的準確性、可靠性以及與品牌價值觀的一致性,特別是在處理可能引入風險(如幻覺或不當內容)的生成式 AI 時,人工監督是不可或缺的關鍵環節。
總而言之,金融時報對 AI 的應用是務實且有策略的。他們將 AI 視為一種工具,用於提升內部效率、增強讀者互動、應對讀者行為變化,並在整個過程中,堅持以安全、品質和人工監督為核心原則,確保 AI 的應用能夠真正服務於優質新聞的生產和傳播。