Working with AI(二)

好的,我們繼續。在上一部分,我們已經理解了這篇論文的兩個基礎論點:第一,必須用「使用者目標」和「AI 行動」的雙重視角來分析 AI 的影響;第二,我們也清楚地看到,人們主要利用 AI 來處理資訊收集、寫作與溝通等知識工作,而 AI 則扮演著一個積極的「服務員」角色,提供資訊、解釋、教學和建議。

現在,我們將進入更深層次的分析。知道了「發生了什麼」之後,下一個更關鍵的問題是:「影響有多大?」以及「誰受到的影響最大?」這就引導我們來到論文的第三和第四個核心論點,這兩個論點將抽象的對話分析,轉化為具體的、可衡量的職業衝擊地圖。


主要論點三:從對話到量尺——「AI 適用性分數」的建構

如果說前兩個論點是在質性上描繪 AI 影響的「樣貌」,那麼第三個論點就是在量化上打造一把衡量 AI 影響的「尺」。研究者們深知,僅僅說「AI 對知識工作有影響」是不夠的。影響程度有深有淺,影響範圍有大有小。為了能夠進行跨職業的比較,他們必須設計一個綜合性的指標。於是,「AI 適用性分數」(AI Applicability Score)應運而生。

這個分數的設計過程,就像一位經驗豐富的醫生在診斷一種新興疾病對人體的影響。醫生不會只看單一的症狀,而是會綜合考量多個指標,才能給出一個全面的評估。同樣地,「AI 適用性分數」也並非單一維度的數字,它巧妙地融合了三個核心要素:

  1. 覆蓋率(Coverage):這個工作真的和 AI 有關嗎? 這就像是醫生的第一步篩查:這位病人(職業)體內,是否存在這種新病毒(AI 所能處理的工作活動)能夠作用的受體?研究者們設定了一個門檻(在他們的研究中是 0.05% 的活動份額),用來判斷某項工作活動(例如「撰寫商業報告」)在他們分析的 20 萬筆對話中,是否出現得足夠頻繁,足以被認為是「被 AI 覆蓋」的。如果一項工作活動很少有人用 AI 來做,那麼它可能就不在當前 AI 能力的「覆蓋範圍」之內。一個職業所包含的所有工作活動中,「被 AI 覆蓋」的活動佔比越高,其「覆蓋率」就越高。這是評估 AI 潛在影響的第一道關卡。
  2. 成功率(Success/Completion Rate):AI 做得好不好? 光是有受體還不夠,醫生還得看藥物治療的效果如何。同樣地,光是有人嘗試用 AI 做某件事還不夠,我們還需要知道 AI 是否能「成功」完成任務。這是一個至關重要的品質控制環節。如果人們用 AI 寫詩,結果 AI 寫出來的都是些狗屁不通的句子,那麼我們就不能說 AI 對詩人的工作有實質影響。研究者們為此訓練了另一個大型語言模型,來判斷每一段對話中的任務是否被成功完成。同時,他們也參考了使用者在 Copilot 中留下的「讚」與「倒讚」的回饋數據。結果發現,使用者滿意度高的任務,通常也是被模型判斷為「完成度高」的任務。只有那些 AI 能夠高效、成功完成的工作活動,才會對相應的職業產生真正的影響。
  3. 影響範圍(Scope of Impact):AI 的幫助有多深入? 這是最精妙、也最容易被忽略的一點。即便 AI 成功完成了一項任務,其影響的深度和廣度也可能天差地別。讓我們回到醫生的比喻:藥物成功地作用於受體,但它只是緩解了輕微的頭痛,還是治癒了整個器官的頑疾?這兩者的影響力是完全不同的。 研究者們舉了一個很好的例子:
    • 場景 A: 使用者問:「什麼是粒線體?」AI 給出了一個準確的定義。這個任務被「成功完成」了。
    • 場景 B: 使用者上傳了一份完整的生物學研究報告,說:「幫我把這份報告的語言潤飾得更專業,並檢查邏輯上的矛盾。」AI 也「成功完成」了這個任務。

    雖然兩個任務都成功了,但它們所對應的工作活動都是「研究生物現象」(Research biological phenomena)。顯然,在場景 B 中,AI 所展現出的能力,對「研究生物現象」這項工作的介入程度要深遠得多。場景 A 只觸及了皮毛,而場景 B 則深入到了核心。研究者們將這種介入程度稱為「影響範圍」,並同樣用模型將其分為「無、最小、有限、中等、顯著、完整」六個等級。

最後,研究者們將這三個要素——覆蓋率、成功率、影響範圍——結合起來,再根據每項工作活動在一個特定職業中的「重要性」和「相關性」(這些數據來自 O*NET 資料庫)進行加權,最終計算出每個職業的「AI 適用性分數」。

這個分數的意義在於,它不再是一個模糊的描述,而是一個可以用來比較不同職業受 AI 影響程度的相對指標。一個職業的「AI 適用性分數」越高,意味著構成該職業的許多重要工作活動,不僅頻繁地出現在 AI 對話中,而且 AI 能夠成功、且深入地完成這些活動。這個分數就像一把精密的「AI 影響力卡尺」,為我們接下來理解哪些職業處於變革的風暴中心,奠定了堅實的數據基礎。


主要論點四:AI 影響力地圖——知識與溝通密集型職業首當其衝

有了「AI 適用性分數」這把尺,研究者們終於可以開始丈量整個職業世界了。他們為美國勞工部 O*NET 資料庫中的數百個職業都計算了分數,其結果繪製出了一幅前所未有的、基於真實世界數據的「AI 影響力地圖」。這幅地圖的發現,既在情理之中,又充滿了令人深思的細節。

誰在風暴中心?(高適用性分數的職業)

排名最靠前的職業,其共性非常明顯:它們高度依賴於知識處理和人際溝通。 這與我們先前在第二個論點中看到的「使用者目標」和「AI 行動」的發現完美契合。 AI 擅長做什麼,那麼以這些活動為核心的職業,其適用性分數自然就高。

排名前列的職業包括:

  • 口譯員與筆譯員(Interpreters and Translators): 這幾乎是預料之中的冠軍。他們的核心工作就是語言的轉換與傳達,這正是當前大型語言模型最核心的能力之一。
  • 歷史學家、作家與作者(Historians, Writers and Authors): 這些職業的核心是研究、整合資訊並將其轉化為結構化的文字。 AI 在資料搜集、草稿撰寫、文字潤飾方面的能力,與他們的工作流程高度重疊。
  • 客服代表、銷售代表(Customer Service Representatives, Sales Representatives): 這些職業的日常工作充滿了與客戶的溝通,需要提供產品資訊、解答疑問、處理問題。 AI 作為一個「溝通代理人」和「資訊服務員」,能夠極大地輔助甚至部分替代這些工作。
  • 其他知識工作者: 如公關專家、政治學家、記者、數學家、校對員等,他們的共同點都是大量處理符號、數據和文字資訊。

一個特別有趣的發現是,一些我們通常不認為是「高科技」的服務業崗位,也獲得了驚人的高分。例如乘客服務員(Passenger Attendants)禮賓司(Concierges) 和 旅店前台(Hosts and Hostesses)。乍看之下,這似乎有違直覺。但如果我們用論文的分析框架來審視,就會豁然開朗。這些職業的很大一部分工作內容,並非體力勞動,而是「向客人提供資訊」、「回應詢問」、「解釋規則與服務」。這些恰恰是 AI 最擅長的溝通與資訊服務類任務。這也揭示了,我們不應僅憑職業名稱的刻板印象來判斷 AI 的影響,而應深入分析其構成的工作活動。

誰相對安穩?(低適用性分數的職業)

地圖的另一端,是那些「AI 適用性分數」極低的職業。它們的共同點也非常突出:工作核心涉及大量的體力勞動、操作精密機械、或與物理世界直接互動。

這些職業包括:

  • 體力勞動者: 如洗碗工、屋頂工、泥水匠、清潔工。
  • 機械操作員: 如堆高機司機、卡車司機、起重機操作員。
  • 動手護理與服務者: 如護理助理、按摩治療師、理髮師。
  • 手藝人: 如汽車玻璃安裝工、輪胎修理工。

這些工作的核心任務,例如「搬運重物」、「駕駛車輛」、「為病人翻身」、「修理引擎」,都遠遠超出了當前生成式 AI(一個基於語言的模型)的能力範圍。論文特別強調,他們的研究對象是 LLM,並不意味著其他類型的 AI(例如機器人學、電腦視覺)不會影響這些職業。但就目前生成式 AI 的浪潮而言,這些以體力為主的職業,受到的直接衝擊是最小的。

現實與預測的交匯

更有說服力的是,研究者們將他們基於「真實使用數據」得出的這份影響力地圖,與另一項由 Eloundou 等人發表的、基於「專家預測」的研究進行了比較。 Eloundou 等人的研究是請人類專家和 GPT-4 來判斷,哪些工作任務可以被 AI 顯著提速。

結果令人振奮:兩份地圖高度吻合! 相關係數高達 0.73,在將職業聚合到更宏觀的類別後,相關係數甚至飆升至 0.91 。這是一個極其重要的發現。它意味著,專家們憑藉其專業知識所做出的前瞻性預測,在很大程度上被真實世界中人們的實際使用行為所驗證。這就像天文學家通過理論計算預測了一顆彗星的軌跡,而這篇論文的作者則架設了望遠鏡,觀測到了彗星確實沿著預測的軌跡在飛行。這雙重驗證,極大地增強了我們對 AI 影響趨勢判斷的信心。

最後,論文還探討了 AI 適用性與薪資、教育水平的關係。他們發現,AI 適用性與薪資的相關性很弱,但與教育水平的相關性則更為明顯。要求學士或更高學位的職業,其平均 AI 適用性分數顯著高於教育要求較低的職業。 這再次印證了生成式 AI 主要衝擊的是「知識密集型」工作,而非簡單地以「高薪」或「低薪」來劃分。

總結來說,這篇論文通過嚴謹的數據分析,為我們提供了關於生成式 AI 在當下及可預見的未來,如何重塑職業格局的深刻洞見。它不僅識別了受影響最大的職業群體,更重要的是,它提供了一套科學的、可複製的分析框架,讓我們能夠持續追蹤這場由 AI 引領的、史無前例的技術變革。這項研究告訴我們,隕石的撞擊並非隨機,其路徑清晰可循,而它的主要目標,正是我們經濟體系中長期以來被視為最穩固的基石——知識工作。