好的,我們繼續探索《第二個機器時代》的第二個核心引擎:萬物的數位化(The Digitization of Just About Everything)。
繼理解了「指數級增長」如何為數位科技提供源源不斷的動力之後,我們需要明白這些動力是如何應用到現實世界並產生巨大影響的。答案就在於「數位化」——將各種形式的資訊、媒體、流程甚至物理實體,轉化為電腦可以理解和處理的「位元」(bits),也就是 0 和 1 的序列。
數位化:資訊的「解放」與「賦能」
想像一下,你正在向你的朋友解釋什麼是數位化,以及它為什麼如此重要。
「嘿,我們剛才聊了摩爾定律和科技如何像坐火箭一樣發展,對吧?但光有強大的計算能力還不夠,這些能力需要有『原料』才能發揮作用。這個『原料』,在很大程度上就是通過『數位化』產生的。
簡單來說,『數位化』就是把我們世界中各種各樣的東西——文字、聲音、圖片、影片、地圖、儀器讀數、感測器數據,甚至是我們的人際關係、商業流程——都轉化成電腦能讀懂的語言,也就是一串串的 0 和 1 。一旦某樣東西被數位化了,它就獲得了一些非常神奇的特性,這些特性是它在『類比』(analog)形態下所不具備的。
數位化資訊的獨特經濟學特性
書中強調了數位化資訊的兩個關鍵經濟學特性,這也是理解其威力的核心:
- 非競爭性(Non-rivalrous):這聽起來有點繞口,但其實很好理解。想像一下你吃一個蘋果,你吃了,我就不能吃了,這個蘋果就是『競爭性』的。但如果你聽一首數位音樂,或者看一篇數位文章,你欣賞它的同時,並不會妨礙我也去欣賞。同一個數位檔案可以被無數人同時使用,而不會被『用光』。這就打破了傳統物質資源的稀缺性限制。
- 接近零的邊際複製成本(Near-zero marginal cost of reproduction):這是數位化最令人驚嘆的特性之一。製作第一份數位產品(比如寫一個軟體、錄製一張專輯、拍攝一部電影)可能成本很高,需要投入大量的時間、金錢和創造力。但是,一旦第一份完成了,複製它的成本就幾乎為零。你複製一份 MP3 音樂、一個 Word 文檔、一個軟體程式,只需要點幾下按鈕,幾乎不費吹灰之力,而且複製出來的副本和原版一模一樣,不會像影印的影印件那樣質量下降。這種「完美複製、瞬間傳輸、成本極低」的特性,是實體物品無法比擬的。
書中用 Waze 這個導航 App 的例子很好地說明了數位化的力量。 Waze 之所以能夠提供即時路況和最佳路線,是因為它依賴於多個數位化資訊流的整合:
- 數位化地圖:這是基礎,早就存在了。
- GPS 定位資訊:得益於政府提供的 GPS 衛星網路和智慧型手機的普及。
- 用戶生成的即時數據:每個運行 Waze 的用戶,他們的智慧型手機都在不斷地將自己的位置和速度資訊(匿名地)上傳到 Waze 的伺服器。這就形成了一個龐大的、即時更新的交通感測器網路。
- 社交數據:用戶還可以主動報告交通事故、警察測速、道路封閉等資訊,甚至可以互相聊天。
Waze 的聰明之處就在於,它將這些不同來源的數位化資訊整合起來,通過複雜的演算法進行分析,從而為每個用戶提供當前最優的導航方案。如果沒有這些資訊的數位化,以及智慧型手機這種廉價而強大的數位化工具,Waze 是不可能實現的。
從「昂貴的第一份拷貝」到「免費的內容盛宴」
早期關於資訊經濟學的觀點(比如夏皮羅和瓦里安在《資訊規則》一書中提出的)強調「資訊的生產成本高昂,但複製成本低廉」。像 Google 翻譯這樣的服務,就利用了這一點。它依賴於大量已有的、由人工翻譯(成本不菲)的雙語文檔。一旦這些文檔被數位化,就可以被切割、複製、分析,用於訓練翻譯模型,從而提供即時翻譯服務。
然而,近年來,數位化的圖景又有了新的發展。一個重要的趨勢是用戶生成內容(User-Generated Content, UGC)的爆炸式增長。維基百科就是一個典型的例子,它的所有內容都是由全球的志願者免費貢獻的。還有各種博客、論壇、社交媒體(如 Facebook 、 Twitter 、 YouTube 、 Instagram),上面的大量文字、圖片、影片,也都是用戶自發創造和分享的,他們通常不期望直接的金錢回報。
這種「免費」內容的湧現,不僅豐富了我們的網路生活,也成為了許多先進 AI 技術的重要「養料」。比如,Siri 通過分析大量用戶的語音指令來不斷改進其語音識別能力。 IBM 的華生電腦在準備《Jeopardy!》競賽時,其資料庫中就包含了完整的維基百科。
機器也在「聊天」:M2M 通信的興起
不僅僅是人在生成數位內容,機器與機器之間(Machine-to-Machine, M2M)的交流也越來越頻繁。當你在 Waze 上導航時,你的手機就在和 Waze 的伺服器「聊天」。當你在 Kayak 上搜索機票時,Kayak 的伺服器也在和航空公司的伺服器「聊天」。 ATM 機會和銀行的系統確認你的帳戶餘額。冷藏車上的數位溫度計會不斷向超市報告貨物溫度。半導體工廠的感測器會向總部報告生產缺陷。據估計,全球無線網路上機器人「聊天」的總量,可能很快就會超過人類語音通話的總量。
數據的「海嘯」:從艾位元組到澤位元組
所有這些數位化活動——文件、新聞、音樂、照片、影片、地圖、社交更新、搜索請求、感測器數據等等——共同構成了一場數據的「海嘯」。書中提到,全球互聯網流量在短短五年內(2006-2011)增長了 12 倍,達到了每月 23.9 艾位元組(Exabytes)。一個艾位元組有多大?相當於超過 20 萬個華生電腦的完整資料庫!
而這還不是終點。 IDC 估計,2012 年全球數位數據總量達到了 2.7 澤位元組(Zettabytes),並且還在以驚人的速度增長。思科預測,到 2016 年,全球互聯網協議流量將達到 1.3 澤位元組。我們甚至快要用光公制系統的詞頭了(目前最大的詞頭是 Yotta,代表 10 的 24 次方,而 Zetta 是 10 的 21 次方)。
二進制科學:數據驅動的知識發現
那麼,如此海量的數位數據有什麼用呢?它們非常有用!數位化之所以是推動第二個機器時代的第二大力量,一個重要原因就是它極大地增強了我們的理解能力,催生了新的科學發現方式。
數據是科學的生命線。傳統的科學研究往往受限於數據的獲取難度和成本。而數位化使得海量數據變得唾手可得,為科學家提供了前所未有的工具。
書中舉了幾個例子:
- 預測房地產市場:作者之一的埃里克·布林約爾松(Erik Brynjolfsson)和他的博士生,利用 Google 搜索趨勢數據(比如人們搜索「鳳凰城房地產經紀人」的頻率),成功地預測了房地產銷售和價格的變化,其準確度甚至超過了專業機構的預測。
- 追蹤傳染病:哈佛醫學院的研究團隊發現,通過分析 Twitter 上的推文,可以比官方報告更早、更準確地追蹤海地地震後霍亂疫情的傳播情況。
- 預測電影票房:惠普社交計算實驗室的研究人員發現,社交媒體上的討論可以非常準確地預測電影的票房收入。社交媒體表達了一種「集體智慧」。
- 文化組學(Culturomics):Google 掃描了數千萬本跨越幾個世紀的書籍,形成了一個巨大的數位文本庫。研究人員基於此分析了人類文化的變遷,比如英語詞彙量的增長、名人成名速度的變化、以及人們對進化論關注度的起伏等等。
所有這些例子都表明,數位化正在催生一種新的、基於大數據的科學研究範式。正如 Google 首席經濟學家哈爾·瓦里安所說:「我一直在說,未來十年最性感的工作將是統計學家。我不是在開玩笑。」在這個數據爆炸的時代,能夠從海量數據中提取洞見、做出預測的人,將擁有巨大的價值。
新的層次,新的配方:數位化促進組合式創新
除了推動科學發現,數位化還扮演著另一個至關重要的角色:它是組合式創新的催化劑。 這是數位化成為第二個機器時代核心引擎的又一個原因,也是我們將在下一個主要論點中詳細探討的「組合式創新」的基礎。
Waze 再次成為一個很好的例子。它的成功並非源於某項單一的革命性技術,而是巧妙地將多個已有的數位化層次和技術組合在了一起:
- 數位地圖(早已存在)
- GPS 定位(2000 年美國政府提高 GPS 精度後變得更加實用)
- 社交數據(用戶分享的路況資訊)
- 感測器數據(用戶手機上傳的即時速度和位置)
傳統的 GPS 導航系統只利用了前兩個層次,功能相對有限。 Waze 的創始人意識到,隨著數位化的深入和擴展(比如智慧型手機的普及和移動網路的覆蓋),他們可以將新的數據層次(社交和感測器數據)疊加到現有系統之上,從而創造出一個遠超傳統 GPS 的、更強大、更有用的服務。
這種通過疊加和重組不同數位化層次和技術來創造新價值的模式,正是當前創新的重要特徵。數位化的非競爭性和零邊際複製成本,使得這些「數位積木」可以被反覆使用、自由組合,而不會損耗。這為組合式創新提供了極其豐富的「原料」和極低的「試錯成本」。
小結
「萬物的數位化」是第二個機器時代的第二個核心引擎。它將世界轉化為電腦可以理解和處理的 0 和 1,賦予了資訊非競爭性和接近零邊際複製成本的特性。這不僅催生了海量的數據,為基於大數據的科學發現提供了基礎,更重要的是,它為下一階段的「組合式創新」準備了豐富的「數位積木」。數位化正在以前所未有的規模和速度,重塑我們獲取知識、進行創造和互動的方式。