Ilya Sutskever:我們正從規模法則時代邁入研究時代

Ilya Sutskever:我們正從規模法則時代邁入研究時代

開場:慢速起飛的錯覺

「你知道什麼最瘋狂嗎?就是這一切感覺有多麼『正常』。」

在 Dwarkesh Patel 的訪談中,Ilya Sutskever 說出了這句耐人尋味的話。

這確實是一個充滿矛盾的時刻。一方面,新聞標題充斥著數百億美元的 AI 投資、GPU 的搶購熱潮,以及對 AGI 即將毀滅(或拯救)世界的預言;另一方面,我們的日常生活似乎並沒有發生翻天覆地的變化。Siri 依然聽不懂複雜指令,Copilot 偶爾還是會寫出充滿 Bug 的程式碼,而我們依然要每天上班、吃飯、睡覺。

這種「雷聲大雨點小」的體感,讓許多人開始懷疑:我們是否正處於一個巨大的泡沫之中?

Ilya 的回答是否定的。他認為,我們感受到的這種「正常」,正是「慢速起飛(Slow Takeoff)」的特徵。這不是泡沫的破滅,而是我們正處於一個時代的交界點——我們正在從單純堆砌算力的「擴展時代(Age of Scaling)」,走向需要更深層智慧的「新研究時代(New Age of Research)」。

這篇文章將深入解析 Ilya Sutskever 的最新觀點,探討為什麼單純的擴展定律(Scaling Laws)可能已經不足以通往 AGI,以及人類大腦中那個尚未被破解的「演算法」,為何才是未來的關鍵。


第一轉折:擴展時代的終結與回歸

要理解為什麼現在需要尋找「新演算法」,我們必須看懂 AI 發展的歷史週期。Ilya 將其劃分為三個階段,這為我們判斷當前局勢提供了極佳的座標系。

2012-2020:研究時代(Age of Research)

從 AlexNet 的驚艷亮相到 GPT-3 的誕生前夕,這是百花齊放的時期。科學家們在黑暗中摸索,嘗試各種架構(CNN, RNN, LSTM),試圖證明深度學習的可行性。這是一個充滿不確定性,但也充滿創新的階段。

2020-2025:擴展時代(Age of Scaling)

這是我們剛剛經歷的黃金五年。擴展定律(Scaling Laws)成為了統治一切的定律。大家發現了一個簡單粗暴但極其有效的公式:更多數據 + 更多算力 = 更強模型

這是一個「低風險投資」的時期。只要你有錢買 GPU,有辦法清洗數據,模型變強幾乎是物理定律般的必然。這也是為什麼微軟、Google、Meta 敢於投入數百億美元進行軍備競賽的原因,因為回報是可預期的。

2025+:新研究時代(The New Age of Research)

然而,Ilya 敏銳地指出,這個時代正在結束。

「但現在算力已經變得如此龐大……在某種意義上,我們又回到了研究時代。」

為什麼?因為「低垂的果實」快被摘光了。

  1. 數據枯竭:高品質的網際網路文本幾乎已被窮盡。
  2. 邊際效應:單純增加算力帶來的性能提升,開始遭遇邊際效應遞減。

預訓練(Pre-training)之所以強大,是因為它「不挑食」。它的答案是「一切」——把所有數據都餵進去。但當「一切」都餵完了,下一步該怎麼辦?

現在,我們回到了研究時代。只是這一次,我們手握前所未有的巨大算力。誰能率先發明出利用這些算力的新範式(例如高效的強化學習擴展(RL Scaling)、新的架構),誰就能開啟下一個時代。這正是 Ilya 創立 SSI 的技術動機。


核心深探:人類學習的奧秘(The Human Advantage)

如果說擴展定律(Scaling Laws)是過去幾年 AI 發展的聖經,那麼 Ilya 在這次訪談中,或許正在暗示這本聖經的「舊約」章節即將結束,而我們需要尋找「新約」。

這一切的線索,藏在他對人類與 AI 學習效率的深刻對比中。

數據效率的巨大鴻溝

我們常驚嘆於 GPT-4 閱讀了整個網際網路的知識,但 Ilya 提出了一個反直覺的質疑:為什麼它需要看這麼多?

試想一下,一個人類小孩學會開車、學會社交、甚至學會寫程式,需要閱讀幾兆個詞元的數據嗎?完全不需要。人類僅憑極少量的數據(Sample Efficient),就能掌握極其複雜的技能,並且具備強大的泛化能力(Generalization)。

相比之下,目前的 LLM 雖然強大,但本質上是「數據飢渴」的。它們需要看過幾乎所有變體,才能學會一個概念。這種巨大的效率落差,暗示了目前的 AI 架構可能還缺少了某種核心拼圖。

演化先驗 vs. 更強的演算法

通常有一種解釋是:人類之所以學得快,是因為演化在我們的大腦中預埋了大量的先驗知識。就像松鼠天生會跳躍,我們天生會語言。

但 Ilya 反駁了這個觀點。他舉了一個極具說服力的例子:寫程式(Coding)

寫程式是人類歷史上最近幾十年才出現的技能,演化根本來不及為此在基因裡寫入任何先驗知識(Prior)。然而,人類工程師依然能憑藉有限的學習,寫出複雜且邏輯嚴密的程式碼。如果演化沒有幫忙,那解釋只有一個:

「這更表明,人類單純就是擁有更好的機器學習演算法。」

這句話是整場訪談的技術核心。它意味著,AGI 的關鍵可能不在於餵養更多的數據(因為數據快沒了),而在於破解大腦中那個「更好的演算法」。

尋找失落的演算法

那麼,這個演算法長什麼樣?Ilya 提到了兩個關鍵詞:非監督(Unsupervised)內在價值函數(Internal Value Function)

青少年學開車時,並沒有一個教練每毫秒都給他獎勵或懲罰,現實世界也不會像遊戲一樣即時顯示分數。但人類能通過觀察、預測和內在的自我修正,在極短時間內掌握這項技能。

這暗示了未來的 AI 研究方向,將從單純的「預訓練」轉向更像人類的學習方式——具備強大內在動機和自我監督能力的系統。這也是為什麼 Ilya 認為我們正在離開單純的擴展時代,回歸到需要發明新架構的研究時代。


SSI 的戰略:不參與老鼠賽跑

基於上述的洞察,Ilya 的新公司 SSI(Safe Superintelligence)制定了一套與眾不同的戰略。

為什麼要成立 SSI?

Ilya 直言,現在的 AI 領域是「公司多於想法」。

大多數公司都在同一條擴展的賽道上狂奔,爭奪同樣的 GPU,訓練類似的模型,發布類似的產品。這是一場典型的「老鼠賽跑」。

SSI 選擇退出這場遊戲。他們不發布產品,不爭奪短期營收,而是專注於最核心的「研究」。因為 Ilya 相信,如果上述的「人類學習演算法」被破解,現在所有的護城河都將失效。這是一場賭上未來的豪賭,賭的是誰能率先找到通往 AGI 的正確路徑。

安全即戰略:關愛感知生命

除了技術路徑,SSI 在安全策略上也提出了獨特的觀點。

Ilya 承認,他改變了想法。過去他可能認為「直通模式(Straight shot)」——在實驗室裡秘密造出 AGI 然後一次性發布——是可行的。但現在,他認為「漸進式發布(Gradual release)」才是必要的。

為什麼?因為人類社會需要時間來適應。我們需要讓世界「看見」AI 的強大,經歷衝擊、適應、然後學會與之共存。這是一個社會工程的過程,而不僅僅是技術問題。

更引人深思的是他對「對齊(Alignment)」的新定義。他不再強調讓 AI 遵守死板的規則,而是提出要讓 AI 「關愛感知生命(Care for sentient life)」

這聽起來很抽象,但 Ilya 用演化論做了一個精彩的類比:基因本身是沒有智慧的,它的目標只是複製。但為了更好地複製,基因演化出了人類的大腦。而這個大腦,竟然發展出了「在乎他人看法」、「追求社會地位」這些與基因複製目標不完全一致、甚至更高層次的概念。

這證明了,一個低層次的最佳化過程(演化),是有可能湧現出具備高層次道德與情感的智慧體的。如果我們能正確設計 AI 的「基因」(基礎目標函數),或許真的能讓超級智慧演化出對人類的「關愛」。


長期的均衡

在這場訪談的最後,Ilya 展現了一種科學家的樂觀與冷靜。

他預測,雖然現在各家公司的路徑不同,但最終大家都會發現那條「正確的路」。技術路徑會收斂,安全策略也會收斂。未來不會只有一個統治一切的 AI 之神,而是會形成一個充滿各種專精 AI 的生態系,達到某種長期的均衡。

對於身處這個時代的我們來說,Ilya 的觀點是一個重要的提醒:不要被眼前的泡沫和喧囂迷惑。

當所有人都在關注下一批 H100 什麼時候到貨時,真正的變革可能正在某個安靜的實驗室裡發生。我們正從粗放的算力堆疊,轉向對智慧本質的精細探索。這不是 AI 的終點,甚至不是中點,這只是這場漫長馬拉松的熱身結束,正式比賽才剛剛開始。


敬請免費訂閱、贊助本電子報

Mosky 從零開始 AI 寫程式

折扣碼:FOXAI

課程連結和限時優惠網址:https://pse.is/8dqy89

折扣金額:$250


引用來源

  • Dwarkesh Patel Interview with Ilya Sutskever (2024)

Read more

華納不是輸家,Youtube 才是真正的敵人:Netflix 併購案背後的「終局之戰」

華納不是輸家,Youtube 才是真正的敵人:Netflix 併購案背後的「終局之戰」

故事得從賓夕法尼亞州的紐卡斯爾(New Castle)說起。1903 年,哈利(Harry)、艾伯特(Albert)、山姆(Sam)和傑克(Jack)——也就是後來名震天下的華納四兄弟(Warner brothers)——買下了一台二手的放映機。他們在當地簡陋的採礦小鎮搭起了簾幕,開始放映電影。 隨後的幾年裡,他們迅速意識到了一個商業真理:單純放電影是不夠的,你必須掌控「戲院」。1907 年,他們買下了第一家永久性戲院;1908 年,他們開始涉足發行;到了 1923 年,華納兄弟影業(Warner Bros. Pictures, Inc.)正式成立。在接下來的一百年裡,這家公司定義了什麼叫做「好萊塢片廠」:龐大的製片廠區、遍布全球的發行網絡、以及對大銀幕的絕對控制權。 Netflix,這家成立於 1997 年的科技巨頭,

By Fox Hsiao
自動化或者人類滅絕:為什麼我們需要 10 億台機器人來拯救文明?

自動化或者人類滅絕:為什麼我們需要 10 億台機器人來拯救文明?

編按: 本文改寫自創投基金 Unruly Capital 的創辦人 Stefano Bernardi 發布的投資論述《The Depopulation Trade》。 Unruly Capital 是一間總部位於倫敦、專注於深科技(Deep Tech)與氣候科技的早期創投,創始人 Stefano Bernardi 曾是 Stripe 和 Ethereum 的早期投資者,以其「加密-無政府-生態資本主義」(crypto-anarcho-eco-capitalist)的獨特視角聞名。 這篇文章被他稱為「未來一世紀的投資論點」(The Unruly investment thesis for the coming century)。他認為,全球人口崩潰的速度遠超預期,而這將徹底改變我們熟知的經濟與社會運作模式。以下是他的核心觀點整理。 我們正在目睹人類歷史上最大的龐氏騙局崩解。這個騙局不是加密貨幣,也不是房地產泡沫,而是我們的現代社會契約。 我們的養老金、健保體系、

By Fox Hsiao
為什麼 Dyson 寧願燒掉 7.5 億美元,也不願做一台平庸的電動車?

為什麼 Dyson 寧願燒掉 7.5 億美元,也不願做一台平庸的電動車?

如果有一本名為《如何成為億萬富翁》的教科書,James Dyson 肯定是那個把書撕爛、然後丟進垃圾桶的學生。 在這個人人都在談論商業模式、護城河、變現效率的時代,Dyson 的存在就像是一個巨大的 Bug。他拒絕上市,拒絕將技術授權給大廠,甚至拒絕了一筆唾手可得的生意——為其他公司代工生產馬達。 當被問到為什麼不開一個部門專門賣馬達給別人賺錢時,他的回答簡單得令人髮指:「因為那不讓我興奮。(Because that doesn't excite me.)」 這句話聽起來很任性,甚至有點天真。但正是這種「任性」,造就了一個年營收數十億英鎊的商業帝國。Dyson 的故事提供了一個完全相反的成功樣本——一個由「興奮感」和「產品執著」驅動,而非由利潤表驅動的商業傳奇。 控制狂的代價:從授權失敗到獨資帝國 Dyson 並不是一開始就這麼「獨裁」的。像許多年輕的發明家一樣,他最初的夢想很單純:發明一個好東西,然後授權給大公司生產,

By Fox Hsiao
美中數位資產的大分流:一場關於未來金融主權的對決

美中數位資產的大分流:一場關於未來金融主權的對決

2025 年的 12 月,未來的歷史學家或許會將其標記為全球金融體系「大分流(The Great Divergence)」的真正起點。 在這個月的同一個星期裡,地球兩端的兩個超級大國,不約而同地對數位資產(Digital Assets)做出了最終判決。只不過,方向截然相反。 美國證券交易委員會(SEC)主席 Paul Atkins 坐在 Fox Business 的攝影棚裡,面對主持人關於加密貨幣未來的提問,他沒有像前任那樣閃爍其詞。相反地,他自信地宣告了一個新時代的來臨:「全面鏈上化(Moving On-chain)」。 Atkins 明確表示:「代幣化是資本市場未來的發展方向,透過將證券資產上鏈可以實現更清晰的所有權確權。」他更拋出一個令市場震驚的預測:「未來約 2 年內,美國所有市場都將遷移至鏈上運行,以實現鏈上結算。」這不僅是承諾實施「創新豁免(Innovation Exemption)」,更是直言美國的目標是重塑市場結構。 與此同時,

By Fox Hsiao