Ilya Sutskever:我們正從規模法則時代邁入研究時代

Share
Ilya Sutskever:我們正從規模法則時代邁入研究時代

開場:慢速起飛的錯覺

「你知道什麼最瘋狂嗎?就是這一切感覺有多麼『正常』。」

在 Dwarkesh Patel 的訪談中,Ilya Sutskever 說出了這句耐人尋味的話。

這確實是一個充滿矛盾的時刻。一方面,新聞標題充斥著數百億美元的 AI 投資、GPU 的搶購熱潮,以及對 AGI 即將毀滅(或拯救)世界的預言;另一方面,我們的日常生活似乎並沒有發生翻天覆地的變化。Siri 依然聽不懂複雜指令,Copilot 偶爾還是會寫出充滿 Bug 的程式碼,而我們依然要每天上班、吃飯、睡覺。

這種「雷聲大雨點小」的體感,讓許多人開始懷疑:我們是否正處於一個巨大的泡沫之中?

Ilya 的回答是否定的。他認為,我們感受到的這種「正常」,正是「慢速起飛(Slow Takeoff)」的特徵。這不是泡沫的破滅,而是我們正處於一個時代的交界點——我們正在從單純堆砌算力的「擴展時代(Age of Scaling)」,走向需要更深層智慧的「新研究時代(New Age of Research)」。

這篇文章將深入解析 Ilya Sutskever 的最新觀點,探討為什麼單純的擴展定律(Scaling Laws)可能已經不足以通往 AGI,以及人類大腦中那個尚未被破解的「演算法」,為何才是未來的關鍵。


第一轉折:擴展時代的終結與回歸

要理解為什麼現在需要尋找「新演算法」,我們必須看懂 AI 發展的歷史週期。Ilya 將其劃分為三個階段,這為我們判斷當前局勢提供了極佳的座標系。

2012-2020:研究時代(Age of Research)

從 AlexNet 的驚艷亮相到 GPT-3 的誕生前夕,這是百花齊放的時期。科學家們在黑暗中摸索,嘗試各種架構(CNN, RNN, LSTM),試圖證明深度學習的可行性。這是一個充滿不確定性,但也充滿創新的階段。

2020-2025:擴展時代(Age of Scaling)

這是我們剛剛經歷的黃金五年。擴展定律(Scaling Laws)成為了統治一切的定律。大家發現了一個簡單粗暴但極其有效的公式:更多數據 + 更多算力 = 更強模型

這是一個「低風險投資」的時期。只要你有錢買 GPU,有辦法清洗數據,模型變強幾乎是物理定律般的必然。這也是為什麼微軟、Google、Meta 敢於投入數百億美元進行軍備競賽的原因,因為回報是可預期的。

2025+:新研究時代(The New Age of Research)

然而,Ilya 敏銳地指出,這個時代正在結束。

「但現在算力已經變得如此龐大……在某種意義上,我們又回到了研究時代。」

為什麼?因為「低垂的果實」快被摘光了。

  1. 數據枯竭:高品質的網際網路文本幾乎已被窮盡。
  2. 邊際效應:單純增加算力帶來的性能提升,開始遭遇邊際效應遞減。

預訓練(Pre-training)之所以強大,是因為它「不挑食」。它的答案是「一切」——把所有數據都餵進去。但當「一切」都餵完了,下一步該怎麼辦?

現在,我們回到了研究時代。只是這一次,我們手握前所未有的巨大算力。誰能率先發明出利用這些算力的新範式(例如高效的強化學習擴展(RL Scaling)、新的架構),誰就能開啟下一個時代。這正是 Ilya 創立 SSI 的技術動機。


核心深探:人類學習的奧秘(The Human Advantage)

如果說擴展定律(Scaling Laws)是過去幾年 AI 發展的聖經,那麼 Ilya 在這次訪談中,或許正在暗示這本聖經的「舊約」章節即將結束,而我們需要尋找「新約」。

這一切的線索,藏在他對人類與 AI 學習效率的深刻對比中。

數據效率的巨大鴻溝

我們常驚嘆於 GPT-4 閱讀了整個網際網路的知識,但 Ilya 提出了一個反直覺的質疑:為什麼它需要看這麼多?

試想一下,一個人類小孩學會開車、學會社交、甚至學會寫程式,需要閱讀幾兆個詞元的數據嗎?完全不需要。人類僅憑極少量的數據(Sample Efficient),就能掌握極其複雜的技能,並且具備強大的泛化能力(Generalization)。

相比之下,目前的 LLM 雖然強大,但本質上是「數據飢渴」的。它們需要看過幾乎所有變體,才能學會一個概念。這種巨大的效率落差,暗示了目前的 AI 架構可能還缺少了某種核心拼圖。

演化先驗 vs. 更強的演算法

通常有一種解釋是:人類之所以學得快,是因為演化在我們的大腦中預埋了大量的先驗知識。就像松鼠天生會跳躍,我們天生會語言。

但 Ilya 反駁了這個觀點。他舉了一個極具說服力的例子:寫程式(Coding)

寫程式是人類歷史上最近幾十年才出現的技能,演化根本來不及為此在基因裡寫入任何先驗知識(Prior)。然而,人類工程師依然能憑藉有限的學習,寫出複雜且邏輯嚴密的程式碼。如果演化沒有幫忙,那解釋只有一個:

「這更表明,人類單純就是擁有更好的機器學習演算法。」

這句話是整場訪談的技術核心。它意味著,AGI 的關鍵可能不在於餵養更多的數據(因為數據快沒了),而在於破解大腦中那個「更好的演算法」。

尋找失落的演算法

那麼,這個演算法長什麼樣?Ilya 提到了兩個關鍵詞:非監督(Unsupervised)內在價值函數(Internal Value Function)

青少年學開車時,並沒有一個教練每毫秒都給他獎勵或懲罰,現實世界也不會像遊戲一樣即時顯示分數。但人類能通過觀察、預測和內在的自我修正,在極短時間內掌握這項技能。

這暗示了未來的 AI 研究方向,將從單純的「預訓練」轉向更像人類的學習方式——具備強大內在動機和自我監督能力的系統。這也是為什麼 Ilya 認為我們正在離開單純的擴展時代,回歸到需要發明新架構的研究時代。


SSI 的戰略:不參與老鼠賽跑

基於上述的洞察,Ilya 的新公司 SSI(Safe Superintelligence)制定了一套與眾不同的戰略。

為什麼要成立 SSI?

Ilya 直言,現在的 AI 領域是「公司多於想法」。

大多數公司都在同一條擴展的賽道上狂奔,爭奪同樣的 GPU,訓練類似的模型,發布類似的產品。這是一場典型的「老鼠賽跑」。

SSI 選擇退出這場遊戲。他們不發布產品,不爭奪短期營收,而是專注於最核心的「研究」。因為 Ilya 相信,如果上述的「人類學習演算法」被破解,現在所有的護城河都將失效。這是一場賭上未來的豪賭,賭的是誰能率先找到通往 AGI 的正確路徑。

安全即戰略:關愛感知生命

除了技術路徑,SSI 在安全策略上也提出了獨特的觀點。

Ilya 承認,他改變了想法。過去他可能認為「直通模式(Straight shot)」——在實驗室裡秘密造出 AGI 然後一次性發布——是可行的。但現在,他認為「漸進式發布(Gradual release)」才是必要的。

為什麼?因為人類社會需要時間來適應。我們需要讓世界「看見」AI 的強大,經歷衝擊、適應、然後學會與之共存。這是一個社會工程的過程,而不僅僅是技術問題。

更引人深思的是他對「對齊(Alignment)」的新定義。他不再強調讓 AI 遵守死板的規則,而是提出要讓 AI 「關愛感知生命(Care for sentient life)」

這聽起來很抽象,但 Ilya 用演化論做了一個精彩的類比:基因本身是沒有智慧的,它的目標只是複製。但為了更好地複製,基因演化出了人類的大腦。而這個大腦,竟然發展出了「在乎他人看法」、「追求社會地位」這些與基因複製目標不完全一致、甚至更高層次的概念。

這證明了,一個低層次的最佳化過程(演化),是有可能湧現出具備高層次道德與情感的智慧體的。如果我們能正確設計 AI 的「基因」(基礎目標函數),或許真的能讓超級智慧演化出對人類的「關愛」。


長期的均衡

在這場訪談的最後,Ilya 展現了一種科學家的樂觀與冷靜。

他預測,雖然現在各家公司的路徑不同,但最終大家都會發現那條「正確的路」。技術路徑會收斂,安全策略也會收斂。未來不會只有一個統治一切的 AI 之神,而是會形成一個充滿各種專精 AI 的生態系,達到某種長期的均衡。

對於身處這個時代的我們來說,Ilya 的觀點是一個重要的提醒:不要被眼前的泡沫和喧囂迷惑。

當所有人都在關注下一批 H100 什麼時候到貨時,真正的變革可能正在某個安靜的實驗室裡發生。我們正從粗放的算力堆疊,轉向對智慧本質的精細探索。這不是 AI 的終點,甚至不是中點,這只是這場漫長馬拉松的熱身結束,正式比賽才剛剛開始。


敬請免費訂閱、贊助本電子報

Mosky 從零開始 AI 寫程式

折扣碼:FOXAI

課程連結和限時優惠網址:https://pse.is/8dqy89

折扣金額:$250


引用來源

  • Dwarkesh Patel Interview with Ilya Sutskever (2024)

Read more

Rocket Lab 的 Peter Beck 如何在富豪們的太空夢間殺出血路

Rocket Lab 的 Peter Beck 如何在富豪們的太空夢間殺出血路

《Relentless》podcast 主持人 Ti Morse 飛到紐西蘭的 Rocket Lab 總部,在訪談一開始就把數字攤開,Rocket Lab 過去五年的發射從 6 次長到 21 次,SpaceX 從 2021 年的 31 次長到 2025 年的 165 次,整個商業太空產業的擴張速度以倍數在跳。兩間公司的起點落差很大,早期馬斯克(Elon Musk)手上有 1 億美元的啟動資金,Ti Morse 問 Peter Beck 有多少,Peter 在鏡頭前帶著紐西蘭式幽默回答「100 美元」。後來他飛到美國募資時,給自己三週時間要拿到支票或滾出城。 兩間公司最後都做到每週一飛的發射節奏,但 Rocket

By Fox Hsiao
AI 時代 Claude Code 育兒法:她用 11 個代理人換來兩小時不理小孩

AI 時代 Claude Code 育兒法:她用 11 個代理人換來兩小時不理小孩

一個已經放棄技術夢的媽媽,養四個五歲以下的孩子 Jesse Genet 是 YC 2015 屆的創辦人,那家叫 Lumi 的包裝公司,幾年前賣掉了。離開戰場之後,她回歸家庭生下四個孩子,現在最大的五歲、最小的才四個月,全部在家自學。她原本打算未來五年不碰任何需要技術能力的新東西,這不是沮喪,只是承認現在的時間分配容不下那些。 六個月前這件事被翻過來了,她第一次打開終端機開始寫東西。兩三個月前她看著 Obsidian 社群的朋友聊 Claude Code,想清楚一件事:她可以趁孩子睡覺或自己玩的時候,建一群代理人替她工作。現在她有 11 個代理人,每天處理自學課表、教材採購、DoorDash 雜貨、家庭記帳,甚至能在她不碰 Mac Mini 的情況下,自己長出新的代理人。 這篇文章不是要你羨慕她有 11 個分身,真正值得記下來的是她反覆提到的一個詞:benevolent neglect,有意為之的放手。

By Fox Hsiao
NASA 月球基地計畫攤開看:三階段、七子系統、採購清單全公開

NASA 月球基地計畫攤開看:三階段、七子系統、採購清單全公開

這份文件該被當成徵求提案書來讀 2026 年 3 月 24 日,NASA 在華盛頓總部辦了一場叫「點火」(Ignition)的活動,邀請產業代表與國際太空社群到場。署長 Jared Isaacman 當場宣布,美國要在月球南極建一座月球基地(Moon Base),採分階段迭代推進。 這類宣示本身不稀奇,Artemis(NASA 自 2017 年啟動的月球重返計畫)已經喊了好幾年,大家多少聽過;真正值得停下來看的,是 NASA 在這次活動同步釋出的一份 16 頁文件《月球基地架構使用者指南》(Moon Base Architecture User's Guide)。 文件的真正讀者是產業、學界、國際夥伴,NASA 把月球基地要做的事、自己還不會的事、希望外面接哪幾塊,

By Fox Hsiao