AI進展變慢了？AlphaGo 核心研究員：我們正處於指數成長最陡峭的一段

Fox Hsiao

29 9月 2025 — 8 min read

身為人工智慧研究機構 Anthropic的研究員，朱利安·施里特維澤（Julian Schrittwieser）的職業生涯，幾乎等同於AI最前沿突破的同義詞。他曾是Google DeepMind團隊的核心成員，其名字與AlphaGo、AlphaZero、MuZero到AlphaCode等一系列改變世界的AI專案緊密相連。

從征服圍棋，到探索演算法、生成程式碼，施里特維澤始終站在推動AI能力邊界的第一線。憑藉如此深厚的背景，昨天公開撰文示警，指出大眾普遍未能理解AI進展的「指數型」本質時，這份觀察就格外值得我們重視。我們似乎又一次，在指數型成長的浪潮前，選擇視而不見。

施里特維澤在文章中直言，大眾的認知與討論，時常瀰漫一種奇特的氛圍，讓人想起數年前新冠疫情爆發初期的情境。當時，數據早已清晰揭示指數型傳播的軌跡，預示一場全球大流行即將到來，但許多人卻依舊將其視為遙遠的局部現象。如今，AI的進展正以同樣驚人的速度奔馳，但公眾的反應卻如出一轍。

「人們注意到AI現在可以編寫程式、設計網站，但它仍然會犯錯或走向錯誤的方向，然後他們不知何故就跳到結論，認為AI永遠無法在這些任務上達到人類水平，或者只會產生微小的影響。」這種結論忽略一個關鍵事實：僅僅在幾年之前，讓AI執行這些任務還完全是科幻小說的情節。又或者，人們在比較兩個相鄰世代的模型時，因為未察覺到對話體驗有巨大差異，便斷定AI的發展正在趨緩。這種憑藉直覺的線性思維，正讓我們嚴重低估即將發生的變革。

Replit創辦人阿姆賈德·馬薩德（Amjad Masad）也描述這種感受：「在許多方面，人工智慧的進展感覺是漸進式的。」他點出，當從GPT-2躍升至GPT-3時，消費者還能感到震撼，但到了現在，「他們卻難以分辨GPT-5的改進之處。」然而，在消費級聊天機器人看似平緩的體驗曲線之下，一股更強大的力量正在以清晰且可衡量的方式，經歷爆炸性的成長。

拆解指數曲線的迷思要準確評估AI的進展，需要專業且系統性的方法。施里特維澤引用專門研究AI能力的機構METR最近發布的報告《衡量AI完成長任務的能力》，該研究專注於衡量模型能自主執行軟體工程任務的時長，這正是馬薩德所強調的「自主代理程式」能力。報告中的圖表清晰地呈現一條指數型成長的趨勢線。例如，七個月前發布的Sonnet 3.7模型，已經能在長達一小時的任務中，達到50%的成功率。

施里特維澤引導我們去看METR網站上即時更新的數據圖表，包含Grok 4、Opus 4.1及GPT-5等更新的模型，不僅完全符合原先「模型能力每七個月翻一倍」的預測，甚至還稍微超出趨勢線，頂尖模型已能成功處理超過兩小時的任務。這條陡峭上揚的曲線，是理解AI真實進展的關鍵鑰匙。它意味著，我們不能用看待過去的方式來預測未來。

線性的預期會告訴我們，從一小時到兩小時的進步，下一步或許是三小時。但指數型的現實卻是，能力的翻倍是以固定的時間間隔發生，成長的絕對值會越來越大，其速度遠超人類的直覺。從程式碼到各行各業的全面滲透當然，一個合理的質疑是：軟體工程的表現，能夠推及到更廣泛的經濟領域嗎？畢竟，這可能是AI實驗室工程師最熟悉的場景。

為回答這個問題，施里特維澤轉向另一份由OpenAI發布的重量級研究GDPval。這份評估報告涵蓋的範圍極廣，橫跨9個產業、44種不同職業，總計1320項任務。所有任務均來自經驗豐富的業界專家，並由評分人員進行盲測比較。結果呈現出相似的趨勢。在GDPval的圖表中，最新的GPT-5模型在多項職業的表現上，已經驚人地接近人類專家的水平。更值得注意的是，比GPT-5更早發布的Claude Opus 4.1，其表現甚至超越GPT-5，幾乎與業界專家的水準並駕齊驅。

施里特維澤特別讚揚OpenAI公布這項評估的正直行為，因為它誠實地展示一個來自競爭對手的模型，在某些方面超越自家的旗艦模型。這顯示出業界對於推動有益的AI發展，抱持著超越商業競爭的關懷。一個被低估的預測工具當我們將這些跨越多年、橫跨多個產業的指數型性能提升趨勢放在一起，一個清晰的圖像便浮現出來。

施里特維澤直言：「如果這些進步突然停止，那將會是極度令人意外的。」他認為，即使只是對現有趨勢進行相對保守的推斷，都指向一個明確的未來。他提出一個簡單卻強大的預測方法：在圖表上畫直線。「這聽起來可能過於簡化，但透過在圖表上延伸直線來做預測，很可能比大多數『專家』，甚至比多數領域專家，更能為你提供一個更好的未來模型。」

他的預測是：

- 到2026年中期，AI模型將能夠自主工作一整個工作日（8小時）。

- 在2026年底前，至少會有一款模型在眾多行業的表現上，能與人類專家匹敵。

- 到2027年底，模型在許多任務上的表現，將頻繁超越人類專家。

這個未來並非遙不可及，它就在指數曲線的下一段延伸線上。然而，當前的公共討論與政策制定，顯然尚未準備好應對如此巨大的變革。我們的心智模型，依舊習慣於用過去的步調去衡量未來，這種慣性，正是我們理解指數型成長最大的障礙。

在文章的討論區，有讀者提出AI的進步與病毒傳播或摩爾定律的機制不同。施里特維澤同意AI成長的因果過程更為複雜，但他巧妙地回應，摩爾定律本身就是一個絕佳的例子。它主要是一個統計觀察，但在很長一段時間內，要做出比「直接延伸對數圖上的直線」更好的預測，極其困難。他強調，至少在短期一到兩年內，同樣的邏輯極可能適用於AI的進展。

我們正處於一個關鍵的轉折點。數據和圖表所描繪的，是一個即將因AI而徹底重塑的經濟與社會樣貌。繼續用線性的、漸進的思維去應對一個指數型的現實，無異於在海嘯來臨前，還在爭論沙灘上的遮陽傘該擺在哪個位置。理解指數型成長，不僅是一個數學概念的認知，更是我們能否為未來做好準備的關鍵第一步。

帶著雜音的黃金時代：NASA 史上最年輕的新署長 Jared Isaacman 的新賭局

2025年12月17日，華盛頓特區的參議院議場內，原本預期是一場慶祝美國太空新時代的表決，最終卻在略顯尷尬的氣氛中落幕。 67 票贊成，30 票反對。 Jared Isaacman，這位億萬富翁、Shift4 Payments 創辦人、以及史上第一位完成商業太空漫步的平民，正式確認成為 NASA 第 15 任署長。表面上看，這是一個舒適的過半票數。但在 NASA 署長確認的歷史長河中，這個數字卻顯得異常刺眼。過去半個世紀，NASA 署長往往是以「全票通過」或極高票數（如 90 票以上）上任的，因為太空探索從來都是超越黨派的美國精神象徵。但這一次不同。67 對 30，這個分裂的數字，精準地預告了 Isaacman 即將面對的戰場：這不再只是關於探索未知的浪漫旅程，而是一場關於 NASA 靈魂的路線之爭。延伸閱讀：關於

Bloomberg 兩年實驗：9000 名工程師導入 AI，為何主管反而變成「文盲」？

9000 名工程師的實驗室這不是一個關於某個敏捷新創團隊如何擁抱 AI 的故事。這是一艘擁有數十億行程式碼、9000 多名軟體工程師的金融科技巨輪——Bloomberg——如何在兩年內調頭轉向的真實紀錄。 Bloomberg 的技術基礎設施部門負責人 Lei 在最近的一次分享中，揭露了他們大規模導入 AI 輔助開發的歷程。他們不僅是導入了 Copilot 類型的工具，更深入到了自動化程式碼修補和事件響應等深水區。然而，在這場耗時兩年的大規模實驗中，數據揭示了一個違反直覺、甚至讓管理層感到不安的現象：第一線工程師的 AI 採用率與適應速度，遠遠高於他們的領導層。這不僅僅是「年輕人比較會用新工具」的代溝問題，這暴露了企業 AI 轉型中一個最被忽視的結構性風險：當基層生產力發生指數級躍升時，依靠「舊經驗」進行管理的主管們，正逐漸成為新時代的「功能性文盲」。斷層危機：為什麼資深主管反而變成「弱勢群體」？在過去的軟體工程世界裡，資歷代表著「直覺」。一個資深主管或 Tech Lead，

放棄 7 萬美元的純電執著，福特改抄中國的增程答案

在底特律的凜冬將至之時，Ford 剛剛丟出了一條震撼彈，正式宣告了美國電動皮卡大戰的第一階段結束。 Ford 宣布，正式取消備受期待的 F-150 Lightning 純電後繼車計畫（代號 Project T3 的純電版本）。取而代之的是，他們將全力投入一項在美國市場聽起來有些陌生，但在大洋彼岸卻早已殺成紅海的技術：EREV（Extended Range Electric Vehicle，增程型電動車）。這是一個巨大的轉向。就在幾年前，Ford CEO Jim Farley 還信誓旦旦地要挑戰 Tesla 的統治地位，要在純電產能上超越 Elon Musk。但今天，他站在殘酷的財務報表前，說出了另一番話：「五萬、六萬、七萬美元的電動車就是賣不動。我們正跟隨顧客的腳步，走向市場所在... 這些七萬美元的昂貴電動卡車，儘管我非常喜歡這項產品，但它們沒有意義。」這段話聽起來像是對現實的妥協，但如果你把視角拉高，看向全球最大的新能源車市場，中國，

從 S&P 500 到 S&P 8：矽谷教父解析「槓鈴經濟」下的生存法則

「這裡有一個思想實驗，我鼓勵大家都試試看。」在與 Marc Andreessen 的對談開始沒多久，這位矽谷最著名的風險投資人拋出了一個聽起來頗為私密、甚至帶著一絲危險氣息的建議。「在深夜裡，把門鎖上，確保四周無人——這真的是只有你自己能看東西。」他說，「拿出一張紙，列出兩份清單，然後把它們收好，十年後再拿出來看。」「第一份清單：有哪些事情是我深信不疑，但我絕對不能公開說出口的？」「第二份清單：有哪些事情我根本不相信，但我必須在公開場合假裝相信？」這不僅僅是一個關於個人誠信的道德拷問，這是一個關於我們這個時代結構性焦慮的縮影。Marc Andreessen 所描述的這種分裂——私人真實與公共偽裝之間的巨大鴻溝——正是理解當下世界運作邏輯的一把鑰匙。如果你仔細觀察，你會發現這種「分裂」並不僅僅發生在個人的心智中。它像一道裂痕，貫穿了我們的經濟體系、商業模式、媒體生態，乃至於地緣政治版圖。在這次長達數小時的深度訪談中，Andreessen 雖然談論了從創投基金的規模、全端新創的崛起，到 AI 競賽與軍事自動化等廣泛議題，但若我們將這些看似分散

Read more

帶著雜音的黃金時代：NASA 史上最年輕的新署長 Jared Isaacman 的新賭局

Bloomberg 兩年實驗：9000 名工程師導入 AI，為何主管反而變成「文盲」？

放棄 7 萬美元的純電執著，福特改抄中國的增程答案

從 S&P 500 到 S&P 8：矽谷教父解析「槓鈴經濟」下的生存法則