AI進展變慢了?AlphaGo 核心研究員:我們正處於指數成長最陡峭的一段

Share
AI進展變慢了?AlphaGo 核心研究員:我們正處於指數成長最陡峭的一段

身為人工智慧研究機構 Anthropic的 研究員,朱利安·施里特維澤(Julian Schrittwieser)的職業生涯,幾乎等同於AI最前沿突破的同義詞。他曾是Google DeepMind團隊的核心成員,其名字與AlphaGo、AlphaZero、MuZero到AlphaCode等一系列改變世界的AI專案緊密相連。

從征服圍棋,到探索演算法、生成程式碼,施里特維澤始終站在推動AI能力邊界的第一線。憑藉如此深厚的背景,昨天公開撰文示警,指出大眾普遍未能理解AI進展的「指數型」本質時,這份觀察就格外值得我們重視。我們似乎又一次,在指數型成長的浪潮前,選擇視而不見。

施里特維澤在文章中直言,大眾的認知與討論,時常瀰漫一種奇特的氛圍,讓人想起數年前新冠疫情爆發初期的情境。當時,數據早已清晰揭示指數型傳播的軌跡,預示一場全球大流行即將到來,但許多人卻依舊將其視為遙遠的局部現象。如今,AI的進展正以同樣驚人的速度奔馳,但公眾的反應卻如出一轍。

「人們注意到AI現在可以編寫程式、設計網站,但它仍然會犯錯或走向錯誤的方向,然後他們不知何故就跳到結論,認為AI永遠無法在這些任務上達到人類水平,或者只會產生微小的影響。」這種結論忽略一個關鍵事實:僅僅在幾年之前,讓AI執行這些任務還完全是科幻小說的情節。又或者,人們在比較兩個相鄰世代的模型時,因為未察覺到對話體驗有巨大差異,便斷定AI的發展正在趨緩。這種憑藉直覺的線性思維,正讓我們嚴重低估即將發生的變革。

Replit創辦人阿姆賈德·馬薩德(Amjad Masad)也描述這種感受:「在許多方面,人工智慧的進展感覺是漸進式的。」他點出,當從GPT-2躍升至GPT-3時,消費者還能感到震撼,但到了現在,「他們卻難以分辨GPT-5的改進之處。」然而,在消費級聊天機器人看似平緩的體驗曲線之下,一股更強大的力量正在以清晰且可衡量的方式,經歷爆炸性的成長。

拆解指數曲線的迷思要準確評估AI的進展,需要專業且系統性的方法。施里特維澤引用專門研究AI能力的機構METR最近發布的報告《衡量AI完成長任務的能力》,該研究專注於衡量模型能自主執行軟體工程任務的時長,這正是馬薩德所強調的「自主代理程式」能力。報告中的圖表清晰地呈現一條指數型成長的趨勢線。例如,七個月前發布的Sonnet 3.7模型,已經能在長達一小時的任務中,達到50%的成功率。

施里特維澤引導我們去看METR網站上即時更新的數據圖表,包含Grok 4、Opus 4.1及GPT-5等更新的模型,不僅完全符合原先「模型能力每七個月翻一倍」的預測,甚至還稍微超出趨勢線,頂尖模型已能成功處理超過兩小時的任務。這條陡峭上揚的曲線,是理解AI真實進展的關鍵鑰匙。它意味著,我們不能用看待過去的方式來預測未來。

線性的預期會告訴我們,從一小時到兩小時的進步,下一步或許是三小時。但指數型的現實卻是,能力的翻倍是以固定的時間間隔發生,成長的絕對值會越來越大,其速度遠超人類的直覺。從程式碼到各行各業的全面滲透當然,一個合理的質疑是:軟體工程的表現,能夠推及到更廣泛的經濟領域嗎?畢竟,這可能是AI實驗室工程師最熟悉的場景。

為回答這個問題,施里特維澤轉向另一份由OpenAI發布的重量級研究GDPval。這份評估報告涵蓋的範圍極廣,橫跨9個產業、44種不同職業,總計1320項任務。所有任務均來自經驗豐富的業界專家,並由評分人員進行盲測比較。結果呈現出相似的趨勢。在GDPval的圖表中,最新的GPT-5模型在多項職業的表現上,已經驚人地接近人類專家的水平。更值得注意的是,比GPT-5更早發布的Claude Opus 4.1,其表現甚至超越GPT-5,幾乎與業界專家的水準並駕齊驅。

施里特維澤特別讚揚OpenAI公布這項評估的正直行為,因為它誠實地展示一個來自競爭對手的模型,在某些方面超越自家的旗艦模型。這顯示出業界對於推動有益的AI發展,抱持著超越商業競爭的關懷。一個被低估的預測工具當我們將這些跨越多年、橫跨多個產業的指數型性能提升趨勢放在一起,一個清晰的圖像便浮現出來。

施里特維澤直言:「如果這些進步突然停止,那將會是極度令人意外的。」他認為,即使只是對現有趨勢進行相對保守的推斷,都指向一個明確的未來。他提出一個簡單卻強大的預測方法:在圖表上畫直線。「這聽起來可能過於簡化,但透過在圖表上延伸直線來做預測,很可能比大多數『專家』,甚至比多數領域專家,更能為你提供一個更好的未來模型。」

他的預測是:

- 到2026年中期,AI模型將能夠自主工作一整個工作日(8小時)。

- 在2026年底前,至少會有一款模型在眾多行業的表現上,能與人類專家匹敵。

- 到2027年底,模型在許多任務上的表現,將頻繁超越人類專家。

這個未來並非遙不可及,它就在指數曲線的下一段延伸線上。然而,當前的公共討論與政策制定,顯然尚未準備好應對如此巨大的變革。我們的心智模型,依舊習慣於用過去的步調去衡量未來,這種慣性,正是我們理解指數型成長最大的障礙。

在文章的討論區,有讀者提出AI的進步與病毒傳播或摩爾定律的機制不同。施里特維澤同意AI成長的因果過程更為複雜,但他巧妙地回應,摩爾定律本身就是一個絕佳的例子。它主要是一個統計觀察,但在很長一段時間內,要做出比「直接延伸對數圖上的直線」更好的預測,極其困難。他強調,至少在短期一到兩年內,同樣的邏輯極可能適用於AI的進展。

我們正處於一個關鍵的轉折點。數據和圖表所描繪的,是一個即將因AI而徹底重塑的經濟與社會樣貌。繼續用線性的、漸進的思維去應對一個指數型的現實,無異於在海嘯來臨前,還在爭論沙灘上的遮陽傘該擺在哪個位置。理解指數型成長,不僅是一個數學概念的認知,更是我們能否為未來做好準備的關鍵第一步。

Read more

把國防部當新創公司重開機:烏克蘭最年輕國防部長的五個月

把國防部當新創公司重開機:烏克蘭最年輕國防部長的五個月

烏克蘭網路上流傳一個關於費多羅夫的迷因,前後兩個版本剛好說明了這個人的轉變。早一點的版本是:「費多羅夫,能不能讓我們在 Diia App 上結婚?」現在的版本變成:「我想殺五萬個俄羅斯人。」一個把政府服務搬上手機、讓人民用 App 辦結婚的數位部長,五個月前接下了一個會用「每平方公里殲滅人數」當績效指標的位子。 2026 年 1 月,米哈伊洛·費多羅夫(Mykhailo Fedorov)從數位轉型部長轉任國防部長,成為烏克蘭史上最年輕的國防部長。他接手的爛攤子,用他自己整理的數字來看:3000 億赫夫納(hryvnia,烏克蘭貨幣,以 2026 年 6 月匯率約合 67 億美元)的預算赤字、大約 20 萬的兵力缺口、首都基輔瀕臨全面停電,而其他城市還在被沙赫德(Shahed)無人機砸。總統交給他的第一道命令很具體,把領土徵兵中心那套被罵到臭頭的強制動員機制收拾乾淨。

By Fox Hsiao
Claude 官方指南,如何打造 AI 原生新創公司

Claude 官方指南,如何打造 AI 原生新創公司

Anthropic 最近出了一本給創業者的電子書《The Founder's Playbook: Building an AI-Native Startup》,把創業的四個階段,構想(Idea)、最小可行產品(MVP)、上線(Launch)、規模化(Scale),按「AI 是核心基礎設施」拆解一遍。整本手冊其實建立在一個前提上,當寫程式、做研究、跑營運都能交給 AI agent,創辦人剩下要煩惱的,就只有方向對不對。 其中有個重要的提示,做得越快、越輕鬆,犯錯的代價反而越大,手冊引用了一個數字:在 AI 自主寫程式這類工具出現之前,就已經有 42% 的新創死於做出沒人要的東西,作者直接預測,這個比率只會往上爬。 工具把「做出來」的門檻降到接近零,卻沒有同步降低「

By Fox Hsiao
中國工程師才是真工程師:Palmer Luckey 在胡佛研究所訪談的反向結論

中國工程師才是真工程師:Palmer Luckey 在胡佛研究所訪談的反向結論

Anduril 創辦人 Palmer Luckey 近期上胡佛研究所《Uncommon Knowledge》接受 Peter Robinson 訪談。整段 53 分鐘從美國世界軍火店戰略、Anduril 怎麼挑戰洛克希德,一路聊到中國工程師密度、海軍要從三百艘擴張到一千艘。 訪談有一段冷戰小說反差的鏡頭,Palmer 要 Robinson 試試這個思想實驗:「想像雷根還在任的時候,出了一本湯姆克蘭西式的小說。他說再過 20 年,五角大廈所有最高機密的指揮管制終端、資訊顯示器跟其他電子裝置,都會在克里姆林宮監督下由蘇聯製造,而美國會以百萬計地採購。」 這當時根本不可想像,就算當虛構小說都沒人會相信。 接下來那句,他停了一下:「但這就是今天發生的事。五角大廈最大的筆電供應商是聯想,聯想是中國公司。他們總部有一根旗杆,掛著中國共產黨黨旗,下面才是聯想的 logo。」 整段論述的起點是這個畫面,Palmer 在訪談裡接著把問題往下挖了一層:美國已經把整套工程能力掏空了,而中國工程師才是真正的工程師。 「我們把真正的工程能力掏空了」 Palmer

By Fox Hsiao
新加坡外長的 AI 第二大腦:沒親手用過,就無法替國家做對決策

新加坡外長的 AI 第二大腦:沒親手用過,就無法替國家做對決策

2026 年 5 月一個下著雨的週六早上,新加坡 Capitol Kempinski 會場的舞台上,站著一位看起來不太像科技演講者的人。他先自我介紹,說自己是個退休的眼科外科醫師,繞進政壇大概繞得太久了,接著又補一句,站在這個場子裡,他覺得自己像個冒牌貨。 台下坐的是 AI Engineer Singapore 大會的觀眾,絕大多數是工程師、開發者、前沿模型團隊的人。而這位「冒牌貨」是新加坡現任外交部長 Vivian Balakrishnan。三個月前,他親手組了一套自己的 AI 助理,跑在一台兩三年前買的 Raspberry Pi 上,那台機器只有 8GB 記憶體。用了三個月之後,他在台上講了一句已經被很多媒體引用的話,說他老實講,已經不敢把它關掉了。 一個外長自己動手做 AI 工具,這件事本身就夠少見了。但他在台上講的那番話,比那套工具更值得記下來。他把整場演講收斂成三個訊息,

By Fox Hsiao