數學接力:陶哲軒、直覺與 AI 的協作展示

數學接力:陶哲軒、直覺與 AI 的協作展示

如果數學界有搖滾巨星,那一定是保羅·艾狄胥(Paul Erdős)。

這位匈牙利數學家的一生就像一場永無止境的巡迴演出。他沒有家,沒有固定工作,全部家當都在一個破舊的皮箱裡。他會突然出現在某個數學家的家門口,敲敲門說:「我的大腦敞開了(My brain is open)。」然後住下來,和對方沒日沒夜地解題,直到靈感耗盡,再前往下一站。

艾狄胥是前網際網路時代的「人肉伺服器」。他連結了全世界的數學家,把問題從一個大腦傳遞到另一個大腦。他深知一件事:數學太難了,難到一個人無法獨自面對。

今天的艾狄胥不再需要搭飛機,也不用睡在別人的沙發上。他的大腦已經數位化,變成了一個網站——艾狄胥問題網(Erdos Problem Website)。而最近,這個數位大腦迎來了一位新夥伴,一位不知疲倦、運算速度以光速計的協作者:AI。

菲爾茲獎得主陶哲軒(Terence Tao)最近在該網站上的一場「人機接力賽」,向我們展示數學研究的未來型態。這不再是孤獨天才的獨角戲,而是一場由人類直覺、數位歸檔與 AI 驗證共同編織的「超級大腦」運算。

數位化的 Erdős 大腦

在深入那場精彩的接力賽之前,我們得先談談這個比賽場地:erdosproblems.com

這個由數學家 Thomas Bloom 維護的網站,不僅僅是一個題庫。它是艾狄胥遺留問題的「數位分身」。艾狄胥一生提出了數千個猜想,許多都懸賞了獎金(從 25 美元到數千美元不等)。過去,這些問題散落在信紙、黑板角落,或是老一輩數學家的記憶裡,隨著時間流逝而模糊。

艾狄胥問題網將這些問題結構化、標籤化,並賦予每個問題一個獨一無二的編號。這看似簡單的整理,實則為 AI 的介入創造了完美的「介面」。AI 也許不懂什麼是「數學之美」,但它非常擅長處理結構化的數據和明確定義的邏輯挑戰。

Bloom 的願景很清晰:他希望將數學變成一個「多人連線遊戲」。而現在,這個遊戲的玩家名單裡,多了矽基生命的名字。

#367 號問題的人機接力賽

截圖 2025-11-27 下午4.15.40.png

讓我們把鏡頭轉到最近發生的 艾狄胥問題 #367。這是一個關於數論的技術性問題,但解決它的過程,比問題本身更具啟發性。這不是某個天才靈光一閃的瞬間,而是一次完美的「分散式運算」。

第一棒:人類的直覺突破

截圖 2025-11-27 下午4.27.44.png

故事始於 11 月 20 日。數學家 Wouter van Doorn 對這個問題的第二部分提出了一個反證(disproof)。但他遇到了一個障礙:他的論證依賴於一個特定的「同餘恆等式」(congruence identity)。

Wouter 擁有數學家最寶貴的資產——直覺(Vibe)。他「感覺」這個恆等式是對的,但他沒有時間或工具去立刻驗證它。於是他把球傳了出來,在論壇上寫道:「我確信這裡有人能驗證這個恆等式確實成立...」

在過去,這句話可能會被淹沒在論壇的深處,等待某個有閒情逸致的研究生幾個月後看到。但這次不同。

第二棒:AI 的光速驗證

截圖 2025-11-27 下午4.27.52.png

陶哲軒接到了球。但他沒有拿起紙筆開始計算。身為當今最頂尖的數學家,他選擇扮演「指揮官」的角色。

他將這個恆等式丟給了 Google 的 AI 模型 Gemini Deepthink

結果令人震驚。原本可能需要人類數學家耗費數小時甚至數天進行繁瑣運算的過程,AI 在 10 分鐘內就完成了。Gemini Deepthink 不僅確認了恆等式成立,還給出了一個完整的證明。

有趣的是,AI 採取了一種「殺雞用牛刀」的策略。它使用了一種相當高深的 p-adic 代數數論方法來解決這個相對初等的問題。這就像是用核彈來打蚊子,但它有效。

陶哲軒隨後介入,發揮了人類的「審美」與「轉譯」能力。他花了大約半小時,將 AI 那個過於複雜的證明,改寫成一個更優雅、更初等的人類可讀版本,並發布在網站上。

第三棒:形式化的最後一哩路

到這裡,問題似乎解決了。但在數學的最高殿堂,光有證明還不夠,我們需要「絕對的確定性」。

兩天後,另一位數學家 Boris Alexeev 接手了最後一棒。他使用了 Harmonic 公司開發的 AI 工具 Aristotle,將陶哲軒整理好的證明,轉化為 Lean 語言。

Lean 是一種「互動式定理證明工具」,它能將數學證明變成電腦可以驗證的程式碼。這通常是數學研究中最枯燥、最耗時的步驟,被稱為「形式化」(Formalization)。許多數學家因為討厭寫程式碼而對此卻步。

但在 Aristotle 的協助下,Boris 僅用了兩三個小時就完成了形式化工作。為了確保萬無一失,防止 AI 產生幻覺或鑽漏洞(AI exploits),Boris 最後親自手動確認了最終的陳述(Final Statement)。

至此,艾狄胥問題 #367 的這部分(第二部分的否證)被徹底攻克。雖然這不代表整個 #367 號問題被完全解決,但針對這個特定子問題的攻防戰,從直覺猜想,到運算驗證,再到程式碼形式化,整個過程行雲流水。

從「獨行俠」到「指揮官」

這個案例標誌著數學家角色的根本轉變。

過去,數學家是孤獨的登山者,必須獨自背負所有的裝備(計算、文獻、證明細節)爬上頂峰。現在,他們更像是指揮官。他們負責制定戰略(提出猜想、定義問題),然後指派 AI 專員去執行戰術任務:

  1. 文獻搜索(Literature Search): 雖然在這個案例中,陶哲軒提到 AI 在文獻搜索上還不夠完美(它搞混了 #366 和 #367),但這只是時間問題。
  2. 運算驗證(Computation): 像 Gemini 處理繁瑣的代數運算。
  3. 形式化(Formalization): 像 Aristotle 將證明轉化為 Lean 代碼。

陶哲軒將這種新模式稱為 "Vibe Formalizing"(直覺形式化)。這是一個強大的概念。過去,從「直覺」(我覺得這是對的)到「形式化證明」(這是 Lean 代碼)之間,有一道巨大的鴻溝。這道鴻溝阻礙了無數好點子的實現。

現在,AI 架起了這座橋樑。數學家可以專注於產生高品質的「Vibe」,而將繁瑣的「Formalizing」交給 AI。這將極大降低形式化驗證的門檻,讓數學研究進入一個「零信任、全驗證」的新時代。


敬請免費訂閱、贊助本電子報

Mosky 從零開始 AI 寫程式

折扣碼:FOXAI

課程連結和限時優惠網址:https://pse.is/8dqy89

折扣金額:$250

Read more

教科書沒教的事,AI 自己學會了!AlphaFold 揭開生物學的隱藏規則

教科書沒教的事,AI 自己學會了!AlphaFold 揭開生物學的隱藏規則

「這太容易了,我們是不是作弊了?」 這是 DeepMind 的 AlphaFold 團隊在看到初步結果時的第一反應。他們甚至打電話給工程主管,懷疑自己是不是不小心把答案洩漏給了 AI。因為在科學研究中,進展通常是緩慢而痛苦的,像這樣勢如破竹的突破,感覺太不真實。 但這不是作弊,這是 AI 展現出的一種全新智慧。 在 Two Minute Papers 最新一集的訪談中,諾貝爾化學獎得主 John Jumper 揭示了 AlphaFold 最令人震驚的一面:它不僅僅是一個預測蛋白質結構的計算工具,它似乎通過「無監督學習」(Unsupervised Learning),掌握了生物學中連人類都尚未完全理解的深層語法。 這場訪談讓我們看到,我們正處於一個科學典範轉移的時刻——從「實驗驗證」走向「AI 預測」,生物學正在被重寫為一門資訊科學。 當 AI 學會了人類沒教的事 我們常認為 AI 只是在模仿人類餵給它的數據。如果教科書上沒寫,

By Fox Hsiao
DeepMind 最新紀錄片:從 Bullfrog 的小精靈到 AI 教父,Demis Hassabis 的傳奇進化史

DeepMind 最新紀錄片:從 Bullfrog 的小精靈到 AI 教父,Demis Hassabis 的傳奇進化史

在紀錄片《The Thinking Game》的開頭,鏡頭跟隨著一個男人的背影。他穿著一件普通的深色夾克,揹著背包,獨自走在倫敦的街頭,或是劍橋大學古老的校園裡。他的步伐不快,但每一步都顯得若有所思。周圍的人群熙熙攘攘,沒有人注意到這個身材不高的男人,大腦裡正運轉著可能徹底改變人類文明進程的程式碼。 他是 Demis Hassabis。 如果你只看新聞標題,你會知道他是 DeepMind 的創辦人、是 AlphaGo 的父親、是 2024 年諾貝爾化學獎的得主,是被稱為「現代圖靈」的 AI 教父。但在這部紀錄片裡,導演用大量的鏡頭捕捉了他「獨行」與獨白的時刻。那些畫面感覺安靜得令人不安,連封面照都令人有這種感覺。 這不是一個普通的科學家在散步。這是一個手握「火種」的普羅米修斯,正走在充滿未知的荒原上。他的大腦是全人類最珍貴的資產之一,卻也可能是最脆弱的單點故障(Single Point of Failure)

By Fox Hsiao
台灣 6 顆衛星搭 SpaceX 公車上太空,同一天俄羅斯載人航太歸零

台灣 6 顆衛星搭 SpaceX 公車上太空,同一天俄羅斯載人航太歸零

2025年11月29日,這一天在全球太空發展史上,或許會被記上一筆,不是因為有什麼驚天動地的科學發現,而是因為兩個發生在地球兩端的事件,如此巧合又如此諷刺地展示了新舊時代的權力轉移。 鏡頭先轉到加州范登堡太空軍基地(Vandenberg Space Force Base),SpaceX 的獵鷹九號(Falcon 9)火箭執行 Transporter-15 任務,這是一次標準的共乘發射,就像一輛準時發車的太空公車,載著來自世界各地的 140 個酬載飛向軌道。第一級火箭在完成任務後,第 N 次完美地降落在陸地回收區,一切都順利得近乎無聊,這種「無聊的成功」正是 SpaceX 統治力的最佳證明,它讓上太空這件事變得像搭飛機一樣日常。 然而就在兩天前,鏡頭轉到哈薩克的拜科努爾發射場(Baikonur Cosmodrome),曾經的太空霸主俄羅斯也進行了一次發射,Soyuz MS-28 載人太空船雖然成功升空,但地面的 Site 31/6 發射台卻在發射過程中發生嚴重事故,移動式維修塔(Movable Service

By Fox Hsiao
為什麼 Nvidia 不裁員?黃仁勳在劍橋揭示的「燉湯管理學」

為什麼 Nvidia 不裁員?黃仁勳在劍橋揭示的「燉湯管理學」

2025年的劍橋大學(Cambridge Union),氣氛莊嚴而熱烈。 在這座見證了牛頓(Newton)重新定義重力、達爾文(Darwin)質疑創世論、圖靈(Turing)想像思考機器的學術殿堂裡,迎來了 2025 年 Stephen Hawking Fellowship 的得主——Nvidia 創辦人兼 CEO,黃仁勳。 這個獎項的歷屆得主名單星光熠熠:2019 年是 Bill Gates,2020 年是 Jane Goodall,2023 年是 OpenAI 團隊。作為世界上任期最長的科技 CEO(執掌 Nvidia 33 年),黃仁勳的獲獎實至名歸。 然而,當他站在講台上,面對台下數百位頂尖學子時,他並沒有大談 H100 的算力突破,

By Fox Hsiao