被裁一週收到所有大廠 offer!Meta FAIR 前總監:大型語言模型可能走錯路了

被裁一週收到所有大廠 offer!Meta FAIR 前總監:大型語言模型可能走錯路了

被裁還不到一個禮拜,田淵棟的手機就沒停過。2025年10月22日,Meta 裁減 AI 部門約600人,這位前 FAIR 研究總監是被裁員工之一。但與其他人不同,各大科技公司高層都在第一時間聯繫他,你能想到的大公司都來了,還有小公司和共同創辦的機會。168小時內,他收到的工作機會多到需要仔細考慮。

但這位在 Meta 待了多年的頂尖科學家似乎並不急著做決定。在訪談中,他穿著 FAIR 的衣服,語氣平靜,「我在被裁之前已經有工作機會了,因為我在公司待的時間多了,所以也許這個正好是個時機可以出來看看。」從頭到尾,他都是主動選擇的那一方。是什麼讓這位頂尖科學家,早在被裁前就已經想離開?

FAIR:從開放研究到產品導向的轉變

FAIR,全名 Fundamental AI Research,基礎 AI 研究實驗室,2013年12月由 Mark Zuckerberg 和圖靈獎得主 Yann LeCun 共同創立。當時的使命很明確:透過開放研究推進 AI 技術,造福所有人。這個實驗室做出了許多奠基性的貢獻,最知名的就是 PyTorch,現在已經是 AI 編程的事實標準。

但過去兩年,FAIR 經歷了劇烈變化。2024年1月重組,負責人 Joelle Pineau 離開,研究重心從基礎科學轉向可規模化的 AI 產品。到了2025年10月22日,600人被裁。更戲劇性的是,就在最近,創辦人 Yann LeCun 也宣布將離開 Meta,創立自己的新創公司。從基礎研究到產品導向,從開放探索到商業優先,FAIR 的轉變折射的是整個科技巨頭對 AI 研究態度的改變。

離開的理由:不只是被裁

表面上看,田淵棟離開 Meta 是因為裁員,但實際上這只是加速了一個早已醞釀的決定。「我早就跟主管說想尋找機會,」他說,「本來可能再待半年,裁員只是讓這個決定提前了。」對於被裁這件事,他的反應是「無所謂吧,就是反正我有工作機會。」

這種從容來自更深層的原因。2025年1月後,他轉到生成式 AI 團隊幫忙 Llama 4,「其實我們大部分時間沒有在做研究,就是在做各種比較救火的工作吧。」作為一個科學家,這不是他想要的狀態。研究被救火取代,探索被執行取代,當工作內容變質到這個程度,離開只是時間問題。

更關鍵的是,他對公司方向有感覺,感覺到裁員會來。雖然不方便透露太多公司內部情況,但他的態度很明確:「也許這正好是個時機可以出來看看。」說白了,他根本就是主動走的。當一個頂尖科學家開始質疑自己所處的方向,離開就成了必然。究竟是什麼讓他對現狀不滿?在訪談中,他毫不掩飾地表達了對當前 AI 路線的三大質疑。

三大質疑:對 AI 路線的深層反思

質疑一:大型語言模型是正確的路線嗎?

「我覺得大型語言模型呢,是一個很有意思的路線,但我不知道會不會是正確的路線。」田淵棟的這句話,道出了許多研究者不敢說的疑慮。作為科學家,他不會滿足於現有框架,「肯定不會在上面做到死。」

他提出的核心問題是:大型語言模型需要10兆以上詞元訓練,但人類一生只學習約100億詞元,中間有1000倍差距。「你怎麼樣去用人類的學習能力去彌補?很難彌補。」這背後指向的是對學習本質的質疑。

歷史上偉大的科學家沒看過那麼多書,沒接觸過那麼多數據,但能發現獨一無二的定理、證明、發明。這些能力從哪來?大型語言模型達到了嗎?「也許訓練算法並沒有達到最優,可能有更好的方式。」他甚至提出「暴論」:也許不要做梯度下降了,可能有別的方法。

質疑二:規模決定一切是悲觀的未來

「規模決定一切是一個悲觀的未來。」這是他最直白的論斷。為什麼悲觀?因為規模決定一切本身是個「很奇怪」的主題,任何模型都可以說塞數據就會有更好結果,「這個都是顯而易見的。」

他用自動駕駛做類比。一開始進展非常快,大家覺得馬上能取代人,但越往後問題越大。好的洞見和數據越來越難找,數據越來越少,模型就訓練不上去。大型語言模型會不會走上同樣的路?當數據紅利消失,當容易的進步都被摘完,剩下的是什麼?

真正應該追求的不是單純規模化,而是什麼樣的模型能在這條路線上走得更有效率。但現在產業的方向是什麼?更大的模型,更多的數據,更多的算力。這是技術進步,還是資源堆砌?

質疑三:通用 AI 神話,人類永遠領先

田淵棟用 GPT-o1 從零開始寫了一篇論文。結果是:沒有領域知識的問題建構缺乏創新性,必須靠研究員指出致命問題,AI 才能在正確方向上深入。這是他的親身經驗,也是他對通用 AI 最大的質疑。

「人對數據的獲取能力和深度挖掘能力永遠是超過計算機的。」人只需1到2個樣本就能看到本質,AI 需要幾百上千個。這根本就是本質上的能力差異。人有高層次的洞見,有領域知識,有對問題的獨到見解,有小領域專家的經驗,這些都無法量化。

「如果是這樣的話,那 AI 就只能永遠是跟在人後面走了。人通過某種比較好的資訊處理的方式獲得一些洞見,然後灌給計算機,灌給 AI,讓 AI 去在這個方向上做得更好。」這是他對通用 AI 最清醒的認識:AI 不會取代人類的創造力,只能增強它。

在 FAIR 的遺憾與收穫:研究品味是什麼

回顧在 FAIR 的時光,田淵棟有遺憾也有收穫。遺憾是「我應該在 FAIR 工程工作應該做更多一點可能好一點。」為什麼這麼說?因為理論和工程需要平衡,純做研究可能脫離實際。這是一個科學家的自我反思。

但最大的收穫是培養了研究品味。「2018年之後,我應該在這段時間之內,我有很多的研究品味。」什麼是研究品味?「有研究品味意味著就是自己給自己是一條道路可以往前走。」不需要別人告訴你該做什麼,知道什麼問題值得做,什麼方向有前景。

在 AI 產業快速變化中,研究品味比技術更重要。技術會過時,框架會改變,但判斷力不會。這是他在 FAIR 培養出的核心能力,也是各大公司搶著要他的原因。現在他收到很多工作機會,還在考慮,有大公司、小公司、共同創辦的機會,但他不急,「還需要想一想,還要考慮考慮。」這種從容,來自對自己能力和方向的確定。

頂尖科學家的選擇,折射了什麼

為什麼各大公司都來挖角?因為像田淵棟這樣有研究品味的科學家太稀缺。但這個故事折射的不只是個人價值,而是整個產業的困境。

當頂尖科學家開始質疑主流路線,當 FAIR 這樣的研究機構大規模裁員,當「做 AI 的人會越來越少」成為趨勢,這反映的是什麼?是 AI 產業進入成熟期的必然,還是方向選擇的警訊?是技術進步的代價,還是創新枯竭的前兆?

田淵棟還在考慮下一步。但有一點很清楚:無論他去哪裡,他都會帶著那些對大型語言模型路線的質疑,對規模決定一切的反思,對人類洞見的堅持。也許,正是這些質疑和反思,會帶來下一個突破。或者,正如他自己說的:「總有一天大家都沒有工作。」(笑)

Read more

AI 時代 Claude Code 育兒法:她用 11 個代理人換來兩小時不理小孩

AI 時代 Claude Code 育兒法:她用 11 個代理人換來兩小時不理小孩

一個已經放棄技術夢的媽媽,養四個五歲以下的孩子 Jesse Genet 是 YC 2015 屆的創辦人,那家叫 Lumi 的包裝公司,幾年前賣掉了。離開戰場之後,她回歸家庭生下四個孩子,現在最大的五歲、最小的才四個月,全部在家自學。她原本打算未來五年不碰任何需要技術能力的新東西,這不是沮喪,只是承認現在的時間分配容不下那些。 六個月前這件事被翻過來了,她第一次打開終端機開始寫東西。兩三個月前她看著 Obsidian 社群的朋友聊 Claude Code,想清楚一件事:她可以趁孩子睡覺或自己玩的時候,建一群代理人替她工作。現在她有 11 個代理人,每天處理自學課表、教材採購、DoorDash 雜貨、家庭記帳,甚至能在她不碰 Mac Mini 的情況下,自己長出新的代理人。 這篇文章不是要你羨慕她有 11 個分身,真正值得記下來的是她反覆提到的一個詞:benevolent neglect,有意為之的放手。

By Fox Hsiao
NASA 月球基地計畫攤開看:三階段、七子系統、採購清單全公開

NASA 月球基地計畫攤開看:三階段、七子系統、採購清單全公開

這份文件該被當成徵求提案書來讀 2026 年 3 月 24 日,NASA 在華盛頓總部辦了一場叫「點火」(Ignition)的活動,邀請產業代表與國際太空社群到場。署長 Jared Isaacman 當場宣布,美國要在月球南極建一座月球基地(Moon Base),採分階段迭代推進。 這類宣示本身不稀奇,Artemis(NASA 自 2017 年啟動的月球重返計畫)已經喊了好幾年,大家多少聽過;真正值得停下來看的,是 NASA 在這次活動同步釋出的一份 16 頁文件《月球基地架構使用者指南》(Moon Base Architecture User's Guide)。 文件的真正讀者是產業、學界、國際夥伴,NASA 把月球基地要做的事、自己還不會的事、希望外面接哪幾塊,

By Fox Hsiao
Anthropic 成長負責人:工程師變快 3 倍之後,PM 反而變成最稀缺的人

Anthropic 成長負責人:工程師變快 3 倍之後,PM 反而變成最稀缺的人

2026 年 2 月,Anthropic 的年化營收(ARR)達到 190 億美元,比 14 個月前的 10 億美元成長了 19 倍。對照組更荒謬:Atlassian、Palantir、Snowflake 這些老牌 B2B 軟體公司,經營 15 到 20 年之後的 ARR 大約落在 45 到 60 億美元之間,Anthropic 每隔幾個月就多加一個這樣的公司規模到自己的營收上。 這樣的成長速度背後,Anthropic 的成長團隊規模小到不成比例。2025 年中,整個成長行銷只有 Austin Lau 一個人在扛,paid search、paid social、

By Fox Hsiao
AI 大神 Karpathy 的 AI 筆記流,一般人也能做到八成

AI 大神 Karpathy 的 AI 筆記流,一般人也能做到八成

我自己是幾乎不用筆記軟體的,身為一個不聰明的人,最常用的是 Apple 的備忘錄,但我覺得這篇大神的筆記流讓覺得蠻值得一試的,因為其實已經跟我現在用的 AI 工作流有點像,介於有筆記跟沒筆記中間惹 (?) 一般而言,大多數人用 ChatGPT 的方式,像是去便利商店買東西:有問題,問一下,拿到答案,關掉視窗,下次再從零開始。Karpathy 和 Lex Fridman 做的事情完全不同,他們讓 AI 幫自己蓋了一座圖書館,而且這座圖書館會自己長大。這篇文章會拆解這兩位 AI 領域最頂尖的人怎麼用 AI 做筆記,然後告訴你:不用寫程式,你也能做到八成。 先搞懂一件事:你用 AI 的方式可能一直在浪費 想像你手邊有兩個實習生,做事方式完全不同。實習生 A,你每次丟一個問題給他,他回答完就失憶了,下次問類似的問題,他又從頭查一遍。實習生

By Fox Hsiao