NVIDIA 自駕野心解析:Musk 潑冷水「達到 99% 很容易,長尾超級難」

Share
NVIDIA 自駕野心解析:Musk 潑冷水「達到 99% 很容易,長尾超級難」

黃仁勳的宣言

2026 年 1 月 6 日,黃仁勳站在拉斯維加斯 CES 的舞台上,對著台下超過六千名觀眾說出一句話:「物理 AI 的 ChatGPT 時刻來了,機器開始能夠理解、推理,並在真實世界中行動。」

這句話的重量不輕。兩年前 ChatGPT 橫空出世,改變了人們對語言 AI 的想像,現在黃仁勳把同樣的期待放到了自動駕駛上。他發布的產品叫做 Alpamayo,這是一個開源的自動駕駛 AI 模型家族,號稱能讓車輛「像人類一樣思考」。

首款搭載 Alpamayo 完整技術堆疊的量產車是 Mercedes-Benz 的 2025 年款 CLA,預計今年在美國上路。NVIDIA 的汽車業務預計在 2026 財年達到 50 億美元營收,黃仁勳直言:「自動駕駛革命已經到來,汽車將成為最大的 AI 與機器人產業之一。」

但這真的是自動駕駛的 ChatGPT 時刻嗎?要回答這個問題,得先理解 Alpamayo 到底在做什麼。

什麼是 Alpamayo?

Alpamayo 是 NVIDIA 發布的一系列開源 AI 模型、模擬工具與資料集,核心產品是 Alpamayo 1,這是一個 100 億參數的視覺-語言-動作模型(Vision-Language-Action Model,簡稱 VLA)。NVIDIA 已將 Alpamayo 1 的模型權重開放在 Hugging Face 上,任何人都可以下載使用,這是 NVIDIA 首次以完全開源的方式釋出自動駕駛核心模型。

傳統的自動駕駛系統採用模組化架構,感知、預測、規劃、控制各自獨立,資訊在模組之間傳遞時會有損失。近年來業界開始轉向端到端(end-to-end)架構,用單一神經網路直接從攝影機影像輸出駕駛軌跡,Tesla 的 FSD 就是這個路線的代表。

Alpamayo 走的也是端到端路線,但加入了一個關鍵元素:鏈式思考推理(Chain-of-Thought Reasoning)。

鏈式思考推理是什麼?

想像一個場景:你開車經過一個路口,前方有行人正在過馬路,旁邊有一台腳踏車,紅綠燈剛從綠轉黃。人類駕駛會在腦中快速推理:行人還沒走完,我應該減速;腳踏車可能會突然切入,要保持距離;黃燈了,來不及過,準備停車。

傳統的端到端模型是「黑盒子」,直接從影像輸出軌跡,中間的推理過程不可見。Alpamayo 的做法是讓模型把推理過程「說出來」,產生一段文字描述它看到什麼、判斷什麼、為什麼這樣決定,然後才輸出駕駛軌跡。

這種做法有幾個好處。第一,可解釋性提高,當車輛做出某個決策時,你可以看到它的推理過程,而不是只能接受黑盒子的輸出。第二,推理能力泛化,當遇到訓練資料中沒見過的場景時,模型可以用推理來填補經驗的空白,而不是直接失敗。

技術架構

Alpamayo 1 的架構分為幾個部分。多鏡頭影像和車輛運動資訊先經過視覺編碼器處理,產生視覺 token,這些 token 連同文字輸入一起送進 VLM 主幹網路(Cosmos-Reason),模型會自回歸地產生推理文字和離散軌跡 token。在推理階段,一個基於 flow matching 的動作解碼器會把離散軌跡 token 轉換成連續且符合車輛動力學的路徑點。

簡單來說,這個模型會先「想」一遍,把想法寫下來,然後才「動」。

NVIDIA 提出了三個關鍵創新。第一是因果鏈資料集(Chain of Causation Dataset),透過自動標註加上人工審核的方式,產生與駕駛決策因果連結的推理標註。第二是模組化 VLA 架構,結合 Cosmos-Reason 與擴散式軌跡解碼器,能即時產生動態可行的路徑規劃。第三是多階段訓練策略,先用監督式微調讓模型學會推理,再用強化學習優化推理品質。

根據 NVIDIA 發布的數據,Alpamayo 1 在困難場景的規劃準確度比純軌跡基線提升了 12%,偏離道路率降低 35%,近距離碰撞率降低 25%。

為什麼「長尾問題」這麼難?

Elon Musk 在 X 上看到 NVIDIA 的發布後,留下一段評論:「他們會發現,達到 99% 很容易,但解決分布的長尾問題超級難。」他的 AI 負責人 Ashok Elluswamy 附和:「長尾太長了,大多數人無法理解。」

什麼是長尾問題?自動駕駛系統的訓練資料大多是「正常」的駕駛場景:直行、轉彎、停紅燈、讓行人,這些場景佔了 99% 以上,模型很容易學會。但真正致命的往往是那些罕見的邊緣案例:施工區的臨時標線、倒在路中間的樹、逆向行駛的腳踏車、突然衝出的動物。這些場景在訓練資料中極少出現,甚至從未出現,模型沒有足夠的經驗來處理,當遇到這些情況時,系統要不是直接失敗,就是做出危險的決策。

這就是長尾問題:常見情況很容易解決,但罕見情況的數量幾乎是無限的,而且每一個都可能致命。

Alpamayo 試圖用推理來解決這個問題。理論上,如果模型能夠理解因果關係,就能在遇到沒見過的場景時,用推理來推導出正確的行為。看到路中間有不明物體,推理它可能是障礙物,應該減速或繞開,而不是因為訓練資料中沒有類似案例就直接撞上去。

但 Musk 的質疑點在於:推理真的能解決長尾問題嗎?Tesla 已經累積了數十億英里的真實駕駛數據,他們的經驗是長尾問題幾乎是無窮無盡的,每解決一批邊緣案例,就會冒出新的一批。

說到底,兩家公司對問題本質的認知不同。NVIDIA 相信推理能力可以泛化,Tesla 相信只有海量數據才能覆蓋長尾。誰對誰錯,要等實際上路後才知道。

合作夥伴與落地時程

儘管有質疑,NVIDIA 的合作夥伴陣容相當驚人。這次 CES 2026 的重點是 Alpamayo 正式落地量產車。

Mercedes-Benz 是這次發布的核心。2025 年款 CLA 是首款搭載 NVIDIA DRIVE 完整技術堆疊的量產車,也是第一台整合 Alpamayo 推理能力的消費級車輛,獲得 2025 年歐洲 NCAP 最高安全評分。這台車具備 Level 2 進階輔助駕駛功能,支援點對點城市導航,預計今年底在美國實現免手駕駛。

NVIDIA 的汽車生態系還包括多家既有合作夥伴。Toyota 早在 2025 年 CES 就宣布加入 NVIDIA 陣營,全球最大的汽車製造商將在 NVIDIA DRIVE AGX Orin 上開發下一代車輛,運行經過安全認證的 NVIDIA DriveOS 作業系統。Aurora 與 Continental 的合作也源自去年,目標是 2027 年量產 Level 4 無人駕駛卡車,Aurora Driver 負責自動駕駛系統,Continental 負責量產製造,NVIDIA 提供運算平台。

其他合作夥伴還包括 JLR、Lucid、Uber,以及學術機構如 Berkeley DeepDrive。NVIDIA 把 Alpamayo 1 的模型權重完全開源,放在 Hugging Face 供任何人下載,希望透過開放生態加速整個產業的發展。

Musk 的態度:質疑但祝福

回到 Musk 的回應。他的完整評論是這樣的:「他們會發現,達到 99% 很容易,但解決分布的長尾問題超級難。我真心希望他們成功。」

這段話透露幾層意思:他認為 NVIDIA 的方向沒錯,但低估了問題的難度;他不認為 NVIDIA 是威脅,至少短期內不是;他樂見更多玩家投入自動駕駛,因為整個產業的進步對 Tesla 也有好處。

Tesla 和 NVIDIA 的路線差異在於數據。Tesla 有數百萬輛車在路上跑,每天產生海量真實駕駛數據,這是任何競爭對手都難以複製的優勢。NVIDIA 的優勢在於運算能力和開放生態,他們不自己造車,而是賣鏟子給淘金者。

兩條路線可能都會走向成功,也可能都會遇到瓶頸。自動駕駛的終局不會只有一個贏家,不同場景、不同市場可能需要不同的解決方案。

既是宣傳,也是願景

黃仁勳說「物理 AI 的 ChatGPT 時刻來了」,這句話既是宣傳,也是願景。ChatGPT 之所以成功,是因為它讓普通人能夠與 AI 對話,感受到 AI 的能力。自動駕駛要達到類似的「時刻」,需要讓普通人坐進車裡,放開方向盤,信任機器帶他們安全抵達目的地。

Alpamayo 是一個技術里程碑,鏈式思考推理為自動駕駛帶來了新的可能性。但從技術突破到大規模落地,中間還有很長的路要走。長尾問題不會因為一個新模型就消失,監管、保險、基礎設施都是待解的難題。

Mercedes-Benz CLA 今年在美國上路,這會是一個重要的測試。如果一切順利,我們可能真的站在自動駕駛普及的起點。如果出了問題,Musk 的話會被反覆引用:「達到 99% 很容易,長尾超級難。」

不管結果如何,2026 年的 CES 標誌著自動駕駛競賽進入了新階段。NVIDIA 把賭注押在推理能力上,Tesla 把賭注押在數據規模上,傳統車廠則在兩邊下注。最終誰會勝出,讓我們拭目以待。


相關資料:

Read more

Rocket Lab 的 Peter Beck 如何在富豪們的太空夢間殺出血路

Rocket Lab 的 Peter Beck 如何在富豪們的太空夢間殺出血路

《Relentless》podcast 主持人 Ti Morse 飛到紐西蘭的 Rocket Lab 總部,在訪談一開始就把數字攤開,Rocket Lab 過去五年的發射從 6 次長到 21 次,SpaceX 從 2021 年的 31 次長到 2025 年的 165 次,整個商業太空產業的擴張速度以倍數在跳。兩間公司的起點落差很大,早期馬斯克(Elon Musk)手上有 1 億美元的啟動資金,Ti Morse 問 Peter Beck 有多少,Peter 在鏡頭前帶著紐西蘭式幽默回答「100 美元」。後來他飛到美國募資時,給自己三週時間要拿到支票或滾出城。 兩間公司最後都做到每週一飛的發射節奏,但 Rocket

By Fox Hsiao
AI 時代 Claude Code 育兒法:她用 11 個代理人換來兩小時不理小孩

AI 時代 Claude Code 育兒法:她用 11 個代理人換來兩小時不理小孩

一個已經放棄技術夢的媽媽,養四個五歲以下的孩子 Jesse Genet 是 YC 2015 屆的創辦人,那家叫 Lumi 的包裝公司,幾年前賣掉了。離開戰場之後,她回歸家庭生下四個孩子,現在最大的五歲、最小的才四個月,全部在家自學。她原本打算未來五年不碰任何需要技術能力的新東西,這不是沮喪,只是承認現在的時間分配容不下那些。 六個月前這件事被翻過來了,她第一次打開終端機開始寫東西。兩三個月前她看著 Obsidian 社群的朋友聊 Claude Code,想清楚一件事:她可以趁孩子睡覺或自己玩的時候,建一群代理人替她工作。現在她有 11 個代理人,每天處理自學課表、教材採購、DoorDash 雜貨、家庭記帳,甚至能在她不碰 Mac Mini 的情況下,自己長出新的代理人。 這篇文章不是要你羨慕她有 11 個分身,真正值得記下來的是她反覆提到的一個詞:benevolent neglect,有意為之的放手。

By Fox Hsiao
NASA 月球基地計畫攤開看:三階段、七子系統、採購清單全公開

NASA 月球基地計畫攤開看:三階段、七子系統、採購清單全公開

這份文件該被當成徵求提案書來讀 2026 年 3 月 24 日,NASA 在華盛頓總部辦了一場叫「點火」(Ignition)的活動,邀請產業代表與國際太空社群到場。署長 Jared Isaacman 當場宣布,美國要在月球南極建一座月球基地(Moon Base),採分階段迭代推進。 這類宣示本身不稀奇,Artemis(NASA 自 2017 年啟動的月球重返計畫)已經喊了好幾年,大家多少聽過;真正值得停下來看的,是 NASA 在這次活動同步釋出的一份 16 頁文件《月球基地架構使用者指南》(Moon Base Architecture User's Guide)。 文件的真正讀者是產業、學界、國際夥伴,NASA 把月球基地要做的事、自己還不會的事、希望外面接哪幾塊,

By Fox Hsiao