Unity 暴跌 24%,但遊戲專家全說「反應過度」:他們知道什麼?
一天蒸發數百億美元
2026 年 1 月 30 日,美股遊戲類股集體崩盤。Unity 單日暴跌 24%,創下 2022 年以來最慘單日跌幅,Roblox 下跌 13%,AppLovin 重挫 17%,就連 Take-Two 和 CD Projekt 也分別下跌 7.9% 和 8.7%。原因只有一個:Google DeepMind 發布了 Project Genie,一個可以用文字提示詞生成可互動 3D 世界的 AI 工具。
投資人的邏輯很直觀:如果任何人都能用一句話生成遊戲,那遊戲引擎公司和遊戲開發商還有什麼價值?Unity 做的事情,AI 現在也能做了,對吧?
但遊戲產業的技術專家們看到這波恐慌,反應卻出奇一致。Mark Kern,《暗黑破壞神 2》的製作人、初代《魔獸世界》的團隊負責人,在 X 上發文:「我們正處於『威爾史密斯吃義大利麵』的發展階段。」這個比喻指的是早期 AI 影片生成的經典失敗案例,當時生成的威爾史密斯吃義大利麵影片詭異到令人發笑。他的意思很清楚:Genie 3 目前還非常早期,早期到不值得恐慌。
更有趣的是,幾乎每一位發表看法的遊戲產業專家,結論都是同一句話:逢低買入。
這篇文章要解釋的就是這個認知落差。投資人在怕什麼?專家為什麼不怕?以及,世界模型到底是什麼?
Genie 3 是什麼?
Google 到底發布了什麼?
Genie 3 是 Google DeepMind 開發的「世界模型」(World Model),它可以根據文字描述或圖片,即時生成一個可以互動的 3D 環境。你輸入「一座中世紀城堡,有護城河和吊橋」,它就會生成一個你可以在裡面走動的城堡場景。聽起來很厲害,對吧?
但前 Unity 和 Ubisoft 首席工程師 Sebastian Aaltonen 在 X 上列出了現實:這個系統的解析度是 720p,幀率是 24fps,記憶持久性最多只有 3 分鐘。3 分鐘之後,系統就會「忘記」之前發生的事情,你回到之前去過的地方,場景可能已經完全不同了。更重要的是,訂閱費用是每月 249.99 美元,而且每次使用被限制在 60 秒,還會被限流。Aaltonen 估計這套系統可能運行在價值 3 萬美元以上的 Nvidia B200 GPU 上。
用白話說:這是一個昂貴、緩慢、健忘的技術展示品。
這不是在貶低 Genie 3 的技術成就,畢竟能用文字即時生成可互動的 3D 世界,本身就是一項突破。問題在於,投資人把這個早期原型當成了遊戲產業的末日預兆,而技術專家們看到的是一個還需要多年發展才能實用化的研究計畫。
五位專家,同一個結論
第一位是 @jsnnsa,Spawn 創辦人,自稱寫過超過 25 萬行遊戲引擎程式碼。他的分析最為深入:「世界模型是某種真正全新的東西,一種我們還沒有名字的第三類媒體。」他指出,短期內這個技術對消費者來說太慢太貴,但對訓練機器人來說非常有價值,因為模擬一百萬種廚房場景正是具身 AI 所需要的。中期來看,如果加上聲音生成、更長的上下文、更多控制,這會變成一個讓 Netflix 害怕的東西。
但他話鋒一轉:「這是互動敘事。遊戲玩家玩遊戲是因為變強的樂趣、進度系統、機械掌握、懷舊感,他們會在一款遊戲上投入數月甚至數年。而且說實話,他們大多不在乎畫面或敘事。」
第二位是 Jacob Navok,Genvid 的執行長,曾在 Square Enix 社長室任職,還是艾美獎得主。他的比喻很精準:「用提示詞生成的遊戲會是遊戲界的 TikTok,而不是取代 3A 遊戲。」什麼意思?就是那種你玩幾分鐘的短暫體驗,小孩打發時間用的,不期待以完全相同的方式再玩一次。這跟 Fortnite 完全不一樣。
他進一步解釋:「遊戲最重要的特性之一是可重現性。當我玩遊戲時,我需要一致性。如果我在 Fortnite 開一槍,它造成的傷害、射速、距離,對每個玩家都必須一樣。如果我玩一款故事向遊戲,像 Final Fantasy,我可以按照作者設計的方式重新體驗那個故事的魔力。Genie 3 不是這樣運作的!它是一個機率性世界模型,意味著它每次都會變。」
他另一則貼文更直接:「人們應該逢低買入。Genie 3 短期內不會取代遊戲引擎或 Take-Two。Roblox 早就在開發類似技術好幾年了,而且可以在本地運行,不需要 3 萬美元的雲端 GPU。」他還補充了一個關鍵觀點:不要把基於大型語言模型的雲端服務,跟即時影片串流搞混。Genie 3 本質上是像素串流(pixel streaming),這是一項投資了將近二十年、但還沒有真正突破的昂貴技術。更重要的是,Genie 3 的運作方式是「分析影片並猜測下一幀會是什麼」,它缺乏底層的遊戲邏輯,這跟真正的遊戲引擎完全不同。
第三位是 Sebastian Aaltonen,前 Unity 和 Ubisoft 首席工程師,目前正在 HypeHype 開發新渲染器。他詳細列出了五大技術限制:持久性不到 3 分鐘、不支援與 NPC 或敵人互動、物理互動不穩定且不精確、運行成本極高、解析度僅 720p 24Hz。他的結論?「這對虛擬體驗來說是非常棒的技術,但我看不出這種技術在短期內有成為遊戲開發工具的明確路徑。我會逢低買入。」
第四位是 Mark Kern(Grummz),《暗黑破壞神 2》製作人、初代《魔獸世界》團隊負責人、《星海爭霸》開發者。他簡潔地列出三個問題:會遺忘玩家所在位置、運行成本極其昂貴、記憶持久性最多 3 分鐘。然後給出了那個經典比喻:「我們正處於威爾史密斯吃義大利麵的發展階段。」
第五位是 Unity 執行長 Matthew Bromberg 本人。他在 X 上發文解釋:「這些模型可以從自然語言或極少輸入生成高品質、可互動、類影片的體驗。但是,它們目前主要只能透過提示詞編輯,這限制了生產級遊戲機制所需的確定性和精確度。因此,它們的輸出仍然是機率性和非確定性的,單獨使用時不適合需要一致、可重複玩家體驗的遊戲。」
他不把這視為威脅:「我們把這視為強大的加速器。基於影片的生成正是我們的 Agentic AI 工作流程設計來利用的輸入類型,可以將豐富的視覺輸出轉換為初始遊戲場景,然後用 Unity 開發者今天使用的確定性系統來精修。」
五位專家,從獨立開發者到上市公司執行長,結論都是同一個:市場反應過度了。
第三類媒體:世界模型的真正身份
@jsnnsa 說世界模型是「第三類媒體」,這到底是什麼意思?
第一類媒體是被動媒體:電影、影集、YouTube 影片。觀眾只能看,無法改變劇情發展,導演決定你看到什麼,你就看到什麼。Netflix、Disney+、電影院,都是這個領域的玩家。這類媒體的特性是「一次創作,無限觀看」,每個觀眾看到的都是完全相同的內容。
第二類媒體是互動媒體:遊戲。玩家可以操控角色、做出選擇,但遊戲規則是確定的。每次在 Fortnite 開槍,傷害值都一樣;每次玩 Final Fantasy,劇情走向都按照設計師的安排;每次挑戰 Dark Souls 的 Boss,它的攻擊模式都可預測。Unity、Unreal Engine、Roblox,都是這個領域的基礎設施。這類媒體的特性是「確定性」,遊戲世界有固定的規則,玩家可以學習、掌握、精通這些規則。
第三類媒體是生成式世界:世界模型。這是一個全新的類別,每次生成都不一樣,沒有固定規則,沒有持久記憶。Aaltonen 說得很精確:這是「幾分鐘的幻覺」。你進入一個世界,探索幾分鐘,然後它就忘記你做過什麼。你再進入一次,可能看到完全不同的場景。
這是一種全新的媒體體驗,跟遊戲完全不同。
投資人的恐慌建立在一個錯誤假設上:他們以為 Genie 3 是來取代 Unity 的。但實際上,Genie 3 創造的是一種完全不同的體驗類型,就像 TikTok 沒有取代好萊塢電影一樣,世界模型也不會取代傳統遊戲。它們服務的是不同的需求、不同的使用場景、不同的用戶期望。
為什麼遊戲不會被取代?
為什麼「確定性」對遊戲至關重要?
首先是多人遊戲。@jsnnsa 寫道:「多人遊戲需要每個客戶端在每一幀都同意物理運算結果。」想像一下,如果你和朋友在玩同一場 Fortnite 對戰,但你看到的地形跟他看到的不一樣,你的子彈軌跡跟他計算的不同,這遊戲還怎麼玩?多人遊戲的基礎就是所有玩家共享同一個確定性的世界狀態。Genie 3 的機率性生成從根本上與此矛盾。
其次是速通社群。@jsnnsa 指出:「速通玩家需要跨越數千次嘗試的逐幀一致性。」速通是一種建立在遊戲可預測性上的藝術形式,玩家花費數百小時研究每一幀的物理運算,找出最佳路線。如果每次遊戲的物理都有微小變化,整個速通社群就無法存在。
第三是競技遊戲。「當現實是機率性的,你就不可能有排名系統。」電競產業價值數十億美元,建立在一個基本前提上:比賽是公平的,規則對每個人都一樣。如果遊戲世界本身是機率性的,每場比賽的條件都不同,那競技的意義何在?
Jacob Navok 說得更明白:「如果我在 Fortnite 開一槍手槍,它在相同距離對任何其他玩家造成相同的傷害、相同的射速。如果我玩一款故事向遊戲,像 Final Fantasy,我可以按照作者設計的方式重新體驗那個劇情的魔力。」
這些不是技術限制,是遊戲體驗的本質需求。世界模型解決不了這些問題,因為這些根本不是它要解決的問題。
誰該害怕?
如果遊戲公司不用怕,那誰該怕?
@jsnnsa:「中期來看,事情會變得有趣。加上聲音生成、更長的上下文、更多的控制,你就會得到一個讓 Netflix 害怕的東西。想像一下在《權力遊戲》季間探索 Westeros,漫遊《怪奇物語》的宇宙。這是真正的產品,而且即將到來。」
這才是世界模型的真正戰場:互動敘事。
想像一下,你剛看完《權力遊戲》最新一季,等待下一季要一年,但現在你可以進入一個 AI 生成的 Westeros,自己探索那片大陸,遇見 AI 生成的角色,經歷 AI 生成的冒險。每次進入都是不同的體驗,沒有「正確答案」,沒有「通關」的概念,就是純粹的沉浸式探索。
這種體驗不需要確定性,不需要可重現性,不需要競技公平性。它需要的是豐富的世界知識、多樣的內容風格、即時的生成能力,而這些正是世界模型的強項。
但這跟遊戲是兩回事。
@jsnnsa 寫道:「遊戲玩家玩遊戲是因為變強的樂趣、進度系統、機械掌握、懷舊感,他們會在一款遊戲上投入數月甚至數年。說實話,他們大多不在乎畫面或敘事。」世界模型擅長的東西,恰好是遊戲玩家不那麼在乎的東西;遊戲玩家真正在乎的東西,世界模型目前完全無法提供。
Tim Sweeney 的預言
在這場討論中,Epic Games 創辦人兼執行長 Tim Sweeney 提供了最平衡的觀點。
他在 X 上寫道:「去年 Fortnite 的 AI Darth Vader,現在 Gemini 的純世界模型,展示了 AI 進化的速度有多快。我們會看到『引擎中心 AI』和『世界模型中心 AI』之間持續的跳躍式競爭,直到它們結合在一起達到最大效果。」
他接著解釋兩者的優劣:「世界模型在廣泛的世界知識和混搭各種內容與風格方面有巨大優勢。引擎在穩定的世界表示、可重現的模擬、以及 GPU 和能源效率的渲染方面有巨大優勢。」
這個觀點很重要。Tim Sweeney 沒有說世界模型是威脅,也沒有說它無關緊要,他說的是:這是兩種不同的技術路徑,各有優勢,最終會融合。
Unity 執行長 Matthew Bromberg 的說法呼應了這一點:「我們把這視為強大的加速器。基於影片的生成正是我們的 Agentic AI 工作流程設計來利用的輸入類型。」換句話說,未來的遊戲開發可能是這樣的:用世界模型快速生成初始場景和視覺概念,然後用傳統引擎的確定性系統來精修遊戲機制。
兩者最終會融合,而非取代。
Codegen Agents 才是遊戲的未來
@jsnnsa 在他的推文串最後提出了一個關鍵觀點:「長期來看,世界模型可能會吃掉渲染器,生成像素而不是光柵化三角形。但遊戲邏輯、系統、作者設計的約束?那是完全不同的問題。而且是一個非常適合程式碼生成 AI 的問題。」
這句話值得深思。
如果 AI 要真正改變遊戲開發,關鍵可能不是世界模型,而是能夠理解遊戲設計意圖、自動生成遊戲邏輯程式碼的 AI 代理。想像一個系統,你告訴它「我想要一個 Roguelike 遊戲,有隨機生成的地牢、三種職業、漸進式難度曲線」,它就能生成完整的遊戲程式碼,而且這些程式碼是確定性的、可測試的、可精修的。
這才是會真正改變遊戲產業的東西,而不是一個生成幾分鐘幻覺的世界模型。
但也有人這樣說
當然,也有人認為這些專家可能看走眼了。
X 用戶 @Gonbat93 發了一則諷刺貼文,用 1903 年萊特兄弟首飛的視角來嘲諷這些分析:「航空投資者似乎不太懂交通技術......萊特飛行器只能在空中停留 12 秒,然後就會墜毀。你需要起飛和著陸每個街區。旅行需要持久性。這只是短暫的受控墜落。不支援攜帶任何有用的東西、乘客或貨物。大家都把馬車股票賣了嗎?當熱氣球到來時?」
他列出的「問題」跟專家們對 Genie 3 的批評如出一轍:持久性不足、無法承載有用內容、運行成本極高、容量極低。最後他的結論是:「這對航空展示來說是超級好的技術,但我看不出這種技術在短期內有成為交通工具的明確路徑。我會逢低買入。」
這個類比的殺傷力在於:萊特兄弟首飛時,所有「理性分析」都是對的。12 秒的飛行確實沒有實用價值,確實無法載客載貨,確實需要極端條件。但 66 年後,人類登上了月球。
專家們說的限制都是真的。問題是:這些限制是永久的,還是暫時的?回到開頭的問題:投資人在怕什麼?他們怕的是一個誤解。他們看到「AI 可以生成遊戲世界」,就以為遊戲引擎要被取代了。但專家們看到的是:這是一種全新的媒體類型,有自己的應用場景,但跟傳統遊戲根本不是同一個賽道。
這就是為什麼專家們說「免驚」。不是因為 Genie 3 不重要,而是因為它的重要性被錯誤地投射到了錯誤的地方。世界模型的未來在互動敘事、虛擬體驗、機器人訓練,而不是取代 Fortnite 或 GTA。
不過跟 SaaS 類股一樣,也許這些公司還是很賺錢,短期間內也看不到甚麼太大的問題,但問題就是 AI 對於產業的前景陰影太大了。
免責聲明:本文不構成投資建議。文中提及的股票分析僅為產業觀察,投資決策請諮詢專業財務顧問。
相關資料: