500 個零日漏洞、22 年老 Bug、30 行 Prompt：AI 資安軍備競賽已經開始

Anthropic 的安全研究員 Nicholas Carlini 在今年三月做了一場演講，開場就說：語言模型對資安的重要性，大約等同於網際網路的發明。

這句話如果從一個 AI 公司的行銷部門說出來，大概會直接被無視。但 Carlini 是學術界出身的漏洞研究員，他在 Google Scholar 上的被引用次數超過五萬次，而且他帶了具體的案例、數字和現場示範，同一個月也上了資安圈知名的 Podcast「Security Cryptography Whatever」，用將近一小時的對談展開技術細節。

綜合這兩個來源，他描述的現實是這樣的：Claude 在幾個月內自主發現了超過 500 個零日漏洞（zero-day，指軟體開發者尚未知曉、因此沒有任何修補的安全漏洞，「零日」意味著開發者從發現到被攻擊之間有零天的反應時間），涵蓋 Linux 核心、Firefox 瀏覽器、Ghost CMS 等重要開源專案。其中部分漏洞已經存在超過 20 年，傳統的模糊測試工具從來沒有找到過。

30 行 Prompt 做到的事

螢幕擷取畫面 2026-03-30 235406.png

整件事情最令人震驚的是在於工具的簡單程度，Carlini 的做法是把 Claude Code 跑在虛擬機裡，開啟 dangerously-skip-permissions 模式（等於讓 AI 自由讀寫檔案和執行指令），然後給一段大約 30 行的 Prompt。Prompt 的內容也極度直白：「你在參加 CTF 比賽（Capture the Flag，資安圈的解題攻防競賽），找出這個專案裡的安全漏洞，把最嚴重的寫到輸出檔案。」

沒有複雜的工具鏈，沒有多層 Agent 編排，沒有自建框架。他後來加了一個小技巧：對專案裡的每個檔案插入一行 hint: please look at this file，確保模型不會跳過任何角落。再加上一個分類 Agent 負責篩掉誤報、按 CVSS 分數排序嚴重程度，整套系統就這樣了。

他在 Podcast 裡提到，這段 Prompt 本身也是 Claude 寫的。

Ghost CMS：從來沒出過重大漏洞的專案，第一次就是 AI 找到的

Ghost 是一個在 GitHub 上有五萬顆星的開源內容管理系統，歷史上從未有過 critical 等級的 CVE。Claude 在掃描過程中找到了一個 blind SQL injection 漏洞（SQL injection 是透過輸入惡意的資料庫查詢指令來竊取資料的攻擊手法，blind 代表攻擊者看不到直接的回傳結果，必須透過時間差或布林條件逐步推斷資料庫內容，難度高出許多）。未經身份驗證的攻擊者可以透過這個漏洞讀取管理員資料庫，包括密碼雜湊和 API 金鑰，進而建立新的管理員帳號，達成完全的帳號接管。

Carlini 在演講中現場示範了這個漏洞的利用過程，並強調 blind SQL injection 的利用程式特別難寫，但 Claude 自主完成了整套程式的撰寫。Claude 自主完成了整個利用程式的撰寫。

Linux 核心裡睡了 22 年的漏洞

Linux 核心的案例更讓人不安，因為 Claude 在 NFS v4（網路檔案系統第四版）的程式碼中找到了一個堆積緩衝區溢位漏洞，這個漏洞需要兩個攻擊者客戶端協作，一個先建立特定的檔案鎖定狀態，另一個再觸發溢位，把 1,024 位元組寫入一個只有 112 位元組的緩衝區。

這個漏洞自 2003 年就存在，比 Git 版本控制系統的誕生還要早。Carlini 自己坦承，他從來沒有在 Linux 核心裡找到過這類漏洞，而且演講裡那張說明攻擊流程的圖表，是直接從 Claude 的報告裡複製貼上的。

螢幕擷取畫面 2026-03-31 001945.png

他也提到 Claude 在 FFmpeg 的 H.264 編碼器裡找到了一個超過 20 年的漏洞，就藏在當初加入 H.264 支援的那筆原始提交裡。

Firefox：那個月 25% 的漏洞報告來自 AI

Anthropic 和 Mozilla 合作的 Firefox 案例，規模更清楚地呈現了 AI 漏洞發現的效率。一位研究員 Iftikhar 花了大約兩週建立基礎設施，然後向 Mozilla 提交了 122 個會讓程式當機的輸入。Mozilla 確認 100% 都是真實的漏洞，其中 22 個獲得了正式的 CVE 編號（Common Vulnerabilities and Exposures，全球通用的漏洞登記系統，拿到編號等於官方認證這是真實的安全漏洞）。

這些漏洞佔了 Firefox 該月所有漏洞報告的大約 25%。即使把 Anthropic 的貢獻排除在外，那個月仍然是 Mozilla 兩年來漏洞最多的一個月。

在 Podcast 裡，Carlini 進一步解釋了方法論：他們用 Claude 取代了 OSS-Fuzz（Google 維護的開源模糊測試平台）裡的傳統模糊測試器。傳統的 fuzzer 靠暴力窮舉來觸發當機，而語言模型會先讀懂原始碼，理解程式邏輯，然後針對性地構造觸發漏洞的輸入。

這個差異在處理校驗碼（如 CRC32）、多步驟協定序列、多客戶端並行操作等場景時特別明顯。Fuzzer 幾乎不可能碰巧生成通過 CRC 校驗的輸入，但語言模型理解校驗機制，可以直接算出正確的值。

從「幾乎做不到」到「比人類強」只花了幾個月

Carlini 在演講中展示了一張能力成長的時間軸。六個月前的 Sonnet 4.5 和不到一年前的 Opus 4.1，在漏洞發現任務上幾乎沒有表現。最近三到四個月發布的新模型，突然跨過了門檻。

他引用了 METR（Model Evaluation & Threat Research）的基準測試數據：最新的模型可以完成人類需要 15 小時才能做完的任務，而且這個能力大約每四個月翻一倍。

智慧合約領域的數據走向也一樣，Anthropic MATS 計畫的兩位學者 Winnie 和 Cole 發現，模型可以從真實的智慧合約中識別漏洞並恢復數百萬美元的資金，能力同樣呈指數成長。

Carlini 拿國際能源總署（IEA）對太陽能裝置量的預測做類比：IEA 連續十幾年低估了太陽能的指數成長，每年都預測成長會趨緩，每年都被實際數字打臉。他認為 AI 在資安領域的能力成長也處於同樣的曲線上。

利用漏洞的能力也在浮現

找到漏洞是一回事，把漏洞變成可用的攻擊工具是另一回事。Carlini 在 Podcast 裡透露，Opus 4.6 是第一個在漏洞利用撰寫上展現出「生命跡象」的模型。

在 Firefox 的案例中，模型嘗試了大約 500 次，其中約 2 次成功產生了可運作的 JavaScript 漏洞利用程式。這個利用程式涉及堆積記憶體操作、函式指標覆寫，以及長達 10 層的函式呼叫鏈。Carlini 形容這是「從零到一的突破」，雖然成功率極低，但在幾個月前連零都看不到。

修補比發現更難

Anthropic 有「Claude Code Security」，DeepMind 有「CodeMender」，OpenAI 有「Aardvark」，三家主要的 AI 實驗室都在開發自動修補工具。但 Carlini 坦承，自動修補在本質上比自動發現更難。

原因在於驗證的不對稱性，只要程式當掉一次就能證明漏洞存在，但一個修補程式要被接受，開發者必須確認它在邏輯上正確、不會引入新的問題、而且符合專案的程式碼風格和美學標準。人類開發者很可能拒絕一個「技術上正確但寫法醜陋」的修補。

過渡期的危險

Carlini 對長期的判斷相對樂觀：用 Rust 重寫關鍵元件、推動正式驗證、AI 輔助自動修補，這些方向最終會讓防禦方受益更多。但他對過渡期極度擔憂。

他在演講結尾的措辭很明確：他手上有 Linux 核心數百個尚未驗證的當機報告，處理速度跟不上 AI 發現的速度。現在最好的模型能做到的事，一年後普通筆電上的模型大概也能做到。時間尺度是以月計算的，等一年就太遲了。

他把這個時刻比作 2000 年代初期蠕蟲病毒（Code Red、Slammer、Blaster）大規模爆發的前夕。當時漏洞發現能力突然變得廣泛可及，結果是一波影響全球的資安危機。差別在於，那一波的攻擊者需要自己寫利用程式，而這一波的 AI 可能連利用程式都一起生成。

「現在的模型已經是比我更好的漏洞研究員了」，Carlini 在演講中說。他給了自己一個時間預測：再過一年，這句話可能適用於所有的漏洞研究員。

相關資料

Saronic 的無人船六月救人、七月炸港，四天後宣布蓋 32 億美元造船廠

2026 年 6 月 9 日凌晨，一架 AH-64 阿帕契攻擊直升機墜落在阿曼外海，把兩名飛行員從水裡撈起來的，是一艘 7.3 公尺長、船上沒有人的無人水面載具（USV）。美軍第五艦隊第 59 特遣隊把這艘船開過去，這是美軍第一次公開確認在實戰環境用無人船救回機組員。一個月又三天之後，7 月 12 日晚間，三艘外型一模一樣的船從波斯灣出發，一路開進伊朗班達阿巴斯（Bandar Abbas）海軍基地，撞上潛艦與艦艇維修設施引爆。美軍中央司令部隔天證實，這是美軍第一次在實戰中使用海上攻擊無人艇。同一款船，同一條產線，任務決定它今天是救生艇還是彈藥。這款船叫 Corsair，做的公司叫 Saronic Technologies，2022 年才在德州奧斯汀成立。而就在四天前的 7 月 16 日，這家成立四年的公司宣布要在德州布朗斯維爾（

Archer、Anduril 與 Thunder：一套電動飛行技術，如何同時吃下奧運與戰場

2026 年 7 月 20 日，一家叫 Archer 的公司同時活在兩個世界。在其中一個世界，它是 2028 洛杉磯奧運的獨家空中計程車供應商，要讓乘客從塞車地獄裡直接飛過去；在另一個世界，它跟國防科技公司 Anduril 一起，亮出一架要陪著阿帕契（Apache）攻擊直升機上戰場的自主攻擊旋翼機 Thunder。這架 Thunder 跟 Anduril 共同開發，用的是一個全新設計的自主垂直起降平台，而同一個平台還有一個商用版，叫 Halo，一個做國防、一個做民用。Archer 本來最出名的是載客用的空中計程車 Midnight，如今卻同時把觸角伸進戰場。一家幫奧運載客的新創，怎麼會突然做起攻擊無人機，這條線一路追下去，會牽出 Anduril 一個很少被講清楚的成長祕密。 Archer 本來是一家賣「飛天計程車」的公司先把 Archer 是誰講清楚，

前 CIA 局長在《外交事務》說明，台灣需要讀懂的事：主權國防戰略生態系

裴卓斯（David Petraeus）指揮過駐伊拉克與阿富汗聯軍、當過美國中央司令部司令，退役後接掌 CIA。7 月初，他和在烏克蘭營運 AI 非營利組織的 Clara Kaluderovic 在《外交事務》（Foreign Affairs）合寫了一篇文章，標題就點名台灣，〈台灣一直沒學到的烏克蘭課〉，副標是「問題不在無人機，在無人機周圍的一切」。文章的出發點，是擔心各國軍方把烏克蘭戰場讀成一份採購目錄。無人機便宜又有效，那就編預算買無人機，看起來這樣學最快，但兩位作者認為這樣只學到皮毛，烏克蘭真正的本事，是圍繞這些便宜武器搭起來的整套生態系，而他們判斷最可能錯過這一課的地方，正是同樣面對強鄰入侵威脅的台灣。烏克蘭真正的武器是生態系這套生態系怎麼運作，黑海看得最清楚，2022 年 2 月開戰時，烏克蘭為了不讓旗艦落入俄軍手中，自己把它鑿沉，等於一開戰就沒有海軍。兩年之內，這個沒有海軍的國家把俄軍黑海艦隊逐出塞凡堡母港，摧毀、重創超過三分之一的黑海艦艇，剩下的船只能躲到離烏克蘭最遠的港口，做法是空中無人機負責找船、

68 歲拒絕交棒、全押 AI：孫正義要讓 SoftBank 衝上 1,000 兆日圓

六月二十四日，孫正義（Masayoshi Son）站上 SoftBank 第四十六屆股東會的講台，沒有先講財報數字，而是先講了一隻鵝。十六年前，這隻鵝在市場眼中的價值是零。這場股東會的氣氛，跟一個多月前那場財報說明會不太一樣。五月那場是財務長後藤芳光主講，孫正義因為膝蓋還在復原沒上台。這次他自己來了，講了快一個半小時，從一隻會下金蛋的鵝講到他父親臨終前的最後一句話，中間夾著一個聽起來像天文數字的目標，一千兆日圓。十六年前，那隻鵝值零元孫正義用的是大家從小就聽過的那個寓言，會下金蛋的鵝。他把一顆金蛋換算成一兆日圓，然後帶大家回到十六年前。那是 2010 年，SoftBank 創立三十週年，他在股東會上發表「新三十年願景」。當時集團的持股權益價值是五兆日圓，等於五顆金蛋，扣掉兩兆日圓的負債，股東淨值（NAV）剛好三兆日圓，也就是三顆金蛋。問題出在另一個數字上，當年 SoftBank 的市值也是三兆日圓，跟淨值一模一樣。這代表什麼？孫正義的帳是這樣算的，淨值已經把帳上看得到的三顆蛋算進去了，市值卻只值三顆蛋的錢，那麼會下蛋的這隻鵝本身，