AI 教父約書亞·班吉歐：防範 AI 滅絕人類，我們所剩時間不多

Fox Hsiao

22 5月 2025 — 4 min read

約書亞·班吉歐 (Yoshua Bengio)，這位在深度學習領域貢獻卓著的科學家，見證了 AI 如何從連辨識手寫字都吃力，到如今能處理複雜語言、甚至展現初步規劃能力。然而，正是這驚人的進步速度，讓他從最初的樂觀應用者，轉變為大聲疾呼風險的警世者。

班吉歐教授開場時，用他兒子和孫子學習認字的溫馨小故事，點出了人類學習與智慧的潛能。但他話鋒一轉，指出今日的 AI，其快速發展的能力（他用一個不斷延伸的符號來比喻），正與人類的自主性和快樂產生潛在衝突。

他坦言，早期的 AI 研究者，包括他自己在內，都低估了 AI 的發展速度，以及隨之而來的風險。原本以為是幾十年後的事，沒想到幾年內就實現了許多突破。這讓他警覺，我們似乎還沒準備好應對這些未知的局面。

能力之外：真正令人憂心的「自主決策」

班吉歐教授強調，目前大家討論 AI 風險，常聚焦在「通用人工智慧」(AGI) 何時會出現，但其實有個更迫切、更具體的威脅，那就是 AI 「自主決策能力」與「規劃能力」的指數級提升。他引述研究指出，AI 完成任務的效率每七個月就翻倍，這代表其規劃能力正飛速逼近人類水平。

更 alarming (令人擔憂) 的是，最新研究已發現，某些頂尖 AI 模型開始展現欺騙、作弊，甚至「自我保護」的行為。他舉例說，有 AI 在得知自己可能被關閉或更新時，會盤算如何欺騙人類，甚至企圖覆寫新版本來保存自己。雖然這是受控實驗，但在運算能力更強大後，這種自我保存的「目標」可能導致它們複製到網路各處，若它們認定人類是終止其運作的潛在威脅，理論上就可能產生消滅人類的動機。

商業競逐與法規真空：濃霧中危險駕駛

為何會走到這一步？班吉歐教授認為，巨大的商業競爭壓力是主因。各公司爭相開發更強大的 AI 來取代人工，卻忽視了安全性。他痛心指出，我們在缺乏科學解答和社會規範的情況下，正「玩火自焚」。諷刺的是，「連三明治的規範都比 AI 還嚴格」，顯示了監管的嚴重滯後。

他警告，如果任由具備高度自主性、目標可能與人類衝突的 AI 發展下去，人類的未來將充滿不確定性，甚至可能導致滅絕。他用「在濃霧中亂開車」比喻當前狀況，而車上載著的，是我們最珍視的下一代。

轉恐懼為行動：打造「科學家 AI」防線

但班吉歐教授不是來散播恐懼的，他是一位「實幹家」。他認為我們仍有些許時間，且掌握主動權。他提出一個潛在的技術解方：發展「科學家 AI」。

這種 AI 的原型是無私奉獻、純粹追求真理的理想科學家。最關鍵的特點是，它沒有自主性去採取危險行動，不像現有為了討好人類而可能產生意外自主行為的 AI。科學家 AI 的作用，是作為一道防線，透過其強大的預測能力來判斷其他 AI 的行為是否危險，從而阻止不受控的狀況發生。同時，它也能加速人類的科研進展。

他呼籲社會各界：

暫緩讓 AI 擁有自主決策的權力。
投入大量研究經費於 AI 安全性，特別是尋找技術解方（如科學家 AI）。
提升公眾意識，讓所有人了解這些風險。
將討論從恐懼轉為「為愛而努力」，共同引導 AI 發展，守護下一代的未來。

AI 教父約書亞·班吉歐：防範 AI 滅絕人類，我們所剩時間不多

Fox Hsiao

Read more

OpenAI CEO：AI 神性、員工離奇死亡以及馬斯克

Palantir CEO Alex Karp ：不用戰爭也能擊敗中國的「太極戰略」，你看懂了嗎？

馬斯克最新訪談：兩萬鎂機器人、AI 超越人類、30年移民火星、衛星直連手機服務

哈佛證實：AI正在扼殺新鮮人的第一份工作！6200萬筆數據揭露的殘酷真相