史上最大規模醫療AI誕生!英國用5700萬人健康資料訓練,預測病情、分配資源

史上最大規模醫療AI誕生!英國用5700萬人健康資料訓練,預測病情、分配資源

科技界巨頭與醫療體系結合,催生出前所未有的醫學人工智慧(AI)。最近,一個名為 Foresight 的生成式 AI 模型在醫療研究領域進行突破:它利用了來自英國國民保健署(NHS)高達 5700 萬名病患的去識別化健康紀錄進行訓練。這不僅是史上涵蓋人數最多的醫療 AI 訓練計畫,更是 首次將 AI 應用到一整個國家級規模的健康資料集上,為醫療研究和未來健康照護開啟了新的篇章。


這款 Foresight AI 模型擁有強大的預測能力,能根據個人的醫療歷史,預測未來可能發生的健康事件,例如:

  1. 住院風險: 哪些病患在未來較可能需要住院?
  2. 特定疾病發生: 是否有較高風險罹患心臟病、中風等數百種不同疾病?
  3. 其他健康狀況: 潛在的醫療需求或健康趨勢。
    研究人員在5月6日的記者會上表示,如果這些預測證實具有實用價值,Foresight 未來甚至有潛力直接用於輔助醫護人員判斷個別病患的照護需求,或是幫助 NHS 更有效地分配醫療資源。劍橋大學的健康數據科學家 Angela Wood 強調:「這是 AI 模型首次在醫療研究中使用到 5700 萬人的數據,是向前邁出的一大步。」
    巨量數據的力量:從何而來?涵蓋多廣?
    這個最新版本的 Foresight 是以 2018 年至 2022 年間的 NHS 數據為基礎,涵蓋了約 100 億個醫療事件。這些資料來源非常多元,包括:
  4. 醫院就診與住院紀錄
  5. 疫苗接種紀錄
  6. 家庭醫師(GP)看診紀錄
  7. 英國全國死亡登記資料

為了保護隱私,所有用於訓練的數據都經過嚴格的「去識別化」處理,移除了姓名、地址、出生日期等個人身份資訊。此外,模型目前只能在 NHS 內部建構的安全數據環境中運行,任何基於 Foresight 產生的研究預測結果在發布前也會經過篩選。


NHS 表示,雖然民眾可以選擇讓家醫科的紀錄不被用於研究或規劃,但其他類型的健康數據目前無法選擇退出這個資料集。對此,牛津大學的數據隱私研究員 Luc Rocher 也提醒,雖然去識別化已執行,但如此豐富的數據集本質上就很難做到「完全匿名」,這也讓它非常有價值;因此,這樣的模型必須嚴格由 NHS 控制,確保其在安全環境下使用。


台灣經驗:健保資料庫的價值、爭議與憲法判決


無獨有偶地,在台灣,根據財團法人法律扶助基金會探討台灣健保資料庫的文章,我們也擁有一個規模龐大且歷史悠久的健康資料庫——自 1995 年實施的全民健康保險所累積的健保資料庫。近 30 年來,涵蓋超過 2300 萬人的每次就醫、用藥、住院等詳細紀錄,使其成為生醫研究、公共衛生、醫療管理上的巨大資源。如同英國 NHS 資料的用途,台灣健保資料庫的數據也被廣泛應用於學術研究,並催生了數千篇國際論文,足見其價值。


然而,這些健保資料的原始蒐集目的是為了辦理保險業務(如醫療給付申請與支付)。當資料被用於原始目的以外的研究或其他用途時,即構成「二次利用」。這種未經個別同意的二次利用,在台灣引發了廣泛的隱私爭議。許多民眾和人權團體質疑,即使資料經過去識別化處理,仍可能存在隱私風險,並主張民眾應有權利選擇不讓自己的資料被用於這些二次用途,也就是行使「退出權」(Opt-out)。


這項爭議最終鬧上了台灣的憲法法庭。在 2022 年,憲法法庭做出了一份重要判決,雖然肯定了在符合特定條件下,健保資料的二次利用並不違憲(例如基於學術研究且無重大損害),但同時也嚴厲指出,台灣現行的法規制度在以下兩方面存在不足,不符合憲法對資訊隱私權的保障:一是缺乏一個獨立的、具公信力的個人資料保護監督機制;二是健保資料庫在使用上,缺乏足夠的組織與程序性防護措施。


更關鍵的是,憲法法庭明確確認人民擁有請求健保署停止將其資料用於原始蒐集目的外二次利用的權利(退出權)。判決要求相關政府機關必須在三年內(即 2025 年 8 月 12 日前)完成修法,建立獨立監督機制、強化資料庫安全防護,並明確規範民眾退出權的行使方式與例外。


這顯示即使資料具有巨大價值,如何在法規、制度與技術上確保隱私受到充分保障,並賦予民眾對自己健康資料的自主權,是利用龐大健康資料時必須嚴肅面對並解決的課題,也是台灣目前正在努力回應憲法要求的重要進程。


目前的應用與未來的可能性


儘管潛力巨大,英國 Foresight 目前的使用受到限制。它主要被用於大約 100 個與 COVID-19 相關的研究專案中,這是英國心臟基金會與 NHS 英格蘭合作的一部分,旨在利用病患數據研究疫情帶來的影響,例如因疫情導致的醫療預約取消等衝擊。任何超出此範圍的研究應用都需要額外批准。


研究團隊也正在積極評估 Foresight 的預測精準度。他們將利用模型根據病患在 2018-2022 年的數據,去預測他們在 2023 年罹患約 1000 種疾病的狀況,並與真實結果進行比對。倫敦大學學院的健康數據科學家 Chris Tomlinson 指出,這能幫助他們盡可能地接近「地面真相」(ground truth),驗證模型的有效性。


德國癌症研究中心的健康數據科學家 Moritz Gerstung 指出,NHS 這種龐大的數據規模,對於訓練出更精準的醫療 AI 模型至關重要,特別是在預測不常見疾病或解讀非典型醫療歷史方面具有顯著優勢。他也表達了申請在 NHS 數據上訓練自己團隊開發模型的興趣,認為 NHS 數據為生成式健康模型的訓練提供了「非常令人興奮的潛力」。


Foresight AI 的出現,代表著運用巨量、真實世界的健康數據來訓練 AI 的重要進展。它開啟了更精準預測疾病、優化醫療流程、甚至實現個人化精準醫療的可能性。然而,無論是英國正在啟動的國家級 AI 訓練,或是台灣健保資料庫多年來的應用與爭議,都共同指向一個核心挑戰:如何在推動醫療創新的同時,確保病患數據的安全與隱私不被洩露,並建立透明且受監督的資料治理框架。


這需要健全的法規基礎、嚴謹的技術措施,以及賦予民眾適當的資料自主權。NHS 在此扮演的角色,以及其採取的安全措施,如同台灣憲法法庭對健保資料庫治理提出的要求一樣,將是這項技術能否成功並取得公眾信任的關鍵基礎。

Medical AI trained on whopping 57 million health records
Researchers fed an artificial-intelligence model called Foresight with anonymized data from a huge swathe of patients in England’s National Health Service.

Read more

AI 商機大爆炸!紅杉資本:這次市場規模比雲端轉型大一個數量級,學會「隨機性思維」與「管理 AI Agents」

AI 商機大爆炸!紅杉資本:這次市場規模比雲端轉型大一個數量級,學會「隨機性思維」與「管理 AI Agents」

在 2025 紅杉資本 AI Ascent 大會上,紅杉合夥人 Pat Grady, Sonia, 和 Constantine 作為開場引言人,雖然謙稱只是「開胃菜」,但他們分享的觀察與觀點,猶如一道道精彩的前菜,為與會者描繪了 AI 時代的產業現況、發展速度,以及未來蘊藏的巨大機遇與挑戰。 AI 大浪為何如此重要?規模比你想的更巨大! Pat Grady 首先拋出創投界的經典框架:「這是什麼?為何重要?為何是現在?接下來怎麼辦?」他巧妙地省略了「這是什麼」(畢竟在場的都是 AI 專家),直接切入「為何重要」的核心。 他引用一張對比圖:雲端轉型 (Cloud Transition) 當時的市場規模約 4,000 億美元,這已經大於當時全球的軟體市場總和。而對比這次

By Fox Hsiao
NVIDIA 的「物理圖靈測試」,用 AI 生成影片訓練機器人?它們很快就能夠為你打掃煮飯

NVIDIA 的「物理圖靈測試」,用 AI 生成影片訓練機器人?它們很快就能夠為你打掃煮飯

在 AI 領域,我們常聽說圖靈測試(Turing Test)是衡量機器能否展現與人類無異對話能力的里程碑。如今,大型語言模型(LLM)似乎已悄悄地通過了這個測試,但大家對其突破已習以為常,甚至會因為語音助理慢了幾秒或程式碼沒被完全除錯而抱怨連連。 NVIDIA AI 研究總監、身為廣受矚目人形機器人專家 Jim Fan 指出,當前業界對 LLM 的驚人進步視為「只是又一個平常的星期二」(just yet another Tuesday),這反映了我們對文字世界 AI 的標準已大幅提高。 然而,當我們將目光轉向現實世界,讓機器人進行物理操作時,會發現挑戰巨大得多。 Jim Fan 在演講中提出了一個引人深思的概念:「物理圖靈測試 (Physical Turing Test)」。這個測試的想像情境是:如果你回家後,看到雜亂的房間被整理得乾淨俐落,甚至還準備了一頓浪漫的燭光晚餐,而你無法分辨這是由真人還是機器人完成的,那代表這個機器人通過了物理圖靈測試。 但現實呢?看看那些連站起來都困難的人形機器人,

By Fox Hsiao
前蘋果設計長 Jony Ive 罕見受訪,科技產品為何不能沒有「喜悅」與「幽默」

前蘋果設計長 Jony Ive 罕見受訪,科技產品為何不能沒有「喜悅」與「幽默」

在前 Apple 傳奇設計長、現任 LoveFrom 創辦人 Jony Ive 少數的公開露面場合中,他與 Stripe 創辦人 Patrick Collison 在 2025 年 5 月 7 日於舊金山舉行的 Stripe Sessions 大會上,進行了一場深度爐邊對談(fireside chat)。這場大會主題聚焦於可程式化金融基礎設施(programmable financial infrastructure),而 Ive 在此背景下,分享他對於設計哲學、科技產業演變及團隊文化的洞察,探討的內容遠超越了單純的支付或金融議題,觸及了科技與人性更廣泛的連結。 從服務人性的初心,到金錢與權力的驅動 Ive 回憶起 1992 年剛來到矽谷時,感受到的是一種「天真爛漫的興奮」(innocent euphoria),當時科技界普遍懷抱著「服務人類」

By Fox Hsiao
金流龍頭 Stripe CEO:AI 與穩定幣雙引擎正在強力驅動經濟

金流龍頭 Stripe CEO:AI 與穩定幣雙引擎正在強力驅動經濟

Stripe 共同創辦人暨執行長 Patrick Collison 在開場演講中,揭示網路經濟的驚人成長動能,並強調在當前全球經濟充滿不確定性之際,有兩股「巨風」正以前所未有的力量重塑商業地貌:人工智慧(AI)與穩定幣(Stablecoins)。Stripe 則致力於打造可程式化的金融服務,協助企業駕馭這波變革。 網路經濟強勁增長,Stripe 扮演推手 Patrick Collison 首先分享了 Stripe 生態系的亮眼成績:2024 年,使用 Stripe 的企業總營收成長速度是標普 500 指數成分股企業的七倍。Stripe 平台上新增的支付量高達 4,000 億美元,相當於 Stripe 生態系的「GDP」成長。全年總處理支付金額超過 1.4 兆美元,佔全球 GDP 約 1.

By Fox Hsiao