AI 大神 Karpathy 的 AI 筆記流,一般人也能做到八成
我自己是幾乎不用筆記軟體的,身為一個不聰明的人,最常用的是 Apple 的備忘錄,但我覺得這篇大神的筆記流讓覺得蠻值得一試的,因為其實已經跟我現在用的 AI 工作流有點像,介於有筆記跟沒筆記中間惹 (?)
一般而言,大多數人用 ChatGPT 的方式,像是去便利商店買東西:有問題,問一下,拿到答案,關掉視窗,下次再從零開始。Karpathy 和 Lex Fridman 做的事情完全不同,他們讓 AI 幫自己蓋了一座圖書館,而且這座圖書館會自己長大。這篇文章會拆解這兩位 AI 領域最頂尖的人怎麼用 AI 做筆記,然後告訴你:不用寫程式,你也能做到八成。
先搞懂一件事:你用 AI 的方式可能一直在浪費
想像你手邊有兩個實習生,做事方式完全不同。實習生 A,你每次丟一個問題給他,他回答完就失憶了,下次問類似的問題,他又從頭查一遍。實習生 B 不一樣,他每次回答完會把資料整理成一本筆記,下次你再問相關問題,他翻筆記就能回答,而且越回答越快、越精準。
大部分人用 ChatGPT 的方式就是實習生 A。每次開新對話,之前聊過的東西全部消失,AI 對你的研究主題零記憶。Karpathy 做的事情,就是把 AI 變成實習生 B。
Andrej Karpathy 是 OpenAI 的共同創辦人之一,也是 Tesla 前 AI 總監,在 AI 領域的影響力無庸置疑。今年四月初他在 X 上發了一篇長文,描述自己怎麼用 AI 建立個人知識庫,Lex Fridman(MIT 研究員,全球最知名的科技 Podcast 主持人之一)馬上回覆說自己也有類似的系統。
兩個人的做法拆開來看,一般人其實能從裡面學到不少東西。
Karpathy 的系統:讓 AI 幫你蓋一座會自己長大的百科全書
他的流程分成六步:
第一步:把資料全部丟進一個資料夾
Karpathy 看到好文章、論文、GitHub 上的程式碼、資料集、圖片,全部存進一個叫 raw/ 的資料夾(raw 就是「原始、未加工」的意思,你可以把它想成電腦裡的「待整理」資料夾)。他用一個叫 Obsidian Web Clipper 的瀏覽器外掛,看到網頁按一下就存成本地檔案,就像你把所有參考資料丟進一個「未整理」的資料夾,不管它亂不亂,先存再說。
幾個名詞先解釋:
- Obsidian:一個免費的筆記軟體,所有筆記存在你自己的電腦裡(不是雲端),檔案格式是 Markdown(一種用簡單符號標記粗體、標題的純文字格式,任何軟體都打得開)。它最強的功能是筆記之間可以互相連結,像是你自己的維基百科
- GitHub:工程師放程式碼的平台,你可以先不管它
第二步:叫 AI 把亂七八糟的資料「編譯」成百科全書
整套系統最關鍵的一步在這裡,Karpathy 不是自己整理筆記,他叫 AI 讀完 raw/ 資料夾裡的所有原始資料,然後自動產出一本「wiki」,也就是一組有結構的筆記:自動寫摘要、自動分類、自動在相關主題之間建立連結。
換個方式想:你把一整疊亂七八糟的影印資料交給一個超級認真的助理,跟他說「幫我整理成一本有目錄、有索引、有交叉引用的參考手冊」,而且這個助理不會喊累。
重點來了:他幾乎不會手動去改這本百科全書。所有的整理、分類、連結、摘要,都是 AI 在維護。他只負責丟新資料進去,AI 負責把新資料消化進現有的知識體系裡。
這裡有一個 Obsidian 創辦人 Steph Ango 提出的重要提醒:你自己的筆記和 AI 產出的知識庫應該分開存放。如果混在一起,你的搜尋結果、連結圖、反向連結全部會被 AI 生成的內容淹沒,你再也分不清哪些是自己的想法、哪些是 AI 整理出來的。Karpathy 自己也確認了這一點,他的 raw/ 資料夾是親自整理的權威來源,AI 產出的 wiki 則獨立存放,每篇文章都有反向連結指回原始資料,隨時可以追溯來源。
第三步:直接對這本百科全書提問
當 wiki 長到一定規模(Karpathy 說他某個主題的知識庫大約有 100 篇文章、40 萬字),就可以直接對 AI 提問,AI 會去翻這本百科全書來回答你。
他本來以為要用一種叫 RAG 的技術(想像成「AI 先去圖書館翻資料再回答你」的機制),但發現 AI 自己維護的索引和摘要已經夠好了,不需要額外的搜尋系統。
回到實習生的比喻:你不用自己翻資料了,問問題就好,助理直接從他整理好的手冊裡找答案給你。而且因為手冊是他自己整理的,他知道每個資訊放在哪裡。
第四步:答案不只是文字
Karpathy 不是讓 AI 回一段文字就結束了,他會讓 AI 產出各種不同格式的輸出:
- Markdown 文件:就是格式化的筆記,可以在 Obsidian 裡漂亮地顯示
- Marp 簡報:一種把 Markdown 筆記直接轉成投影片的工具,不用開 PowerPoint
- matplotlib 圖表:用程式畫出來的長條圖、折線圖、圓餅圖
全部在 Obsidian 裡就能看,不用切換其他軟體。
但真正聰明的地方在後面:他會把這些查詢結果「回存」到百科全書裡。也就是說,你每次問的問題和得到的答案,都會變成知識庫的一部分。知識庫越用越厚,越厚越好用。
第五步:定期讓 AI 幫知識庫做「健康檢查」
Karpathy 會讓 AI 掃描整本百科全書,找出資料互相矛盾的地方、補上缺漏的資訊(用網路搜尋)、發現不同主題之間有趣的關聯。
類似的概念你在工作上一定見過:每季盤點一次檔案夾,看看有沒有過時的資料、重複的內容、或是漏掉的東西。只是這件事也交給 AI 了。
第六步:自己做小工具
他用 vibe coding 的方式做了一個簡易搜尋引擎,有網頁介面也有命令列版本。所謂 vibe coding,就是「用嘴巴告訴 AI 你想要什麼功能,AI 幫你寫程式」,不需要你自己真的會寫。
這一步對一般人來說比較進階,但概念很重要:當知識庫大到一定程度,你會自然想要更好的方式來搜尋和操作它。
Lex Fridman 怎麼把這套系統玩得更遠
Lex Fridman 在回覆裡說他有類似的系統,但多了兩個獨特的玩法。
互動式網頁取代靜態圖表
Karpathy 的輸出是靜態的圖表和簡報,Lex 更進一步,他讓 AI 直接產出帶有 JavaScript 的 HTML 頁面。Karpathy 拿到的是一張「列印出來的報表」,Lex 拿到的是一個「可以點、可以篩選、可以拖動的互動式儀表板」。你可以按不同條件排序資料、切換不同的視覺化方式,像是 Excel 的樞紐分析表但更靈活。
跑步時用語音學知識
Lex 最有意思的用法跟電腦完全無關,跟他的跑步習慣有關。他的工作是做 Podcast,需要研究的主題非常多。他會針對某個特定主題,讓 AI 從大知識庫裡抽出一份「精華版筆記」(他叫它 mini knowledge base),然後把這份精華版載入 AI 的語音對話模式。
接下來他去跑步,7 到 10 英里(大約 11 到 16 公里),一邊跑一邊用講的問 AI 問題,聽 AI 用語音回答。他自己形容這叫「互動式 Podcast」,差別在於這個 Podcast 的內容完全根據他的問題即時產生。
一般人通勤、運動、做家事的時間,其實都可以拿來學習。你不需要 Lex 那麼複雜的系統,光是用 ChatGPT 的語音模式,把你想搞懂的主題丟進去對話,效果就已經很好了。
一般人怎麼做:不用寫程式的三步驟版本
看到這裡你可能會想,Karpathy 是 OpenAI 共同創辦人,Lex 是 MIT 研究員,他們的系統一般人怎麼可能做到?
其實核心邏輯很簡單,工具可以換成你熟悉的。
步驟一:建立你的「原始資料庫」
你需要的工具:Obsidian(免費)或 Notion(免費版就夠)
做法很簡單:看到值得保存的文章、報告、筆記,全部存進同一個資料夾。不用管格式,不用管分類,先存再說。
如果你用 Obsidian,裝一個 Web Clipper 的瀏覽器外掛,看到網頁按一下就能存成筆記。如果你用 Notion,內建的 Web Clipper 也能做到類似的事。
重點:不要花時間整理,這是 AI 的工作。
步驟二:定期讓 AI「消化」你的資料
每週或每兩週,把你的原始資料丟給 ChatGPT 或 Claude,用這樣的提示:
「我收集了以下關於 [主題] 的資料,請幫我:1) 整理出核心概念清單,2) 為每個概念寫 2-3 句摘要,3) 標出不同概念之間的關聯,4) 列出目前資料裡還缺少哪些面向。」
把 AI 整理好的結果存回你的筆記軟體,這就是你的「wiki」。下次有新資料,再丟一次,跟 AI 說「根據之前的整理,把這些新資料也納入」。
聽起來很手動,確實是。Karpathy 用的是自動化腳本,但手動做每次大概花 10 到 15 分鐘,效果已經比你自己整理好太多了。
步驟三:對你的知識庫提問
當你的 wiki 累積到一定程度,開新對話的時候先把 wiki 貼給 AI 當背景資料,再問你的問題。AI 會根據你累積的所有資料來回答,而不是從零開始。要注意的是,AI 單次對話能讀的量有上限(ChatGPT 大約 10 萬字,Claude 大約 15 萬字),所以如果你的 wiki 太大,可以只貼跟當次問題相關的部分。
進階一點的做法:Claude 的 Projects(專案功能)可以把檔案上傳為專案知識,ChatGPT 的自訂 GPT 也能上傳知識檔案,兩者都可以讓你把 wiki 設成「永久背景」,每次開新對話不用重新貼。
如果你連手動貼都嫌麻煩,Google 的 NotebookLM 可能是目前最接近 Karpathy 這套概念的現成免費工具。你把文件丟進去,它會自動整理摘要,讓你直接對所有上傳的資料提問。它甚至有一個 Audio Overview 功能,可以把你的資料變成 Podcast 風格的語音對話,概念上就是 Lex 那個「互動式 Podcast」的簡化版。
Lex 的語音學習法也能做:把你的 wiki 精華丟進 ChatGPT 的語音模式,通勤的時候用講的問問題,AI 會根據你的資料回答。不需要跑步,搭捷運也行。
這件事真正改變的是什麼
Karpathy 在推文最後說了一句話:他覺得這整套流程應該變成一個正式的產品,而不只是「一堆拼湊的腳本」。這句話反過來也透露了一件事:目前這些工具還很原始,但核心概念已經成立了。
回到開頭的比喻,差別就在於你把 AI 當成便利商店還是圖書館。便利商店去一次拿一次,圖書館會記住你借過什麼、研究過什麼,你下次來的時候,圖書館員會說「上次你看的那本,這裡有一本相關的新書」。
Karpathy 和 Lex Fridman 做的事情聽起來很技術,但拆開來看,其實就是三件事:收集、讓 AI 整理、對整理好的東西提問。這三件事,你今天就能開始做。
唯一的門檻從來都跟技術無關,就是願不願意養成這個習慣,如果你讀完想試試看,最快的起步方式就是把這篇文章本身,或是下方 Karpathy 和 Lex Fridman 的原始貼文,直接丟進 ChatGPT 或 Claude 裡,跟 AI 說「根據這套方法,幫我設計一個適合我工作場景的版本」。用他們的方法論當起點,讓 AI 幫你客製化一套自己的流程,這件事本身就是在實踐他們講的概念。
相關資料
- Andrej Karpathy 原始推文:LLM Knowledge Bases
- Lex Fridman 回覆推文:Similar setup with voice-mode learning
- Obsidian 官方網站(免費筆記軟體)