【客座文】MCP 是怎樣讓世界又更好一點點

最近研究 AI 領域的熱門新概念 MCP,原本覺得自己已經理解了,但當我第一次親眼看到 AI 透過 MCP 一口氣完成原本用 ChatGPT 要反覆多次才能解決的問題時,那種震撼感徹底顛覆了我的想像!發現自己對 MCP 從「理解」跟「體會」還是有一段落差。寫了一篇把我自己的心得打下來當作梳理自己的想法。

【客座文】MCP 是怎樣讓世界又更好一點點
mountains by GPT 4.5
本文作者,林裕欽,Dcard 共同創辦人與CEO,本文將帶您深入了解MCP如何突破傳統語言模型的限制,讓AI不僅能「說」,更能「做」。從理論到實踐,從現狀到未來,作者以親身體驗分享這項技術如何通過觀察與行動的循環,以及跨領域整合的網路效應,為我們的工作與生活帶來改變。

最近研究 AI 領域的熱門新概念 MCP,原本覺得自己已經理解了,但當我第一次親眼看到 AI 透過 MCP 一口氣完成原本用 ChatGPT 要反覆多次才能解決的問題時,那種震撼感徹底顛覆了我的想像!發現自己對 MCP 從「理解」跟「體會」還是有一段落差。寫了一篇把我自己的心得打下來當作梳理自己的想法。

▍MCP:讓 AI 把語言變成咒語 From language to spell

LLM 全文是 Large Language Model 大型語言模型,我們平常在使用 ChatGPT 的時候就是輸入一些文字、也是輸出一些文字。我們之所以會覺得 LLM 做出來得很聰明,把它稱為 AI,是因為那些文字用特定人類喜歡的規則排列。

例如蘊含很多知識量、條理分明、或富有創造力。然而不論這些文字多棒,單純資訊輸入輸出,能做的事情還是有限。我們使用 ChatGPT 時經常需要剪下貼上、或是按照 LLM 輸出的指示在現實生活中一步一步操作。有時候不小心做錯了、或是得到不如預期的結果,還要想辦法描述給 LLM 發生了什麼事情,等待下一步指令,實在令人很沮喪。

而 MCP (Model Context Protocol)的出現就是希望解決這樣的問題!MCP 是由 Claude 母公司 Anthropic 提出來的統一規範,讓 LLM 有了「控制」跟「觀察」其他事物的能力。LLM 一樣還是只是會文字的輸入輸出,但只要 LLM 按照規則輸出文字,就會由 MCP (client server host 架構) 把相關文字解讀成指令,去跟其他支援 MCP 的軟硬體互動。就像是有些文字突然變成咒語一般,讓依然只需要負責文字的 LLM 有了更多能力。

▍更好的觀察帶來更好的行動 Better Observations leads to better actions

看完第一段,你可能會用很多方式去描述:「這就是 API 的 API 吧!」「這是 AI 界的 USB!」這些說法都正確,但對有智能的 AI 的來說,改進不僅止「接起來」。

想像一個場景,今天如果我們左手打直拿著手機,再用右手點擊畫面上的一點,相信很多人都能夠輕鬆做到。然而同樣的任務,如果要求你只看一眼後閉上眼,右手再開始動作,要精準點擊到目標的難度就會大大大提升。這是因為一個看似簡單的動作,我們在運動的過程持續透過眼睛觀察去調整。

大腦會根據觀察到的訊號,時時調整每條相關肌肉的發力,最後達成看似簡單的目標。如果不會觀察,就很難把事情做好。繪畫、做菜、音樂、打球等皆是如此。每一次的短暫觀察與動作行為,讓每個任務變簡單,集合在一起就讓人類可以完成各式各樣了不起的事情。

最早將這樣觀察與行動循環帶入 LLM 領域的概念是 Agent。而早期的 Agent 能使用的外界工具有限,例如 Web Search 搜索網路上的結果。而 MCP 大大降低開發工具給 LLM 的門檻,同時賦予 LLM 「觀察」與「控制」外在事物的能力,讓許多任務透過觀察與控制循環得到更多資訊,達成原先 LLM 沒辦法一次就做到的事情。只看一眼後閉上眼睛,就像是我們過去下 prompt 指令一樣,希望 LLM 高表現一次就吐出正確答案。

而有了 MCP 後的 LLM 可以先「試試看」更多事情。例如叫 AI 寫個 3D 遊戲。它可以先試寫一段程式碼,透過 MCP 控制檔案系統跟遊戲編譯器,讓寫出來的程式碼跑起來看看。如果一但發現物理邏輯不如預期、或跑起來光線反射跟原先要求不一樣,可以再換段程式碼寫法,再試一次。

如此往復,讓遊戲越來越靠近用戶的要求。現在支援 MCP 的軟硬體還不算多,但正在以飛速增加中。最基礎如主流資料庫 mysql, postgres, bigquery 都有開源的 MCP 支援。上班族常用的 Excel、短推文媒體 X、財經資訊 Yahoo Finance 也都有 MCP 支援。因為能「試試看」的事情變多了,能做到的複雜任務也比過去多的更多。(ps. 懂寫程式的讀者可以去下載剛出爐的 claude code!寫程式的體驗會有 10x 的感受,看著 AI 自己寫 debug 程式碼試試看為什麼有 bug 的時候,我還記得自己在電腦前叫了出來!)

▍跨領域的網路效應 The Network Effects of Cross-Domain Integration

跨領域的人才能夠做出許多不可思議的事物。例如懂多國料理做法的廚師,能夠融合不同手法創作出新的料理。懂影像、音樂、心理學的講者,或許能把演講帶到下一個高度。人類世界有許多突破性的進展,是因為跨領域的借鏡跟串聯,最後形塑出許多美好事物。

我自己第一次體會到 MCP 震撼的時候,是把多個不同資料庫 MCP (postgres, bigquery) 設定好的第一次提問。原先需要好幾次 LLM 生成 SQL、查表格 、我再手動跑去不同介面執行的問題,支援 MCP 的 claude 一次提問就幫我完成。是 LLM 時代後又一次 10x 效率提升。

這時我想到如果掛上 dashboard (e.g. redash) 的 MCP。瞬間用自然語言產生一張可以持續使用、修改 dashboard 的全過程就被實踐了!這個過程不是簡單的自動化,而是 LLM 有意識的根據當前情境,做出下一步選擇,最後完成的傑出任務。每多一個 MCP,LLM 就對多一個領域有更多理解與控制的能力。

就像是有網路效應一般,能做到的排列組合以非線性增長。想像未來你只需對 AI 說:「幫我規劃一趟京都三日遊,要有美食和景點,而且我去過的地方不要去。」AI 就能自動連上飯店、餐廳訂位網站,甚至直接把行程表送到你的手機裡。現在之所以做起來還有點愚笨,是因為 MCP 不夠充足。

我們沒有及時的景點資訊、飯店跟餐廳訂位也沒有相對應好存取的 MCP。MCP 還在發展的早期,許多服務也因為技術採用速度、穩定性、商業模式考量等尚未支援。MCP 的設定對非工程師族群尚有一些門檻。

上述美好的情景不一定會那麼快發生,甚至因為技術以外的問題不會發生。我仍相信有一天人類能做到或不能做到的事情,都可能會透過 MCP 或其他類似概念,讓 AI 能夠學會,拼湊出更不一樣的世界。很多事情不需要我們再手工一步一步拼接!如果那一天到來,我還是想要叫 AI 去幫我買菜跟洗碗,讓我可以更好享受煮菜創作的過程,這世界總有些 AI 可能做得比我們好,但我們想自己來的事。

▍後記

MCP 或許很快就會像半導體一樣無縫融入生活,下一代的人或許會理所當然地享受它帶來的便利,甚至連這概念本身都無需知道。而我們,正幸運地見證著 AI 世界快速蛻變的關鍵時刻。

作者 : Dcard 有在徵 infra manager~我們有很多大規模併發、底層機構的挑戰~同時如果有對推薦演算法有經驗的人才我們也都很歡迎聊聊!幫忙介紹推薦成功我也會給推薦獎金喔!!https://boards.greenhouse.io/dcard/jobs/6475999

Read more

Word、HTML、JSON 全輸了:AI 時代最重要的格式 Markdown 是 22 年前發明的

Word、HTML、JSON 全輸了:AI 時代最重要的格式 Markdown 是 22 年前發明的

2004 年,一個部落客和一個 17 歲的天才一起做了一個純文字格式。 部落客叫 John Gruber,2002 年他做了一個在當時看起來完全不理性的決定:把自己的線上事業全部押在兩個東西上,蘋果和部落格。Anil Dash(Movable Type 的早期團隊成員,也是 Gruber 的朋友)後來回憶說,2002 年的蘋果才剛從瀕死邊緣走回來,幾乎沒有人在固定報導蘋果,更不用說「只寫蘋果」。當時連「科技新聞」這個領域都還不太存在,寫部落格的人也寥寥無幾。 第一台支援 Windows 的 iPod 剛推出,iPhone 還要再等五年。但 Gruber 就是把所有籌碼押在了 Daring Fireball 上,一個專寫蘋果的個人部落格。從那之後,蘋果的股價漲了大約 120,000%,而 Gruber

By Fox Hsiao
打造 Claude Code 的經驗:我們如何使用 Skills(翻譯)

打造 Claude Code 的經驗:我們如何使用 Skills(翻譯)

翻譯說明:本文翻譯自 Anthropic 工程師 Thariq Shihipar(@trq212)的文章 Lessons from Building Claude Code: How We Use Skills。Thariq 是 Claude Code 團隊的成員,這篇文章分享了 Anthropic 內部使用 Skills 的實戰經驗。翻譯由 Fox 完成,所有觀點與建議均為原作者立場。 Skills 已經成為 Claude Code 中最常被使用的擴充機制之一。它們靈活、容易製作、也容易分發。 但這種靈活性也讓人很難判斷什麼做法最好。哪些類型的 Skills 值得做?寫好一個 Skill 的祕訣是什麼?什麼時候該分享給其他人? 我們在 Anthropic 內部大量使用

By Fox Hsiao
8,300 萬美元的失敗和七頁投影片的成功:暴雪「姐夫」Jeff Kaplan 的遊戲設計三課

8,300 萬美元的失敗和七頁投影片的成功:暴雪「姐夫」Jeff Kaplan 的遊戲設計三課

Jeff Kaplan(暴雪玩家圈的「姐夫」)在 Lex Fridman 的 Podcast 上說了一句話,大意是:「我覺得魔獸世界成功的一大原因,是我們根本不知道自己在做什麼。」 這句話出自一個在暴雪(Blizzard)待了 19 年、先後主導魔獸世界(World of Warcraft,簡稱 WoW)和鬥陣特攻(Overwatch)兩款史上最具影響力遊戲的人。他 2002 年進暴雪的時候年薪 35,000 美元,職稱是初階遊戲設計師。他 2021 年離開的時候,鬥陣特攻全球玩家超過 5,000 萬。現在他帶著 34 個人的小工作室,在做一款叫 The Legend of California 的新遊戲。

By Fox Hsiao
1 兆美元從哪來?NVIDIA GTC 2026 三個最重要的訊號

1 兆美元從哪來?NVIDIA GTC 2026 三個最重要的訊號

去年 GTC,Jensen Huang 站在同一個舞台上說,AI 基礎設施到 2026 年底的累計營收將達到 5,000 億美元。 一年後的 GTC 2026,他把這個數字改成了 1 兆美元,時間拉到 2027 年,直接翻倍。 NVIDIA 本季營收約 780 億美元,年增 77%,連續 11 季成長超過 55%。市值 4.5 兆美元,全球最高。光是 AWS 一家就要部署超過 100 萬顆 NVIDIA GPU。過去一年,AI 原生新創公司拿到了 1,500 億美元的創投資金,

By Fox Hsiao