【客座文】MCP 是怎樣讓世界又更好一點點

最近研究 AI 領域的熱門新概念 MCP,原本覺得自己已經理解了,但當我第一次親眼看到 AI 透過 MCP 一口氣完成原本用 ChatGPT 要反覆多次才能解決的問題時,那種震撼感徹底顛覆了我的想像!發現自己對 MCP 從「理解」跟「體會」還是有一段落差。寫了一篇把我自己的心得打下來當作梳理自己的想法。

【客座文】MCP 是怎樣讓世界又更好一點點
mountains by GPT 4.5
本文作者,林裕欽,Dcard 共同創辦人與CEO,本文將帶您深入了解MCP如何突破傳統語言模型的限制,讓AI不僅能「說」,更能「做」。從理論到實踐,從現狀到未來,作者以親身體驗分享這項技術如何通過觀察與行動的循環,以及跨領域整合的網路效應,為我們的工作與生活帶來改變。

最近研究 AI 領域的熱門新概念 MCP,原本覺得自己已經理解了,但當我第一次親眼看到 AI 透過 MCP 一口氣完成原本用 ChatGPT 要反覆多次才能解決的問題時,那種震撼感徹底顛覆了我的想像!發現自己對 MCP 從「理解」跟「體會」還是有一段落差。寫了一篇把我自己的心得打下來當作梳理自己的想法。

▍MCP:讓 AI 把語言變成咒語 From language to spell

LLM 全文是 Large Language Model 大型語言模型,我們平常在使用 ChatGPT 的時候就是輸入一些文字、也是輸出一些文字。我們之所以會覺得 LLM 做出來得很聰明,把它稱為 AI,是因為那些文字用特定人類喜歡的規則排列。

例如蘊含很多知識量、條理分明、或富有創造力。然而不論這些文字多棒,單純資訊輸入輸出,能做的事情還是有限。我們使用 ChatGPT 時經常需要剪下貼上、或是按照 LLM 輸出的指示在現實生活中一步一步操作。有時候不小心做錯了、或是得到不如預期的結果,還要想辦法描述給 LLM 發生了什麼事情,等待下一步指令,實在令人很沮喪。

而 MCP (Model Context Protocol)的出現就是希望解決這樣的問題!MCP 是由 Claude 母公司 Anthropic 提出來的統一規範,讓 LLM 有了「控制」跟「觀察」其他事物的能力。LLM 一樣還是只是會文字的輸入輸出,但只要 LLM 按照規則輸出文字,就會由 MCP (client server host 架構) 把相關文字解讀成指令,去跟其他支援 MCP 的軟硬體互動。就像是有些文字突然變成咒語一般,讓依然只需要負責文字的 LLM 有了更多能力。

▍更好的觀察帶來更好的行動 Better Observations leads to better actions

看完第一段,你可能會用很多方式去描述:「這就是 API 的 API 吧!」「這是 AI 界的 USB!」這些說法都正確,但對有智能的 AI 的來說,改進不僅止「接起來」。

想像一個場景,今天如果我們左手打直拿著手機,再用右手點擊畫面上的一點,相信很多人都能夠輕鬆做到。然而同樣的任務,如果要求你只看一眼後閉上眼,右手再開始動作,要精準點擊到目標的難度就會大大大提升。這是因為一個看似簡單的動作,我們在運動的過程持續透過眼睛觀察去調整。

大腦會根據觀察到的訊號,時時調整每條相關肌肉的發力,最後達成看似簡單的目標。如果不會觀察,就很難把事情做好。繪畫、做菜、音樂、打球等皆是如此。每一次的短暫觀察與動作行為,讓每個任務變簡單,集合在一起就讓人類可以完成各式各樣了不起的事情。

最早將這樣觀察與行動循環帶入 LLM 領域的概念是 Agent。而早期的 Agent 能使用的外界工具有限,例如 Web Search 搜索網路上的結果。而 MCP 大大降低開發工具給 LLM 的門檻,同時賦予 LLM 「觀察」與「控制」外在事物的能力,讓許多任務透過觀察與控制循環得到更多資訊,達成原先 LLM 沒辦法一次就做到的事情。只看一眼後閉上眼睛,就像是我們過去下 prompt 指令一樣,希望 LLM 高表現一次就吐出正確答案。

而有了 MCP 後的 LLM 可以先「試試看」更多事情。例如叫 AI 寫個 3D 遊戲。它可以先試寫一段程式碼,透過 MCP 控制檔案系統跟遊戲編譯器,讓寫出來的程式碼跑起來看看。如果一但發現物理邏輯不如預期、或跑起來光線反射跟原先要求不一樣,可以再換段程式碼寫法,再試一次。

如此往復,讓遊戲越來越靠近用戶的要求。現在支援 MCP 的軟硬體還不算多,但正在以飛速增加中。最基礎如主流資料庫 mysql, postgres, bigquery 都有開源的 MCP 支援。上班族常用的 Excel、短推文媒體 X、財經資訊 Yahoo Finance 也都有 MCP 支援。因為能「試試看」的事情變多了,能做到的複雜任務也比過去多的更多。(ps. 懂寫程式的讀者可以去下載剛出爐的 claude code!寫程式的體驗會有 10x 的感受,看著 AI 自己寫 debug 程式碼試試看為什麼有 bug 的時候,我還記得自己在電腦前叫了出來!)

▍跨領域的網路效應 The Network Effects of Cross-Domain Integration

跨領域的人才能夠做出許多不可思議的事物。例如懂多國料理做法的廚師,能夠融合不同手法創作出新的料理。懂影像、音樂、心理學的講者,或許能把演講帶到下一個高度。人類世界有許多突破性的進展,是因為跨領域的借鏡跟串聯,最後形塑出許多美好事物。

我自己第一次體會到 MCP 震撼的時候,是把多個不同資料庫 MCP (postgres, bigquery) 設定好的第一次提問。原先需要好幾次 LLM 生成 SQL、查表格 、我再手動跑去不同介面執行的問題,支援 MCP 的 claude 一次提問就幫我完成。是 LLM 時代後又一次 10x 效率提升。

這時我想到如果掛上 dashboard (e.g. redash) 的 MCP。瞬間用自然語言產生一張可以持續使用、修改 dashboard 的全過程就被實踐了!這個過程不是簡單的自動化,而是 LLM 有意識的根據當前情境,做出下一步選擇,最後完成的傑出任務。每多一個 MCP,LLM 就對多一個領域有更多理解與控制的能力。

就像是有網路效應一般,能做到的排列組合以非線性增長。想像未來你只需對 AI 說:「幫我規劃一趟京都三日遊,要有美食和景點,而且我去過的地方不要去。」AI 就能自動連上飯店、餐廳訂位網站,甚至直接把行程表送到你的手機裡。現在之所以做起來還有點愚笨,是因為 MCP 不夠充足。

我們沒有及時的景點資訊、飯店跟餐廳訂位也沒有相對應好存取的 MCP。MCP 還在發展的早期,許多服務也因為技術採用速度、穩定性、商業模式考量等尚未支援。MCP 的設定對非工程師族群尚有一些門檻。

上述美好的情景不一定會那麼快發生,甚至因為技術以外的問題不會發生。我仍相信有一天人類能做到或不能做到的事情,都可能會透過 MCP 或其他類似概念,讓 AI 能夠學會,拼湊出更不一樣的世界。很多事情不需要我們再手工一步一步拼接!如果那一天到來,我還是想要叫 AI 去幫我買菜跟洗碗,讓我可以更好享受煮菜創作的過程,這世界總有些 AI 可能做得比我們好,但我們想自己來的事。

▍後記

MCP 或許很快就會像半導體一樣無縫融入生活,下一代的人或許會理所當然地享受它帶來的便利,甚至連這概念本身都無需知道。而我們,正幸運地見證著 AI 世界快速蛻變的關鍵時刻。

作者 : Dcard 有在徵 infra manager~我們有很多大規模併發、底層機構的挑戰~同時如果有對推薦演算法有經驗的人才我們也都很歡迎聊聊!幫忙介紹推薦成功我也會給推薦獎金喔!!https://boards.greenhouse.io/dcard/jobs/6475999

Read more

加密貨幣金融卡 EtherFi 與 RedotPay 說明與推薦 ,回饋 3% 與出金怎麼選

加密貨幣金融卡 EtherFi 與 RedotPay 說明與推薦 ,回饋 3% 與出金怎麼選

隨著加密貨幣在全球加速普及,使用加密貨幣,尤其是使用穩定幣消費的需求也變得前所未有的迫切。數位資產過去大多數僅限於在交易所交易,或作為投資存放在錢包裡,但如今隨著加密貨幣金融卡的普及,正使得數位資產的使用逐漸走入日常生活。 加密貨幣金融卡可以將比特幣、以太幣或穩定幣等加密貨幣儲值到卡片中,並使用這些資金以美金或者台幣等法定貨幣來支付商品和服務。 與提供信用額度的信用卡不同,加密貨幣金融卡必須使用數位資產預先儲值,在儲值後,它將在每筆交易當下自動轉換為法定貨幣,可以像使用傳統簽帳金融卡一樣使用該卡,無需手動兌換,儲多少用多少。 我怎麼加密貨幣金融卡消費? 其實跟一般的信用卡消費相同,唯一需要注意的是,當你在刷卡的時候會詢問你要利用當地貨幣或者是美金結這筆消費,根據業內人士建議,通常是選擇發卡的幣別,比如說 RedotPay 我們拿到的會是美金卡,所以請用美金計算該筆消費。 * Apple Pay 類的行動支付:大部分的加密貨幣金融卡平台支援 Apple Pay、Google Pay 等,所以可以在實體店頭利用手機感應支付。 * 店內付款:在任何接受實體信用卡的刷卡機上使用

By Fox Hsiao
90億美金獨角獸 Cursor CEO:我們尋找的不是碼農,而是有品味的創造者

90億美金獨角獸 Cursor CEO:我們尋找的不是碼農,而是有品味的創造者

本集 Y Combinator 的掌舵手 Garry Tan 對話的主角,是 AnySphere 的共同創辦人兼執行長 Michael Truell。他所打造的 AI 輔助程式開發平台 Cursor,正掀起一場寧靜卻深刻的革命。成立僅僅 20 個月,年度經常性收入(ARR)便衝破一億美元,公司估值飆升至 90 億美元。 在這場由 Garry Tan 主持的深度訪談中,Truell 揭示的並非僅是商業上的巨大成功,而是一個更為顛覆性的宏大願景:一個「後程式碼時代」的到來,一個程式開發的典範即將被徹底改寫的未來。 Truell 與他在麻省理工學院結識的夥伴們,正大膽地押注一個夢想——將軟體創造這門複雜的工藝,從逐行敲打程式碼的傳統模式,進化到更高維度的「意圖驅動」時代。開發者只需用自然語言描述想法,AI 便能將其轉化為具體的軟體功能。這不僅是效率的提升,更是對創造力的一次解放。

By Fox Hsiao
Figure 機器人「快思慢想」的一小時物流處理影片

Figure 機器人「快思慢想」的一小時物流處理影片

新創公司 Figure 推出的 Helix 模型,正將人形機器人的能力推向前所未有的高度,以下是他們推出的一小時影片,我覺得這很像是某種的 1 小時 ASMR 版影片 XDDD Figure 將 Helix 定位為一種通用的「視覺-語言-行動」(Vision-Language-Action, VLA) 模型。它革新了機器人的感知、語言理解和運動控制方式,讓機器人能克服許多過去難以解決的挑戰。Helix 的出現,標誌著人形機器人在多個領域實現了重要的「第一次」突破: * 控制全身、動作靈巧: Helix 是第一個能高速、連續控制整個人形機器人上半身 (包括手腕、軀幹、頭部、甚至獨立的手指) 的 VLA 模型。機器人不再只是僵硬的執行者,而是能做出更自然、細膩的動作。 * 聽懂人話,什麼都能撿: 配備 Helix 的 Figure

By Fox Hsiao
🏗️ 馬斯克:每年造千艘火箭!SpaceX 星艦解鎖四大關鍵技術,打造人類「跨行星文明」!

🏗️ 馬斯克:每年造千艘火箭!SpaceX 星艦解鎖四大關鍵技術,打造人類「跨行星文明」!

在這場由馬斯克親自主持的大會中,我們得以深入了解這場太空革命的核心——位於德州的「星際基地」(Starbase),以及他對人類未來的太空藍圖。 這個被馬斯克稱為「火星之門」的基地,從幾年前的一片荒蕪沙洲,短短數年內躍升為一座功能齊備的太空城。馬斯克驕傲地指出,這裡不僅是全球最大火箭的生產與發射中心,更是一個為未來火星移民而生的嶄新城市,甚至是數十年來美國首座全新規劃建造的城市。令人振奮的是,這個基地並非遙不可及的神秘禁區,透過公路,任何人都能近距離親眼見證這場由馬斯克領導、正在進行的太空史詩。 從荒蕪到「太空城」:馬斯克定義的驚人製造規模 訪談中,馬斯克特別強調了星際基地的建設速度與規模。他透露,目前每兩三週就能打造一艘星艦,而他為團隊設下的遠期目標更是驚人——每年生產數千艘星艦,平均一天要產出三艘!馬斯克坦言,這個數字放在太空產業看似瘋狂,但與其他產業(例如特斯拉的汽車產量)相比,儘管產品複雜度不同,單從產量或噸位來看,他相信人類的製造能力絕對能夠達成。這種前所未有的規模製造能力,正是馬斯克實現大規模太空移民願景的基石。 為何要移民火星?馬斯克對「跨行星文明」韌性的堅持

By Fox Hsiao