Fox Hsiao

Taiwan
Fox Hsiao
GPUs融化中!從「畫素註解」到「魔法繪師」:ChatGPT-4o圖像技術有多猛?

News

GPUs融化中!從「畫素註解」到「魔法繪師」:ChatGPT-4o圖像技術有多猛?

社群媒體上瘋傳著各種以ChatGPT-4o生成的吉卜力風格圖像,熱潮之猛烈,甚至讓OpenAI創辦人Sam Altman在3月28日發推特表示:"看到人們喜愛ChatGPT中的圖像功能真是太有趣了,但我們的GPU正在融化。我們將暫時引入一些使用限制,同時努力提高效率。希望不會太久!"——短短幾天,這則推文已獲得700萬次瀏覽,足見此功能的爆炸性影響。這些作品不僅令人驚嘆於其畫風以及角色連續性,更令人好奇其背後的技術突破。 與此同時 OpenAI 釋出了《GPT-4o系統卡的增補:原生圖像生成》技術報告,首次揭開了這款引爆網路的圖像生成技術的神秘面紗。 報告中的關鍵揭露令人驚訝:與之前的DALL·E系列截然不同,4o圖像生成並非獨立的擴散模型,而是深度嵌入GPT-4o架構中的自迴歸模型。這種根本性的架構差異,讓我們得以一窺AI視覺技術數十年來的演變歷程。 從早期需要人工標記每個像素的繁瑣工作,到如今能自動理解並創造精美圖像的全能模型,這一路徑不僅顯示技術的進步,更代表我們理解智能本質的深刻轉變。本文將帶您了解 AI 圖像訓練方法的演進過程,揭示從語義分割到弱監督學習,再到今日生成式

By Fox Hsiao
哈佛與 P&G 合作研究人工智慧如何徹底改變團隊合作模式

哈佛與 P&G 合作研究人工智慧如何徹底改變團隊合作模式

隨著人工智慧在各領域迅速發展,AI 不僅能提升個人工作效率,更有可能徹底改變團隊協作的本質。哈佛大學數位數據設計研究所(Digital Data Design Institute at Harvard)最新發表的研究成果顯示,AI 不僅是一項工具,更像是一位「數位團隊成員」,正在重新定義專業知識的界限與團隊合作的方式。 原始研究與貼文連結 – > https://www.oneusefulthing.org/p/the-cybernetic-teammate 實驗設計:模擬真實商業環境測試 AI 效能 研究團隊以寶僑公司(Procter & Gamble)為實驗場域,招募了 776 名來自歐美的專業人士參與這項隨機對照試驗。實驗參與者需在一天的工作坊中,為嬰兒用品、女性護理、個人修飾和口腔護理等真實業務部門開發產品創意、包裝和零售策略。優秀的點子將提交給管理層批准,因此結果也具有實際意義。 研究人員隨機組成了由一位商業專家和一位研發專家組成的團隊,這些專業人士平均在寶僑工作超過 10 年。一半的團隊和個人可使用 GPT-4

By Fox Hsiao
NVIDIA CEO 黃仁勳 2025 GTC 演講,下一代 AI 運算效能暴增 40 倍,矽光子技術讓 NVIDIA 再領先 5 年,完整中英文字幕對照影片

News

NVIDIA CEO 黃仁勳 2025 GTC 演講,下一代 AI 運算效能暴增 40 倍,矽光子技術讓 NVIDIA 再領先 5 年,完整中英文字幕對照影片

NVIDIA 創辦人暨執行長黃仁勳在最新一屆 GTC 大會主題演講中,揭示了 AI 產業的劃時代發展及該公司雄心勃勃的技術藍圖,展現 NVIDIA 如何透過創新技術引領全球 AI 運算革命。 從電競顯卡到 AI 霸主 黃仁勳開場回顧了 GTC 從 25 年前專注於 GeForce 顯示卡的起點,到如今成為全球 AI 技術盛會的歷程。他特別宣布推出新一代旗艦級顯示卡 GeForce 5090,並強調 AI 如何徹底改變電腦繪圖技術,實現 100% 即時路徑追蹤,大幅提升精確度與時間穩定性。 AI 發展邁向「具代理能力」與「物理 AI」新階段 黃仁勳分析了 AI 在近十年的演進,從感知 AI、生成 AI,到現在的「

By Fox Hsiao
🤖 【客座文】 MCP 的發展將取代 AI 工作流平台

🤖 【客座文】 MCP 的發展將取代 AI 工作流平台

作者 : 洪大倫 光明頂創育智庫創辦人,原文發表於臉書 過去幾年,AI自動化的需求暴增,帶動了一波工作流平台的風潮。Make、n8n、Dify 這類工具紅遍半邊天,許多人都靠它們來讓繁瑣的流程變得自動化,但如果你以為工作流平台已經是終極解法,那你可能要準備迎接下一場變革了。MCP(Model Context Protocol)正在悄悄崛起,未來這類架構的發展,很可能讓傳統的工作流平台變成「老時代」的產物。 我不是在唱衰工作流平台,雖然它們的確改變了許多AI的操作方式,讓原本需要人工處理的一大堆步驟變成自動化流程。問題是,這種「線性」的方式終究有它的極限——就像堆積木一樣,每個動作都要按順序來,稍微有一點變化或邏輯不對,整個流程就可能崩掉。 簡單說對許多人而言,串接這些工具與流程,還是非常麻煩的事。你得自己理解邏輯,拉線去串,去個別平台申請帳號,還要設定各種參數,種種區塊的串接並不那麼直覺,總是令人困惑。試想,你如果要解決100種問題,你就得組裝出100個線性的流程,真有可能這會是人類使用AI自動化的未來嗎?我一直都保持高度的質疑。 MCP的架構就完全不同,它以圍繞在一個特定的客

By Fox Hsiao
什麼是氛圍開發 Vibe Coding ?

什麼是氛圍開發 Vibe Coding ?

Andrej Karpathy 是一位知名的電腦科學家,最為人熟知的經歷是他曾任特斯拉的人工智慧總監、也是 OpenAI 的共同創辦人之一,近期他更是連出兩則科普大型語言模型的 Youtube 影片,堪稱是實踐與教育的大神級人物,他在 2 月初的時候在 X 上提出了 Vibe Coding這個字眼,在過去的一個月內顯然成為新的潮流詞彙。 這個字具體是甚麼意思呢?依照他的貼文解釋,他所謂的氛圍開發,是一種相當依賴開發者感覺和直覺的寫程式方式。開發者不再需要深入鑽研每一行程式碼的細節,而是透過自然語言與 AI 工具溝通。想像一下,當開發者只要說出「請將側邊欄的間距縮小一半」這樣的話,AI 就能立即理解並完成相應的程式修改。 這種開發方式主要仰賴 Cursor Composer 搭配 Anthropic 的 Sonnet 模型,以及 SuperWhisper 語音轉文字工具等先進 AI 技術。在直覺程式開發的世界裡,開發流程變得極為簡單。開發者只要用口語或文字描述需求,AI

By Fox Hsiao
🛩️ 揭秘「44死神」:安杜瑞爾與美空軍的無人機革命

🛩️ 揭秘「44死神」:安杜瑞爾與美空軍的無人機革命

美國空軍已正式將通用原子(General Atomics)和安杜瑞爾(Anduril)目前正在開發的無人機分別命名為YFQ-42A和YFQ-44A,這些無人機是協同作戰飛行器(Collaborative Combat Aircraft,CCA)計劃第一階段(或稱增量1)的一部分。這些是美國軍方史上首次使用「戰鬥無人機」的編號,反映美國空軍作戰理念的重大轉變。第一批CCA主要在空對空作戰角色中與有人駕駛戰鬥機密切合作,至少在初期階段如此。 美國空軍參謀長戴維·阿爾文(David Allvin)將軍在空軍與太空軍協會2025年戰爭研討會的主題演講中宣布了這一命名。在美國軍方通用的飛行器和導彈命名系統中,「F」代表「戰鬥機」,「Q」代表無人機,前面的「Y」表示這是原型設計。 值得注意的是,安杜瑞爾工業在官方X平台上發文表示:「這是美國空軍首次為無人戰鬥機發布官方代號。今天,我們離確保美國在未來數十年主宰天空的目標又近了一步。」 有趣的是,安杜瑞爾獲得的YFQ-44A編號在中華文化中可能被視為不吉利,因為安杜瑞爾創辦人 Palmer Luckey 表示,在中華文化中,數字「44」被視為不

By Fox Hsiao
【翻譯文】程式設計的終結,也是新起點:我們所知的程式設計將迎來變革

【翻譯文】程式設計的終結,也是新起點:我們所知的程式設計將迎來變革

作者: Tim O’Reilly 本文出自於此, Tim O’Reilly 是美國科技出版界的重量級人物,他創辦的O'Reilly Media以出版深入淺出的電腦技術書籍而聞名,其書籍封面常以動物圖像為特色。他不僅是成功的出版人,更是科技趨勢的敏銳觀察者,他提出的「Web 2.0」概念,深刻影響了網際網路的發展方向。此外,O’Reilly 也是開放原始碼的積極推動者,他透過出版和會議,促進了開放原始碼社群的發展和壯大。他對科技的遠見和洞察力,使他被譽為「矽谷先知」,他的思想和工作,持續引導著科技界的創新和進步。 本文重點: 1. 程式設計正在演變而非消亡 - 文章指出,雖然媒體聲稱AI將導致程式設計師失業,但歷史告訴我們這只是程式設計形式的轉變,類似於從組合語言到高階語言的轉變。每次技術變革後,我們看到的不是程式設計師減少,而是更多人以新方式參與程式設計。 2. AI將成為程式設計師的輔助工具而非替代者 - 優秀的程式設計師將學會如何有效地使用AI作為協作工具,專注於高價值的系統思考而非機械性的編碼。AI可以處理重複性工作,

By Fox Hsiao
Peter Thiel 才應該在這期 TIME 封面

Peter Thiel 才應該在這期 TIME 封面

看完 All-in Podcast Naval 在講完整段贊許 Elon Musk 後,神來一筆的讚美 Peter Thiel ,讓我更深的確定 TIME 其實搞錯了,不應該把 Elon 放在封面,而是 Peter Thiel。 從 Peter Thiel 體系影響的公司,你可以看到另一個公司命名的特色,從 Mithril 、Narya、Palantir 以及 Anduril,都是小說魔戒裡的物品。就好像你會看到金箍棒、芭蕉扇、七星劍一般自然。從他的早年經歷可以看出,這種命名傳統源自他對托爾金作品的深厚興趣,據說他曾閱讀《魔戒》超過十遍。 Peter Thiel 在 2016 年是矽谷少數公開支持川普的科技巨頭之一,雖然在第二任川普政府沒有擔任任何角色,但跟他直接相關的人跟事務有 : 1. JD Vance:

By Fox Hsiao
安杜瑞爾宣布接管美國陸軍的整合視覺增強系統 (IVAS) 計劃

安杜瑞爾宣布接管美國陸軍的整合視覺增強系統 (IVAS) 計劃

從今天開始,Anduril Industries 將接管歷史上同類計畫裡最大的一個:美國陸軍的整合視覺增強系統 (IVAS) 計劃。 將美國士兵轉變成超級英雄 以下來自 Anduril CEO Palmer Luckey 部落格 對我個人而言,這個消息意義重大。早在 Oculus 時代,我還是個青少年時,就有機會參與陸軍的 BRAVEMIND 項目,從那時起,我就相信每個士兵都會配戴頭戴式裝置,而且會比每個平民都配戴頭戴式裝置還要早。鑑於美國在訓練中損失的士兵比在戰鬥中還多,僅 IVAS 的小隊沉浸式虛擬訓練器 (SiVT) 部分,就有可能比我們想像中任何其他東西都能拯救更多的生命。 將戰士變成科技巫師,並與武器化機器人配對的戰術抬頭顯示器,是 Anduril 最初的提案簡報中的產品之一,這是有原因的。過去八年我們在構建 Lattice 的過程中,讓 Anduril 有能力讓這類事物真正發揮作用,就像軍事戰略家和科技人員自從羅伯特·海因萊因 1959 年的小說《星艦戰士》

By Fox Hsiao
OpenAI Sam Altman 對於 AI 經濟學的三個觀察

OpenAI Sam Altman 對於 AI 經濟學的三個觀察

* AI 發展迅猛,經濟影響巨大: 文章指出 AI 的智慧程度與投入資源成正比,成本快速下降,但社會經濟價值卻呈超指數級增長,這將對經濟產生深遠影響。 * AI 代理人將成虛擬同事: AI 代理人,特別是軟體工程師代理人,將在各領域扮演重要角色,它們雖然需要人類監督,但能極大地提高生產力。 * AGI 將改變社會,帶來機遇與挑戰: AGI 將像電晶體一樣滲透到各行各業,改變人們的生活和工作方式。雖然會帶來經濟繁榮和科學進步,但也可能加劇不平等,需要及早思考應對策略。 * 本文來源,全文用 Gemini 2.0 Flash 編譯,請贊助訂閱本站選文 我們的使命是確保通用人工智慧(AGI)能為全人類帶來福祉。 隨著越來越多系統開始指向AGI,我們認為重要的是要理解我們所處的時刻。AGI是一個定義較為寬鬆的術語,但一般來說,我們指的是一種能夠在許多領域中,以人類水準處理日益複雜問題的系統。 人類是工具的建造者,天生具有理解和創造的動力,這也促使世界變得對我們所有人更好。每一代人都建立在前幾代人的發現之上,創造出更強大的工具——電力、電晶體、

By Fox Hsiao
Dario Amodei at TechCrunch Disrupt 2023, TechCrunch - https://www.flickr.com/photos/techcrunch/53202070940/

Anthropic CEO:DeepSeek 更加證明晶片出口管制重要,我們要避免專制國家取得軍事地位領先

* 雖然 Twitter 上的簡體中文使用者對於這篇文章反應大致負面,但持平來說我認為他對於中共的態度與其他大部分的科技巨頭與領導人一致。 * 他對於 DeepSeek 的進展看法,大約也與 Open AI 陳信翰(Mark Chen)類似,"我認為一個公平的說法是「深度探索以低得多的成本(但遠不及人們所說的比例)製作了一個接近 7-10 個月前的美國模型效能的模型」" * AI發展的三個動態:規模定律、曲線偏移和典範轉移,解釋深度探索的進展主要來自工程效率的提升,而非顛覆性創新。更重要的是,中美在AI領域的競爭最終取決於誰能取得關鍵技術的領先地位,而晶片出口管制正是確保美國及其盟友在AI競賽中保持優勢的關鍵手段。 * 本文來源,全文用 Gemini 1.5 Pro 編譯,請贊助訂閱本站選文 幾週前,我主張美國應加強對中國的晶片出口管制。從那時起,中國的人工智慧公司深度探索(DeepSeek)設法——至少在某些方面——以較低的成本達到了美國前沿人工智慧模型的效能。 在此,我不會聚焦於深度探索是否對 Anthropic 等美國人工智慧公司構成威脅(

By Fox Hsiao