每週大事電子報

Elon Musk 公開「世界模型」計畫：要讓 AI 學會理解現實

這週的 AI 世界有點像同時在玩模擬城市和真人實境秀： Elon Musk 打造能「理解現實」的世界模型，要讓 AI 自己生成遊戲與物理邏輯；高雄的 TTXC 大會則讓文化與科技在駁二碰撞出新的創作場景； Google 推出 Gemini 2.5 Computer Use，AI 能直接「動手」操控你的電腦； Sora App 五天破百萬下載，App Store 馬上被假索拉灌爆；而牛津路透報告顯示，AI 使用率翻倍，但讀者對 AI 新聞的信任卻持續下滑。

Hank

13 Oct 2025 — 18 min read

週末我在 X 上看到美圖創辦人吳欣鴻的一場內部演講，感觸很深。他先是舉出了一些讓人既熟悉又無力的場景（當然不是指我們，只是讓我想起前公司了 XD ）：
需求文件寫得相當漂亮、細節拉好拉滿，PPT 能動是最好，不能動至少矩形要加個光暈在多個凸面，然後開發要花半天時間讀完，讀完啥都聽不懂；
每天泡在會議裡，例會、同步會、複盤會輪番上陣，開了一整天卻什麼都沒決定；
一個小需求要經過層層審批、OA 流轉數十人；
一個創新想法得等到下個季度再排期。

他稱這種現象叫「慣性工作流」——聽起來是流程化，其實是把動能都消耗在這些無意義的瑣事上。於是他們在今年的五月執行了一個名為「RoboNeo」的組織實驗專案，5 月封閉開發，6 月開放內測，7 月正式上線，沒有預算、沒有 PR、也沒有任何外部導流，結果上線首月就突破 百萬 MAU，直接登上多國 Appstore 前十。

在 RoboNeo 的開發過程中，一個人可能同時擔任設計師、文案、營運與測試；
AI 則成為每個人的「共用助手」，幫忙生成素材、測試介面、撰寫文案，甚至進行多語言在地化。從傳統的「依賴流程與分工」轉為「依賴個體與工具」。

當我們在討論 multi-model（多模態）AI 如何整合語言、圖像與行動的同時，「multi-functional 的個體」也正逐漸取代「多職能的團隊」。在 AI 工具足夠成熟的時代，一個人能同時扮演產品、設計、營運與開發，這也許才是 AI 時代最被低估的現象之一 —— 當模型越來越多模態，人也開始變得越來越多功能。