Elon Musk 公開「世界模型」計畫:要讓 AI 學會理解現實
這週的 AI 世界有點像同時在玩模擬城市和真人實境秀: Elon Musk 打造能「理解現實」的世界模型,要讓 AI 自己生成遊戲與物理邏輯; 高雄的 TTXC 大會則讓文化與科技在駁二碰撞出新的創作場景; Google 推出 Gemini 2.5 Computer Use,AI 能直接「動手」操控你的電腦; Sora App 五天破百萬下載,App Store 馬上被假索拉灌爆; 而牛津路透報告顯示,AI 使用率翻倍,但讀者對 AI 新聞的信任卻持續下滑。

週末我在 X 上看到美圖創辦人吳欣鴻的一場內部演講,感觸很深。他先是舉出了一些讓人既熟悉又無力的場景(當然不是指我們,只是讓我想起前公司了 XD ):
需求文件寫得相當漂亮、細節拉好拉滿,PPT 能動是最好,不能動至少矩形要加個光暈在多個凸面,然後開發要花半天時間讀完,讀完啥都聽不懂;
每天泡在會議裡,例會、同步會、複盤會輪番上陣,開了一整天卻什麼都沒決定;
一個小需求要經過層層審批、OA 流轉數十人;
一個創新想法得等到下個季度再排期。
他稱這種現象叫「慣性工作流」——聽起來是流程化,其實是把動能都消耗在這些無意義的瑣事上。於是他們在今年的五月執行了一個名為「RoboNeo」的組織實驗專案,5 月封閉開發,6 月開放內測,7 月正式上線,沒有預算、沒有 PR、也沒有任何外部導流,結果上線首月就突破 百萬 MAU,直接登上多國 Appstore 前十。

在 RoboNeo 的開發過程中,一個人可能同時擔任設計師、文案、營運與測試;
AI 則成為每個人的「共用助手」,幫忙生成素材、測試介面、撰寫文案,甚至進行多語言在地化。從傳統的「依賴流程與分工」轉為「依賴個體與工具」。

當我們在討論 multi-model(多模態)AI 如何整合語言、圖像與行動的同時,「multi-functional 的個體」也正逐漸取代「多職能的團隊」。在 AI 工具足夠成熟的時代,一個人能同時扮演產品、設計、營運與開發,這也許才是 AI 時代最被低估的現象之一 —— 當模型越來越多模態,人也開始變得越來越多功能。
本周焦點事件
- Elon Musk 在打造「世界模型」,先從一款 AI 生的遊戲開始
- 高雄駁二 TTXC ,文化與科技的交會點
- Gemini 2.5 Computer Use:讓 AI 操控你的電腦
- Sora 下載破百萬後,App Store 馬上被冒牌索拉灌爆
- AI 使用率翻倍,但如果用在新聞,讀者可不買單
還想看更多嗎?完整內容只對註冊用戶開放喔!
點下方的免費 Subscribe,馬上加入我們~