GPT-5.2 匆忙上線:OpenAI 在急什麼?聖誕更新可能才是重頭戲
每當我們提到「AI 工具變得越來越強」,其實是指它們在解決問題的方式上變得更加高效和靈活。從 Manus 1.6 MAX 模式的自動化流程,到 OpenAI 與迪士尼的十億合作,再 ChatGPT 引入 Claude Skills 功能——這些改變不只代表技術的進步,更是 AI 實際應用的拓展,從單純的工具升級為能夠主動執行任務的夥伴。
這週廢話不多說,馬上讓我們進入本週的五件 AI 大事,搭配一段觀察筆記
讓你不只是看熱鬧,也能看懂門道。
本周焦點事件
- GPT-5.2 匆忙上線:OpenAI 在急什麼?聖誕更新可能才是重頭戲
- 自動化最強的 AI Agent ─ Manus AI 推出 1.6 MAX,三大升級一次看
- 迪士尼投資 OpenAI 10 億美元,Sora 將可生成超過 200 個經典角色
- FAANG 工程師實測:AI Coding 不是玩票,讓上線速度加快 30%
- OpenAI 也上車 Skills:ChatGPT × Codex CLI 實驗性支援上線
🎄AI 郵報聖誕精選|你一定不能錯過的 AI 活動
今年 Microsoft Ignite 聚焦的「Work IQ/Fabric IQ/Foundry IQ」三大框架,正在改寫企業導入 AI 的路徑——從工作記憶到資料語意、再到 Agent 能力的落地,每一步都超關鍵,但該怎麼開始?
👉 台灣微軟將在 12/23(三創 Unispace) 舉辦一場實體活動,手把手帶你看懂這套 AI 能力藍圖怎麼落地:
- 看標竿:歐美零售與製造龍頭,怎麼用 AI 改寫營運流程
- 看實戰:台灣 Partner 分享在地企業導入心得與價值成效
- 拿路線圖:從資料、工具到 Agent,掌握全流程導入地圖
GPT-5.2 匆忙上線:OpenAI 在急什麼?聖誕更新可能才是重頭戲

這次 ChatGPT 5.2 的上線,可以說是內憂外患。
一方面,根據華爾街日報的資訊,OpenAI 內部其實有人主張「再等等、再多打磨一下」;但另一方面,外部壓力也非常明確——Gemini 3 與 Claude Opus 4.5 正在正面逼近,而且不只是在單一 benchmark 上,而是整體體感、敘事與市場聲量。
在這樣的情況下,GPT-5.2 更像是一支在弦上的箭。
OpenAI 對 GPT-5.2 的定位是:「目前最適合專業知識型工作的模型」。
這個說法主要來自一項名為 GDPval 的基準測試。和我們熟悉的數學、推理或 coding benchmark 不同,GDPval 評估的是 AI 在真實工作場景的表現,例如:整理試算表、撰寫簡報內容等等...
在這套測試中,GPT-5.2 Thinking 模式,有 71% 的表現不輸產業中的專業人士。這也是 OpenAI 用來強調的一個關鍵訊號:GPT-5.2 不只是「好用的助理」,而是開始能穩定接手白領工作流程中的一部分任務。
那這次 GPT-5.2 的更新重點是什麼呢?我們節錄了幾個值得關注的:
- 視覺理解能力顯著提升 (不過還是輸 Gemini,詳情可以看這篇)
- 工具呼叫與工作流程協同能力更強(篇幅有點長,寫在第五則,比較技術性一點)
- 幻覺(Hallucination)率下降
- 更強的多步推理與連貫性
觀察筆記
老實說,比起基準測試,我自己更在意的是另外三件事。
- 可信度。它的回答看起來很聰明,但問題是:你真正「相信它」的比例有多少?在專業與非專業的問答下,它能不能給出正確、而不只是「聽起來合理」的回答,這對我來說才是關鍵。
- 它是否真的「熟悉你」。很多時候,我們丟給 AI 的問題,其實是連自己都還沒想清楚的問題。這非常吃重對情境、情感,以及對於使用者的理解。但目前社群對 GPT-5.2 的討論,卻頻繁出現像是 cold、lack of basic comprehension 這類形容。
在記憶這件事上,我自己的感受是:從 GPT-5 之後,就算搭配 Project 功能,還是很常出現「記憶混亂」的狀況。模型記得很多,但不一定記得對。 - 功能多元性,就是純比功能廣度、整合深度。但老實說,現在沒有一個打得過 Gemini,所以在碰到多元情境下,換模型使用通常會是最優解。
雖然「脫 ChatGPT、入 Gemini」已經成為社群 meme,但我腦中一直浮現上一次聖誕節 Sam Altman 戴著聖誕帽,連續好幾天開直播,一天一個更新的畫面,每天都有新內容 XD。
也難怪現在外媒都在傳:OpenAI 很可能把真正的底牌留在聖誕檔期。
拜託,真的要有,不然想靠 GPT-5.2 就堵住大家的嘴,是真的很有挑戰性。
還想看更多嗎?完整內容只對註冊用戶開放喔!
點下方的免費 Subscribe,馬上加入我們~
