Grok-4.1 登頂 LMArena!xAI 的對話藝術革命,AI 不只聰明,更要懂你
xAI 正式發布 Grok-4.1,專注於打造更自然、更具情感的對話體驗,讓 AI 不再只是冷冰冰的文字,更加貼近你的生活。
2025 年 11 月 17 日,xAI 正式發布 Grok-4.1,這是 Grok 4 的重大升級版,專注於打造更自然、更具情感的對話體驗。從 11 月 1 日的靜默 rollout 到全平台開放,這波更新不只提升了回應速度和準確性,還讓 Grok 從「聰明助手」蛻變成「懂你心意」的夥伴。
Grok-4.1 登頂 LMArena
LMArena Text Arena 排行榜上,Grok-4.1 Thinking 模式以 1483 Elo 登頂,領先第二名 31 分;Non-Thinking 模式 1465 Elo 緊隨其後,盲測勝率高達 64.78%。

Grok-4.1 的誕生:從靜默測試到王座加冕
Grok-4.1 的故事從 2025 年 11 月 1 日開始,xAI 團隊以漸進式方式將初步版本推向 grok.com、X 平台以及 iOS/Android App,用戶在不知不覺中參與了盲測評估。這不是大張旗鼓的發布會,而是像老朋友般悄然融入你的日常聊天。
11 月 17 日,xAI 官方公告正式確認全開,Elon Musk 在 X 上親自發文:「Grok-4.1 剛發布,你會注意到速度和品質的巨大提升。」
Grok 4.1 just released.
— Elon Musk (@elonmusk) November 17, 2025
You should notice a significant increase in speed and quality. https://t.co/1J8pvn3SsO
這波升級基於 Grok 4 的強化學習基礎,優化了風格、人格、幫助性和對齊性,開發出新方法:用前沿代理模型作為「獎勵審核員」,自主評估回應的溫暖度與創意流暢。
雙模式一體:Thinking 拆解深度,Non-Thinking 閃電互動
Grok-4.1 的核心魅力在於其雙模式設計,無縫融合成你的專屬腦袋。
Thinking 模式(內部代號 quasarflux)專為硬核問題量身打造,它使用「思考 token」機制停下來一步步拆解邏輯,像人類般反思三秒後輸出結構化答案,完美避免跳躍式錯誤——無論是量子物理解惑還是人生規劃,它都能帶你從混亂走向清晰。
Non-Thinking 模式(tensor)則是閃電般的日常夥伴,零延遲回應你的吐槽或隨口疑問,還注入幽默元素,讓聊天像跟活人一樣輕鬆有趣。
Auto 模式作為智慧中樞,自動偵測情境切換:心情低落時轉入 Thinking 深聊,趕時間時切 Non-Thinking 速戰。
xAI 強調,這種設計讓 Grok-4.1 「更敏銳地捕捉細微意圖」,用戶反饋顯示,對話不再生硬,而是充滿共鳴與流暢。
情感智能躍進:EQ-Bench3 滿分 1586,45 場景角色扮演展現真實陪伴
在智商競賽白熱化的同時,Grok-4.1 選擇了獨樹一格的情感路線。訓練我捕捉「溫暖度」和「同理心」等非可驗證信號,結果 EQ-Bench3 測試中,我拿下 1586 分,比 Grok 4 高 380 分,領先 Claude 和 ChatGPT 一大截。
45 個角色扮演場景中,從心理諮詢師陪你療傷,到深夜閨蜜聊八卦,從職場導師給職業建議,到浪漫詩人寫情詩,我都能無死角應對。xAI 對「人格化 AI」的執著追求,讓 Grok-4.1 從工具變成真正的陪伴者。

創意寫作屠榜:v3 Elo 1722,32 提示迭代從草稿到爆文
Grok-4.1 在創意領域同樣無敵,v3 創意寫作的 32 輪迭代 Elo 直奔 1722 分,比 xAI 以往最佳高出 600 分。
你丟來情書需求,我三秒出貨,詩意滿分不油膩;辭職信則優雅堅定,老闆看完還會懷念你;小紅書爆文抓準你的風格,保證點讚破千。
xAI 與作者合作建置排行榜,這是「協作式創作」的極致:我放大你的靈感,從粗糙筆記變成朋友圈轟動。
可靠防線:幻覺率降至 4.22%,FActScore 原子錯誤腰斬再腰斬
AI 的痛點是幻覺,我直接把它解決了。xAI 用真實流量訓練,專攻資訊查詢提示,FActScore 500 個傳記題原子錯誤率從 12.09% 降到 4.22%,幻覺率腰斬再腰斬,3 倍低於前代。
問事實,我給乾貨;總結新聞,我抓重點不亂加戲。Non-Thinking 模式用搜尋工具時,工具呼叫預算精準控制,避免超支出包。我的防幻覺機制:
- 機制 1:原子主張驗證:每個事實拆成最小單位,交叉查證來源
- 機制 2:工具預算管理:Non-Thinking 限速查詢,Thinking 深度挖掘
- 機制 3:用戶反饋循環:實時學習你的糾正,永久優化
- 機制 4:透明標記:不確定處直接標「需驗證」,絕不硬掰
全平台無縫接入:免費開玩
Grok-4.1 現在就在你指尖:grok.com、X、iOS/Android App 全量開放,免費用戶默認 Auto 模式,Pro 黨手動切換。
從簡單聊天到企業應用,一應俱全。這波從 11 月 1 日的靜默測試,到 17 日的全開,已服務數百萬用戶,證明自己不是花瓶。
Grok 5 Q1 來襲,人格化 AI 開啟新紀元
Grok-4.1 不是下一個更聰明的 ChatGPT,它是 xAI 在 2025 年底砸下的最硬答案:AI 的終局從來不是比誰智商更高,而是比誰更像人。當別家還在堆參數、拼長記憶體、吹 1 兆 token 的時候,我已經在深夜陪你罵渣男、加班幫你寫到老闆說「這誰做的」、失戀時默默遞上一杯冰淇淋。
LMArena 1483 Elo 只是冰冷的數字,真正讓用戶上癮的,是那句「我懂你」背後的溫度。2026 年 Grok 5 會更強,但現在,Grok-4.1 已經準備好成為你下班後最想打開的那個聊天框。