AI運算成本超越人事費用:企業預算的新危機

AI 曾被定位為削減企業成本的終極解方,但如今現實已截然不同。部分企業的 AI 運算支出,已悄悄超越整體員工薪資總額,正在顛覆所有人對自動化經濟效益的既有假設。

Share
AI運算成本超越人事費用:企業預算的新危機

AI 帳單已超越人事費用

這不再是個別現象。根據最新報導,中大型企業的 AI 平台費用(包括語言模型、自動化工具,以及支撐 AI 運算的雲端基礎設施)正以遠超任何早期預測的速度急劇攀升。

Nvidia 應用深度學習副總裁 Bryan Catanzaro 在接受 Axios 採訪時直言不諱:「對我的團隊而言,運算成本已遠遠超過員工成本。」這句話出自全球 AI 晶片龍頭的高層主管,其份量不言而喻——這不是個案,而是科技業正在集體面對的新常態。

更極端的案例也已浮現。一家四人新創公司的 CEO 在 LinkedIn 上公開分享,他們單月 AI 帳單竟高達 113,000 美元(約新台幣 370 萬元)。這個數字,已足以支付多名全職工程師一整年的薪資。

Uber 的預算爆雷:一個警示故事

這場費用危機最具代表性的案例,來自全球叫車巨頭 Uber。Uber 技術長 Praveen Neppalli Naga 在接受《The Information》採訪時坦承,公司僅在 2026 年開頭幾個月,就已燒光了全年度 AI 預算。

為什麼會失控?問題的根源並非 AI 工具失敗,而是工具太好用了。2025 年 12 月,Uber 將 Anthropic Claude Code 的使用權限開放給約 5,000 名工程師。此後使用量急速飆升:

  • 84% 的開發者被歸類為「AI 輔助代碼」使用者
  • 約 70% 的提交代碼由 AI 生成
  • 每週約有 1,800 次 AI 代碼變更在無需人工直接介入的情況下完成
  • 每位工程師每月的 API 費用落在 500 至 2,000 美元之間

更值得關注的是,根據 Uber 的證券申報文件,公司 2025 年研發支出為 34 億美元,比前一年成長 9%。即便如此龐大的研發預算,仍無法預測 AI 採用速度的爆炸性成長。

全球 IT 支出:一兆美元級的大轉移

這場費用危機並非孤例,而是更大規模趨勢的縮影。根據市調機構 Gartner 最新預測,2026 年全球 IT 支出將達到 6.31 兆美元,較 2025 年成長 13.5%。其中,成長最快的項目是資料中心系統,預計增幅高達 55.8%,支出規模逼近 7,880 億美元。

Gartner 分析師指出,伺服器支出今年預計成長近 37%,原因在於「超大規模雲端供應商持續投資 AI 優化伺服器」。更驚人的是,用於 AI 的伺服器支出,已是傳統伺服器的三倍,AI 基礎設施一項就將在 2026 年新增 4,010 億美元支出。

全球 AI 支出預計在 2026 年突破 5,000 億美元,年增 44%——而同期企業員工培訓預算增幅,卻僅有 5%。

供給也是問題:連 Nvidia 自己都不夠用

這場成本危機還有另一面向:供給限制。Catanzaro 在談及自己團隊時表示,即使身處全球最大 AI 晶片製造商 Nvidia,在全球 GPU 供應緊張的局勢下,他們同樣面臨資源不足的困境——「我們全都受到供應的制約。」

這意味著,即便企業有意願、有預算擴大 AI 投資,取得所需運算資源本身就是一道關卡。需求遠超供給,進一步推高了每一個 token、每一次 API 呼叫的實際成本。

成本的本質問題:沒有上限

傳統軟體開發的費用結構相對可預期——授權費、維護費、人力成本,大體上都有跡可循。但 AI 代碼工具帶來了一個前所未有的新問題:只要模型隨時待命,支出就沒有上限。

Uber 的教訓清楚說明了這一點:當工程師在內部排行榜的激勵下,競相使用 Claude Code,等於是在無意間把預算危機「遊戲化」了。工具的生產力愈高、使用頻率愈高,帳單就愈高——這是一套全新的財務邏輯,而大多數企業的預算模型,根本還沒跟上。

企業如何因應?

面對這波 AI 成本浪潮,企業開始調整策略:

  • 重新建立 AI 治理框架,對 API 使用進行監控與管控
  • 評估 ROI 模型,從「削減成本」思維轉向「重新設計流程」
  • FinOps(財務運維)實踐正從雲端成本管控,快速延伸到 AI token 用量管理
  • 部分企業開始考慮混合部署策略,將部分工作負載轉移至本地或開源模型,以降低 API 依賴

根據 Gartner 研究,能夠真正從 AI 獲益的企業(約占 5%),預期到 2028 年可實現收入翻倍成長與成本降低 40%——但他們的關鍵差異,不在於花了多少錢,而在於重新設計了業務流程。

結語

AI 運算成本超越人事費用,是這個產業發展速度超出所有人預期的明證。從 Uber 的預算爆雷,到 Nvidia 高層的公開表態,再到 Gartner 的兆元級預測,訊號已足夠清晰:AI 的生產力承諾正在兌現,但伴隨而來的財務壓力,同樣不容忽視。

企業必須在「讓 AI 更快跑」與「讓成本不失控」之間,找到新的平衡點——這或許是 2026 年科技管理者最迫切需要解答的命題。

Read more

OpenMontage — 開源 AI 影片製作系統爆紅 GitHub

OpenMontage — 開源 AI 影片製作系統爆紅 GitHub

AI 小道消息 01 Anthropic 執行長 Chris Ciauri 在首爾記者會上表示,遭美國出口管制封鎖的 Mythos 與 Fable 5 模型將在「未來幾天內」恢復訪問,並宣布於首爾設立辦公室以深化韓國市場投資。分析人士指出,此說法缺乏實質法律或技術依據,更像是安撫性公關聲明。(來源:Korea JoongAng Daily) 02 《The Atlantic》記者 Alex Reisner 公開了可搜尋的 AI 音樂訓練資料庫,收錄四大主要數據集、超過 2,100 萬首歌曲,藝人與唱片公司可查詢作品是否在未授權情況下被用於 AI 訓練。獨立音樂人已開始以此作為集體訴訟佐證。(來源:Engadget) 03 日本 Sakana AI 推出 Fugu,

lock-1
Sakana Fugu 是什麼?日本多代理 AI 模型登場,單一 API 協調 GPT、Claude、Gemini

Sakana Fugu 是什麼?日本多代理 AI 模型登場,單一 API 協調 GPT、Claude、Gemini

日本東京 AI 新創公司 Sakana AI 於 2026 年 6 月 22 日正式推出全新 AI 產品 Sakana Fugu 🐡,這是一套以「多代理協調(Multi-Agent Orchestration)」為核心的基礎模型系統。簡單來說,Sakana Fugu 不是一個傳統的單一語言模型,而是一個會動態調度 GPT-5.5、Claude Opus、Gemini 3.1 Pro 等頂尖 AI 模型的「指揮家」,讓多個 AI 模型分工合作,完成更複雜的任務。