【深度專題】避免資料殖民！解決資料荒的下一步？來自日本的新創 APTO

生成式 AI 正在爆發成長，但背後最關鍵的燃料──高品質資料──卻正面臨全球枯竭。研究指出，現有語料可能在 2026 年前耗盡，讓模型面臨「吃不飽、吃不對」的雙重危機。更嚴重的是，當前主流 AI 訓練大多仰賴英語世界的資料，讓模型在處理非西方語境時失準，也讓全球多數地區陷入「資料殖民」——只能使用別人定義的語言與知識。在這場資料競賽中，日本新創 APTO 推出社群標註平台 harBest，讓資料不再專屬於少數科技巨頭，而能由全民參與、在地生產、專業分工。對台灣而言，這樣的平台不是「可以有」，而是「應該有」。

AI 正在快速進化，但真正能餵飽它的「高品質資料」卻正在快速枯竭。

根據 Epoch AI 的預估，我們可能在 2026–2032 年間，耗盡現有的高品質公開文字資料庫；美國公共電視主播 PBS 也指出，AI 系統可能在 2026 年前「吃光」人類書寫的資料。這不是某家公司的問題，而是整個 AI 產業面臨的全球性挑戰。

OpenAI 更在技術報告中坦言：「高品質人類標註資料」是模型性能提升的關鍵，也是一切最難的來源。傳統的資料收集與清洗流程，如今正面臨「量不夠、速度慢、成本高」的三重壓力。

但資料問題不只是「不夠」，還可能是「不對」。

目前主流訓練多依賴英語世界的資料，導致模型在其他文化、語言或地區使用時往往失準。這促使各國政府和企業提出「主權 AI」概念：資料的蒐集、訓練與使用應該在地化，以確保 AI 符合在地語言習慣與倫理標準。

延伸閱讀: 台灣也能打造自己的「主權 AI」？

這也讓「共享 AI 標註」成為未來的可能解方之一：如果資料無法複製，能否動員社群共同生產？

Midjourney Medical：AI圖像公司跨界醫療，60秒全身掃描機震撼登場

以「生成AI圖像」聞名全球的 Midjourney 宣布進軍醫療硬體，推出 60 秒即可完成全身超音波掃描的 Midjourney Scanner，挑戰傳統 MRI 領域，並計劃於 2027 年開設結合 Spa 體驗的健康中心。

記憶體晶片股暴漲：Apple 確認漲價，AI 需求引爆結構性短缺危機

Apple 執行長 Tim Cook 正式確認旗下產品將因記憶體晶片短缺而全面調漲售價。AI 基礎設施的爆炸性擴張導致 DRAM 與 NAND Flash 進入「高價新常態」，Micron、SanDisk 等記憶體大廠股價創下歷史新高，標誌著產業從週期性波動轉向結構性典範轉移。

Perplexity 推出 Brain：讓 AI Agent 越用越聰明的自我進化記憶系統

Perplexity AI 推出專為 AI Agent 平台「Computer」設計的全新自我改善記憶系統 Brain。不同於傳統記憶方式，Brain 讓 Agent 記住自身的工作成果與路徑，透過持續更新的「脈絡圖譜」實現自我進化，讓 AI 真正從工作中累積知識並持續進步。

你可以外包工作，但你永遠無法外包學習

You can offload a task, or even a job, but you can never offload your learning. - Satya Nadella 前天，微軟 CEO Satya Nadella 在 X 發表了一篇長文，乍看之下很像心靈雞湯，但整段文章給了非常清晰的 AI 時代的學習框架，雖然微軟的重點是放在公司，但我看完後認為他提出的 Human Capital (人力資本) 跟 Token Capital (算力資本) 也符合我們一般人成長的邏輯。他提到，在 AI 時代裡面必須同時建立兩種資本： Human Capital 人力資本：你的知識、判斷力、人際關係、

Read more

Midjourney Medical：AI圖像公司跨界醫療，60秒全身掃描機震撼登場

記憶體晶片股暴漲：Apple 確認漲價，AI 需求引爆結構性短缺危機

Perplexity 推出 Brain：讓 AI Agent 越用越聰明的自我進化記憶系統

你可以外包工作，但你永遠無法外包學習