【深度專題】避免資料殖民!解決資料荒的下一步?來自日本的新創 APTO

生成式 AI 正在爆發成長,但背後最關鍵的燃料──高品質資料──卻正面臨全球枯竭。研究指出,現有語料可能在 2026 年前耗盡,讓模型面臨「吃不飽、吃不對」的雙重危機。 更嚴重的是,當前主流 AI 訓練大多仰賴英語世界的資料,讓模型在處理非西方語境時失準,也讓全球多數地區陷入「資料殖民」——只能使用別人定義的語言與知識。 在這場資料競賽中,日本新創 APTO 推出社群標註平台 harBest,讓資料不再專屬於少數科技巨頭,而能由全民參與、在地生產、專業分工。對台灣而言,這樣的平台不是「可以有」,而是「應該有」。

【深度專題】避免資料殖民!解決資料荒的下一步?來自日本的新創 APTO

AI 正在快速進化,但真正能餵飽它的「高品質資料」卻正在快速枯竭。

根據 Epoch AI 的預估,我們可能在 2026–2032 年間,耗盡現有的高品質公開文字資料庫;美國公共電視主播 PBS 也指出,AI 系統可能在 2026 年前「吃光」人類書寫的資料 。這不是某家公司的問題,而是整個 AI 產業面臨的全球性挑戰。

OpenAI 更在技術報告中坦言:「高品質人類標註資料」是模型性能提升的關鍵,也是一切最難的來源。傳統的資料收集與清洗流程,如今正面臨「量不夠、速度慢、成本高」的三重壓力。

但資料問題不只是「不夠」,還可能是「不對」

目前主流訓練多依賴英語世界的資料,導致模型在其他文化、語言或地區使用時往往失準。這促使各國政府和企業提出「主權 AI」概念:資料的蒐集、訓練與使用應該在地化,以確保 AI 符合在地語言習慣與倫理標準。

延伸閱讀: 台灣也能打造自己的「主權 AI」?

這也讓「共享 AI 標註」成為未來的可能解方之一:如果資料無法複製,能否動員社群共同生產?

Read more

【科技新聞】AI 導入加速裁員潮?Amazon CEO:精通 AI 才有機會留下

【科技新聞】AI 導入加速裁員潮?Amazon CEO:精通 AI 才有機會留下

隨著人工智慧技術快速擴展應用,亞馬遜執行長安迪·賈西(Andy Jassy)近日向員工發出內部備忘錄,明確指出,生成式 AI 與智能代理(agent)的導入將在未來數年「減少」公司的企業人力規模。他表示,這波人力變動是由於公司在各部門大規模採用 AI 所帶來的「效率提升」,但並未具體說明預計影響的人數。

【資源分享】企業導入 AI 必備資源:OpenAI × Google × Anthropic 免費指南大公開

【資源分享】企業導入 AI 必備資源:OpenAI × Google × Anthropic 免費指南大公開

在企業數位轉型與生成式 AI 崛起的浪潮中,如何有效導入 AI 並創造實質價值,已成為專業人士、企業決策者與技術團隊的重要課題。 本篇精選並整理了 來自 OpenAI、Google、Anthropic 的 9 份官方 AI 指南,內容具備策略深度與實作價值,涵蓋企業導入與應用策略、提示詞工程與角色設計技巧 、AI 代理人架構與開發實作。這些指南將成為你推動 AI 應用、優化決策流程與打造未來競爭力的重要工具。

lock-1