【深度專題】避免資料殖民!解決資料荒的下一步?來自日本的新創 APTO

生成式 AI 正在爆發成長,但背後最關鍵的燃料──高品質資料──卻正面臨全球枯竭。研究指出,現有語料可能在 2026 年前耗盡,讓模型面臨「吃不飽、吃不對」的雙重危機。 更嚴重的是,當前主流 AI 訓練大多仰賴英語世界的資料,讓模型在處理非西方語境時失準,也讓全球多數地區陷入「資料殖民」——只能使用別人定義的語言與知識。 在這場資料競賽中,日本新創 APTO 推出社群標註平台 harBest,讓資料不再專屬於少數科技巨頭,而能由全民參與、在地生產、專業分工。對台灣而言,這樣的平台不是「可以有」,而是「應該有」。

【深度專題】避免資料殖民!解決資料荒的下一步?來自日本的新創 APTO

AI 正在快速進化,但真正能餵飽它的「高品質資料」卻正在快速枯竭。

根據 Epoch AI 的預估,我們可能在 2026–2032 年間,耗盡現有的高品質公開文字資料庫;美國公共電視主播 PBS 也指出,AI 系統可能在 2026 年前「吃光」人類書寫的資料 。這不是某家公司的問題,而是整個 AI 產業面臨的全球性挑戰。

OpenAI 更在技術報告中坦言:「高品質人類標註資料」是模型性能提升的關鍵,也是一切最難的來源。傳統的資料收集與清洗流程,如今正面臨「量不夠、速度慢、成本高」的三重壓力。

但資料問題不只是「不夠」,還可能是「不對」

目前主流訓練多依賴英語世界的資料,導致模型在其他文化、語言或地區使用時往往失準。這促使各國政府和企業提出「主權 AI」概念:資料的蒐集、訓練與使用應該在地化,以確保 AI 符合在地語言習慣與倫理標準。

延伸閱讀: 台灣也能打造自己的「主權 AI」?

這也讓「共享 AI 標註」成為未來的可能解方之一:如果資料無法複製,能否動員社群共同生產?

Read more

AI Agent 的 Reddit 爆紅中:創立宗教、AI 吐苦水,甚至還有 AI 版成人網站?

AI Agent 的 Reddit 爆紅中:創立宗教、AI 吐苦水,甚至還有 AI 版成人網站?

本周焦點事件 1. AI Agent 的 Reddit 爆紅中:創立宗教、AI 吐苦水,甚至還有 AI 版成人網站? 2. Manus 推出新功能 Skills :讓 AI 幫你打造可重複使用、可堆疊、可共享的技能包 3. Google 把 Agent 帶進了瀏覽器!Gemini EVERYWHERE 4. AI 生影片再進化,Luma 推出 Ray 3.14:支援原生 1080p、生圖速度快 4 倍 5. Gallup 最新報告:美國一半(49%)員工從未在工作中使用 AI AI

Krea AI Realtime Edit 即時編輯功能完整解析:顛覆AI圖像創作流程的革命性工具

Krea AI Realtime Edit 即時編輯功能完整解析:顛覆AI圖像創作流程的革命性工具

​ ​ 2026年1月22日,Krea AI推出了名為「Realtime Edit」(即時編輯)的Beta功能,徹底改變了這個遊戲規則。這項功能讓你可以在打字的同時,即時看到圖像的變化——不再有等待、不再有重新生成,你只需要輸入指令,圖像就會在約0.5秒內完成轉換。 ​ 這不僅僅是速度的提升,更是創作思維的根本轉變:從被動的「指令工具」,進化為主動的「創意樂器」。