【科技新聞】Google最新AI「SignGemma」能看懂手語、即時翻譯成口語文字!

Google 全新 AI 工具「SignGemma」能即時翻譯手語成文字,年底將全面上線!目前支援美國手語與英文,開放開發者和聽障社群參與測試。這是 Google 迄今最強的手語 AI 模型,將為全球聽障者開啟無障礙溝通新時代。

【科技新聞】Google最新AI「SignGemma」能看懂手語、即時翻譯成口語文字!

「AI 看得懂手語了!」Google 推出 SignGemma 助攻無障礙溝通

AI 不只能聽懂你說的話,還能「看懂」你手上比的每一個動作?

Google 在 2025 年的 I/O 開發者大會上,正式揭曉了它最新的 AI 成果——SignGemma。這是一款專門設計來將手語即時轉譯成文字的 AI 工具。簡單來說,就是讓不懂手語的人,也能「看見」手語使用者的語言。

目前 SignGemma 主要支援 美國手語(ASL)與英文的轉換功能,預計將於今年底向大眾開放。開發者與特定用戶現已能參與早期測試,Google 希望透過實際使用者的回饋,優化系統準確率與使用體驗。

「最強的手語 AI」不只會翻譯,更強調即時與開放

Google DeepMind 的產品經理 Gus Martins 在大會上表示,SignGemma 是 Google 目前最具能力的手語理解 AI 模型,不僅強調開放模型架構,更具備高即時性與準確度。這與過去嘗試手語翻譯的技術相比,進步幅度巨大。

「我們希望不只是做出一個能翻譯手語的工具,而是打造一個能讓開發者與聽障社群共同參與、共同成長的開放平台,」Martins 強調。這種從「技術開發」轉向「共創生態」的思維,也成為本屆 Google I/O 上的重要訊號。

AI 不只是強,還要懂人心:聽障社群共同參與打造未來

Google 深知這款工具所涉及的不只是技術問題,更是文化與社會的溝通橋樑。因此他們邀請全球的開發者、研究人員與聽障者社群一同參與測試,從實際使用出發,調整模型理解的準確性與文化敏感度。

Google 在 X(原 Twitter)上的公告寫道:「您的經驗、觀點與需求,將是我們把 SignGemma 打造成真正有用、真正具影響力產品的關鍵。」這樣的態度,也反映出 AI 發展不只是程式碼,更是人與人之間理解的延伸。

無障礙科技再升級:Google 正在重新定義「平等存取」

SignGemma 的推出,正值 Google 積極擴展其 AI 產品線,特別著重在「無障礙科技」的應用。除了手語翻譯,他們也在 Android 的 TalkBack 中導入 Gemini AI,讓視障使用者能請 AI 讀出圖片內容,甚至進一步提問;Chrome 也加入 PDF 自動光學辨識(OCR)功能,幫助使用輔助工具的用戶閱讀掃描文件。

此外,Google Chromebook 上也加入了新功能——Face Control 臉部控制技術,讓使用者透過頭部或臉部表情來操作電腦。從手語到面部動作,Google 正一步步將科技變得更「懂人」,更平等。

SignGemma 是什麼?是一雙讓世界看見手語的眼睛

SignGemma 的誕生,不只是科技的進步,更是一次對平等溝通權的回應。當 AI 開始學會「看懂」手語,這不只是一種技術實現,更是一種文化理解與社會包容的實踐。年底正式上線後,SignGemma 能否真正成為全球手語使用者的溝通橋梁,值得我們一同關注。

Read more

Meta 收購語音新創 Play AI:加速佈局 AI 聲音技術與超級智慧計畫

Meta 收購語音新創 Play AI:加速佈局 AI 聲音技術與超級智慧計畫

Meta 正式收購語音 AI 新創公司 Play AI,進一步強化其在人工智慧領域的投資與佈局。根據 Bloomberg 報導,Meta 已向媒體證實這項收購,並透露 Play AI 的全體團隊將於下週加入 Meta。 Play AI 是一家專注於開發自然人聲合成技術的創業公司,透過 AI 模型生成逼真的語音,並打造一個簡便的語音創作平台。Meta 在內部備忘錄中指出,Play AI 的技術與平台非常契合 Meta 的未來發展藍圖,尤其是在 AI 虛擬角色(AI Characters)、Meta AI 助理、可穿戴裝置(Wearables)、以及音頻內容創作等應用上。 0:00 /0:34 1× 收購金額未公開,顯示 Meta