【科技新聞】Google最新AI「SignGemma」能看懂手語、即時翻譯成口語文字!

Google 全新 AI 工具「SignGemma」能即時翻譯手語成文字,年底將全面上線!目前支援美國手語與英文,開放開發者和聽障社群參與測試。這是 Google 迄今最強的手語 AI 模型,將為全球聽障者開啟無障礙溝通新時代。

【科技新聞】Google最新AI「SignGemma」能看懂手語、即時翻譯成口語文字!

「AI 看得懂手語了!」Google 推出 SignGemma 助攻無障礙溝通

AI 不只能聽懂你說的話,還能「看懂」你手上比的每一個動作?

Google 在 2025 年的 I/O 開發者大會上,正式揭曉了它最新的 AI 成果——SignGemma。這是一款專門設計來將手語即時轉譯成文字的 AI 工具。簡單來說,就是讓不懂手語的人,也能「看見」手語使用者的語言。

目前 SignGemma 主要支援 美國手語(ASL)與英文的轉換功能,預計將於今年底向大眾開放。開發者與特定用戶現已能參與早期測試,Google 希望透過實際使用者的回饋,優化系統準確率與使用體驗。

「最強的手語 AI」不只會翻譯,更強調即時與開放

Google DeepMind 的產品經理 Gus Martins 在大會上表示,SignGemma 是 Google 目前最具能力的手語理解 AI 模型,不僅強調開放模型架構,更具備高即時性與準確度。這與過去嘗試手語翻譯的技術相比,進步幅度巨大。

「我們希望不只是做出一個能翻譯手語的工具,而是打造一個能讓開發者與聽障社群共同參與、共同成長的開放平台,」Martins 強調。這種從「技術開發」轉向「共創生態」的思維,也成為本屆 Google I/O 上的重要訊號。

AI 不只是強,還要懂人心:聽障社群共同參與打造未來

Google 深知這款工具所涉及的不只是技術問題,更是文化與社會的溝通橋樑。因此他們邀請全球的開發者、研究人員與聽障者社群一同參與測試,從實際使用出發,調整模型理解的準確性與文化敏感度。

Google 在 X(原 Twitter)上的公告寫道:「您的經驗、觀點與需求,將是我們把 SignGemma 打造成真正有用、真正具影響力產品的關鍵。」這樣的態度,也反映出 AI 發展不只是程式碼,更是人與人之間理解的延伸。

無障礙科技再升級:Google 正在重新定義「平等存取」

SignGemma 的推出,正值 Google 積極擴展其 AI 產品線,特別著重在「無障礙科技」的應用。除了手語翻譯,他們也在 Android 的 TalkBack 中導入 Gemini AI,讓視障使用者能請 AI 讀出圖片內容,甚至進一步提問;Chrome 也加入 PDF 自動光學辨識(OCR)功能,幫助使用輔助工具的用戶閱讀掃描文件。

此外,Google Chromebook 上也加入了新功能——Face Control 臉部控制技術,讓使用者透過頭部或臉部表情來操作電腦。從手語到面部動作,Google 正一步步將科技變得更「懂人」,更平等。

SignGemma 是什麼?是一雙讓世界看見手語的眼睛

SignGemma 的誕生,不只是科技的進步,更是一次對平等溝通權的回應。當 AI 開始學會「看懂」手語,這不只是一種技術實現,更是一種文化理解與社會包容的實踐。年底正式上線後,SignGemma 能否真正成為全球手語使用者的溝通橋梁,值得我們一同關注。

Read more

【影音工具教學】AI ASMR 影片怎麼做?用 Veo 3 生成高品質畫面與聲音!

【影音工具教學】AI ASMR 影片怎麼做?用 Veo 3 生成高品質畫面與聲音!

Veo 3 是目前最懂「聲音」的 AI 影片工具,能根據提示詞自動生成同步的畫面與音效,成為打造 ASMR 類影片的秘密武器。這篇教學將帶你從撰寫 prompt 開始,教你如何讓 Veo 不只「看見」你想像的畫面,也能「聽見」你腦中的聲音節奏。附上範本與實例,讓你第一次寫 prompt 就能切出一刀療癒的紅蘿蔔。

lock-1
【科技新聞】AI 導入加速裁員潮?Amazon CEO:精通 AI 才有機會留下

【科技新聞】AI 導入加速裁員潮?Amazon CEO:精通 AI 才有機會留下

隨著人工智慧技術快速擴展應用,亞馬遜執行長安迪·賈西(Andy Jassy)近日向員工發出內部備忘錄,明確指出,生成式 AI 與智能代理(agent)的導入將在未來數年「減少」公司的企業人力規模。他表示,這波人力變動是由於公司在各部門大規模採用 AI 所帶來的「效率提升」,但並未具體說明預計影響的人數。