Meta推出更自然更即時的翻譯模型「Seamless」

Meta最近更新了其多模態AI翻譯模型「SeamlessM4T」,該模型支持近100種文字語言和36種語音語言。隨著新的「v2」架構的推出,Meta正在進一步擴展這一工具,以使對話翻譯變得更加自然和有表現力。這一更新將對日常生活和內容製作領域都產生重大影響 。

Meta推出更自然更即時的翻譯模型「Seamless」

Meta最近更新了其多模態AI翻譯模型「SeamlessM4T」,該模型支持近100種文字語言和36種語音語言。隨著新的「v2」架構的推出,Meta正在進一步擴展這一工具,以使對話翻譯變得更加自然和有表現力。這一更新將對日常生活和內容製作領域都產生重大影響​​。

新功能中的第一項是「SeamlessExpressive」,這個功能將用戶的表達方式(包括音調、音量、情感調性(如興奮、悲傷或低聲說話)、語速和停頓)轉化到翻譯的語音中。目前支持的語言包括英語、西班牙語、德語、法語、意大利語和中文。這種將用戶表達方式融入翻譯的創新做法,使得翻譯的語音不再顯得機械化​​​​。

第二項新功能是「SeamlessStreaming」,該功能可在講話者仍在說話時開始翻譯,使其他人能夠更快聽到翻譯。這項技術雖然仍有短暫的延遲(不到兩秒),但至少不需要等到某人完成一句話。Meta表示,挑戰在於不同語言有不同的句子結構,因此它必須開發一種專門的算法,來研究部分音頻輸入,以決定是否有足夠的上下文來開始生成翻譯輸出,或者是否繼續聆聽​​。

現在將 SeamlessM4T v2、SeamlessExpressive、SeamlessStreaming 合併成 Seamless 模型,讓翻譯做到接近「無縫接軌」的狀態,現在已經可以上Hugging Face 上試用。此外為了確保真實性,從這些表達式模型生成的音頻輸出都包含水印。在創建翻譯時,會在生成的音頻信號中添加一個聽不見的簽名用於追蹤,從而提高安全性。這種方法可以對較短的段落進行水印,比目前最先進的方法更加穩健​​

Read more

Meta Connect 2025:六大重磅發布震撼科技界,智慧眼鏡革命正式開啟

Meta Connect 2025:六大重磅發布震撼科技界,智慧眼鏡革命正式開啟

Meta於2025年9月17-18日舉辦的年度開發者大會Meta Connect 2025,這場被譽為「智慧眼鏡元年」的科技盛會帶來了前所未有的創新突破。CEO馬克·祖克柏(Mark Zuckerberg)在活動中發布了六項重大產品更新,其中最受矚目的Meta Ray-Ban Display智慧眼鏡搭載革命性顯示技術和神經腕帶控制系統,標誌著穿戴式運算正式進入新紀元。這次發布會不僅展現了Meta在AI和穿戴科技領域的深厚實力,更為整個智慧眼鏡產業的未來發展指明了方向。

【AI 工具地圖】免費快速考取 Google Gemini Certified Educator 證照指南

【AI 工具地圖】免費快速考取 Google Gemini Certified Educator 證照指南

想在最短時間內獲得一張 Google 官方免費 AI 證照嗎?「Gemini Certified Educator」正是近期最熱門的選擇!這是一張專為教育者與學習者設計的 AI 能力認證,只要完成 37 題不限時的選擇題,就能立刻拿到有效期三年的電子證書,還能放到 LinkedIn 為履歷加分。考試重點涵蓋 Gemini 與 NotebookLM 的操作方法、Prompt 輸入技巧、AI 幻覺與偏見的判斷,即使你不是老師,也能透過這張證照展現專業的 AI 應用能力。本文將帶你完整解析:為什麼值得考?考什麼?如何準備?並附上報名流程,一篇搞懂,週末就能輕鬆拿到。

lock-1
全球第一位「AI 官員」上任,阿爾巴尼亞任命 AI 為內閣

全球第一位「AI 官員」上任,阿爾巴尼亞任命 AI 為內閣

從 AI 官員到語音翻譯,AI 這週正式「入職」現實世界。 阿爾巴尼亞任命全球首位 AI 部長,開啟政府決策新實驗;Google Meet 推出 2 秒內完成的即時語音翻譯,打破語言隔閡;Claude 則正式變身職場助理,能幫你轉檔寫簡報;而在內容世界,AI 播客工廠每週量產 3,000 集節目,一集成本不到 1 美元。 但這波 AI 熱潮是否過熱?OpenAI 董事長 Bret Taylor 坦言「泡沫存在,但這沒關係」,因為創造力會留下來──這週的新聞,也讓我們看見 AI 正從實驗室,跨出螢幕,成為真正的社會角色。

lock-1