Meta推出更自然更即時的翻譯模型「Seamless」

Meta最近更新了其多模態AI翻譯模型「SeamlessM4T」,該模型支持近100種文字語言和36種語音語言。隨著新的「v2」架構的推出,Meta正在進一步擴展這一工具,以使對話翻譯變得更加自然和有表現力。這一更新將對日常生活和內容製作領域都產生重大影響 。

Meta推出更自然更即時的翻譯模型「Seamless」

Meta最近更新了其多模態AI翻譯模型「SeamlessM4T」,該模型支持近100種文字語言和36種語音語言。隨著新的「v2」架構的推出,Meta正在進一步擴展這一工具,以使對話翻譯變得更加自然和有表現力。這一更新將對日常生活和內容製作領域都產生重大影響​​。

新功能中的第一項是「SeamlessExpressive」,這個功能將用戶的表達方式(包括音調、音量、情感調性(如興奮、悲傷或低聲說話)、語速和停頓)轉化到翻譯的語音中。目前支持的語言包括英語、西班牙語、德語、法語、意大利語和中文。這種將用戶表達方式融入翻譯的創新做法,使得翻譯的語音不再顯得機械化​​​​。

第二項新功能是「SeamlessStreaming」,該功能可在講話者仍在說話時開始翻譯,使其他人能夠更快聽到翻譯。這項技術雖然仍有短暫的延遲(不到兩秒),但至少不需要等到某人完成一句話。Meta表示,挑戰在於不同語言有不同的句子結構,因此它必須開發一種專門的算法,來研究部分音頻輸入,以決定是否有足夠的上下文來開始生成翻譯輸出,或者是否繼續聆聽​​。

現在將 SeamlessM4T v2、SeamlessExpressive、SeamlessStreaming 合併成 Seamless 模型,讓翻譯做到接近「無縫接軌」的狀態,現在已經可以上Hugging Face 上試用。此外為了確保真實性,從這些表達式模型生成的音頻輸出都包含水印。在創建翻譯時,會在生成的音頻信號中添加一個聽不見的簽名用於追蹤,從而提高安全性。這種方法可以對較短的段落進行水印,比目前最先進的方法更加穩健​​

Read more

AI Agent 的 Reddit 爆紅中:創立宗教、AI 吐苦水,甚至還有 AI 版成人網站?

AI Agent 的 Reddit 爆紅中:創立宗教、AI 吐苦水,甚至還有 AI 版成人網站?

本周焦點事件 1. AI Agent 的 Reddit 爆紅中:創立宗教、AI 吐苦水,甚至還有 AI 版成人網站? 2. Manus 推出新功能 Skills :讓 AI 幫你打造可重複使用、可堆疊、可共享的技能包 3. Google 把 Agent 帶進了瀏覽器!Gemini EVERYWHERE 4. AI 生影片再進化,Luma 推出 Ray 3.14:支援原生 1080p、生圖速度快 4 倍 5. Gallup 最新報告:美國一半(49%)員工從未在工作中使用 AI AI

Krea AI Realtime Edit 即時編輯功能完整解析:顛覆AI圖像創作流程的革命性工具

Krea AI Realtime Edit 即時編輯功能完整解析:顛覆AI圖像創作流程的革命性工具

​ ​ 2026年1月22日,Krea AI推出了名為「Realtime Edit」(即時編輯)的Beta功能,徹底改變了這個遊戲規則。這項功能讓你可以在打字的同時,即時看到圖像的變化——不再有等待、不再有重新生成,你只需要輸入指令,圖像就會在約0.5秒內完成轉換。 ​ 這不僅僅是速度的提升,更是創作思維的根本轉變:從被動的「指令工具」,進化為主動的「創意樂器」。