Meta推出更自然更即時的翻譯模型「Seamless」

Meta最近更新了其多模態AI翻譯模型「SeamlessM4T」,該模型支持近100種文字語言和36種語音語言。隨著新的「v2」架構的推出,Meta正在進一步擴展這一工具,以使對話翻譯變得更加自然和有表現力。這一更新將對日常生活和內容製作領域都產生重大影響 。

Meta推出更自然更即時的翻譯模型「Seamless」

Meta最近更新了其多模態AI翻譯模型「SeamlessM4T」,該模型支持近100種文字語言和36種語音語言。隨著新的「v2」架構的推出,Meta正在進一步擴展這一工具,以使對話翻譯變得更加自然和有表現力。這一更新將對日常生活和內容製作領域都產生重大影響​​。

新功能中的第一項是「SeamlessExpressive」,這個功能將用戶的表達方式(包括音調、音量、情感調性(如興奮、悲傷或低聲說話)、語速和停頓)轉化到翻譯的語音中。目前支持的語言包括英語、西班牙語、德語、法語、意大利語和中文。這種將用戶表達方式融入翻譯的創新做法,使得翻譯的語音不再顯得機械化​​​​。

第二項新功能是「SeamlessStreaming」,該功能可在講話者仍在說話時開始翻譯,使其他人能夠更快聽到翻譯。這項技術雖然仍有短暫的延遲(不到兩秒),但至少不需要等到某人完成一句話。Meta表示,挑戰在於不同語言有不同的句子結構,因此它必須開發一種專門的算法,來研究部分音頻輸入,以決定是否有足夠的上下文來開始生成翻譯輸出,或者是否繼續聆聽​​。

現在將 SeamlessM4T v2、SeamlessExpressive、SeamlessStreaming 合併成 Seamless 模型,讓翻譯做到接近「無縫接軌」的狀態,現在已經可以上Hugging Face 上試用。此外為了確保真實性,從這些表達式模型生成的音頻輸出都包含水印。在創建翻譯時,會在生成的音頻信號中添加一個聽不見的簽名用於追蹤,從而提高安全性。這種方法可以對較短的段落進行水印,比目前最先進的方法更加穩健​​

Read more

【設計師的 AI 秘笈】程式小白也能懂!用 Cursor 從零搭建專屬 Design System Skill,讓 AI 自動寫出完美 UI

【設計師的 AI 秘笈】程式小白也能懂!用 Cursor 從零搭建專屬 Design System Skill,讓 AI 自動寫出完美 UI

每次請 AI 寫網頁代碼,UI 的顏色和間距總是像「抽盲盒」一樣難以預測?其實,你只需要幫 AI 建立一份「專屬設計說明書」。這篇文章專為非程式背景的設計師與 PM 打造,將透過 3 個簡單步驟,教你如何利用 Cursor 的「Design System Skill 」,讓 AI 牢牢記住你的 Material Design 或 Figma 設計規範。告別反覆來回修改的痛點,新手也能讓 AI 一鍵產出完美對齊設計稿的網頁組件!

lock-1
Google Stitch 重大更新:5大升級讓「Vibe Design」成為 AI 設計新典範

Google Stitch 重大更新:5大升級讓「Vibe Design」成為 AI 設計新典範

Google 旗下實驗性 AI 設計工具 Stitch 於 2026 年 3 月 18 日迎來史上最大規模更新,正式進化為「AI 原生設計畫布(AI-Native Canvas)」。這次更新不僅是功能擴充,更是對整個設計流程的重新定義。Google 將這套理念稱為「Vibe Design(氛圍設計)」,讓任何人不需手動繪製線框稿,只要用自然語言描述想法,就能生成高保真 UI 介面。