Meta推出多語言語音與文字轉換AI模型,跨越語言障礙的重大突破

Mega 新推出的AI模型「SeamlessM4T」已引起廣泛關注,這款模型能夠跨越語言障礙,進行語音和文字之間的翻譯和轉換,涵蓋近100種語言,被認為是AI在語音和文字互轉領域的一大突破。此模型承襲了Meta「報表拋下任何語言」(No Language Left Behind,NLLB)專案和通用語音翻譯工具(Universal Speech Translator,UST)專案,基於大規模多語言語音(Massively Multilingual)語音(MMS)數據集,實現了語音轉語音、語音轉文字、文字轉語音、文字轉文字等四種模式的翻譯。

Meta推出多語言語音與文字轉換AI模型,跨越語言障礙的重大突破

techcrunch報導,Mega 新推出的AI模型「SeamlessM4T」已引起廣泛關注,這款模型能夠跨越語言障礙,進行語音和文字之間的翻譯和轉換,涵蓋近100種語言,被認為是AI在語音和文字互轉領域的一大突破。此模型承襲了Meta「報表拋下任何語言」(No Language Left Behind,NLLB)專案和通用語音翻譯工具(Universal Speech Translator,UST)專案,基於大規模多語言語音(Massively Multilingual)語音(MMS)數據集,實現了語音轉語音、語音轉文字、文字轉語音、文字轉文字等四種模式的翻譯。

在模型的開發過程中,Meta從公開網絡收集了約數百億個句子的文字數據以及約400萬小時的語音數據作為訓練資料。據稱,這些數據的採集不受版權保護限制,主要來自於開源或獲得許可的內容。基於這些數據,Meta建立了名為「SeamlessAlign」的訓練數據組,該數據組包含了超過44.3萬個小時的語音和文字場景,以及2.9萬個小時的「語音轉語音」場景內容。

Meta表示,經過內部基準測試,SeamlessM4T在語音轉文字的處理表現上優異,與當前最先進的語音轉譯模型相比有顯著優勢。SeamlessM4T的優勢被歸因於其豐富的訓練數據,涵蓋了語音和文字兩方面的數據。

然而,Meta也坦承SeamlessM4T存在一些限制。Meta 透露,該模型“在從中性術語翻譯時過度概括為男性形式”,並且在大多數語言中從男性參考(例如英語中的“he”等名詞)翻譯時表現更好。此外,Meta 推測,在缺乏性別信息的情況下,SeamlessM4T 在大約 10% 的情況下更喜歡翻譯男性形式,這可能是因為訓練數據中“男性詞彙的比例過高”。

這些系統可能會導致詞彙豐富性的喪失,與人工智慧不同,人類口譯員在將一種語言轉換成另一種語言時,會根據具體情境做出獨特的選擇。他們可能會解釋、規範化、濃縮和總結,從而創造出一種非正式的翻譯風格,而人工智能系統可能會生成更「準確」的翻譯,但這種「準確」可能是以犧牲翻譯的多樣性和靈活性為代價,這也許解釋了為什麼Meta建議不要在某些情境下使用「SeamlessM4T」進行翻譯,特別是在需要長篇翻譯或經過認證的翻譯場景中。例如,政府機構和翻譯機構認可的翻譯可能不適合使用這種技術。

同樣,Meta也不建議將「SeamlessM4T」用於醫療或法律目的,這可能是為了避免在翻譯出現錯誤時可能引起的潛在風險。這一情況突顯了人工智慧翻譯與人類翻譯之間的差異,以及在特定領域中使用AI翻譯技術可能需要謹慎處理的挑戰。

Meta一直以開源方式向開發者和研究人員分享其AI模型。除了SeamlessM4T之外,近期還推出了能夠創造音樂的AudioCraft模型,以及大型語言模型Llama 2的開源使用,這一系列舉措彰顯了Meta對於促進AI領域發展的雄心。

Read more

加拿大新創 Taalas 直接把 AI 模型變成晶片!每秒 17000 token 的 HC1

加拿大新創 Taalas 直接把 AI 模型變成晶片!每秒 17000 token 的 HC1

感謝大家熱情參與「AI 郵報年度訂閱調查」!目前調查已正式結束,我們收到了非常多寶貴的建議,有些人覺得我們可以辦更多的實體活動或是 Workshop (這些我們目前都在籌備中!很快就有消息能跟大家分享)。 但在整理名單時,我們發現系統設定未能完整擷取到部分讀者的 Manus 註冊 Email。為了確保您的抽獎權益不因系統問題受損,請先前已填寫過的夥伴,撥冗 10 秒鐘回到原表單連結補填 Email,我們將以此作為最終的中獎與發獎憑證。 👉 補填連結: AI 郵報訂戶調查 * 得獎公布: 將於下期電子報正式揭曉。 * 特別說明: 活動目前已截止,本次補填僅限原參與者領獎資格確認;新填寫的朋友雖然無法計入抽獎,但我們依然非常感謝您的支持! 另外,我們正將大家的 Feedback 整理成一份精華 Report,預計於下週與各位分享,敬請期待! 接著馬上讓我們進入本週的五件 AI 大事,搭配觀察筆記 讓你不只是看熱鬧,也能看懂門道。 本周焦點事件 1. 加拿大新創 Taalas 直接把 AI

[AI郵報新年特輯] 2025 - 26 Top 5 AI 工具 & 大事件回顧

[AI郵報新年特輯] 2025 - 26 Top 5 AI 工具 & 大事件回顧

新年快樂,各位 AI 狂熱者!(文末有抽獎活動!抽十位 Manus 8000 積分 Pro 會員!) 在點開這封信、開始閱讀本週的週年回顧前,請先給螢幕前的自己鼓鼓掌。老實說,在農曆新年期間還能保持「開信」的慣性,基本上已經是 AI 成癮者了,如果開一個戒斷互助會,我想是沒有人會來的,因為就我們來說,用 AI 已經成為不想戒、不能戒的習慣了。 上週我們啟動了《AI 郵報》的年度訂戶調查(目前仍在進行中,點這裡前往填寫)。在後台看反饋時,有讀者對我們的題目設計蠻有興趣,私底下詢問我們「為什麼要問閱讀週報時,同時還在做什麼?」 這題看似閒聊,但其實是因為我之前研究 Netflix 的一個啟發。當大家在討論 Disney+ 或 YouTube 或是其他本地 OTT 對於