OpenAI推出語音引擎預覽版,15秒聲音合成多語言人聲

OpenAI最近公開了語音引擎(Voice Engine)的預覽版,這是一項能夠重現人聲的創新AI工具。這項功能允許用戶上傳一段15秒的語音樣本,然後將這些語音資料合成更多版本,目前已開放給少數公司進行測試。這項技術的亮點在於,它能夠產生情感豐富且自然真實的聲音,與原始說話者非常相似,並且在處理完成後會刪除所使用的音訊。

OpenAI推出語音引擎預覽版,15秒聲音合成多語言人聲

OpenAI最近公開了語音引擎(Voice Engine)的預覽版,這是一項能夠重現人聲的創新AI工具。這項功能允許用戶上傳一段15秒的語音樣本,然後將這些語音資料合成更多版本,目前已開放給少數公司進行測試。這項技術的亮點在於,它能夠產生情感豐富且自然真實的聲音,與原始說話者非常相似,並且在處理完成後會刪除所使用的音訊。

在一個示例中,一名英語用戶的聲音被翻譯成多種語言,包括西班牙語、國語、德語、法語和日語,同時保留了原說話者的口音,這項技術不僅展示了OpenAI在提供高品質語音方面的能力,也引發了對於語音合成技術可能帶來的影響的討論,包括對配音員、影音內容製作等領域的潛在影響,以及公眾對這類工具被不法分子用於詐騙或散播不實資訊的擔憂。官網視聽

儘管OpenAI的Voice Engine展現了令人驚艷的成果,但公司對於這項技術的推廣採取了謹慎的態度,目前僅進行小範圍的限定測試。這種謹慎的態度反映了OpenAI對於技術濫用的擔憂,特別是在語音合成技術可能對配音員、影音內容製作等領域帶來影響,以及公眾對這類工具被不法分子用於詐騙或散播不實資訊的擔憂。

OpenAI強調,他們對於採用Voice Engine技術的合作夥伴都嚴格規範,禁止任何未經同意的使用情況,並且有針對產生的語音加入可追蹤原始來源的水印。此外,OpenAI提出了一系列措施,包括逐步淘汰以語音進行身分認證的敏感服務的驗證機制,以及開發追蹤視聽內容來源的技術,以確保人們在與真人或AI互動時能夠清晰辨識。

Read more

AI Agent 的 Reddit 爆紅中:創立宗教、AI 吐苦水,甚至還有 AI 版成人網站?

AI Agent 的 Reddit 爆紅中:創立宗教、AI 吐苦水,甚至還有 AI 版成人網站?

本周焦點事件 1. AI Agent 的 Reddit 爆紅中:創立宗教、AI 吐苦水,甚至還有 AI 版成人網站? 2. Manus 推出新功能 Skills :讓 AI 幫你打造可重複使用、可堆疊、可共享的技能包 3. Google 把 Agent 帶進了瀏覽器!Gemini EVERYWHERE 4. AI 生影片再進化,Luma 推出 Ray 3.14:支援原生 1080p、生圖速度快 4 倍 5. Gallup 最新報告:美國一半(49%)員工從未在工作中使用 AI AI

Krea AI Realtime Edit 即時編輯功能完整解析:顛覆AI圖像創作流程的革命性工具

Krea AI Realtime Edit 即時編輯功能完整解析:顛覆AI圖像創作流程的革命性工具

​ ​ 2026年1月22日,Krea AI推出了名為「Realtime Edit」(即時編輯)的Beta功能,徹底改變了這個遊戲規則。這項功能讓你可以在打字的同時,即時看到圖像的變化——不再有等待、不再有重新生成,你只需要輸入指令,圖像就會在約0.5秒內完成轉換。 ​ 這不僅僅是速度的提升,更是創作思維的根本轉變:從被動的「指令工具」,進化為主動的「創意樂器」。