OpenAI推出語音引擎預覽版,15秒聲音合成多語言人聲

OpenAI最近公開了語音引擎(Voice Engine)的預覽版,這是一項能夠重現人聲的創新AI工具。這項功能允許用戶上傳一段15秒的語音樣本,然後將這些語音資料合成更多版本,目前已開放給少數公司進行測試。這項技術的亮點在於,它能夠產生情感豐富且自然真實的聲音,與原始說話者非常相似,並且在處理完成後會刪除所使用的音訊。

OpenAI推出語音引擎預覽版,15秒聲音合成多語言人聲

OpenAI最近公開了語音引擎(Voice Engine)的預覽版,這是一項能夠重現人聲的創新AI工具。這項功能允許用戶上傳一段15秒的語音樣本,然後將這些語音資料合成更多版本,目前已開放給少數公司進行測試。這項技術的亮點在於,它能夠產生情感豐富且自然真實的聲音,與原始說話者非常相似,並且在處理完成後會刪除所使用的音訊。

在一個示例中,一名英語用戶的聲音被翻譯成多種語言,包括西班牙語、國語、德語、法語和日語,同時保留了原說話者的口音,這項技術不僅展示了OpenAI在提供高品質語音方面的能力,也引發了對於語音合成技術可能帶來的影響的討論,包括對配音員、影音內容製作等領域的潛在影響,以及公眾對這類工具被不法分子用於詐騙或散播不實資訊的擔憂。官網視聽

儘管OpenAI的Voice Engine展現了令人驚艷的成果,但公司對於這項技術的推廣採取了謹慎的態度,目前僅進行小範圍的限定測試。這種謹慎的態度反映了OpenAI對於技術濫用的擔憂,特別是在語音合成技術可能對配音員、影音內容製作等領域帶來影響,以及公眾對這類工具被不法分子用於詐騙或散播不實資訊的擔憂。

OpenAI強調,他們對於採用Voice Engine技術的合作夥伴都嚴格規範,禁止任何未經同意的使用情況,並且有針對產生的語音加入可追蹤原始來源的水印。此外,OpenAI提出了一系列措施,包括逐步淘汰以語音進行身分認證的敏感服務的驗證機制,以及開發追蹤視聽內容來源的技術,以確保人們在與真人或AI互動時能夠清晰辨識。

Read more

Meta Connect 2025:六大重磅發布震撼科技界,智慧眼鏡革命正式開啟

Meta Connect 2025:六大重磅發布震撼科技界,智慧眼鏡革命正式開啟

Meta於2025年9月17-18日舉辦的年度開發者大會Meta Connect 2025,這場被譽為「智慧眼鏡元年」的科技盛會帶來了前所未有的創新突破。CEO馬克·祖克柏(Mark Zuckerberg)在活動中發布了六項重大產品更新,其中最受矚目的Meta Ray-Ban Display智慧眼鏡搭載革命性顯示技術和神經腕帶控制系統,標誌著穿戴式運算正式進入新紀元。這次發布會不僅展現了Meta在AI和穿戴科技領域的深厚實力,更為整個智慧眼鏡產業的未來發展指明了方向。

【AI 工具地圖】免費快速考取 Google Gemini Certified Educator 證照指南

【AI 工具地圖】免費快速考取 Google Gemini Certified Educator 證照指南

想在最短時間內獲得一張 Google 官方免費 AI 證照嗎?「Gemini Certified Educator」正是近期最熱門的選擇!這是一張專為教育者與學習者設計的 AI 能力認證,只要完成 37 題不限時的選擇題,就能立刻拿到有效期三年的電子證書,還能放到 LinkedIn 為履歷加分。考試重點涵蓋 Gemini 與 NotebookLM 的操作方法、Prompt 輸入技巧、AI 幻覺與偏見的判斷,即使你不是老師,也能透過這張證照展現專業的 AI 應用能力。本文將帶你完整解析:為什麼值得考?考什麼?如何準備?並附上報名流程,一篇搞懂,週末就能輕鬆拿到。

lock-1
全球第一位「AI 官員」上任,阿爾巴尼亞任命 AI 為內閣

全球第一位「AI 官員」上任,阿爾巴尼亞任命 AI 為內閣

從 AI 官員到語音翻譯,AI 這週正式「入職」現實世界。 阿爾巴尼亞任命全球首位 AI 部長,開啟政府決策新實驗;Google Meet 推出 2 秒內完成的即時語音翻譯,打破語言隔閡;Claude 則正式變身職場助理,能幫你轉檔寫簡報;而在內容世界,AI 播客工廠每週量產 3,000 集節目,一集成本不到 1 美元。 但這波 AI 熱潮是否過熱?OpenAI 董事長 Bret Taylor 坦言「泡沫存在,但這沒關係」,因為創造力會留下來──這週的新聞,也讓我們看見 AI 正從實驗室,跨出螢幕,成為真正的社會角色。

lock-1