Redian新闻
>
OpenAI首次官宣语音项目,配音演员警报拉响

OpenAI首次官宣语音项目,配音演员警报拉响

公众号新闻
机器之心报道
编辑:陈萍

文本输入和一个 15 秒的音频样本就能生成与原始说话者非常相似的自然声音。


今天,OpenAI 在语音领域又带给我们一点点震撼,通过文本输入以及一段 15 秒的音频示例,可以生成既自然又与原声极为接近的语音。值得注意的是,即使是小模型,只需一个 15 秒的样本,也能创造出富有情感且逼真的声音。
OpenAI 将这个语音引擎命名为 Voice Engine,首次开发时间是 2022 年末,今天是 Voice Engine 预览版的首次亮相。


下面为该语音引擎的一些早期示例,例如可以帮助用户翻译视频和播客等内容,输入一段原始音频:
Voice Engine 可以翻译成西班牙语:
还能翻译成中文:
以及日语:
Voice Engine 为有语言障碍的人合成相似的声音,使得用户在每种口语中保持声音一致:
输入参考音频:
生成的音频(英语):
生成的音频(葡萄牙语):
又比如,帮助患有突发性或退化性言语病症的患者说话。
原始声音:
参考声音:
生成的音频:
令人惊讶的是,Voice Engine 并未根据用户数据进行训练或微调,而是通过一个扩散过程和 transformer 结合的方式 —— 从而产生语音。
OpenAI 产品员 Jeff Harris 表示,他们采用少量音频样本和文本,生成与原始说话者相匹配的真实语音。请求完成后,所使用的音频将被删除。
其实,在语音生成领域,有很多我们熟悉的公司,从 ElevenLabs 到 Replica Studios 再到 Papercup ,亚马逊、谷歌和微软等大型科技公司也早已布局。
Harris 声称,采用 OpenAI 的方法,可以得到更好的语音质量。
在定价方面,尽管 OpenAI 在今天发布的营销材料中删除了 Voice Engine 的定价信息,但根据新闻网站 TechCrunch 消息,Voice Engine 的定价为每一百万字符 15 美元,这样的定价可以覆盖狄更斯的《雾都孤儿》,还略有余地,相当于 18 小时的音频,使得价格略低于每小时 1 美元。这个价格确实比 ElevenLabs 的收费便宜一些 —— 每月 100,000 字符收费 11 美元。不过,Voice Engine 目前不支持音调、音高或节奏的调整。
如果 OpenAI 的音频工具流行起来,那么,配音员们又将何去何从呢?要知道,ZipRecruiter 上的配音员工资从每小时 12 美元到 79 美元不等 —— 比 Voice Engine 贵很多,即使是低端的配音员,价格也不便宜。
最后又回到大家关心的安全与隐私,OpenAI 也早早考虑了这些问题,他们明确禁止未经授权来模仿任何个人或组织。与此同时,他们也开发了一系列安全措施,包括对 Voice Engine 生成的音频加水印,主动监控使用情况等。

参考链接:

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

https://techcrunch.com/2024/03/29/openai-custom-voice-engine-preview/




© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
不用再等 OpenAI ,全球首个 Open-Sora 全面开源!以色列拉响防空警报!伊朗停飞多地航班!又一家千亿地产巨头拉响退市警报!刚驰援了王健林的“白衣骑士”又要出手?股价立马涨停OpenAI CEO称GPT-5发布前会发一批新产品;Airbnb前高管将加入OpenAI担任高管丨AIGC日报咀外文嚼汉字(322)高尔夫“差点”与空手道“段位”hé bàng?hé bèng?For China’s Parks, How Open Is Too Open?Anthropic找到了打败OpenAI的方法:自己也成为OpenAI恐怖!美流浪汉当街杀人"吃掉他的脸",员警到场时已吞下眼睛、耳朵苏州景旅客近280万!官员警告:复活节周末需提前到达机场理想首次官宣降价,背刺了谁?惠普新款 Spectre x360 笔记本曝光,配英特尔酷睿 Ultra 200V CPU纽约水库发现无名男尸 官员警告:水煮沸才能饮用!传微软OpenAI领投人形机器人;OpenAI一键调用GPTs功能上线;年度大模型评测榜单公布丨AIGC大事日报2死1重伤!澳洲持刀伤人案大规模出现,商场持刀砍人,突袭民居,视频曝光!紧急警报拉响美议员警告: ISIS-K或在美国发动“莫斯科式”恐袭芝加哥遭遇强降雨,路面湿滑,洪水警报拉响!墨尔本拉响警报!烈性传染病公布,暴露地这么多,去过Monash大学、购物中心等速查...OpenAI小规模开放语音生成模型,上海发放电脑家电补贴,搜狗发布硬件产品服务下线公告,这就是今天的其他大新闻!OpenAI 推出语音引擎,只需15秒样本,即能重建任何人的声音浓人,nèng死淡人特朗普跻身全球富豪400强;诺和诺德减肥药成本5美元竟卖1000美元;OpenAI语音克隆:只需15秒音频样本|一周国际财经以色列确定48小时内反击伊朗,美情报人员警告美将发生恐怖袭击万达引入600亿元投资,未设立对赌协议;美国升级对华芯片出口限制;OpenAI发布语音模型Voice Engine|邦早报我理解的繁花武汉杨泗大桥15 秒音频即可“复制”原声!但OpenAI 担心新语音模型被滥用而限制发行【社会】他三次故意拉响警报导致RER C停运,还暴打司机OpenAI发布Voice Engine,15秒克隆任何语音,霉霉说中文就靠它全国碳市场价格首次突破100元/吨,配额趋向收紧小试验校园安全再拉响警报!芝加哥大学抢劫案频发,女学生英勇反抗夺枪全球首台!英伟达重磅产品交付,配送员:黄仁勋,收货人:OpenAI法国“犯罪地图”看过来!巴黎八区入室抢劫损失上百万欧!92岁老人也遭暴抢!今天,巴黎各地拉响警报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。