Redian新闻
>
OpenAI首次官宣语音项目,配音演员警报拉响

OpenAI首次官宣语音项目,配音演员警报拉响

公众号新闻
机器之心报道
编辑:陈萍

文本输入和一个 15 秒的音频样本就能生成与原始说话者非常相似的自然声音。


今天,OpenAI 在语音领域又带给我们一点点震撼,通过文本输入以及一段 15 秒的音频示例,可以生成既自然又与原声极为接近的语音。值得注意的是,即使是小模型,只需一个 15 秒的样本,也能创造出富有情感且逼真的声音。
OpenAI 将这个语音引擎命名为 Voice Engine,首次开发时间是 2022 年末,今天是 Voice Engine 预览版的首次亮相。


下面为该语音引擎的一些早期示例,例如可以帮助用户翻译视频和播客等内容,输入一段原始音频:
Voice Engine 可以翻译成西班牙语:
还能翻译成中文:
以及日语:
Voice Engine 为有语言障碍的人合成相似的声音,使得用户在每种口语中保持声音一致:
输入参考音频:
生成的音频(英语):
生成的音频(葡萄牙语):
又比如,帮助患有突发性或退化性言语病症的患者说话。
原始声音:
参考声音:
生成的音频:
令人惊讶的是,Voice Engine 并未根据用户数据进行训练或微调,而是通过一个扩散过程和 transformer 结合的方式 —— 从而产生语音。
OpenAI 产品员 Jeff Harris 表示,他们采用少量音频样本和文本,生成与原始说话者相匹配的真实语音。请求完成后,所使用的音频将被删除。
其实,在语音生成领域,有很多我们熟悉的公司,从 ElevenLabs 到 Replica Studios 再到 Papercup ,亚马逊、谷歌和微软等大型科技公司也早已布局。
Harris 声称,采用 OpenAI 的方法,可以得到更好的语音质量。
在定价方面,尽管 OpenAI 在今天发布的营销材料中删除了 Voice Engine 的定价信息,但根据新闻网站 TechCrunch 消息,Voice Engine 的定价为每一百万字符 15 美元,这样的定价可以覆盖狄更斯的《雾都孤儿》,还略有余地,相当于 18 小时的音频,使得价格略低于每小时 1 美元。这个价格确实比 ElevenLabs 的收费便宜一些 —— 每月 100,000 字符收费 11 美元。不过,Voice Engine 目前不支持音调、音高或节奏的调整。
如果 OpenAI 的音频工具流行起来,那么,配音员们又将何去何从呢?要知道,ZipRecruiter 上的配音员工资从每小时 12 美元到 79 美元不等 —— 比 Voice Engine 贵很多,即使是低端的配音员,价格也不便宜。
最后又回到大家关心的安全与隐私,OpenAI 也早早考虑了这些问题,他们明确禁止未经授权来模仿任何个人或组织。与此同时,他们也开发了一系列安全措施,包括对 Voice Engine 生成的音频加水印,主动监控使用情况等。

参考链接:

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

https://techcrunch.com/2024/03/29/openai-custom-voice-engine-preview/




© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
小试验墨尔本拉响警报!烈性传染病公布,暴露地这么多,去过Monash大学、购物中心等速查...特朗普跻身全球富豪400强;诺和诺德减肥药成本5美元竟卖1000美元;OpenAI语音克隆:只需15秒音频样本|一周国际财经苏州景【社会】他三次故意拉响警报导致RER C停运,还暴打司机万达引入600亿元投资,未设立对赌协议;美国升级对华芯片出口限制;OpenAI发布语音模型Voice Engine|邦早报注意!波士顿拉响空气质量警报,达到“不健康”级别,持续至今晚早鸟报|​抖音演绎内容需明确标注;小红书成立电商运营部;京东采销大幅涨薪...我理解的繁花联邦警报拉响!电网恐受影响,GPS或失联 极光登场……准备好手电筒OpenAI 推出语音引擎,只需15秒样本,即能重建任何人的声音武汉杨泗大桥咀外文嚼汉字(322)高尔夫“差点”与空手道“段位”郎朗好莱坞摘星离不开它!同款捡漏机会来了!一年一次官方特卖hé bàng?hé bèng?OpenAI又一吹哨人离职!拉响安全警报,风险隐患实在太大美国爆发禽流感:惊现人类病例!加拿大拉响警报!牛奶必须买这种!AI 配音酷似斯嘉丽,OpenAI 紧急停用;净亏损大幅收窄,小鹏股价一度大涨;Kimi 访问量超文心一言 | 极客早知道2死1重伤!澳洲持刀伤人案大规模出现,商场持刀砍人,突袭民居,视频曝光!紧急警报拉响Anthropic找到了打败OpenAI的方法:自己也成为OpenAI配音VS同期录音,哪种更能保留演员情感?芝加哥遭遇强降雨,路面湿滑,洪水警报拉响!浓人,nèng死淡人储蓄警报拉响!消费支柱裂痕加剧对美国意味着什么美国爆发禽流感:疑似惊现人类病例…加拿大拉响警报!牛奶必须买这种!全球首台!英伟达重磅产品交付,配送员:黄仁勋,收货人:OpenAI法国“犯罪地图”看过来!巴黎八区入室抢劫损失上百万欧!92岁老人也遭暴抢!今天,巴黎各地拉响警报OpenAI发布Voice Engine,15秒克隆任何语音,霉霉说中文就靠它OpenAI大招要来了!AI语音助手狙击谷歌苹果,官宣下周二上新,GPT-5年前见以色列拉响防空警报!伊朗停飞多地航班!理想首次官宣降价,背刺了谁?寡姐怒了,GPT-4o系统配音强行模仿,OpenAI回应删除OpenAI小规模开放语音生成模型,上海发放电脑家电补贴,搜狗发布硬件产品服务下线公告,这就是今天的其他大新闻!校园安全再拉响警报!芝加哥大学抢劫案频发,女学生英勇反抗夺枪又一家千亿地产巨头拉响退市警报!刚驰援了王健林的“白衣骑士”又要出手?股价立马涨停
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。