Redian新闻
>
别的简报|微软的新 AI 可以模仿任何人的声音

别的简报|微软的新 AI 可以模仿任何人的声音

其他

#别的简报# 是 BIE 的日更简报,旨在介绍这个浮华世界中正在发生的各种有或者没有意义的事件,供你在茶余饭后 /上班摸鱼的这个时间里转移一下注意力,看看别人正在干什么。
今天是 2023 年 1 月 11 日,星期三。研究人员并没有提供试用的途径。

最近,微软研究人员宣布了一种名为 VALL-E 的新文本转语音的人工智能模型,给它一段三秒钟的音频样本,它就能模仿说话者的声音说任何话,而且还保留说话者的情感语调。 
在 VALL-E 的示例网站上有几十个音频样本。“Speaker Prompt” 是提供给 VALL-E 的三秒钟的真人音频,“Ground Truth” 是样本本人读目标语段的录音,“Baseline”是用传统文本到语音合成方法创造的音频,这俩都是对照组,跟 VALL-E 生成的语音做对比。
除了保留说话人的声音音色和情绪语调,VALL-E 还可以模仿样本音频的声学环境。比如输入的录音是在打电话,输出的模仿音频也听起来像是在电话里一样。同时,VALL-E 可以通过改变生成过程中使用的随机种子来产生声调的变化。 
但不像 ChatGPT,VALL-E 的研究人员并没有提供试用的途径,因为他们表示自己意识到了这项技术可能带来的潜在社会危害。他们写道:
“由于 VALL-E 可以合成保持说话者特征的语音,滥用有可能会带来风险,比如欺骗语音识别功能或冒充特定说话者。为了减轻这种风险,建立一个检测模型来判断一个音频片段是否由 VALL-E 合成是有可能的。不仅如此,在对模型接下来的开发中,我们将继续把微软对AI的原则付诸实践。”
但估计他们自己已经玩得很开心了。


// 编译:Arvin Hu

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
别的简报|帮你把大白话改成商务邮件的 AI 工具来了别的简报|韦氏词典发布年度词汇:Gaslight —— 煤气灯别的简报|​人类艺术家首次大规模抗议 AI 生成图片别的简报|人类精子浓度只剩一半,而且下降速度在加快跳蚤市场里的神韵3秒复制任何人的嗓音!微软音频版DALL·E细思极恐,连环境背景音也能模仿别的简报|史上首次,没有英国球迷在世界杯上被逮捕别的简报|为避免污名化,猴痘将改名为“M 痘”别的简报|年末大戏!男拳网红跟格蕾塔对喷喷进监狱别的简报|三男子偷狗不成,于是偷走了主人的哥哥别的简报|2022 年牛津词典年度词汇:“哥布林模式”别的简报|​阿根廷小姐和波多黎各小姐结婚了!周末随笔(战争· 疫情· 疾病)​别的简报|维基百科不同意这位加拿大女作家离婚,于是她……别的简报|《萤火虫之墓》水果糖停产,再也吃不到妹妹的糖果了别的简报|俄铸九戒,赠独联体八戒,独留最后一戒回国路 再放松; 官清零 民抗争攻击民企的声音可以有,但要让挺民营经济的声音更强大起来别的简报|想要年老脑子好,猫猫狗狗少不了这年青人卧槽,卧槽,玩命呢啊【决赛预告】NYC 心动的声音 | 决赛观众报名开启!快来pick你最爱的声音吧!​别的简报|88 岁老人体内取出一战炮弹,医院进行疏散别的简报|科学证据支持,人一生的记忆会在死亡前回放大型音乐舞蹈史诗《东方红》别的简报|美国男子刺穿女子心脏,自称为了“拯救生命”别的简报|NASA 花 5720 万美金研发在月球上搞基建的技术别的简报|法国将为年轻人免费提供安全套别的简报|新《变形金刚》动画推出首个非二元性别机器人别的简报|欧盟花 40 万欧元做元宇宙派对引来六人参加别的简报|加州女孩获得独角兽抚养官方永久许可证别的简报|英格兰球迷穿十字军盔甲看球,卡塔尔方禁止其进入赛场别的简报|26 岁的 Flossie 正式成为世界上最老的猫咪别的简报|巴基斯坦,强奸者在同意与受害者结婚后被释放别的简报|戴森推出空气净化耳机,售价 949 美元别的简报|​诺兰新片《奥本海默》核爆实验场景将不使用 CGI
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。