Redian新闻
>
15 秒音频即可“复制”原声!但OpenAI 担心新语音模型被滥用而限制发行

15 秒音频即可“复制”原声!但OpenAI 担心新语音模型被滥用而限制发行

公众号新闻


整理 | 傅宇琪

3 月 30 日,OpenAI 在官网首次展示了名为“ Voice Engine ”的语音生成模型,该模型能够通过文本输入和仅仅 15 秒的音频样本生成与原始说话者声音高度相似、充满情感且逼真的自然语言语音。据悉,OpenAI 于 2022 年末首次开发出 Voice Engine,并已将其应用于其文本转语音 API 以及 ChatGPT 语音和朗读功能中的预设语音。

这项技术的问世,显然将对那些经常录制自己语音的人产生重大影响,包括播客、配音艺术家、口语表演者、有声书和广告解说员、游戏玩家、流媒体主播、客户服务代理、销售人员等众多职业。

不过目前,这项技术仅在小范围内提供,拥有访问权限的公司包括:教育技术公司 Age of Learning、视觉叙事平台 HeyGen、一线健康软件制造商 Dimagi、AI 通信应用程序创建者 Livox 和卫生系统 Lifespan。OpenAI 在其博客文章中表示:“这些小规模部署有助于为我们的方法、保障措施提供信息,并思考语音引擎如何在各个行业中发挥作用。”

官网文章中,OpenAI 也展示了 Voice Engine 的使用示例。首先,提供英文参考音频:

基于该示例,以下是三个 AI 生成的音频剪辑:



可以说,无论从音色,还是从语调、停顿等方面来看,OpenAI 的产出结果都模仿得惟妙惟肖。

OpenAI 目前使用该工具的开发合作伙伴之一,非营利性医疗系统 Lifespan 的诺曼·普林斯神经科学研究所(Norman Prince Neurosciences Institute)正在使用该技术帮助患者“恢复声音”:有一名患者因脑肿瘤失去了清晰说话的能力,该公司通过她早期在学校演讲的录音,“复制”出了她的声音。

这个模型还可以将其生成的音频翻译成不同的语言,使得它对音频业务公司很有用,比如 Spotify Technology SA。Spotify 已经在自己的试点项目中使用了这项技术来翻译 Lex Fridman 等热门主持人的播客。

AI 文本到音频生成是生成式 AI 的一个领域,正在不断发展。目前大多数专注于生成器乐或自然声音,语音生成方面相对较少被接触,部分原因是人们对深度伪造风险的担忧。

造假风险?

与 OpenAI 之前在生成音频内容方面的努力不同,Voice Engine 可以创建听起来很像本人的语音,并具有特定的节奏和语调。软件需要的是 15 秒录制的人说话的音频,以重现他们的声音。

在该工具的演示中,外媒听取了 OpenAI 首席执行官 Sam Altman(萨姆·奥特曼) 的一段视频,他简要解释了这项技术,声音听起来与他的实际演讲没有区别,但完全是人工智能生成的。

“如果你有正确的音频设置,Voice Engine 基本上能生成与本人无异的声音,”OpenAI 的产品负责人 Jeff Harris(杰夫·哈里斯)说。“它的技术质量令人印象深刻。”不过,哈里斯最后补充说:“在真正准确地模仿人类说话的能力方面,显然存在很多安全问题。”

就在不久之前,已经有 AI 技术被用于伪造声音。今年 1 月,一个自称是 Joe Biden(乔·拜登)总统的人打电话鼓励新罕布什尔州的人们不要在初选中投票,声音听起来十分逼真,这一事件在关键的大选之前也引发了人们对 AI 的担忧。

OpenAI 的一位发言人表示,在收到政策制定者、行业专家、教育工作者和创意人员等利益相关者的反馈后,他们决定缩减发布规模。“我们认识到,产生类似于人们声音的言论具有严重的风险,这在选举年尤其重要,” OpenAI 在一篇博客文章中写道。“我们正在与来自政府、媒体、娱乐、教育、公民社会等领域的美国和国际合作伙伴合作,以确保我们在建设过程中采纳他们的反馈。”

据悉,OpenAI 要求合作伙伴同意遵守其使用政策,不使用该模型来冒充个人或组织,且需要获得原始说话者的“知情同意”,并向听众披露这些声音是 AI 生成的。OpenAI 还在音频剪辑中添加了一个听不见的音频水印,使其能够区分一段音频是否是由 Voice Engine 创建的。

在文章的最后,OpenAI 呼吁银行逐步取消语音认证,作为访问银行账户和敏感信息的安全措施。它还呼吁加强对 AI 深度伪造的教育,并更多地开发用于检测音频内容是真实的还是 AI 生成的技术,以应对更先进的 AI 技术带来的挑战。

参考链接:

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

https://www.theverge.com/2024/3/29/24115701/openai-voice-generation-ai-model

https://www.bloomberg.com/news/articles/2024-03-29/openai-previews-new-audio-tool-that-can-read-text-mimic-voices?srnd=technology-vp

内容推荐
大模型应用挑战赛已拉开帷幕。现阶段,多数语言模型已完成 3 轮更新,大模型赛道入场券所剩无几。同时,2023 年超 200 款大模型产品问世,典型场景又有哪些产品动向?对于现阶段的文生图产品而言,四大维度能力究竟如何?以上问题的回答尽在《2023 年第 4 季度中国大模型季度监测报告》,欢迎大家扫码关注「AI 前线」公众号,回复「季度报告」领取。

活动推荐

AICon 全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展将于 5 月 17 日正式开幕,本次大会主题为「智能未来,探索 AI 无限可能」。如您感兴趣,可点击「阅读原文」查看更多详情。

今天是会议 9 折购票阶段,购票或咨询其他问题请联系票务同学:13269078023,或扫描上方二维码添加大会福利官,可领取福利资料包。

今日荐文


大模型创业淘汰潮开始了:这是第一个估值10亿美元的祭品

小米汽车乱局:小爱同学“罢工”、F 码炒至 5 万元;罗永浩直播卖阿里云;小扎亲自挖谷歌员工:无需面试  | AI周报

今年 Q1 “神仙打架”:Sora惊艳、马斯克“找茬”,微软谷歌接连翻车 |文末好礼

投资人烦死 Sam Altman 了

马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!

你也「在看」吗?👇


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Anthropic找到了打败OpenAI的方法:自己也成为OpenAIOpenAI发布Voice Engine,15秒克隆任何语音,霉霉说中文就靠它ChatGPT 语音模式酷似「寡姐」?OpenAI 刚刚发文回应雷军宣布:追加开售;凯迪拉克回应海报暗讽小米SU7;OpenAI 首次展示音频模型;俞敏洪要求河南新东方文旅停播整顿...OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折AI搜索引擎来了!谷歌放大招,发布最强AI模型,语音功能正面刚OpenAI山姆或将开通香港线上业务;抖音回应限制发布时政财经内容;淘宝改版首页... | 刀法品牌热讯OpenAI掌门人最新演讲内容要点:下一代AI模型更强大,不需担心超级智能浓人,nèng死淡人AI早知道|腾讯智影宣布声音模型大升级;淘宝推出天猫AI讲价小助手OpenAI首席科学家宣布离职,曾参与驱逐CEO奥特曼;马斯克称OpenAI最新模型“慢得离谱”丨AIGC日报GPT-4o再秀神操作,“复现”OpenAI总裁讲课,网友当真了原生家庭伤害,被滥用和夸大了纽约新一轮驱逐移民行动开始!但这类移民可“豁免”…2023年度全国购物中心新势力TOP30微软「诈骗届」王牌框架,真到可怕!一张照片+音频即可生成数字人今日帖,今日读——— 2024年1月31日npm又被滥用,灰产用《庆余年2》盗版资源——把开源公共基础设施的羊毛薅秃了万达引入600亿元投资,未设立对赌协议;美国升级对华芯片出口限制;OpenAI发布语音模型Voice Engine|邦早报楼市“去库存”:新语境,老目标7037 血壮山河之枣宜会战 “扑朔迷离”南瓜店 14OpenAI小规模开放语音生成模型,上海发放电脑家电补贴,搜狗发布硬件产品服务下线公告,这就是今天的其他大新闻!OpenAI 推出语音引擎,只需15秒样本,即能重建任何人的声音云岚时光香刻|1秒,将世界切换成静音模式AI 时代的新语言、新工具,以及新的开发者昇腾社区回应网传华为发布会大模型生成图片系人工操控;Sam Altman:新款语音模型GPT-4o尚未发货丨AIGC日报生命的美好不可辜负特朗普跻身全球富豪400强;诺和诺德减肥药成本5美元竟卖1000美元;OpenAI语音克隆:只需15秒音频样本|一周国际财经OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了电影《第二十条》爆火,事件原型被扒:“可怜之人必有可恨之处”,是世上最大的谬误财经早参|抖音限制发布时政、财经等内容?回应来了;中国恒大原总裁夏海钧拟被处分;小米回应SU7刹车故障:软件误识别,已修复今日帖,今日读——2024年2月1日连发4个大招,房价会上涨吗?专家:不必过早担心新政可能引发的房价暴涨问题模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收旅行的尽头是日本(6)国立新美术馆
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。