Redian新闻
>
【专题速递】音频生成、TTS和AIGC在音乐上的运用

【专题速递】音频生成、TTS和AIGC在音乐上的运用

科技

  //  

AIGC的发展为音频带来了什么?AIGC如何赋能音乐创作?如何识别虚假音频?TTS可以在哪种场景下解决特定问题?7月29日LiveVideoStackCon2023上海站音频新体验专场,为您解答。


音频新体验


随着多媒体和通信网络技术的不断更新,以及新型音视频应用场景的不断涌现,音频处理技术向着更加智能化和沉浸化的趋势发展。人们对音频的听觉体验要求也逐步提高,各类场景下的声音体验更加清晰,并呈现声临其境的沉浸感。

议题介绍


 


TOPIC1《AIGC技术探索与应用创新》

江源 科大讯飞 讯飞音乐首席科学家

针对近年来元宇宙、AIGC、大模型等关键技术发展,分享科大讯飞在AIGC技术方上,围绕音频、视觉、认知三大领域的技术布局和探索研究,以及在相关行业的创新应用案例。期待与业界共同探讨,利用人工智能的力量建设美好数字世界。
演讲大纲:1.当前AIGC领域的发展;2. 科大讯飞在音频生成创作领域的进展和应用案例;3. 科大讯飞在视觉生成创作领域的进展和应用案例;4. 科大讯飞在认知智能大模型领域的进展和布局。

TOPIC2《音乐流媒体平台在音乐AIGC方面的探索》

邓阳 网易云音乐音视频实验室 资深音频算法工程师

随着音乐制作设备成本的不断降低,音乐产业正在经历一场前所未有的变革。为了在这个新的音乐时代中保持青春活力,我们决心打造一种新型音乐创作引擎,利用最先进的AI技术来赋能音乐的创作和体验过程。我们的愿景是将音乐从一种静态的媒介转变为一种具有实时交互性和可感知性的元素,让用户在创作过程中享受更加丰富的音乐创作体验。然而,复杂的技术壁垒和研发门槛使我们面临着诸多挑战。
本次分享将以音乐流媒体平台在音乐AIGC方面的探索为主题,深入探讨天音TY-AIGC内容生产引擎的架构设计思路。在第一部分,我们将从国际主流的音乐生产解决方案及其技术难点入手,详细介绍如何将云音乐生态与AIGC相结合,设计高可用音乐生产解决方案。在第二部分,我们将深入挖掘AIGC的关键技术线和技术点,包括架构设计、算法优化、音频处理和数据管理等方面的技术细节。最后,在第三部分,我们将分享TY-AIGC技术落地的具体产品和业务成果,为音乐产业的AI数字化升级贡献技术成果。

TOPIC3《音频人物特征生成与鉴别发展实践》

温正棋 中科极限元 总经理

音频人物特征生成与鉴别是对模仿的特定人声音进行鉴别的技术,在安全、网信、公安和通讯等领域发挥着关键作用。使用深度模仿技术生成的虚假音频已经非常逼真,相关开源代码在近4年间同比增多217%,生成虚假音频的门槛大幅降低,导致互联网和电信网络中非常容易混杂虚假音频。虚假音频对国家安全、社会稳定和财产安全都带来巨大危害,对虚假音频的鉴别和防御现已成为世界各国政府、企业乃至个人所关注的热点问题之一。
本次分享将分为三个部分,第一部分介绍音频人物特征生成相关的研究进展,第二部分介绍音频人物特征鉴别方面的工作,第三部分介绍在AIGC的浪潮下,音频人物特征鉴别面临新的挑战以及我们的对策。通过以上三个部分将为大家系统地介绍团队在音频人物特征生成与鉴别领域的工作进展。

TOPIC4《当“AI”遇见“爱”——人工智能情感技术如何赋能喜马拉雅创作生态》

林怡亭 喜马拉雅 珠峰实验室数据研发负责人

音频行业一直存在着创作周期长、投入成本高的问题。喜马拉雅为了解决这个问题,采用TTS(语音合成)技术,用AI为创作者赋能,更好地打造创作者生态。本次演讲将会介绍喜马拉雅是如何利用TTS针对特定场景进行跨语言合成、情感处理,以及存在的难点和痛点。


扫描图中二维码或点击“阅读原文 

即刻购票

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【专题速递】云网一体,超大规模流量下边缘云的架构与技术揭秘智能周报|微软、Alphabet、 Meta发布AIGC后首份财报;小红书、TikTok上线AI生成发帖功能FT3 ↓、TT3↓, FT4 、TT4 、TSH 正常,要补充甲状腺激素吗?谷歌大模型云服务上线,代码生成、PaLM for Chat首次亮相小说:兰欣与乌茶 21兰甘亨石碑时间、空间可控的视频生成走进现实,阿里大模型新作VideoComposer火了无需微调,一张照片即可换脸、换背景!NUS等华人团队破局个性化视频生成周末灌水:关于PLATONIC PARTNERSHIPS【玩具日报】奥飞娱乐上半年预盈5000万至6500万元;王尼玛恶搞奥特曼一案达成和解幻霄科技CTO高天寒:创新教育体验—探索AIGC在元宇宙教学实训中的无限潜能|量子位·视点分享回顾【专题速递】「云智新生」_视频云的全智能进化借鉴海外看ESG在中国的运用细胞与基因治疗之——慢病毒的运用【专题速递】感知无损压缩、LCEVC、RTE中的AV1、PPA优化以及Tencent266编码器ONE THIRD独家专访|Hedegaard:绝不在音乐质量上妥协千利休学习名言一个开源库搞定各类文本到音频生成,Meta发布AudioCraft【专题速递】大模型、带宽优化、智能外呼和AIGC的数据实践【无忧买房】​Somerville全翻新三室公寓出售,近Porter和Davis广场,方便到哈佛、Tufts和MIT台风兰恩已生成、医疗反腐风暴正在展开、美派多名士兵前往红海等丨今日天下【专题速递】在线K歌、云化XR、咔嚓剪辑和FFmpeg直播能力更新计划五一演出收入同比增长962.2%,Resso 关闭免费服务,AI音乐上不了平台?希腊雅典,海港黎明【忽然一周】奥飞娱乐上半年净利润6045万元;乐高预计今年中国门店数量将超500家;华强方特2023年半年度净利2.90亿元阿里大模型VideoComposer火了!时间、空间可控的视频生成走进现实AIGC算力全景与趋势报告发布!一文解读AIGC算力构成、产业链条,还有五新趋势判断Meta音频AI三件套爆火:一句话生成流行音乐&音效,还能高保真压缩音频|开源【专题速递】MD-VQA、AB实验、音视频质量建设以及在手机上的应用【专题速递】全真互联时代下,如何为用户打造极致的音视频体验?【专题速递】触觉反馈、边缘计算+元宇宙、Unity的云原生分布以及GPU加速下的元宇宙AIGC在保险行业有哪些应用落地的可能性?年轻人到底在音乐节玩什么?AIGC在媒体领域运用走到哪一棒?无故遭数人围殴!!美国亚裔大学生在音乐节上突遭群殴,浑身血获途人报警送院...
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。