Redian新闻
>
音视频编辑技术新拐点:AI智能力量的隐形突破

音视频编辑技术新拐点:AI智能力量的隐形突破

公众号新闻

短视频时代下,HMS Core的进击与赋能。


我们正处于一个短视频充斥生活的时代。

短视频的发展速度超出很多人的想象,据估计,今年年底市场规模能达到4000亿以上,大规模的创作参与,让内容创作生态不断完善,用户创作音视频也成为移动互联网的主导内容形态。随着视频内容创作节奏的加快,大众鉴赏能力与鉴赏标准的不断提升,也要求创作者不断增强创意设计、增快创作频率。但是,由于用户音视频编辑技术基础相对薄弱,市场强烈需要一种能降低创作门槛、提升剪辑效率的辅助工具。

作为鸿蒙生态的一个移动应用技术底座,HMS Core是怎样理解和破解的呢?

HDC 2022

HMS Core音视频编辑服务的完美一击

11月4日,在以“创新照见未来”为主题的华为开发者大会 2022(HDC 2022)上,作为鸿蒙生态重要组成部分的HMS Core(华为移动核心服务),向开发者全面展示了最新的AI技术与核心服务能力,以帮助更多的应用开发者参与到鸿蒙新生态中。HMS Core的音视频开发生态引领影音、影像美学技术持续升级,进而帮助创作者和开发者在音视频领域打出完美一击。

在HDC音频与视频展区,开发者能够一站式体验HMS Core音视频编辑服务的新特性。参照短视频创作的顺序:勾选视频素材-分割精彩片段-匹配动画特效-添加音乐,HMS Core展台将音频编辑与视频编辑能力结合,将精彩片段一键成片、高拟真歌声合成等AI技术在一台手机上进行了全面展示,重塑了开发者对短视频剪辑的体验:创作可以更便捷,更智能。

除了能一气呵成创作短视频的便捷流程,在展台上还可以体验到视频编辑服务中的一键微笑、动态照片等多种脸部AI能力。令人惊喜的是,导入一张正面脸部的图片,一键微笑能力可以智能匹配出合适的微笑弧度及其牙齿形态,比市面上许多只能露出标准8颗牙齿的微笑特效更加自然。在展台讲解员处了解到,当前HMS Core视频编辑服务不仅有全面的剪辑功能和丰富的素材库,还提供如AI着色等14种AI能力,集成方式也非常简单,最快2小时即可集成使用,这将为开发者大幅降低开发成本,也能更聚焦产品本身,做出具有特色的应用。

华为开发者大会2022主题演讲中提及到的花瓣剪辑一键成片功能,使用的就是HMS Core视频编辑服务“精彩片段”技术。该技术采用华为自研的AI美学评价引擎,综合光影、色彩和构图维度,能精准捕捉到动态人脸和人体,从海量视频中智能提取有较高美学价值的精彩片段。同时,通过超大规模的内容理解模型,视频编辑服务积累了14亿图像语义的训练数据,能支持理解百万场景内容。现在,HMS Core视频编辑服务面向开放者全面开放这项技术。

华为开发者大会2022主题演讲现场

完美的视频

也需要更深入人心的音频

自由创造的除了视觉上的剪辑,音频编辑带来体验感让人更加新奇。我们知道,一段容易被大众所记住的短视频,除了优美和谐的画面,沉浸式的音乐享受同样重要。为了让用户身临其境地畅享音乐,HMS Core音频编辑服务推出了高拟真歌声合成和空间音频渲染技术。

通过使用HMS Core音频编辑服务中的歌声合成技术,创作者只需输入一段歌词,自由选择流行女声或国风女声,系统就可以根据所选的曲式、音色完成高拟真歌声合成,实现媲美真人的虚拟歌声。基于独创的AI Singer模型,音频编辑服务能够精准预测颤音、扰动和换气声等演唱技巧,让拟真的呼吸音与歌曲节奏完美契合,实现歌手级的高水准演唱。这些功能可以在短视频创作、UGC音乐制作、虚拟歌手等领域应用推广,加速推动原创音视频内容和原创IP的创新。另外,据展区工作人员介绍,HMS Core还会继续提供更多人声音色。

立体环绕演唱的沉浸式空间音频体验同样惊喜,感受人声、伴奏、乐器等音频在三维空间来自不同方位、轨迹的立体环绕音效。创作者还可以自由设置三维音效:通过分离人声、乐器的音轨,让不同音源元素在水平线180°环绕耳边,塑造沉浸式声场,还原真实世界的立体音效。这些功能可以用在音乐播放平台、K歌平台、音频制作等领域,为推动音乐娱乐方式的多元化发展提供技术支撑。

华为开发者大会2022主题演讲现场

开放生态

HMS Core看重的是星辰大海般的征程

目前我国的音视频内容创作市场愈发拥挤,用户创作供给却仍然处在扩张期,创作者对于契合自身属性的音视频处理技术存在较高的需求,这也不断促进创作辅助工具及服务的完善。

HMS Core提供的音视频编辑能力,希望和开发者共同构建繁荣的应用生态,为用户提供全场景高品质的智慧生活体验。世有伯乐然后有千里马,在音视频创作领域,HMS Core的能力也正在帮助创作者和开发者们开启星辰大海般的征程,或许将赋予行业更为创新与高效的未来。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
中秋节,炸出了朋友圈的隐形富豪【品牌专场】视频化升级新思路 —— StreamLake音视频技术创新与应用[圆桌]技术商业策略:攻城略地,音视频企业“走出去”硅谷技术新焦点:摆脱缝合怪的多云设计,才是云计算的归宿【今晚7点】:对话田建华——web音视频新能力Chiplet技术新突破,降低芯片设计门槛新一代视频编码标准VVC的芯片设计思考音视频技术开发周刊 | 265大规模核酸叫停,预示新拐点到来?人到中年 再次归零 再创辉煌在美国223.难忘的一天Descript:OpenAI投资,像编辑文档一样编辑音视频音视频技术开发周刊 | 275「紧急通知」LiveVideoStackCon 2022 音视频技术大会北京站改期「主题演讲」LiveVideoStackCon 2022 音视频技术大会 北京站品牌技术专场重磅加盟,看音视频如何引领新趋势音视频技术开发周刊 | 264开店2.9万家,闷声发财,这个广东大佬是零售业的隐形大BOSS视频编解码的新突破Instagram如何将视频编码时长缩短94%?音视频技术开发周刊 | 268这种危害2亿孩子的隐形毒药,杀伤力100%!快看看你家有吗?「延期通知」LiveVideoStackCon 2022 音视频技术大会北京站K-Pop迎来新拐点:女团盛世,男团失守单细胞技术最新进展丨技术突破使得相关研究频发顶刊,带来临床科研的多项突破「最终延期通知」LiveVideoStackCon 2022 音视频技术大会北京站【主编连线】:对话田建华——web音视频新能力哦,不!Fedora 正在放弃对流行的视频编解码器的支持 | Linux 中国音视频物联网行业起势,实时互动成智能设备的“硬指标”!览于右任草书记广州多地宣布解封,张文宏团队紧急发文:抗疫三年,我们迎来“新拐点”!​《让孩子自己去打拼》第二版出版发行一个人的徒步,900公里法国之路+世界尽头:D47~西班牙的瑰宝音视频技术开发周刊 | 273音视频技术开发周刊 | 269
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。