Redian新闻
>
FFmpeg直播能力更新计划与新版本发布

FFmpeg直播能力更新计划与新版本发布

科技

  //  

编者按:客户端作为直接面向用户大众的接口,随着技术的发展进化与时俱进,实现更好的服务是十分必要的。FFmpeg作为最受欢迎的视频和图像处理开源软件,被相关行业的大量用户青睐,而随着HEVC标准的发布到广泛使用,相信国内很多网络流媒体从业者都在长期关注FFmpeg FLV支持HEVC的官方更新。LiveVideoStackCon 2023 上海站邀请了来自快手的音视频首席架构师刘歧,为大家带来他关于FFmpeg 直播能力的更新计划。

文/刘歧
整理/LiveVideoStack
大家好,下面由我和大家分享近期FFmpeg的最新技术、部分未来的发展方向以及一些我个人的经验思考。
首先向大家做一个自我介绍,本人浸淫音视频行业多年,目前是FFmpeg/SRS社区委员会的成员,曾参与编写《FFmpeg 从入门到精通》一书,也是腾讯云最具价值专家TVP。
我于2007年参加工作,早期曾从事图形图像库、Flash解析引擎开发工作。2011年我正式参与音视频流媒体技术开发。2016年受邀成为FFmpeg维护者。2017年成为FFmpeg官方顾问,创业成立了OnVideo。2019年成为FFmpeg决策委员会委员,并开始担任FFmpeg GSoC Mentor。2020年,OnVideo被快手收购,我也随之进入快手工作。
接下来简单介绍我做出本次分享的契机。
首先,FFmpeg FFplay的官方版本目前仍然无法实现FLV对封装HEVC、VVC、VP9、AV1、OPUS等现代化编码格式的支持,随着音视频技术的发展,FLV需要随之改变。
第二,业界有声音提出重视HLS、DASH、LLHLS、LLDASH等协议。但目前看来,这些协议的实时性还很差。在CDN分发过程中,链路稍有卡顿就很容易影响广域用户的观看体验。
第三是WebRTC等低延迟协议对当前大规模使用的RTMP、FLV发出了挑战。
基于前述的问题和我们开展的工作,本次分享分为以下四部分:一是介绍FFmpeg支持Enhanced FLV的有关情况;二是介绍FFmpeg支持WHIP的进展;最后是关于未来一些更多有趣的事情。

-01-

FFmpeg支持Enhanced FLV

首先,从官方标准来看,目前FLV的视频Codec ID不包括HEVC,但现有Codec ID可从8拓展到15。
目前国内一些大厂出于业务需要会拓展官方标准。例如上图,其中视频codec ID增加了12对应的HEVC。但这种方式不适用同时引入多个编码格式,且各企业、厂商对codec ID不同的自定义风格容易导致公共环境混乱。
官方标准内音频编码的定义已经被占满,引入OPUS等新格式的难度较大。
我也曾进行过类似尝试,于2014年向FFmpeg team提交了关于FLV支持HEVC编码格式的补丁,但由于没有可供参考的公认标准遭到了反对,实际上该版本也无法播放泛式的FLV视频。
2021年,一位活跃的开发者James Almer做了同样的工作,但由于相同的问题最终未能实现合并。
SRS作为国内主要的CDN服务供应端,早期已经实现了对HEVC编码的支持,并曾向FFmpeg team发出了相关呼吁。可以看到,很多音视频从业者都曾为HEVC over HTTP-FLV的官方化做出努力。
后来我们意识到,推动Adobe修订现有参考标准才是关键。于是在接下来一段时间里,我们与Adobe的相关人员积极沟通,询问关于参考标准的修订计划。虽然得到了积极回复,但一直没有实质性的进展。
期间我们也对可用在直播场景的其他网络协议进行了检讨。但目前看来,HLS、DASH、HDS的延迟远大于RTMP/FLV。LLHLS、LLDASH仅在技术上有优于RTMP/FLV的可能,经过实际测试效果并不好。SRT的延迟足够低,但在PC、手机端等多平台的可用性还有不足。
为了加快实现我们的目标,经过查访,我们与RTMP、FLV的实际维护方,Adobe旗下的Veriskope建立了联系。
与此同时,从更好地兼容现状这一角度出发。在和Veriskope沟通前,我们利用FourCC代码完成了Enhanced FLV方案。该方案解决了仅依靠修改视频Codec ID可拓展的编码格式数量有限这一缺陷,可实现无限制数量的拓展。
相较于传统参考标准,我们针对FrameType增加了拓展模式,以定义对应的读包方式和编码格式。
针对不同FourCC值指向的编码格式,可以对其HVCC和VPCC进行拓展读取。
在我们向FFmpeg team提交Enhanced FLV补丁的过程中,有videoline的开发者提出疑问:在拓展RTMP时如何明确服务端支持的编码格式。
我们查找了Enhanced RTMP标准,发现只要在conncet command内加入FourCClist即可解决这个问题。
开发完成后,我使用RTMP通过Youtube测试了AV1推流。但发现无论推流何种格式,最终得到的都是VP9格式的流。针对该现象目前我还在等待Youtube开发者的回复解释。
相较于HLS和DASH,RTMP/FLV的延迟虽然较低,但链路质量变化或推流抖动等因素同样会引起播放的卡顿和延迟累加,因此我们考虑引入WebRTC进行推流。

-02-

FFmpeg支持WHIP

FFmpeg 支持WHIP这一项目的诞生起于SRS作者杨成立的倡导。当时,现场演示端到端普通推流的延迟仅有500毫秒,可以推定,引入WebRTC是十分可行的。
WHIP易于实施。为了建立推流会话,WHIP客户端将向WHIP终端发送包括SDP Offer的HTTP POST请求,返回“201 Created”响应,建立一个SDP。随后WHIP客户端和媒体服务器之间建立ICE/DTLS会话,通过RTP/RTCP开始视频、音频流传输。推流结束后,执行HTTP DELETE请求即可结束ICE/DTLS会话,整个过程只需要实现如上所示的四个简单标准。
我在2023年5月发布了第一版补丁,具体的代码大家可以在Github上找到,Cloudflare的工程师首先响应宣布了支持。
Pion随后也反馈宣布支持。
经过测试,我们发现Janus、Millicast、TRTC等开源服务器均可支持。目前FFmpeg WebRTC可以直接对接这些服务器进行推流。
使用WebRTC从采集、推流到播放的延迟经实测约为132毫秒。
但引入WebRTC也带来了一些风险。首先是有可能导致五花八门的网络传输优化算法泛滥,其次是大幅增加了代码量,提高了维护的难度。

-03-

更多有趣的事情

最后和大家分享一些有趣的事情。首先是关于FFmpeg,6.1准备发布了,当然也可能会跳过。主要的操作包含实现了Muxer和Demuxer的拆分,实现了format和commandline层的多线程支持,相较于历史版本单线程处理DASH、HLS、MXF等大数据量音视频封装的方式进一步提升了速度;scale支持切slice多线程处理,缩放、色彩转换的性能得到大幅提升;支持了VVC解码;支持了软件无线电(Software Defined Radio),可以收听一些广播节目;支持了Enhanced FLV和Enhanced RTMP。
然后,我同其他作者共同编写了《深入理解FFmpeg》一书,此次在介绍FFmpeg基本组成的基础上进一步结合实例讲解了API的使用,目前已经全渠道开售了,大家可以在京东、当当、淘宝买到。
我本次的分享就到这里,谢谢大家!

▼点击下方阅读原文 ▼

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
酿丸子|附华夏厨师祖师爷简介|味之精微,口不能言全程干货!Apollo新版本Beta自动驾驶技术系列公开课即将开播!Firefox 118 版本发布,带来了原生的翻译功能 | Linux 中国秋招求助 | NG直呼:真的好难!!!FFmpeg 6.1 发布,7.0时代即将来临为什么国外孩子动手能力更强?看他们怎么玩你就知道了!快乐每一天(加州的老墨 - 8)《原神》冰箱贴:神子&宵宫&申鹤&甘雨&刻晴&优菈&莫娜7位角色!苹果暂停iOS新版本研发专注修复Bug/华为未独占卫星通讯功能/马斯克征志愿者切除头骨植芯片趣文:程序员丰富的计划与现实…TQUIC开源版本发布,提升全场景业务体验以色列军事计划与宣传计划曝光好消息,支原体高峰或已过!坏消息,传播能力更强的病毒已经来了!怎么办?Enscape3.5暴力更新!比AI出图还“傻瓜”?(附破解版下载)ChatGPT测试新版本,可上传文件和自动切换模式;苹果前员工研发无屏幕AI硬件产品:能够运行GPT-4丨AIGC日报iOS新版本或解决发热,诺贝尔化学奖公布,传Meta将裁员,DALL-E 3可通过必应免费访问 ,这就是今天的其他大新闻!佛山电翰甩手舞风靡网络,类明星化的主播能走多远FDA批准更新版新冠疫苗 两款均对EG.5有效国内疯狂的网购Fedora 39 版本发布,新亮相一款不可变版本 | Linux 中国T-Mobile老用户注意了!旧计划将自动换新计划,费用大幅增加微信、QQ 全新 UOS 版本发布留学专业怎么选?看完这几个真实案例,才懂谨慎的选择比能力更重要安省华人连中大奖!密西男子玩20年彩票终赢!女子“一开即中”$10万!计划与兄弟分享奖金!特斯拉皮卡完成暴力测试,苹果推新版本修复“烧屏”,字节回应“放弃PICO”传闻,谷歌等浏览器被曝漏洞,这就是今天的其他大新闻!智能周报|Google发布Gemini;OpenAI推迟发布GPT商店;微软明年发布新版Windows,AI功能大幅增强…Blender 4.0 版本发布,引领了渲染升级的新趋势 | Linux 中国我眼中的人類起源和去向是怎麼回事比努力更重要的,是沉静思考的能力Ubuntu 23.10:全新版本来袭! | Linux 中国安省华裔女子中即开奖 计划与兄弟分享奖金!硬核观察 #1113 已停止支持的 OS/2 Warp 的继任者 ArcaOS 发布新版本垂类主播能否接棒“李佳琦”们?所有金融打工人:比赚钱能力更重要的,其实是这种能力……第一章第三节 人类的思想语言
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。