【专题速递】感知无损压缩、LCEVC、RTE中的AV1、PPA优化以及Tencent266编码器
//
从H.265到AV1再到各家自研编解码标准,编解码一直是音视频行业里的“当红炸子鸡”。这次的专场更是八仙过海,各显神通。7月29日LiveVideoStackCon2023上海站AI与视频编解码长专题专场,集齐当下最热门的编解码话题,与您共享。
AI与视频编解码
TOPIC1 《AVS感知无损压缩标准概述》
TOPIC2 《系统芯片(SoC)实现低复杂度增强视频编码(LCEVC)》
Rick Clucas V-Nova 创新与技术高级副总裁
低复杂度增强视频编码(LCEVC)是MPEG组织最新定义的一种视频编码格式。V-Nova已经实现了几种创新的LCEVC硬解码,通过利用终端平台提供的硬件模块和处理资源实现了安全有效的驱动层解码,这种方案能帮助终端设备制造商在现有设备上实现LCEVC解码,以便给流媒体服务运营商部署这种能大幅度减少传输成本的新MPEG标准。
本文会介绍LCEVC技术梗概以及两种V-Nova实现的基于现有SoC的LCEVC硬件解码方案。
TOPIC3 《支持 AI 视频处理的高容量流媒体加速卡方案》
主要介绍 AMD Alveo™ MA35D 视频加速卡的基本架构和功能,以及基于 MA35D 转码卡在各个领域的视频解决方案中的应用。
TOPIC4 《深度神经网络压缩技术及应用》
深度神经网络通常会导致大量计算和存储资源的消耗,阻碍其在移动和嵌入式设备上的部署。因此,降低深度神经网络的计算和存储资源消耗,成为深度学习落地应用的重要问题之一。
本次演讲中,我们将首先回顾深度神经网络压缩和加速领域的经典工作,然后介绍我们实验室在这一领域的研究工作,包括:(1)卷积神经网络的剪枝;(2) 压缩特定任务的神经网络,例如人脸识别、风格迁移和超分辨率网络等;(3) Transformer网络的压缩;(4)Transformer与CNN的协同知识蒸馏。在大模型时代,深度神经网络压缩和加速领域的机遇和挑战在哪里?我们也会对以上问题进行启发式的探讨。
谢义 英特尔 高级软件架构师
戴伟 声网 视频编解码器负责人
随着RTC的不断发展,高清甚至是超高清的视频逐渐成为实时互动中的刚需。RTC中最开始支持的VP8、VP9以及H.264,对这一类的视频的支持能力都有所欠缺。为了提升高清以及超高清的主观体验,RTC开始支持AV1以及H.265两个更高一代的编码标准,其中,AV1以其免专利费、在RTC的框架中支持度更友好等特点,得到了众多开发者的关注。
本次的分享会先从AV1的特点以及其在RTC的发展历史进行介绍,进一步结合AV1在落地实施通讯过程中的难点与痛点,分析AV1在RTC领域中的优势和未来。
范益波 复旦大学 博士生导师
唐敏豪 腾讯 多媒体实验室专家研究员
本次分享将分为三个部分,第一部分介绍VVC标准的特点以及腾讯在VVC标准中的一些工作;第二部分介绍腾讯自研Tencent266解码器;第三部分介绍腾讯自研Tencent266编码器。
▲扫描图中二维码或点击“阅读原文” ▲
查看更多LiveVideoStackCon 2023上海站精彩话题
微信扫码关注该文公众号作者