Redian新闻
>
火山引擎国际深度学习图像压缩挑战赛蝉联冠军

火山引擎国际深度学习图像压缩挑战赛蝉联冠军

公众号新闻

作者 | 火山引擎视频云  

近日,第六届深度学习图像压缩挑战赛(以下将简称“CLIC 大赛”)比赛结果公布,由火山引擎多媒体实验室与北大组成的联合参赛平台 b-2 在高码率视频压缩低码率视频压缩两个赛道均夺得主客观指标冠军。这也是火山引擎多媒体实验室连续两届蝉联该赛道冠军。

CLIC 大赛由电气与电子工程师协会 IEEE 主办,从诞生开始就获得了学术界与工业界的广泛关注。2023 年 CLIC 大赛暂停一届,本届大赛依托于数据压缩领域的顶级会议 Data Compression Conference (DCC) 再次举办。值得一提的是,本届 DCC 中,火山引擎多媒体实验室有 8 篇论文入选。

随着以深度学习为代表的新一代人工智能技术不断取得突破,学术界与工业界逐渐意识到人工智能技术在图像、视频压缩领域的巨大应用潜力。基于深度学习的图像视频压缩技术被视为超越传统压缩技术能力极限,取得突破性进展的明日之星。基于深度学习技术,火山引擎和北大 b-2 平台提出了一项智能混合解决方案。

基于深度学习的智能混合解决方案

b-2 平台在充分理解传统压缩技术与深度学习压缩技术的各自原理的基础上,发挥两种技术路线的各自优势,取长补短,将二者有机融合成为一个整体,形成了独具特色的传统——智能混合解决方案。传统编码模块在业界已有传统编码框架基础上,加入了非对称四叉树划分等创新技术。智能编码模块则引入了基于深度学习的环路滤波等技术。

图 1 非对称四叉树划分结构;(a)H1 型水平 UQT,(b)H2 型水平 UQT,(c)V1 型垂直 UQT,(d)V2 型垂直 UQT。

编码单元划分是混合视频编码框架的基础,决定着编码单元的基本形状和尺寸。灵活的划分方法能更有效地表达视频丰富的纹理和运动,对编码性能的提升起着至关重要的作用。团队提出了非对称四叉树 (UQT) 划分结构,旨在提高视频的编码效率。与现有的四叉树 (Quad Tree, QT),二叉树 (Binary Tree, BT),三叉树 (Ternary Tree, TT) 划分结构相比,UQT 通过一次划分生成的子编码单元能触及更深的划分深度,能更有效地捕捉视频丰富的细节特性。此外,UQT 生成的子块形状是无法通过 QT 、BT、TT 组合实现的,一定程度上弥补了现有划分的不足,丰富了划分的表达。

图 2 环路滤波网络结构示意图,包括网络的输入,滤波与输出模块

传统视频编码中采用环路滤波器去除编码失真,缩小原始图像与重建之间的失真,例如经典的去块滤波、样本自适应偏移和自适应环路滤波等。参赛平台提出了一种基于残差卷积网络的增强型环路滤波技术,有机地将环路滤波技术与深度学习技术结合在一起,在网络结构中与模型训练中充分利用传统视频编码的先验信息,提升环路滤波效率。网络输入方面,除重建像素外,团队将编码过程中的预测信息、划分信息、边界强度以及量化参数等作为增强信息供深度网络学习,丰富先验知识,使得网络能更好地感知压缩失真。在分层参考的编码结构中,待编码帧将参考已重建的高质量帧。团队提出对不同时域层次帧所使用的滤波器采用迭代训练的方式,获取最接近真实编码的训练数据,实现更高性能的滤波。此外,每个条带及最大编码单位均可以在多个滤波模型中自适应地选择率失真性能最优的网络模型,并将选择信息传输到解码端。

图 3 CLIC 视频压缩赛道基于 MOS 的排行榜

2022 年,火山引擎多媒体实验室第一次参加 CLIC 大赛。参赛平台 Neutron Star(中子星)在高码率视频压缩低码率视频压缩两个赛道,主客观指标均以大幅领先优势夺冠。

此次,火山引擎与北大联手夺冠,是结合了北大学科和人才优势,以及火山引擎的技术和产业优势,围绕深度学习在视频压缩领域的一次重要学术探索。

火山引擎多媒体实验室是字节跳动旗下的研究团队,致力于探索多媒体领域的前沿技术,参与国际标准化工作,其众多创新算法及软硬件解决方案已经广泛应用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技术服务。实验室成立以来,多篇论文入选国际顶会和旗舰期刊,并获得数项国际级技术赛事冠军、行业创新奖及最佳论文奖。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
《桃花谣》&《杏花落》NUS刘老师1v1科研:使用深度学习进行投资组合优化|收获一作论文与导师推荐信!月之暗面 Kimi 智能助手实现 200 万字长上下文,火山引擎提供云服务支持冠军奖金2000刀!2024悉尼篮球魔王挑战赛拉开序幕!报名通道现在火热开启从零构建现代深度学习框架(TinyDL-0.01)转到富士山的另一侧 ----- 箱根2024年英国中级数学挑战赛真题和答案温村隔壁活火山 又是站在雪檐 滑雪牛人摔落火山口身亡深度学习近10年,10篇必读论文总结独家!整车热管理「升温」,谁在领跑「电动压缩机」增量市场强化学习第十三篇:使用深度学习解决迷宫问题,完整步骤和代码深度分析:月收入超12亿,三消冠军手游《Royal Match》厉害在哪?Linux 圈 “ 地震 ” :主流压缩工具 XZ 被曝后门,红帽、Debian 等发公告要求紧急停用2024年英国少年数学挑战赛真题和答案出炉today\'s power walk record (after China Family Visit)谷歌LLM挑战赛开启!冠军直接奖励20万美金清华微软开源全新提示词压缩工具,长度骤降80%!GitHub怒砍3.1K星清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!Java对象头压缩---- 永久为Java应用“降本增效”重点关注替代蛋白,贝索斯地球基金投入1亿美元发起「AI气候与自然」挑战赛博士申请 | 美国佐治亚大学卢国玉老师招收计算机视觉/深度学习方向全奖博士生NUS刘老师1v1科研:使用深度学习进行动态套期保值|收获一作论文与导师推荐信!厉害了!奥克兰华人少年每天4小时写代码,赢得世界顶级挑战赛!青菜豆腐保平安太牛了!大神把Windows 11 压缩到 100MB!人类社会三大规律换季必备!太力免抽气真空压缩袋,不用工具3秒压缩,让衣柜空间大大大!还是航天纪念款!奖金丰厚!KDD Cup 2024 检索增强生成CRAG挑战赛正式启动喂饭式学习VS打磨式学习,剖析托福和SAT学习的差异性德林国际财报:毛绒玩具仍然是增长引擎,占集团总收入的51.1%差旅神器get!自带压缩功能的收纳包,节省50%行李箱空间!60万奖金!2024全球人工智能技术创新大赛-算法挑战赛,等你来战!开源日报 | 马斯克为何要作开源 “秀”;当初质疑倪光南的人,今天果然被打脸;Java 22正式GA;压缩的二三事混合云架构下,灵活可靠的 DNS 解析解决方案——火山引擎 PrivateZone港中文李教授1v1科研:基于深度学习的无人机目标识别算法研究|收获一作论文与导师推荐信!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。