AAAI 2023 Oral | 字节提出非对称图像重采样模型,JPEG、WebP上抗压缩性能领先SOTA
机器之心专栏
作者:字节跳动-火山引擎多媒体实验室
字节跳动 - 火山引擎多媒体实验室针对图像重采样模型面向图像压缩的鲁棒性,设计了一种非对称的可逆重采样框架,提出新型图像重采样模型 SAIN。
提出了非对称 (asymmetric) 式的可逆图像重采样框架,解决了先前方法中由于严格对称性导致的性能下降问题;提出了增强可逆模块 (E-InvBlock),在共享大量参数和运算的前提下,增强模型拟合能力,同时建模压缩前和压缩后的两组 LR 图像,使模型能够通过逆运算进行压缩恢复和上采样。 构建可学习的混合高斯分布,建模分辨率下降和有损压缩造成的联合信息损失,通过重参数化技巧直接优化分布参数,更加符合隐变量的实际分布。
论文地址:https://arxiv.org/abs/2303.02353 代码链接:https://github.com/yang-jin-hai/SAIN
第一,衡量 D-IRN 和 U-IRN 两个分支中间层特征的 CKA 相似性。如上图 (b) 所示,D-IRN 最后一层的输出特征(即网络生成的高质量 LR 图像)与 U-IRN 浅层的输出特征具有高度的相似性,表明 U-IRN 的浅层行为更贴近采样损失的模拟,而深层行为更贴近压缩损失的模拟。 第二,统计 D-IRN 和 U-IRN 两个分支中间层隐变量的真实分布。如上图 (c)(d) 所示,不具压缩感知的 D-IRN 的隐变量整体上满足单峰的正态分布假设,而具有压缩感知的 U-IRN 的隐变量则呈现了多峰的形态,表明有损压缩带来的信息损失形式更加复杂。
PSNR:Peak Signal-to-Noise Ratio,峰值信噪比,反映重建图像与原始图像的均方误差,越高越好; SSIM:Structural Similarity Image Measurement,衡量重建图像与原始图像的结构相似度,越高越好。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章