Redian新闻
>
「专题速递」JPEG AI、端到端图像编码的标准化及产品落地、深度学习

「专题速递」JPEG AI、端到端图像编码的标准化及产品落地、深度学习

科技

从最初的追随者到如今的领跑者,中国的超高清视频编解码技术已经走过20年的漫长征程。从开始制定不同的视频编解码标准,如H.264/265、AV1、VVC、AVS,再到积极地探索基于AI的视频编码技术。视频编解码——这一将视频数据高效压缩、传输和解码还原清晰度的技术应用,每一次微小的提升都是技术者智慧的结晶。


面对越来越复杂的视频编解码算法,新一代的视频标准对计算算力的需求呈指数级增长。这也使得GPU、ASIC等硬件的依赖程度不断上升。技术研究人员和工程师们一直在不懈努力,以不断提高视频编解码技术的性能和效率。AI可以帮助优化编码算法,提高视频压缩率,同时保持高质量的视频输出。此外,AI还可以应用于视频质量增强,去除噪声、提高清晰度,使用户能够享受更加逼真和令人沉浸的观看体验。


在本次视频编解码与AI专题中,我们将了解JPEG AI的标准进展,聆听关于端到端图像编码的标准化以及前沿产品的落地实践,同时了解结合深度学习、AI增强的视频编码技术。视频编解码与AI的融合已经改变了我们观看和分享视频内容的方式,期待与您共同探索这一领域的未来。



01

基于深度学习的视频编码




王诗淇

香港城市大学 副教授


视频编码是数字视频应用的核心技术,推动了多媒体产业的快速发展。随着超高清视频、虚拟现实技术的进步,亟需高效视频编码技术以应对海量视频数据量的挑战。此外,随着智慧城市相关技术的应用,针对面向机器视觉的高效视频编码的需求与日俱增。


本次分享将为大家介绍实验室在基于深度学习的高效视频编码领域的近期进展,主要包括三个部分:1)基于深度学习的混合视频编码,主要包括利用深度神经网络对传统视频编码平台工具的改进;2)端到端视频编码,主要包括基于深度学习的语义编码、生成式编码等工作;3)面向机器视觉任务的视频编码,主要包括面向机器视觉任务的高效视觉表示压缩。



02

端到端图像视频编码及其标准化




李礼

中国科学技术大学 特任教授


传统图像视频编码基于混合编码框架,经过数十年的发展,其性能提升已经进入瓶颈。端到端图像视频编码作为一种新的编码框架,短短几年的发展,就达到了和传统图像视频编码相匹配的性能。本分享拟介绍端到端图像视频编码的基本思想,并介绍其用于图像、视频、三维生物医学图像等多个模态的发展现状和标准化情况。


本次分享将分为两个部分,第一部分介绍针对端到端图像视频编码的基本思想,主要包括自编码器,基于深度学习的概率估计网络等。第二部分介绍端到端编码方法用于图像、视频、三维生物医学图象等模态的发展现状和标准化情况。



03

全球领先的基于端到端图像编解码落地的产品及解决方案



曹磊

双深科技 创始人&CEO


信息化时代带来图像视频数据的爆发式增长,导致图像视频数据的传输、存储、分析和应用面临瓶颈。因编解码技术可以有效对数据进行压缩,进而成为近几年的研究热点。


本次演讲将聚焦AI端到端图像编解码技术上的应用落地研究,阐述双深科技对AI端到端编解码技术的理解和趋势判断,AI编解码技术在图小小相册APP的应用落地,在CDN场景的行业应用,以及将AI端到端编解码与跨模态语义检索模型进行融合探索。



04

JPEG AI图像编码标准进展和应用



赵寅

华为 视频编码技术专家


图像是互联网数据的重要组成部分。30年前JPEG标准组制订了JPEG-1标准(即为人熟知的JPG格式),并已发展成应用最为广泛的图像格式。随着AI技术的发展,图像不但能够被更高效地压缩,也正在被更多的AI应用所使用。面向更高图像压缩效率和AI任务效率的应用需求,JPEG标准组启动了JPEG AI图像编码标准,基于AI技术、服务AI应用。


本次分享主要包括三个部分:1)JPEG AI标准愿景、应用场景和标准化时间线;2)JPEG AI标准的整体架构、技术效果和优势;3)JPEG AI的重点技术、标准化过程中遇到的难点问题及其解决方法。通过本次介绍,希望能让大家走近JPEG AI,并给业务和研究以启示。




 *本专题讲师陆续上线中,更多精彩请关注大会官网


如果你希望参与到音视频技术大会当中,此刻刚刚好:“LiveVideoStackCon 2023音视频技术大会深圳站”门票限时9折优惠中,报名立享优惠,团体参会优惠更多哦!现在报名,与您相约深圳。


●时间:2023年11月24日-25日

●地点:深圳圣淘沙酒店(翡翠店)

●获票方式:扫描下方二维码,或咨询票务微信,了解大会详情。


优惠截止10月15日 

          票务服务:

微信同号13520771810

[email protected]




关于LiveVideoStackCon 音视频技术大会


LiveVideoStackCon是专注于音视频领域的技术大会,致力于分享一流的技术内容,在把握行业趋势和热点的同时持续挖掘技术深度。自首届以来的13场大会中,LiveVideoStackCon成为众多音视频技术人的舞台、国内多媒体生态的风向标,也成为大家技术交流、拓展专业网络、职场进阶的新方式。


LiveVideoStackCon 2023 深圳站,将以“沉浸·新视界”为主题,在2023年11月24日-25日在深圳和大家见面。本场音视频技术大会,依然聚焦在多媒体生态,精心打磨3场主题演讲、13场专题(包括一场圆桌专题)。本次大会规模约300+参会人员,50+技术分享,80+参会企业,并设有VIP社交晚宴、硬件体验区、扭蛋抽奖等各种活动,带来丰富、沉浸的技术大会体验。


▼点击下方阅读原文 ▼

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
单点端到端文本检测识别框架速度提升19倍!华科、华南理工等联合发布SPTS v2报名进行中 | 中国老年学和老年医学学会标准化委员会2023年度学术会议暨会员代表大会早财经丨超级黄金周将至,国内热门酒店预订量暴涨超5倍;申遗成功!我国再添一处世界遗产;国内首个研究生商业性助学贷款产品落地文末送书 | 深度学习之图像识别:详解核心算法与12个经典实战案例第八章第三节 社会组织全新的总体架构「专题速递」水下图像的画质增强、HDRVivid生态、视觉质量评价模型、音乐可视化效果「专题速递」GPU算力思考、内容生产技术实践、AI动漫、多模态可控的作曲框架「专题速递」嵌入式物联网、RTC技术、实时通讯终端、混合现实影像祥晨市委中心组学习会传达学习习近平总书记贺信精神,专题学习城市工作重要论述魔镜洞察:2023皮肤屏障修护市场及产品洞察分析华人更要脱钩中国简单有效!Direct Inversion: 三行代码提升基于Diffusion的图像编辑效果OpenCV实战:从图像处理到深度学习的全面指南「专题速递」AR协作、智能NPC、数字人的应用与未来历史小说《黄裳元吉》人物图片集锦腾讯推出混元大模型,已接入微信搜一搜、腾讯会议等 50 多个业务及产品LLaMA 2端到端推理打通!来自中国团队「专题速递」数据驱动赋能、赛事直播优化、RTC技术、低延时传输引擎、多媒体处理框架、GPU加速用了甲方的标准化模块,我做设计跟开挂一样!马斯克机器人大进化!全新技能解锁,启用端到端神经网络中国电子技术标准化研究院副院长刘贤刚:用标准化手段支撑虚拟现实产业链短板的突破直播链接发布 | 中国老年学和老年医学学会标准化委员会会员代表大会暨2023年度学术会议马斯克直播试驾特斯拉FSD V12!世界首个端到端AI自动驾驶,1万块H100训练Nature:基于人工智能的开源软件,正在标准化显微镜生成数据的图像格式历史小说《黄裳元吉》第一百二十四章 元吉(大结局)最后机会|《数据/商业分析求职实战营》马上开课,三大跨行业名企实战项目,拓展视野,提升端到端项目完成能力!「专题速递」RTC云网端联合优化、弱网对抗策略、QUIC协议的能力和实践简单有效!Direct Inversion:三行代码提升基于扩散的图像编辑效果「专题速递」边缘降本、智能语音降本、提高压缩率、极速高清实践魔镜洞察:肌肤屏障修护市场及产品洞察分析「专题速递」数字人直播带货、传统行业数字化升级、远程协作中的低延时视频、地产物业中的通讯终端OpenAI前CEO计划推出新的AI企业,前总裁预计加入其中;Meta展示全新AI图像编辑工具丨AIGC日报特斯拉「擎天柱」机器人视频爆了!端到端AI大脑加持,挑战高难度瑜伽CVPR 2023最佳论文作者李弘扬:端到端自动驾驶的前景与挑战
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。