Redian新闻
>
「专题速递」水下图像的画质增强、HDRVivid生态、视觉质量评价模型、音乐可视化效果

「专题速递」水下图像的画质增强、HDRVivid生态、视觉质量评价模型、音乐可视化效果

科技


在音视频应用领域,我们积累了大量的用户上报数据,包括音视频质量数据、用户行为数据等。这些数据不仅仅是数字,更是连接我们与用户之间的纽带。通过深入分析这些数据,我们可以洞察用户的需求、体验和行为,为我们提供宝贵的洞见。


通过分析音视频质量数据,我们能够了解用户在使用过程中遇到的问题,如画面模糊、声音延迟等。这种数据可以揭示网络稳定性、服务器负载和设备性能等问题,帮助我们精准定位并解决各类技术难题,提升音视频传输的稳定性和清晰度。


其次,用户行为数据告诉我们用户在应用中的习惯、兴趣和偏好。通过深入了解用户行为,我们可以为用户个性化定制推荐内容,提供更符合用户口味的视频推荐,增加用户粘性和满意度。


在本专题中,我们将聆听云音乐视频图像技术、HDR Vivid是如何提升内容品质、丰富用户体验的;并学习视觉质量评价模型及水下图像的画质增强。通过数据驱动,我们能针对性地进行优化,以提供更贴近用户需求的完美体验。



01

云音乐视频图像技术应用




蔡苗苗 

网易云音乐 计算机视觉算法专家


随着互联网的飞速发展和智能设备的广泛普及,视频及图像内容的需求和消费呈现出爆炸式的增长趋势。这种现象在云音乐领域表现得尤为突出,基于庞大的用户群体和流量基础,云音乐不断衍生出多元化的视频图像技术需求。这些技术不仅在满足日益更新的内容创意方面发挥着关键作用,还为日新月异的社交互动玩法提供了强大的支持。同时,对于庞大的后台数据的高效处理,这些技术同样扮演着举足轻重的角色。


本次分享将深入探讨云音乐中都运用了哪些视频图像技术,这些技术如何在云音乐的各项业务中发挥至关重要的作用。我们将详细介绍这些技术在提升用户体验、增强音乐可视化效果、优化社交互动以及高效处理数据等方面的具体应用。



02

以一当十-高效通用视觉质量评价模型建设




吴庆波

电子科技大学 副教授


随着图像视频业务形态和产品功能的快速发展,视觉质量评价任务的需求不断更迭。传统的专家系统式评估模型,适用范围小,存储成本高,重复建设开销大,与图像视频应用产品轻量化、快迭代的发展需求形成了巨大矛盾。


本次分享从模型结构与数据标注两个方面展开,探讨高效通用视觉质量评价模型建设的解决方案。第一部分介绍动态可伸缩网络结构,以及如何利用连续的遗忘与学习机制实现评价模型的以一当十,即同一模型服务不同任务的质量评价需求。第二部分介绍数据标注的主观偏置推断,以及如何利用交替优化策略实现数据标注的以一当十,即同一图像仅需一人标注便可训练可靠的质量评价模型。通过上述两部分方案的分享与介绍,我们希望能够为低成本、高效率图像视频应用业务的开发提供借鉴与启发。



03

HDR Vivid在腾讯视频臻彩视听中的应用实践




丰志平 

腾讯视频 播放技术中心 高级开发工程师


当下视频平台都把高品质内容视为提高用户高品质体验和用户会员数的一个重要抓手,随着HDR技术的发展,在高品质内容领域中,HDR技术得到了广泛的应用。在众多的HDR技术中,HDR Vivid作为国产自主建设的标准,已得到芯片、终端设备、内容生产制作、平台、编解码系统等端到端的支持。腾讯视频做为UWA联盟常务理事单位和内容平台,参与到了HDR Vivid标准的建设,推进和应用当中。


本次分享将分为三个部分,第一部分介绍当下众多的HDR技术标准,以及HDRVivid标准和其他标准的区别,当下HDRVivid生态状况。第二部分介绍腾讯视频在高品质内容中的布局,以及为什么选择HDRVivid作为高品质内容的重要组成部分。第三部分介绍腾讯视频在HDRVivid内容制作和终端消费,以及终端认证等方面的具体实践。



04

水下图像质量评价与画质增强研究




赵铁松 

福州大学 教授、博士生导师


海洋占据地球面积的70%以上。而当前人类对于海洋的探测尚且存在众多难题。如光学成像存在模糊、色彩失真等众多问题,而画面的清晰度也对下游的计算机视觉任务产生决定性的影响。如何有效对水下图像画质增强,及对图像增强后的画质进行评测,仍存在较大挑战。


本次分享主要包括我们近年在水下图像质量评测及画质增强的若干研究工作。第一部分主要介绍水下图像质量评测的研究工作,包含其在水下光学成像及声呐成像中的实现;第二部分主要介绍水下光学图像增强、修复的研究工作,特别是如何有效结合AI技术,提升相关任务的系统性能;第三部分主要介绍水下光学图像处理系统的算法集成,包括上述质量评价、增强与编解码算法。通过以上三部分,系统性介绍当前图像质量评价及增强算法在水下成像系统中的应用。





LiveVideoStackCon 2023音视频技术大会深圳站

诚邀您参与!


时间:2023年11月24日-25日

地点:深圳圣淘沙酒店(翡翠店)

获票方式:扫码购票,团体参会还有优惠!

咨询:13520771810(微信同号),[email protected]


立即购票




▼点击下方阅读原文 ▼

跳转大会官网查看更多精彩专题内容

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一个强大的可视化历史查阅工具应该是怎么样的?收听澳广的那些日子「专题速递」数据驱动赋能、赛事直播优化、RTC技术、低延时传输引擎、多媒体处理框架、GPU加速美警局长详解击毙中领馆袭击者视频,这就叫法律权威可视化浅析 “代码可视化”买什么厨电,可以花一次钱,省下80%的厨房空间?大容量可视化空气炸锅!新标准首次评价!券商债券执业质量评估结果将发布,A类券商占比降低宋志平:心态、状态、生态投行业务质量评价,迎来新修订!全业务链覆盖,债券承销、北交所等业务获纳入OpenAI旗下图像生成软件遭艺术家抵制我喜歡讀書新规后首次评价!债券执业质量评价结果出炉,A类锐减至14家「专题速递」GPU算力思考、内容生产技术实践、AI动漫、多模态可控的作曲框架「专题速递」RTC云网端联合优化、弱网对抗策略、QUIC协议的能力和实践「专题速递」JPEG AI、端到端图像编码的标准化及产品落地、深度学习「专题速递」AR协作、智能NPC、数字人的应用与未来古老与现代并存:耶路撒冷「专题速递」嵌入式物联网、RTC技术、实时通讯终端、混合现实影像清华大学与智谱 AI 联合推出 CogAgent:基于多模态大模型的 GUI Agent,具备视觉问答、视觉定位等能力揭示爬岩鳅"水下壁虎"吸附-滑行机理,启发水下机器人新运动模式 | NSR[电脑] 13600K+ROG STRIX B760-F +ATS RTX 4060,九州风神CH560可视化数显装机秀弥合2D和3D生成之间的次元壁!X-Dreamer:高质量的文本到3D生成模型PyTorch最新工具mm来了!3D可视化矩阵乘法、Transformer注意力!「专题速递」边缘降本、智能语音降本、提高压缩率、极速高清实践申请美国夏校要什么材料?体验型、课程型、研讨型怎么选?矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见投行质量评价演习开始!覆盖99家券商,抽查项目近1000个,月底前完成又到周末的咖啡屋矩阵成真!Pytorch最新工具mm,3D可视化矩阵乘法、Transformer注意力任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2金正恩和普京聯手世界會怎樣科研上新 | 第2期:可驱动3D肖像生成;阅读文本密集图像的大模型;文本控制音色;基于大模型的推荐智能体在图像、视频生成上,语言模型首次击败扩散模型,tokenizer是关键降温了!阿宝推荐 超舒服的儿童家居服套装,AB面绒恒温保暖,可视化温感变色小马「专题速递」数字人直播带货、传统行业数字化升级、远程协作中的低延时视频、地产物业中的通讯终端
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。