Redian新闻
>
AI Codec,视频模板技术,高效视频处理,RTC+AI,感知编码,CV-CUDA,窄带高清AI

AI Codec,视频模板技术,高效视频处理,RTC+AI,感知编码,CV-CUDA,窄带高清AI

科技

AI Codec,NPU硬件加速

Topic

基于AI和NPU的Codec变革

孔德辉  中兴微电子 多媒体技术总监

伴随通信容量(包括5G以及千兆有线网络)的发展,高带宽为更多用户接入超高清视频提供了可能。但是随着用户数量的增加,高质量的压缩方案也是变得更迫切,而边缘计算平台的性能提升也为解码增强提供了算力支持。AI算法的进步则提供了更丰富的计算方式。

本次分享包括三个部分:第一部分介绍Codec在不同场景下的需求,以及使用基于混合编码策略的困境;第二部分重点分析AI-Codec的发展思路,带来的收益通过修正编码参数、修复编码缺陷或者完全端到端方法的可行性以及部署困境;第三部分将讨论从算法到NPU硬件加速或者芯片化设计的一些可能形态。通过这些介绍,与各位同行讨论“云”和“端”结合的硬件架构与性能提升方法。

1. 经典编码标准在应用中的困境;

2. AI-Codec的发展现状,益处与困境;

3. AI-NPU-Codec的可能形态探讨;

多平台视频模板技术落地实践

Topic

兼容并蓄,全平台视频模板技术创新及应用

李磊  北京美摄网络科技有限公司 研发总监

在视频内容生产过程中,效果的复用可以极大简化生产流程,提高生产效率。美摄多平台的视频模板技术方案不仅可以在包装效果上实现复用,而且配套使用美摄自研的多端工具,可以让用户根据自身使用场景,在移动端、PC端、Web端之间实现工作方式的自由切换,随时随地完成视频内容生产。同时美摄模板支持以插件的方式实现对AE效果的转化,进一步拓展了使用范围。

1. 基于美摄多平台视频技术实现的视频模板方案

2. 通过AE插件转化视频模板技术探索

3. 美摄多平台视频模板技术落地实践

高效视频处理技术架构及实践

Topic

海量视频的系统化高效处理构想和算法实践

虞新阳  沐曦 AI解决方案总监

随着短视、直播、智慧城市、5G等的快速发展,视频内容遍地开花,五花八门,相应的处理需求也多种多样。如何能高效地应对这些视频处理需求?需要数据处理的系统管理,底层计算能力,以及算法研究等多方面协同努力。

本次分享主要分为三个部分:第一部分阐述对视频处理的需求理解和归纳;第二部分介绍沐曦应对视频处理场景的GPU产品;第三部分介绍视频系统处理的解决方案构想和实践。

1. 视频处理的需求理解和归纳;

智能编码,视频超分,语音提取字幕,视频结构化分析等

2. 沐曦高性能GPU产品简介;

3. 视频系统处理的解决方案构想和实践;

AI助力ORTC技术演进

Topic

ORTC与AI互相成就之道

李雪松  OPPO 高级后台工程师

随着计算规模的增大及对计算精度要求的提高,端侧AI运算已经不能满足高精度、高算力要求的应用场景,很多AI处理算法就要搬到算力强大的云端处理。而要达到近乎等同于端侧的效果,则需要在端云传输实时性、稳定性、抗弱网、分布式、集群等技术做深入优化,从而更好的发挥云端优势。

本次分享主要内容包括与RTC紧密结合的AI应用场景,ORTC在低延时、抗弱网所做的策略保证,媒体服务器如何实现AI算法解耦、如何保障大规模AI处理的有序进行,以及如何进行有效的预警及事后取证。

1. ORTC简介

2. ORTC在实时通信技术中实践案例

3. AI及其在实时通信的应用场景

4. AI助力ORTC技术演进

5. ORTC成就AI落地的探索展望

AI驱动的感知编码技术

Topic

AI驱动的感知编码技术及其落地实践

邢怀飞  百度智能云 资深工程师

人眼视觉出发的感知编码技术,成为互联网短视频、OTT等UGC场景的重点优化手段,可以更好的降低带宽成本、提升用户体验;AI技术为感知编码优化提供了必要的辅助技术手段。

本次分享,主要介绍AI驱动的感知编码优化方案,质量评价方法,技术落地收益等。期望通过本次分享,听众能够对相关技术有所了解,更好的进行技术选型。

1. 感知编码技术背景

2. AI驱动感知优化核心介绍

3. 应用落地实践

CV-CUDA: 高性能图像处理

Topic

CV-CUDA: 高性能图像处理加速库

张毅  英伟达 GPU计算专家团队工程师

盛一耀  字节跳动 机器学习系统团队工程师

在深度学习领域,图像前处理和后处理作为非常重要的组成部分存在于众多应用之中,例如内容理解,视频特效,图片/视频检索等。传统的方案中图像前后处理会在CPU上进行,一方面会占用CPU的资源,另一方面性能较差,容易成为整个流水线的瓶颈。因此NVIDIA和ByteDance联合开发了CV-CUDA图像处理加速库,有效提升了图像处理整体效率。

目前此方案不仅在字节跳动内部业务成功落地,而且也集成到 火山引擎,有需要的业务可以去上面体验。本次分享主要分为两部分,第一部分介绍CV-CUDA的特性和基本框架,第二部分介绍CV-CUDA在字节的典型使用案例。

1. CV-CUDA特性和基本框架

2. ByteDance典型应用案例

视频超分,窄带高清AI落地实践

Topic

B站视频云画质与窄带高清AI落地实践

成超  哔哩哔哩 资深开发工程师

视频赛道卷到下半场,一定会面临体验与成本的对抗,尤其是在行业大环境“过冬”的背景下,想要在有限带宽下获得最佳的画质观感变得异常具备挑战性。从视频云业务场景的视角来看,如何有效解决cross-domain问题、如何突破低业务延迟下的算力瓶颈、如何提升单位码字承载的有效信息量,成为我们在实践过程中的应用范式。

本次分享将分为两个部分:一是介绍B站视频云云端转码中的画质提升链路。重点介绍我们基于画质修复观点下的视频超分技术在点播业务中的应用落地,以及在4K@60fps直播场景下的实践;二是介绍B站窄带高清AI所采用的低秩重构方案是如何做到在视觉无损的条件下进一步压缩18%以上码率带宽的。

1. B站视频云画质提升链路

2. 4K超分在点播/直播业务中的落地实践

3. 窄带高清AI如何做到视觉无损下的极致视频压缩




所属专题


相关阅读推荐

↓ 点击「阅读原文」立即报名!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
我的“海外”文章在哪里???年薪超200万的最新最热技术岗:无需编码,靠给AI吹“枕边风”赚钱华大妈挖坑, 赵偷乐悲嚎, 汪健忘打脸CV不存在了?Meta发布"分割一切"AI模型,CV或迎来GPT-3时刻!Gstreamer中的视频处理与硬件加速太省了!Costco折扣只一天,直采直邮更省钱,COSTCO近期折扣大盘点来啦应用谷歌云实现高效视频转码和分发电还原CO2制乙醇:Cu/CuNC双位点界面,实现低过电位下的高效C-C偶联 | NSR3万元档,RTX4080,ROG全家桶DIY游戏主机上海交通大学感知科学与工程学院医学多模态感知研究所招聘博士后9999元,ROG魔霸新锐,RTX4060、i7-13650HX爱美丽锻炼我跑步【模板】Nature:一种临床常用药有阻断新冠病毒感染的潜力。这个“老药新用”研究的模板很值得借鉴被ChatGPT带热的最新技术岗:无需编码,年薪超200万专访令狐昌洋 | MIT团队开发生物信号记录新工具,完全基因编码,可像「年轮」一样记录大脑活动靠LeetCode刷题模板,学妹“开奖”字节offer!LeCun吴恩达开直播,疾呼GPT-5不能停!LeCun:干脆管制凤头鹦鹉6个月华硕发布全新设计的 16 英寸天选笔记本:全 AMD 配置,窄边框屏幕快速构建音视频能力与服务,5G低延迟视频技术应用实践,RTC云游戏场景探索,面向用户体验的客户端优化实践智能处理与编码算法产品化;媒体传输协议的演进与未来;音视频播放技术与消费体验升级19999、23699元,RTX4080,ROG全家桶DIY游戏主机炒股破产,却在其他方面取得巨大成就的人数字视网膜芯片,云端实时AI高清视频处理,编解码融合架构,极致降本增效实践一年半,考了11次公务员,年少不知编制香CV开启大模型时代!谷歌发布史上最大ViT:220亿参数,视觉感知力直逼人类正开发AI工具,Roblox CTO:极度看好生成AI技术,人人都将是创造者【公开课预告】智能感知编码优化与落地实践直播 | 安谋科技“玲珑” V6/V8 视频处理器概览CO2辅助生成富含晶界的Cu催化剂实现高效CO-CO偶联CV不存在了?Meta发布「分割一切」AI 模型,CV或迎来GPT-3时刻达尔文说过一句话图像视频编码新纪元,体验升级&技术变革,AR及其关键技术......央视春晚的元宇宙技术,微软发布AI声音生成工具VALL-E,百度将推出类ChatGPT风格机器人,2023WebRTC预测…CVPR 2023 | EMA-VFI: 基于帧间注意力提取运动和外观信息的高效视频插帧背完LeetCode刷题模板,真的不一样!(已拿字节offer)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。