Redian新闻
>
「专题速递」边缘降本、智能语音降本、提高压缩率、极速高清实践

「专题速递」边缘降本、智能语音降本、提高压缩率、极速高清实践

科技

互联网的流量红利见顶后,音视频领域技术者纷纷寻求在维持卓越用户体验的前提下,降低运营成本的方法。然而,传统的网络基础设施难以满足日益增长的数据需求,存储、算力成本仍在持续攀升。因此,制定创新性的降本增效策略成为了当务之急。


在本专题中,我们将深入研究音视频领域内的降本增效实践,从中获得启发和技术思考。在本专题,我们将聆听和学习:多媒体的边缘网络以及智能语音系统如何帮助降本,争取更大的效益;并学习提高压缩率的原理和编解码技术的极速高清实践,以提升用户的流媒体体验。本专题旨在为技术者及企业提供实用的、可操作的建议,引领技术在降本增效的道路上走得更稳更远。



01

多媒体网络的边缘降本再探索




韩锐 

字节跳动 超边缘设备网络负责人



字节跳动是全球范围内的音视频带宽用量大户,因此对降本有着长期且精益的诉求。


本次分享聚焦在多媒体降本的一项重要路径——边缘节点和边缘网络的潜力再挖掘。从超越边缘的视角,讨论几个行业内普遍关心的问题,包括:边缘降本下沉的边界在哪里?如何利用好越来越边缘化的设备?如何提供同等优质的体验、质量和能力?如何继续挖掘边缘的新业务价值?


本次分享将试图立足“多媒体网络如何超越边缘,服务业务降本”这一主题,在行业普遍经验的基础上,分享字节在点直播等场景,超越传统边缘过程中的工程经验、研究成果、以及组织变革努力。 探讨在极大用量、复杂业务的情形下,如何长期保障和优化全球降本的边际效益。



02

希沃智能语音的低成本落地实践




李波 

希沃 AI Tech Leader


随着教育信息化的发展,音视频教学资料在迅速增加。与文本资料相比,音视频材料在学习过程中存在更大挑战,例如难以进行重复阅读、检索、批注和总结归纳等。因此,我们的多项产品旨在通过智能语音技术帮助用户更好地利用这些资料,使用户能够像使用文本资料一样有效地学习音视频内容。


而要打造出精度较高的智能语音系统,通常要投入数百万乃至千万的数据标注成本。希沃团队通过构建半监督学习系统,在海量的无标签数据上训练,以不到十分一的成本实现业界领先的语音识别系统。



03

转码系统究竟在优化什么?——提高压缩率的原理与实践




蔡春磊 

哔哩哔哩 多媒体算法组 teamleader


建设包括画质评价、前处理、自适应转码策略、新一代编码器、终端增强等模块的内容自适应转码系统,是各大视频公司的重要工作。而压缩转码系统所涉及的技术种类繁多,各个模块的技术路线也各不相同,它们的优化方向和有效性是否能用同一套理论框架来解释?近几年,面向未来的深度学习视频图像编码技术,在短时间内达到了媲美最新传统编码的性能。而这两大类编码方法的优化原理是否也息息相关呢?其实这些工作都能被信息论中的两条定理所归纳和解释:


  1. 解码时,与信号相关的先验信息越多,剩余的条件熵就越小,编码所需码率就越低;

  2. 对信号概率分布的预测越准确,交叉熵就越小,编码所需码率就越低。

在能够对转码方法进行原理解释之后,即可指导B站的内容自适应转码系统的各个模块的设计与优化。以自适应转码策略为例,我们提出了一种画质可控的转码系统,其目的是提高逼近画质临界点的能力,最终我们的方法可以以99%的准确率,控制编码视频的画质,显著改善了画质体验,同时节省了数亿元的带宽成本。


04

shopee视频编码技术与极速高清最佳实践



范志兴    

shopee 视频编解码tech leader    


随着经济增长放缓,各大互联网公司都喊出了降本增效的口号,shopee也不例外。近2年,如何在降低带宽、算力成本的同时提高或者至少不降低用户的画质体验成了shopee 音视频技术团队最大的挑战。


    本分享将带大家深入了解一下,shopee如何做到端到端的画质提升,以及带宽/算力成本节省的。我们结合了AI增强,采集端编码策略优化(软硬编码结合),后台转码优化(编码器bdrate提升,编码效率提升),播放端增强等技术达到了这一目的。





LiveVideoStackCon 2023音视频技术大会深圳站,诚邀您参与。

时间:2023年11月24日-25日

地点:深圳圣淘沙酒店(翡翠店)

获票方式:扫码购票,团体参会还有优惠!

咨询:13520771810(微信同号),[email protected]


立即购票





▼点击下方阅读原文 ▼

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
亚马逊白菜!抢双立人炒锅、智能门铃、任天堂游戏机、面巾纸、智能压力锅、高压清洗机!任何2-1=1的健身運動都值得做「专题速递」AR协作、智能NPC、数字人的应用与未来佑驾创新完成数亿元E轮融资,加速高阶智能驾驶产品研发|36氪首发未来的人工智能语言,是 Rust 还是 Mojo ?「专题速递」JPEG AI、端到端图像编码的标准化及产品落地、深度学习亚马逊捡漏!抢象印火锅神器、智能电热水壶、智能取暖器、飞利浦水牙线、铲雪机!小说:兰欣与乌茶 32「专题速递」GPU算力思考、内容生产技术实践、AI动漫、多模态可控的作曲框架支持提取付首付、提高"多孩家庭"贷款额度…多地优化公积金政策8张3090,1天压缩万亿参数大模型!3.2TB骤降至160GB,压缩率高达20倍「专题速递」嵌入式物联网、RTC技术、实时通讯终端、混合现实影像「专题速递」数据驱动赋能、赛事直播优化、RTC技术、低延时传输引擎、多媒体处理框架、GPU加速学不好数理化,一样需要走天下「专题速递」RTC云网端联合优化、弱网对抗策略、QUIC协议的能力和实践抖音直播电商背后的技术实践:画面更高清、网络更低延迟、玩法儿更多我在美国教新移民学生英语:边缘地带内的“主流”与“边缘”我国首次!星间激光超高速高分辨遥感影像传输成功「专题速递」数字人直播带货、传统行业数字化升级、远程协作中的低延时视频、地产物业中的通讯终端Achronix黄仑:FPGA加速超低延迟大并发实时智能语音识别|公开课预告AIGC+AIoT——打造AI智能语义+语音的新时代|人本智汇李亚专访RTE2023:声网首创广播级4K超高清实时互动体验突发!圆通速递、韵达速递、京东物流被约谈!集度CEO、极越CEO夏一平:一个智能化的「实用主义者」与他的汽车机器人圆通速递、韵达速递、京东物流被约谈!边缘性行为,为什么是边缘的?AVS感知无损压缩标准概述——视觉无损质量等级视频浅压缩IBM最新推出一款类脑芯片“NorthPole” 用于快速高效的人工智能大反转!奥特曼回归OpenAI ?;微软发布人工智能芯片;百度李彦宏:重复造大模型是浪费;阿里巴巴、百川智能、极睿科技等最新消息「佑驾创新」完成数亿元E轮融资,加速高阶智能驾驶产品研发|早起看早期「专题速递」水下图像的画质增强、HDRVivid生态、视觉质量评价模型、音乐可视化效果何以知道就是girl, 要是梁效呢?ChatGPT能语音聊天和看图了!五种音色选项,背后模型细节公开小学生学英语、提高大语文素养必备!上万元海量资源,语法纠错,一对一练口语旅美散记(15):门前草坪与邻里关系
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。