音视频技术开发周刊 | 293
每周一期,纵览音视频技术领域的干货。
新闻投稿:[email protected]。
谷歌全面反攻 ChatGPT!PaLM 2、Gemini 双杀,Bard 正式开放
以上是2023 Google I/O 大会的重点内容,AI含量极高。
OpenAI发布最新开源项目Shap-E,通过文本就能生成3D模型
5月6日,ChatGPT母公司OpenAI发布了最新开源项目Shap-E,通过文本就能生成3D模型。目前github已经突破2000颗星。
https://github.com/openai/shap-e
HugNLP开源啦!教你玩转各种NLP任务,还可训类ChatGPT模型
在大模型训练异常火爆的今天,基于HugNLP框架,还推出了能够支持类ChatGPT模型进行训练和部署的产品HugChat。
用图像对齐所有模态,Meta开源多感官AI基础模型,实现大一统
Orillusion引擎正式开源!AIGC时代下的WebGPU轻量级3D渲染引擎!
「AI孙燕姿」全网沸腾!AI翻唱大爆发,整个华语乐坛都「复兴」了
人工智能技术的快速发展,为互联网行业带来了更多可能性的同时,也带来了虚假信息、侵权等问题。参照《互联网信息服务深度合成管理规定》等法律法规,抖音提出十一条平台规范与行业倡议。
声网自研编码器 a264 & a265:更优画质更低能耗,进一步适配实时互动场景需求
LiveVideoStackCon 2022北京站邀请到了安谋科技多媒体产品经理董峰,为我们分享“玲珑”编解码融合架构助力视频多元化需求。
MPEG LA和Via Licensing专利池的合并会带来哪些影响?
文章表示,该合并将使MPEG LA负责管理HEVC、AV1和VVC等主要视频编解码器的专利池,这些编解码器是当前和未来的许多流媒体应用程序所依赖的核心技术。此外,该合并还将减少客户在获取许可证时需要与多家公司沟通的复杂性,从而降低了使用这些编解码器的成本。
https://www.streamingmedia.com/Articles/News/Online-Video-News/Via-LAs-Heath-Hoglund-Talks-MPEG-LA-Via-Licensing-Patent-Pool-Merger-158547.aspx
元宇宙直播的终端架构设计和关键技术
5月16日 19:00,我们邀请到了百度智能云视频云资深研发工程师李明路老师围绕终端引擎技术发展与演进,详细介绍元宇宙直播技术体系、终端架构设计和关键技术,分享百度智能云在元宇宙直播场景中的实践探索。
AVIF 图像编码器添加了实验性 AV2 支持代码合并请求
看起来 AV2 的工作进展顺利,很高兴看到更新的 AVIF 图像格式支持也将得到及时支持
https://github.com/AOMediaCodec/libavif/pull/1361
Metal 和 OpenGLES 的差异,快速入门 Metal 开发
本文介绍Metal和Metal Shader Language,以及Metal和OpenGL ES的差异性,也是实现入门教程的心得总结。
作者将点云和 NeRF 相结合,从⽽提出了⼀种名为 Point2Pix 的新型点云渲染器,可以从彩⾊点云合成逼真的图像。
作者分别询问了印象AI、ChatGPT和Bard等TCP和UDP的区别,以上是它们的答案。
这是一篇关于视频技术应用在保险行业里的文章。在整个理赔过程中,数字工具是缩短等待时间和提高客户满意度的关键。
利用多种算法和策略进行网络传输控制,最大限度满足弱网场景下的音视频用户体验。
通过DRM(Digital Radio Mondiale)数字广播进行远程教学
这是一篇详尽介绍DRM广播教育应用场景的文章,结合DRM技术特点和功能成功实现教育普及的理想远景。
https://www.audioblog.iis.fraunhofer.com/cn/radioschooling
南洋理工大学提出基于单目相机和超宽带传感器的VR-SLAM:实现高精度室内定位与建图
本文提出了一种使用单目相机和UWB传感器的SLAM系统。系统称为VRSLAM,是一个多阶段框架,利用每个传感器的优势并弥补其弱点。
本综述首次系统性地概述了深度学习驱动下的相机标定技术,涵盖了深度学习时代以来(8年时间跨度)各类相机模型标定及其应用的最新研究进展。
LiveVideoStackCon 2022北京站邀请到火山引擎RTC团队负责人——杨智超,为大家介绍在实时通信场景下火山引擎RTC对体验的理解与应用落地。
NSDI 2015 | PCC:重新建构面向持续高性能的拥塞控制
如何以实时精度完善5G场内体验
这篇文章讨论了如何在场馆中提供完美的 5G 体验。作者认为,5G 可以极大地改善用户在场馆中的体验,包括视频流、VR/AR、实时互动等方面。
https://www.red5pro.com/blog/perfect-5g-in-venue-experiences/
LiveVideoStackCon 2023上海讲师招募中
微信扫码关注该文公众号作者