音视频技术开发周刊 | 243

2022-04-30 04:04

每周一期，纵览音视频技术领域的干货。
新闻投稿：[email protected]。

✦

一周简讯

✦

FFmpeg 支持 JPEG-XL

多媒体开源库 FFmpeg 在上周六的提交记录中添加了对 JPEG-XL 图像解码器的支持。JPEG XL 基于 Google 的 PIK 格式和 Cloudinary的 FUIF 格式（该格式基于 FLIF），它的默认设置能在实现接近无损的视觉效果的同时，提供良好的压缩效果，这一项目希望成为其他光栅有损和无损图像格式的通用替代品。

Julia开源新框架SimpleChain：小型神经网络速度比PyTorch快5倍

世上没有免费的午餐，享受了通用框架的便利，在特定任务上就要牺牲性能。最近Julia开源了一个新框架SimpleChain，在小型神经网络的运行速度上比PyTorch至少快5倍！开发人员表示，这个框架不会对所有人都有用，但对那些需要它的人来说，它是非常有用的。SimpleChains.jl是由Pumas-AI和Julia Computing与Roche和马里兰大学巴尔的摩分校合作开发的一个库，它的主要目的就是为小型神经网络提供尽可能高的性能。

疫情之下，通过咳嗽声也可以检测新冠

澳大利亚科学家开发了一种APP，该APP仅通过咳嗽声即可检测是否感染新冠。据《每日邮报》报道，这款名为ResApp的APP使用机器学习来分析咳嗽的声音，能够以92%的准确率检测到新冠病毒。ResApp由昆士兰大学的Udantha Abeyratne教授开发。美国制药巨头辉瑞公司最近出价1亿美元收购这家总部位于布里斯班的公司。

北京率先放开自动驾驶主驾无人许可百度首批获准

《科创板日报》28日讯，北京发放无人化载人示范应用通知书，百度成为首家获准企业，其旗下自动驾驶出行服务平台萝卜快跑正式开启无人化自动驾驶出行服务。这意味着“方向盘后无人”的自动驾驶服务在中国超大城市首次放开。根据北京市智能网联汽车政策相关规定，获得通知书的示范应用主体可在北京市高级别自动驾驶示范区60平方公里范围内进行公开道路的无人化自动驾驶载人示范应用。

✦

超级干货

✦

Android AVDemo（1）：音频采集，免费获取全部源码丨音视频工程示例
 在音视频工程示例这个栏目，我们将通过拆解采集 → 编码 → 封装 → 解封装 → 解码 → 渲染流程并实现 Demo 来向大家介绍如何在 iOS/Android 平台上手音视频开发。这里是 Android 第一篇：Android 音频采集 Demo。

视频编解码芯片设计原理----11 率失真优化
 本系列主要介绍视频编解码芯片的设计，以HEVC视频编码标准为基础，简要介绍编解码芯片的整体硬件架构设计以及各核心模块的算法优化与硬件流水线设计。本文提出了一种硬件友好的码率估计算法，依次介绍了算法优化和VLSI实现，最后对VLSI实现进行了性能评估。

iOS AVDemo（10）：视频解封装，从 MP4 解出 H.264/H.265丨音视频工程示例
 在音视频工程示例这个栏目，我们将通过拆解采集 → 编码 → 封装 → 解封装 → 解码 → 渲染流程并实现 Demo 来向大家介绍如何在 iOS/Android 平台上手音视频开发。这里是第十篇：iOS 视频解封装 Demo。

图像信号处理芯片设计原理----04 自动对焦
 本系列主要介绍图像信号处理器中各核心算法模块的设计以及相关的前沿研究，本文介绍自动对焦技术的基本概念，并介绍现有的一些自动对焦方法。

重学音视频？认识 MP4 视频（上）
字面意思很容易理解，MP4 其实是一种容器，可以存音频和视频内容。那么问题来了，既然说 MP4 是 MPEG-4 第14部分，那其他部分是什么呢？有没有 MPEG 的 1、2、3 甚至 5、6、7 呢？

重学音视频？认识 MP4 视频（下）
字面意思很容易理解，MP4 其实是一种容器，可以存音频和视频内容。那么问题来了，既然说 MP4 是 MPEG-4 第14部分，那其他部分是什么呢？有没有 MPEG 的 1、2、3 甚至 5、6、7 呢？

音乐研发必备：理解 MIDI 协议与标准 MIDI 文件格式
 本文的目的是让开发中涉及到音乐“本体”的同学可以了解这一最通用的演奏信息交互和文件存储格式的编码规则。同时通过对 MIDI 事件流等概念的认识，能在开发中更好地抽象自己的业务逻辑。

W3C: 媒体制作 API (2)
介绍了在 WebCodecs 中 Memory access patterns 这项技术的当前状况和未来发展。

广播公司如何利用多CDN增加直播的弹性和性能
 本次分享的主讲人为来自 Lumen Asia Pacific 的内容交付服务总监 Gautier Demond，主讲人分享了他对广播公司如何通过多 CDN 战略提高直播弹性和性能的见解与案例分析。