音视频技术开发周刊 | 294
每周一期,纵览音视频技术领域的干货。
新闻投稿:[email protected]。
五问「ChatGPT+医学影像」:新一代的 AI 能否成为放射科医生的一把利器?
通过此次合作,SAP将微软的多项类ChatGPT功能集成在人力资源解决方案SAP Success Factors中,通过自然语言就能生成职位描述、面试问题等,加速人才招聘流程。
谷歌通过强化学习来优化电子商务推荐系统
传统的推荐系统往往只关注单一目标,如点击率或购买率,而MORL则可以同时考虑多个目标,例如用户满意度、收益和转化率等。通过对这些目标进行综合权衡,谷歌团队的推荐系统可以更加准确地预测用户的偏好并提供更有针对性的推荐。
https://ai.googleblog.com/2023/05/using-reinforcement-learning-for.html
LLM Accelerator:使用参考文本无损加速大语言模型推理
ChatGPT之父舌战国会山!OpenAI欲与政府联手,权力通天
本次LiveVideoStackCon 2022 北京站邀请到腾讯音乐天琴实验室高级研究员——江益靓,为大家介绍全民K歌的多维度评价技术和深度歌唱评价技术的实践,以及优质内容挖掘中使用的音频品鉴系统。
本文以初始时间延迟差为例,来介绍应该如何设计对应的听力测试,探究其在双耳距离感知中的作用。
SMPTE Motion Imaging Journal 2023 | COTS实用媒体处理平台构建案例
使用FFmpeg模拟视频播放列表的实时流
本文展示了如何使用FFmpeg生成一个m3u8播放列表文件以及相关的ts媒体文件,并通过本地服务器将其提供给客户端进行播放。此外,文中还讨论了一些常见问题和解决方案,例如如何处理不同分辨率的视频、如何支持HTTPS等等。
https://www.mux.com/blog/simulate-a-live-stream-of-a-video-playlist-with-ffmpeg
SRT 技术是如何改变现场视频直播的?
据2023年的HAIVISION的广播转型报告显示:SRT已经成为互联网直播视频传输最常用的流媒体协议。2023年,SRT联盟成立六周年,成员超600人。
https://www.haivision.com/blog/broadcast-video/live-video-evolves-with-srt-technology-and-the-internet/
本报告是基于对2023年4月份的数据中心、基础云、SaaS和行业云等赛道动态的调查整理而成。
MSU 视频编解码器比较 2022
这是MSU 的十七个年度视频编解码器比较。
http://www.compression.ru/video/codec_comparison/2022/cloud_report.html
如何将视频的转码速度提升100倍?
本文介绍了如何通过使用多个编码器(Encoder)和多个服务器来实现视频转码的加速,以及如何使用分布式计算框架来划分和并行处理任务。同时,它还提到了一些优化技巧,例如调整编码器参数和使用更高效的编码格式等等,以进一步提高转码速度。
https://www.mux.com/blog/how-to-transcode-video-100x-faster-or-a-gordian-knot-cut
立讯独家代工、Sony独供MicroOLED、台积电独供处理器......
LIveVideoStackCon2023上海站九折期优惠进行中
https://sh2023.livevideostack.cn/tickets
NeRF如何帮助我重新想象世界
为了训练NERF,作者收集了大量真实世界中的图像和深度数据,并使用它们来生成训练样本。然后,作者使用NVIDIA的Triton Inference Server将经过训练的NERF模型部署到云服务器上,以便将其应用于新的图像和视频。
https://developer.nvidia.com/blog/how-nerfs-helped-me-re-imagine-the-world/
为什么目前落地的主流SLAM技术很少用神经网络进行特征提取?
ICRA 2023 同济&港科大开源:高精度、实时的端到端法向量估计方法
ICLR 2017|PIXELCNN++:通过离散逻辑混合似然和其他修改改进 PIXELCNN
LiveVideoStackCon 2023上海讲师招募中
微信扫码关注该文公众号作者