音视频技术开发周刊 | 284
每周一期,纵览音视频技术领域的干货。 新闻投稿:[email protected]。
Google联合多加巨头推出ML基础设施:OpenXLA
https://opensource.googleblog.com/2023/03/openxla-is-ready-to-accelerate-and-simplify-ml-development.html
我们判断,如果ChatGPT不犯大错,两年内,整个科技行业甚至人类社会都会被颠覆一遍。倒计时已经开始了。
Stable Diffusion + ControlNet + Unreal 5 驱动的AI虚拟人
https://twitter.com/CoffeeVectors/status/1632825278148870145
Stable Diffusion完美复制Korean doll likeness
https://zhuanlan.zhihu.com/p/606825889
HDR转SDR实践之旅流程总结
https://juejin.cn/post/7205908717886865469
Meta的AV1在Reels的应用实践
https://engineering.fb.com/2023/02/21/video-engineering/av1-codec-facebook-instagram-reels/
在这篇评论文章中,微帧科技(Visionular)公司联合创始人兼CTO Zoe Liu分享了她对于2023年及之后编码领域的发展态势预测,具体包括低能耗视频转码、HEVC与AV1的发展前景、实时转码、AI在转码中的作用等议题。
Akamai迎来900GBps攻击
https://www.akamai.com/blog/security/record-breaking-ddos-in-apac
本文提出了一种帧跳跃机制,通过主动管理解码器队列中的帧,有效地降低了队列延迟。
Dirty Pixel-极端环境下联合ISP成像和感知的端到端算法方案
Google发布通用语言模型 支持超过100种语言
https://ai.googleblog.com/2023/03/universal-speech-model-usm-state-of-art.html
对话Shopify创始人Tobias Lütke:把小事聚在一起办大事
FPGA具备可编程的属性,成本也非常高,一块高性能FPGA成本就要几千美金。ASIC编解码芯片在满足超高清视频编解码的需求前提下,其TCO成本仅为行业性能领先的软件编码器成本的1/15 - 1/20。
老牌搜索引擎DuckDuckGo推出维基百科 + AI的问答引擎
https://arstechnica.com/information-technology/2023/03/wikipedia-ai-truth-duckduckgo-hopes-so-with-new-answerbot/
Google和亚马逊有兴趣投资SHEIN
https://www.theinformation.com/articles/shein-had-informal-talks-with-u-s-tech-giants-about-potential-investment?rc=nkup8q
活动推荐
Google I/O 2023
https://developers.googleblog.com/2023/03/lets-go-its-google-io-2023.html
倒计时21天:和LiveVideoStack在2023年的第一场约会
时间:2023年3月31日 - 4月1日
报名:点击【阅读原文】了解详细信息,报名参与。
微信扫码关注该文公众号作者