Redian新闻
>
音视频技术开发周刊 | 280

音视频技术开发周刊 | 280

科技
每周一期,纵览音视频技术领域的干货。
新闻投稿:[email protected]


Netflix在动画片中使用AI辅助的背景画面

为了应对人力资源不足,Netflix开始使用AI辅助制作动画。

https://arstechnica.com/information-technology/2023/02/netflix-taps-ai-image-synthesis-for-background-art-in-the-dog-and-the-boy/

基于混合神经体素的快速多视视频合成

基于 NeRF 的方法已经证明了为静态场景渲染照片逼真的新颖视图的可能性,许多方法将神经辐射场扩展到具有时间查询或显式变形场的动态场景中。

单目视频的个性化人脸 NeRF 模型

为了构建个性化语义面部模型,作者将基定义为多个多级体素场。以短的单目 RGB 视频作为输入,本文提出的方法可以在十到二十分钟内构建目标的语义面部 NeRF 模型,并可以在几十毫秒内渲染出具有给定表情系数和视角方向的逼真的人脸图像。

BigColor:利用生成先验给自然图片上色

文章提出了一种利用生成先验的上色方法 BigColor,可为具有复杂结构的各种野外图像提供生动的着色。使用空间特征图而不是空间扁平化的 BigGAN 潜在码,扩大了表示空间。

纽约现代艺术博物馆的装置标志着 AI 艺术的突破

AI 艺术家 Refik Anadol 表示:“现在我们正处于‘文艺复兴’时期。”

KALOS.art AI 作品每周精选 003

爱好者们可以在这里探索发现,购买作品图片(带商用授权),跟艺术家们开启私信通道交流。

英飞凌领导开发未来“数字耳朵”传感器项目

“Listen2Future”项目为工业和医学开发更新更小的麦克风和超声波传感器。精准的微型助听器、婴幼儿快速感染控制或可穿戴超声贴片是其关键应用。

虚拟现实—VR视频技术介绍

文章主要从VR视频压缩编码,视频传输,渲染显示等几个方向进行简单的介绍。本文来自抖音多媒体实验室。

云SRS:支持虚拟直播

使用云SRS可以结合虚拟直播和多平台直播,将直播流推到云SRS后转多个平台。

ChatGPT:关于WebRTC的未来,你怎么看?

ChatGPT可能在几天内成为某个领域的专家,不信?看看他对WebRTC的解读。感谢刘连响对本文的审校。

让天下没有难训练的大模型,微软亚洲研究院开源TorchScale

微软亚洲研究院从深度学习基础理论出发,研发并推出了 TorchScale 开源工具包。TorchScale 工具包通过采用 DeepNet、Magneto 和 X-MoE 等最先进的建模技术,可以帮助研究和开发人员提高建模的通用性和整体性能,确保训练模型的稳定性及效率,并允许以不同的模型大小扩展 Transformer 网络。

ChatGPT成为有史以来增速最快的应用

发布2个月以来获得了1亿用户。

https://arstechnica.com/information-technology/2023/02/chatgpt-sets-record-for-fastest-growing-user-base-in-history-report-says/

OpenAI是如何胜过谷歌的?ChatGPT发展简史

为什么OpenAI的成立初衷就要与谷歌竞争?

Google 会议中的 AI 技术与在浏览器中执行实时音频机器学习应用

在浏览器上使用机器学习会存在一些额外的性能上的挑战,包括如何在浏览器内部运行,并确保在各种不同的终端设备上实时运行。另一方面,在视频会议场景下,同样还需要确保能够实时运行,即达到 30 fps

科学期刊禁止将ChatGPT列为论文作者,ChatGPT自己怎么看?

科学网博主刘洋老师将ChatGPT接入微信,人工智能化身数字人“AEKnow”。他们向AEKnow提问关于署名政策的看法,有意思的是,AEKnow会根据提问者的倾向而改变自己的回答。

ChatGPT vs Claude,聊天机器人大战打响了?

因不满老东家成为微软附庸,11名OpenAI前员工怒而出走,创立了Anthropic公司,打造了ChatGPT最强竞品——聊天机器人Claude,最新估值50亿美元。

LiveVideoStack:展望2023多媒体生态

LiveVideoStack在2023年有哪些计划?你们对2023年抱有怎样的预期?行业生态将迎来哪些变化?本文来自LiveVideoStack创始人包研。

2023年全球AR/VR市场十大趋势洞察

基于 VR陀螺对于过往经验总结、行业观察及市场判断,特发布《2023年全球AR/VR市场十大趋势洞察》,供业内参考。

芯片设计行业的新趋势

芯片设计变得更复杂不仅仅体现在芯片晶体管规模变大上,还体现在SoC复杂度的提升上,而SoC复杂度提升会带来一系列的改变,包括设计方法学的变化,以及设计验证方面的新需求。这些新的变化和新需求将会驱动未来几年芯片设计的变革。

欧洲 ISE 2023,全球AV影音视听盛宴,新品盘点

ISE 2023展会面积超过52000平方米,比2022年增加了30%以上,超过900家参展商来参展,Absen、Blackmagic Design、Barco、Christie、Crestron、Google、KNX、LANG、LG、Logitech、松下、三星、舒尔、Snap One、索尼等知名品牌亮相展会。

多媒体与健身将在2023年产生哪些火花?

线下健身服务是在疫情中最受打击的行业之一,随着全球逐步开放,线下健身正在回暖,而线上+线下的混合健身方式正在流行。

https://www.mux.com/blog/how-video-and-connected-fitness-will-evolve-in-2023-and-beyond

腾讯发布 AIGC 发展趋势报告:迎接人工智能的下一个时代

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

AV1编码器的优化及其在流媒体和实时通讯中的应用

本文来自Google的王云庆老师在LiveVideoStack公开课上的分享整理。
2023春节多媒体新闻回顾

央视春晚的元宇宙技术,微软发布AI声音生成工具VALL-E,百度将推出类ChatGPT风格机器人。

AWS的IVS浏览器SDK发布

AWS终于补上了浏览器直播短板。

https://aws.amazon.com/blogs/media/broadcast-from-a-browser-with-the-amazon-ivs-web-broadcast-sdk/

Discord可通过GeForce RTX 40显卡实现AV1编码4K@60视频直播

AV1和Nvidia的又一次胜利。

https://wccftech.com/discord-brings-av1-streaming-support-with-nvidia-geforce-rtx-40-gpus/

CES 2023:与信心与希望有关

苹果仍然没有参加 CES,Google 在中心展馆主入口的正对面单独设了一个展馆,重点依然是智能家居。亚马逊则在以汽车为主的西馆、中心展馆和Venetian Expo 分馆都设立了展台,微软的展台也不止一处,聚集人流最多的是展示了 XBOX streaming 的游戏展区。

收购机器人界的「Android」,谷歌豪赌未来五十年

过去的几年里,国内外很多机器人和无人机企业,还有无人机驾驶企业,都纷纷将「具备 ROS 开发经验者优先」这句话,加到了算法工程师、研发架构师等岗位的招聘需求里。比如大疆无人机、百度 Apollo、还有华为自动驾驶仿真业务。

再见了HDMI Alt

其实在未能推出配套线缆和适配器的那一刻,HDMI Alt模式就已经没有未来了。HDMI已全面落后DisplayPort。本文来自Arstechnica。

2023年1月合成孔径雷达(SAR)行业动态

我国商业雷达遥感卫星企业—天仪研究院遭美国无端制裁;美媒披露内幕俄乌冲突已演变成"算法之战"。


活动推荐

LiveVideoStackCon 2022北京站 一起见证多媒体趋势

时间:2023年3月31日-4月1日

报名:扫描图中二维码或点击【阅读原文】了解更多详细信息,报名参与。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
音视频技术开发周刊 | 281OPPO第二颗自研芯片:台积电6nm工艺,征服射频技术大山,蓝牙音频芯片揭面纱AI写作、绘画、游戏、编程、音视频编辑……从十款AI应用一窥AIGC时代下APP的最新发展趋势 |【经纬低调研究】一本有思想有情趣的好书音视频技术开发周刊 | 283夏日里,看皑皑雪山,望万仞冰川低延时直播技术优化实践,画质增强技术应用实践,云剪辑架构设计与演进,Web端音视频通话技术探索中国大模型时代新Linux初显!FlagOpen大模型技术开源体系发布音视频技术开发周刊 | 282华人阿姨抖音视频爆红外网,网友得知她的年龄后惊呆了品读彭小玲老师的《生活在英国》一书2023,音视频技术将如何发展?| Q推荐当3D打印技术开始盖房:电脑生成图纸、挤牙膏式铺水泥 |【经纬低调分享】【主编连线】对话快手StreamLake —— 探索音视频技术与服务体验升级之路真情书写人生三维声技术在赛事直播中的应用,TWS耳机中音频技术落地实践,通话降噪算法落地应用及挑战百家云上市后首次融资1000万美元 音视频技术服务领域整合加速黑马营第23家上市公司:中国音视频SaaS第一股来了音视频技术开发周刊 | 275华人阿姨抖音视频爆红外网,网友得知年龄后惊呆了!一位平凡而伟大的中国母亲这10个以色列公司的创新技术开了行业先河 Top 10 Israeli Innovations 2022【推广】伊大将领导ACE可进化计算中心,着力于2030年后分布式计算技术开发腾讯PAG动画组件技术,8K内容生产和传输应用实践,xR虚拟拍摄技术探索,影视生产与互联网音视频【今晚7点】对话快手StreamLake —— 探索音视频技术与服务体验升级之路音视频技术开发周刊 | 284播放器技术演进与探索,Web开播系统的技术演进,大屏终端音视频播放,音视频效果插件开放平台建设智源发布FlagOpen大模型技术开源体系,要做大模型时代的“新Linux”智能处理与编码算法产品化;媒体传输协议的演进与未来;音视频播放技术与消费体验升级快速构建音视频能力与服务,5G低延迟视频技术应用实践,RTC云游戏场景探索,面向用户体验的客户端优化实践音视频技术开发周刊 | 278专家讲座 | 新冠自我急救法·音视频Descript:OpenAI投资,像编辑文档一样编辑音视频音视频技术开发周刊 | 279美股IPO|中国 AI 技术开发商小i机器人,设定 4700 万美元美国 IPO 上市条款
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。