回顾LiveVideoStackCon2022北京
▲扫描图中二维码或点击阅读原文▲
了解LiveVideoStackCon2023上海更多信息
//
文 / 包研
浙江大学求是特聘教授 虞露
LiveVideoStackCon 2022北京站原计划在去年9月交付的,但种种因素一拖再拖,直到上周才终于完成。也许是因祸得福,本次大会是有史以来规模最大的LiveVideoStackCon,下面我来快速回顾下这次大会的一些亮点。
GPT与Chat
图灵公司联合创始人、智源人工智能研究院前副院长刘江为大会作了开场致辞,虽然短短十几分钟,但信息量以及冲击力堪称全场最高。刘江以Chat-GPT为例分析了GPT这类大模型对人类的意义,他可以做人类可以做的任何事情,将会彻底改变社会分工。他建议所有人都应该将Chat-GPT用起来。接下来,刘江强调了“Chat”的价值,这是全新的人机接口,移动互联网的兴起很大程度上基于智能手机这个接口,未来的移动设备并不需要那么多app了,只需要对话框、麦克风和摄像头了。
4月1日晚间在与李超对话中,他也提到即使普通人也应该尝试使用各种Chat-GPT类的应用,至少不会被社会淘汰。而有志于搭上人工智能大爆发的快车的同学,可以学习基础的人工智能原理,这样可以更好的理解他的发展趋势以及背后的价值,他还推荐了几位大师的视频。
题外话,在与李超对话完后,我开了一个“GPT与多媒体”的微信群,不到4个小时,就加到了200人,可见大家对GPT相关技术、产品的关注度之高。
音频领域探索
相比于视频应用,音频是一个更小的圈子,此次大会我们首次推出了两个音频相关的专题。分别由北理工信息与电子学院的王晶老师和腾讯音乐天琴实验室音视频技术负责人赵伟峰出品,从现场的听众反馈看,关注度也是空前的。王晶和中国三星研究院音视频研发经理王立众反复说,这么多年(我们搞音频的人)一直在寻找音频技术有更大的发展空间。王晶透露,音频生态有很多细分领域,比如助听器、驾驶舱娱乐、音乐、游戏、全景声等等。接下来,LiveVideoStack也会同学术界和工业界共同努力探索新的发展空间。
虚实结合 / WWDC 6月5-9日
本次大会上首次推出了硬件交互展示区,虚实结合可以更好的解决真实世界的各种问题。Nreal联合创始人、算法负责人吴克坚分享了下一代计算和人机交互平台的关键技术,以及Nreal取得的进展。
现场很多朋友都提到了苹果即将发布的AR设备,这可能引领下一波技术变革,让我们关注2023年6月5-9日,WWDC。
来自整个生态的焦虑
无论是讲师的分享与现场参会者的交流,都或多或少流露出一些焦虑,行业发展减速后自然就面临调整,降本也好,裁员也好,再正常不过。但这也意味着下一波技术浪潮已经在路上,我们要做的就是做好准备迎接新的变化。
与一些芯片和IP厂商的朋友交流,他们也在寻找下一波算力的爆发点,转码?AI?或是别的什么。
向应用层和行业用户渗透
不断有朋友向我建议,LiveVideoStackCon应该向应用层靠拢,邀请更多应用平台的嘉宾交流,以减少行业内部的内卷。这点我是非常认可的,只有找到更多行业应用场景,整个生态才能更加繁荣,技术的价值也才可以发挥更大的价值。
在会场期间,一位金融领域的技术负责人特意找到我,希望找到视频通话、数字人与AI智能交互相结合的解决方案,主要用于客服和远程技术支持。这位负责人告诉我,其实每个单一的需求模块都有供应商可以支持,但是将所有需求有机结合在一起就很难了。
还有一家国内车企的座舱技术负责人表示,希望找到针对汽车座舱的系统方案,包括娱乐、互动等等。我还与一名在内蒙经营农资的亲戚交流,他告诉我,现在当地使用农用无人机喷洒农药已经非常普及,之所以普及是因为无人机的成本比人工要低,大约可以做到4-8元/亩。
可以肯定的是,我们还可以找到很多多媒体技术在各种行业的应用场景,接下来我们会重点突破,为行业找到更多应用场景。
上海/深圳/旧金山 call for paper
最后,欢迎大家关注7月、11月和10月的LiveVideoStackCon 上海/北京和旧金山,您可以通过 [email protected] 申请演讲。
微信扫码关注该文公众号作者