实时互动在互联网发展中的核心基建与驱动价值地位,不容小觑。
如今,注重“实时”和“互动”的RTE正快速推动着生活、生产方式的革新,也在成为未来数字化生活的新一代基础设施。正如五源资本创始合伙人刘芹所指出的:实时互动技术正在改变我们的世界,改变人与人、人与世界连接的方式。实时互动在互联网发展中的核心基建与驱动价值地位,不容小觑。11月1日-4日,由声网及 RTE 开发者社区主办的第八届 RTE 实时互联网大会于在线上举行。去年,声网发布 RTE 万象图谱,引发行业关注。今年,万象图谱全面升级,并以书刊的形式在 RTE大会重磅推出,《实时万象》图书全面剖析实时互动产业的20+赛道、200+场景,并首次揭秘声网的实时音视频大数据,全面拓展声网对实时互动场景的深度观察与理解,为全球的开发者以及行业从业者提供了一个高价值的参考读物。
音视频场景爆发,实时互动无处不在《实时万象》指出,根据声网对国内几大应用商店在教育、泛娱乐、购物、金融、医疗、企业通讯等行业的近万个应用进行统计,2021 年实时音视频渗透率已突破 30%。未来,很可能在几年时间里,实时音视频技术的渗透率将会在关键行业超过 50%。在声网发布的《实时互动场景创新生态报告》中也曾预估,到 2025 年,实时互动行业将形成一个超过千亿人民币规模级别的市场,并且行业的生态化发展将会加速这个数字的增加,预估五年内复合增长率将达 40% 以上。实时互动到底是什么?有怎样的应用场景?为何会随着音视频场景的爆发迎来蓝海?从广义角度而言,实时互动包含了特定场景下人、物、空间三者交互体验的所有内容;从技术角度而言,实时互动包含了能够实现实时通信和灵活互动能力的一系列技术的集合。其中,最核心的能力为灵活互动,即在信息传输的基础上,根据具体场景需求,借助多样化的插件组件和算法,灵活增加互动工具,提升效率与用户体验。也就是说,实时互动实现了对信息传递效率和用户交互模式的变革,能让用户随时随地即时获取无损信息、多维度地接触信息。因此,RTE的场景从原来的会议、直播、在线课堂等传统应用拓展到了泛娱乐、IOT、金融、医疗以及更多数字化转型的产业中去。实时互动的发展势头,正像声网的愿景中描述的那样:像空气和水一样随时随地、无处不在。
200+场景,实时互动边界在何方?事实上,实时互动技术与近日来火爆的元宇宙也息息相关。CSDN创始人兼董事长蒋涛表示,实时互动技术驱动用户体验和产业场景变革,是元宇宙的底座技术。但实时互动的场景远不至于此,更有许多业内人士也表示出了对实时互动的兴趣:这个实时万象的世界,究竟是怎样的?创业者此时进入这个赛道还有机会吗?具体落地场景中会遇到怎样的困难?在《实时万象》这本书中,声网利用积累的行业数据和服务方案,剖析了实时互动产业 20 多个行业赛道的 200+ 行业场景,以此给开发者和创业者更多灵感和视角,和创新者一起去打磨、探索这些场景中真正的价值和创新点,促进 RTE 行业场景的进一步进化;同时,声网也在《实时万象》中公布他们在实时互动行业观察到的音视频大数据,包括终端设备的机型大数据、音频卡顿率大数据的关联性分析、全球区域热门 RTE 场景的分布等等,希望能给全球的开发者以及行业从业者提供参考,一起去挖掘更多、更丰富的实时互动创新场景,共同赋能和推动 RTE 行业的壮大和持续繁荣。《实时万象》公布的声网音视频大数据共分为三大部分:RTC机型大数据、声网大数据之音频卡顿率与视频卡顿率。《实时万象》显示,在中国大陆,使用RTC的手机前30多以iphone为主,而在中东、北美、南美、印度等地区,手机机型更多元化;但在RTC用量前100的机型中,全球整体的低端机机型占比较少,在用量 Top2000 机型中,低端机的用量占比有明显提升。其中,中国大陆的机型市场比较特殊,平均重合率为15%,不到其他地区的一半;欧洲的平均机型重合率最高,达49%。与中国大陆机型重合率最高的是东南亚,最低的是南美。这些机型大数据为出海企业提供了全球七大区域机型优化适配的参考价值。值得关注的是,音频卡顿率和视频卡顿率大数据的公开对各开发者和创业者具有重大参考价值。目前,从事该领域的企业大部分还处于“大步快走”阶段,并没有足够强的数据挖掘能力对业务流程中的数据进行开发,因而也无法从中获得业务反馈加以改进;其次,整体音视频领域尚未有涉及多行业、多痛点的精细行业数据公布,《实时万象》的数据无疑给这些摸着石头过河的先行者提供了指引方向的明灯。数据显示,在音频/视频各场景中,音频/视频卡顿率是影响用户频道时长、用户次日、第 7 日使用 RTC 留存率的重要因素。书中具体展示了语聊房、游戏语音和狼人杀的音频场景;以及1V1视频通话、视频相亲、秀场直播和电商直播的视频场景。这有利于开发者和创业者从音视频大数据对业务指标影响的关联性分析中提炼数据要点,从而优化产品和解决方案,并挖掘更多创新场景。具体来说,用户频道时长与用户在频道中的音频卡顿率呈现中等负相关性, 相关系数在0.36~0.56 之间。以语聊房场景为例,声网发现当频道中的音频卡顿率高于 8.1% 这一临界值时,99% 用户是无法接受的;使用声网 RTC 的语聊房客户中,超过80% 用户在频道中的音频卡顿率低于1.2%,用户的音频体验质量普遍较好,频道停留时长也较长。且经过数据分析,进一步可知:当用户在频道中的音频卡顿率位于(1.2%~8.1%] 之间时,音频卡顿率每降低 0.1% ,用户在频道中停留的时长平均增加 18s(约为时长中位数的 5.5%),用户在频道中的时长中位数为 327s。· 横坐标表示音频卡顿率,纵坐标表示用户频道使用时长· 图中的每个蓝色的数据点表示语聊房场景中的用户在某频道中的使用时长和该用户在频道中的卡顿率· 图中的红色曲线表示采用对数方程拟合数据点得到的拟合曲线,由曲线可以看出语聊房用户频道使用时长随音频卡顿率变化的趋势这些音视频卡顿率数据的公布,是声网多年的业务经验和产品创新的沉淀,体现了其卓越的技术硬实力,更对行业有着意义非凡的价值。在过去,企业只知道卡顿会对用户带来不好的体验,但是他们无法知道什么样的卡顿率是用户无法接受的;当卡顿率有明显的提升后,具体能给APP的用户使用时长、用户使用留存带来怎样具体的提升?声网通过音频与视频两个维度,综合分析了语聊房、狼人杀、游戏语音、1V1视频、秀场直播、电商直播等多个热门场景下数十家企业APP的音视频卡顿率大数据样本,得出了音视频卡顿率与用户时长以及用户使用音视频留存率这两个核心业务指标的关联性分析,给各个场景的企业客户提供了具体的业务指标优化的参考。只有清晰地了解每一个场景中的每一个数据对用户体验和业务指标的影响程度,创业者和相关从业人员才能更好地“对症下药”,创造出更优质的解决方案。此外,《实时万象》还发布了包含全球20+行业赛道、200+场景的万象图谱,如泛娱乐、IOT、教育、金融、医疗、企业协作和数字政府/智慧城市等,并基于此场景,形成了2022全球区域RTE场景热力榜单,无疑为各创业者和投资人提供了一份“赛道地图”,将产品和市场聚焦到蓝海区域,提前布局。热力榜单显示,中国的前三热门场景为语聊房、游戏语音和秀场直播,新兴场景包括3D K歌房、平行驾驶和Metaverse;日韩的前三热门场景则为Metaverse、在线监考和在线社交,新兴场景为互动播客和远程体育加油;以及欧美、东南亚、中东/非洲等地区,热力榜单也作了详尽的展示,各区域之间的特域性和多元化相互包容,构成了整体的全球RTE场景,展示着RTE落地场景百花齐放的蓬勃生机,为行业带来了创业和持续发展的热情与动力。落脚到具体场景,以泛娱乐为例,可延伸至社交、游戏、电商、直播、体育以及更多场景。社交中还包含一起健身、一起冥想、一起听音乐、在线K歌房等。值得关注的是,疫情这两年,压抑的公共生活催发了人们对线上娱乐互动的需求,以在线 K 歌房为代表的泛娱乐RTE场景正在快速爆发。线上 K 歌房是将传统的线下 KTV 搬到线上,用户在房间或特定场景中实时欢唱,目前已经衍生多种玩法,K 歌爱好者除了选择以录唱、弹唱为主的独唱模式外,抢唱、接唱为主的依次互动类玩法,斗唱、合唱为主的实时互动类玩法也因为能为玩家间创造更多的社交互动性得到更多选择,深受 Z 世代用户青睐。据《实时万象》解析,RTE在其中的应用主要体现在用户通过排麦、点歌、轮唱或合唱等形式实现互动。但实现常会遇到以下技术难点:唱歌时,用户难免受到环境和背景音干扰,所以需要能够轻松抑制常见噪声,实现人声与背景噪声分离,杜绝回声和啸叫,提供高清音质合唱时要求端到端超低延时,以及精准的伴奏、歌词、人声多端精准同步能够支持多人合唱,并且保证各端独立,一端退出不影响整体合唱效果多种美声、变声效果及音效塑造
除了这些传统常见的场景,RTE还广泛应用到很多新兴领域以及更有价值的产业数字化转型应用中。如无人仓储,就可以利用仓储自动化设备实现物品的进出库、存储、分拣、包装等无人化操作,其中移动机器人、分拣机器人、仓库实时监管等都依靠低延时音视频传输。《实时万象》通过对具体200+场景的业务场景剖析和技术难点一一再现,呈现出大量关键数据和行业洞察。IDC中国副总裁兼首席分析师武连峰在推荐序中指出,音视频服务在企业数字化转型与创新中越来越重要,基于API方式提供的实时音视频服务,能够将音视频连接能力快速集成到既有IT系统与业务流程当中,帮助企业提升连接与协同效率、实现更广泛的客户触达、甚至是数据驱动的流程创新与智能决策。本书所列举的200多项实时音视频实践与应用场景,对于渴望尝试实时音视频服务的企业用户,具有重要的参考意义。技术出海布局“全球化”,迎来各场景爆发声网作为实时互动行业的先行者,从创立之初就一直走国际化路线,在硅谷和上海设有双总部,并在班加罗尔、东京、伦敦等海外城市设有分布式协同团队;在技术出海的同时,也在努力拓展更多的市场。目前,声网的全球化业务服务已覆盖中东、东南亚、北美、拉丁美洲、日韩等区域的全球200多个国家和地区。如全球最大的职业社交网络平台Linkedin、中东地区首家在纳斯达克上市的科技公司Anghami,以及在菲律宾异军突起的直播平台Kumu等,背后都离不开声网的技术加持。声网数据显示,截至 2022 年 6 月 30 日,声网全球注册应用超 47.5 万,同比增长 41%;全球活跃客户数量达 2877 个,同比增长 17%。此次,声网发布《实时万象》为行业带来了详实的案例解读和数据参考,更剖析了不同场景下的技术难点解析,一方面给大众展示了一个万象纷呈的实时互动世界,另一方面也给很多细分市场的创业者提供参考,去发现这些场景中真正的价值和创新点,助力实时互动行业踏上一个更开放多元、多方共建和繁荣兴旺的新征程。在文末留言,谈谈您对实时互动的理解,我们将挑取留言最走心的5位读者,每人送出一本《实时万象》。