随着ChatGPT引发的“千模大战”席卷各行各业,国内超30家互联网大厂、AI企业及行业公司已陆续推出了大模型产品。近日,AIoT(智能物联)头部企业宇视科技也重拳出击了。5月9日,在乌镇举办的一场容纳超2000伙伴的盛大聚会上,这家一向低调的企业推出名为“梧桐”的行业大模型,打响AIoT行业大模型第一枪。▲宇视推出“梧桐”行业大模型
宇视科技创立于2011年,与海康威视、大华股份并称为安防行业的“海大宇”,地位就如同互联网圈的“BAT”。自2016年起,随着安防成为AI落地的最佳场景之一,智能摄像头、边缘计算盒子在全国落地,宇视逐渐进化为国内AI工程化最成功的AIoT企业之一。但成功只是一方面,众所周知AI落地近年来面临重重挫折,宇视实际上也是踩坑最多的企业之一。2023年初,以GPT-4、SAM为代表的大模型在全球爆火,宇视CEO张鹏国感到行业的新机遇来了:“就像‘繁体字到简体字’的进化,AI落地的门槛会大大降低,AIoT行业上下游伙伴都有望从中受益。”▲宇视CEO张鹏国在围绕“AIGC+AIoT”主题发表演讲
据悉,“梧桐”专门面向AIoT行业提供覆盖CV(计算机视觉)、NLP(自然语言处理)、MM(多模态)等多项能力。同时,宇视推出AI长尾算法云训练平台、边缘AI推训一体机等产品,与“梧桐”一起预计7月面向第一批伙伴测试,赋能自身的同时为伙伴提供AIGC(生成式AI)智能化基座。当下,AI大模型已经在办公软件、搜索引擎等线上应用领域挥起“魔法棒”。那么在软硬件结合的AIoT领域,AIGC能和行业产生什么样的火花?很多人还记得《流浪地球2》中一个具备“大脑”的摄像机Moss,这样强大的技术离我们还有多远?比较贴近实际的增长蓝海又在哪里?通过对话张鹏国等宇视高管,我们对此进行了深入探讨。
了解AIoT行业的人都知道,这是一个以音视频为主且强调内容保真的领域。交通路网上的摄像机服务于人们出行,政务大厅里的大屏保障城市顺畅运作。这样一个严肃的To B领域,与爆火的AIGC之间有什么关系?宇视CEO张鹏国告诉智东西,起初ChatGPT火的时候,很多人都觉得AIGC好像与行业关系不大,但随着它与视频图像结合的技术出现时,行业的“新大门打开了”。“AI落地的效率和成本问题,将被解决;不赚钱的焦虑,也是时候结束了。”过去近十年里,我们看到AI落地取得了长足的进步,但直到今天我们还依然面临诸多问题。1、少:今天,只有不到10%的AI需求被实现,或因为技术不可实现,或因为实现代价过高、商业不闭环。2、慢:AI需求实现周期长,又依赖厂商需求排序。因此需求交付的周期可能需要六个月甚至更长的时间。3、差:很多长尾需求的落地准确率只有80%,甚至更低。4、费:再炫酷的技术,作为企业来说,盈利最重要。但长尾AI的盈利仍是业界难题。张鹏国坦言:“从2016年AI落地至今,我们没有看到蓬勃向上、蔚为壮观的行业新秩序,反而是众多同行在人和车的识别两条狭窄的细分赛道里残酷竞争。”究其原因,是因为太多的贴近用户的长尾的、定制化的、有特色的需求和算法以及业务软件,实现效率太低,实现成本又太高,AI技术本身存在局限性。AIGC大模型技术打破了这一局限性。大模型具有众多优势,包括:更多的目标种类、更高的开发效率、更少的场景训练数据、更低的定制成本等。“AIGC技术和AIoT的结合,有可能为我们缔造一个新大陆。”张鹏国说。AIGC将从以下至少四个方面解决AIoT行业痛点:1、解决技术分层和生态分层问题。以前行业分层不好,太多伙伴在搬箱子,越过越艰难,技术边疆越做越小。2、为行业带来效率极度提升。面对行业碎片化情况,提高销售、售前和售后的效率。3、为行业带来非常强大的业务变革引擎,挖掘视频数据衍生的新业务蓝海。4、行业严格意义来说是反AIGC的,因为要审核视频、内容保真。矛和盾的较量带来新的市场,AIoT和AIGC相互攀升带来行业变革。可以看到,虽然以ChatGPT为代表的大模型应用看起来与AIoT关系不大,但多模态的AIGC大模型却能直击行业痛点,有望带来行业变革。
实际上,纵观行业内已不止宇视一家有行动迹象。根据行业龙头海康近期业绩说明电话会议,其已面向智能安防场景训练了百亿级参数的大模型。行业老大和老三都出手了,可见AIGC是全行业都不会错过的机会点。
张鹏国说,AI大模型使得AI落地如同“从繁体字到简体字”的变革,本质是技术平权和知识的平权,很大程度上将大厂与小厂拉到了同一起跑线上。在繁体字时代,教育识文断字,读书是少数人的特权;而简体字的出现,大大推动了教育平权,让几亿平民百姓都有了用知识改变命运的机会。AI大模型技术也有类似的功效,降低AI落地应用的门槛,从而带来技术的平民化。这有助于行业新秩序的形成:“意味着每一个合作伙伴可以做自己所在行业的细分的算法和业务软件,而不用再做搬箱子的事,构筑自身的护城河。”张鹏国告诉智东西。▲张鹏国称AIGC本质是技术平权和知识平权
那么具体来说,行业伙伴如何找到应用AI大模型“抓手”?李聪廷说,与市面上常见的通用大模型不同,“梧桐”行业大模型专门面向AIoT行业。通用大模型落地行业有两大难点:首先是精度问题,市面上的通用大模型,落地行业应用精度不够,比如在加油站安全生产AI应用中,某通用大模型将一个远端红色工作服的工作人员识别成了灭火器,这就需要结合行业场景进行二次开发。其次是部署问题,大模型动辄百亿甚至千亿参数规模,难以在AIoT产品中部署。为此,宇视的解决之道是:通用大模型+行业场景+训练调优=行业大模型。经过行业场景学习的行业大模型,在处理任务时精度更高;同时,因为聚焦处理行业场景任务,模型得到瘦身,使得边缘部署成为可能。据悉,“梧桐”行业大模型覆盖面向AIoT的CV、NLP、MM多项能力。1、梧桐CV行业大模型,提升长尾AI需求落地的效率和效果通过“行业大模型+小样本”训练学习模式,宇视会以AI训练平台、推训一体机的方式服务客户,助其以更低的成本获取效果更好的AI。宇视的伙伴来自城市、交通、园区、工业、金融、旅游等各个领域,张鹏国告诉智东西,其客户目前实际上并未提出上大模型的需求,但客户关心的是效率和效果的提升,通过底层AI模型的切换有望实现这一目标。NLP大模型可以改变产品研发、销售及运营等环节的交互方式,替换重复工作人力,从而赋能AIoT的全流程。举个例子,当用户输入想要采购一款AIoT相机并提出了若干性能要求,通用大模型竟然推荐了几款深度学习开源框架;但经过训练调优的行业大模型不仅给出了具体型号推荐,还能连续回答应用、部署等方面的深入问题。基于“梧桐”多模态大模型,伙伴有望挖掘视频数据衍生的新业务蓝海。比如宇视已拓展视频内容AI运营新赛道,Vlog“AI文旅智能短视频平台”。简单说,就是通过4k视频拍摄+AI体态分析抓拍,自动筛选游客精彩片段,自动叠加文生图特效和音乐,自动为游客剪辑专属Vlog短视频,一键分享。这一应用可用于景点拍照打卡、滑轨类记录、高空运动项目等场景,目前已经落地到了500多个景区。“梧桐”既是对宇视内部的赋能,也是合作伙伴开发AI差异化需求的利器。针对AI长尾需求,基于梧桐,宇视本次推出了云训练平台、边缘AI推训一体机、交互式数据驾驶舱、AI文旅智能短视频平台等产品。通过这些产品,宇视助力AIoT生态伙伴跳出既有 “搬箱子”桎梏,找到AI高价值产品落地的更多控制点。总的来说,AI大模型可能大大降低AIoT长尾需求、差异化需求的落地技术门槛,使得原本不具备高技术能力的集成商、运营商都成为受益者。更大的金矿是靠近他们的海量行业经验和数据,这是行业大模型不断进化、发挥“魔法”的关键。我们知道,其实像宇视这样的设备和方案商本身不具备数据权,他们只能吃下一部分AI市场;下游靠近客户的集成商、运营商却有望凭借数据资产,成为AI平权的第一受益人。
所有行业都值得用大模型重做一遍,从而挣脱旧秩序、开辟新大陆。随着ChatGPT在今年2月突然爆火,国内的“千模大战”也已经打响。据智东西统计,目前国内已有近50个类GPT大模型已经推出或马上面世,互联网和云服务大厂、AI企业、行业公司、高校及科研机构、大数据公司、算力公司都参与到这场AI“大乱斗”之中来了。与AI大模型正加速落地的办公软件、消费文娱等互联网领域相比,AIoT是一个软硬结合的领域,从底层芯片到相机模组、上层软件任何一个环节都可能限制大模型效果的发挥,因此行业大模型的研发和落地难度更大。可能很多人想问,宇视在这么短时间里推出大模型是怎么做到的?李聪廷说,一是因为积累,宇视在深度学习领域十多年的积累,以及2017年即开始跟进大模型技术的进展。二是因为开源,Meta、Google等科技巨头开源了SAM、LLaMA等通用大模型,这意味着行业公司不用从头开始,而是可以“站在巨人的肩膀上”打造自己的AIGC智能底座。除此之外,宇视强调了其在业务规模、硬件创新及软件开放等多方面的“护城河”:1、规模决定产业链地位,产业链地位是性价比的前提,宇视业务规模奠定了其落地AIGC的地基。2、积累了“两大支撑能力+八大核心开发能力+三大机电平台能力”创新力体系,宇视用性价比打造AIGC落地的支撑。3、深度开放的产品能力,宇视产品支持多品牌即插即入、一站式交付,为AIGC落地提供生态合力。纵观AIoT产业发展,行业头部公司从田间地头到西装革履,大多依然保持着务实和善战的基因。而随着所处的地平面快速移动,他们也是最不乏开眼看世界和向上攀爬意愿的群体之一。向上攀爬最怕的是没有抓手或控制点,我们看到,AIGC大模型或许为他们提供了这样的绝佳控制点。
从安防到AIoT,这一行业经历了早年乘风IP化和高清化浪潮,让从业者赚得盆满钵满,又随着AI技术发展的涨落经历了波峰波谷。在波谷中,很多产业链玩家感到市场卷、挣钱难、为生存焦虑。如今,AIGC及大模型技术正诱发这一行业的新变革,市场的边疆有望实现大大拓展。如何在这片新大陆上找到自己的掘金坐标?以宇视为代表的AIoT头部企业已经率先推出行业大模型。尽管其行业大模型的更多细节未公布,落地效果也仍待检测,但从其公布的AI研发力、业务规模、ICT创新力、生态开放度来看,这家年富力强的跨界玩家没打算对这波AI机会手软。AIoT领域的玩家会陆续出招,比如行业龙头海康曝出已有安防领域CV大模型,大华可能很快有动作。值得一提的是,与AIGC已落地的办公软件、社交媒体等线上场景不同,AIoT涉及的开发流程、销售交付过程、运营服务都复杂得多,因此找准刚需点及切入时机变得尤为重要。张鹏国告诉智东西,要让《流浪地球2》中的Moss成为现实,可能还有非常漫长的路要走。
(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)