对话共达地CEO赵丛:建一条生产流水线,做人人用得起的AI | 甲子光年
AI的低门槛交付到低门槛创新。
作者 | 赵健
在过去的一年中,从AI作画到ChatGPT,AIGC依次刷爆科技圈。前所未有的人机交互体验,让技术的魅力在社交媒体蔓延。
人工智能在今天的发展高度超出了很多人的想象,而当新奇的感受褪去后,在很多人心目中,更希望知道的答案恐怕是,人工智能还能在各行各业怎么落地应用?
其实,当大量科学家在通过AI仰望星辰的同时,也有工程师在思考如何让AI更接地气,降低使用门槛,渗透到千行百业。
共达地就是这样一家AI公司,其核心AI技术为AutoML——自动机器学习。2017年,Google首次发布了Google Cloud AutoML。简单来说,AutoML能够“用AI生产AI”,从而减少人工的参与,提升生产效率。
基于AutoML,共达地让企业无需构建专业AI团队,即可获得生产与部署AI的能力。
在2022年的甲子引力大会上,共达地创始人兼CEO赵丛博士发表了主题演讲,甲子光年也进行了专访。
当AI行业进入下半场,需求会在哪里迎来井喷?共达地怎么做?与BAT与AI四小龙又有哪些不同?
1.谈定位:面对各行业井喷需求,做行业伙伴的赋能者
甲子光年:共达地成立于 2020 年,在行业已经有“AI四小龙”等人工智能公司的背景下,留给共达地的创业机会是什么?
赵丛:过去AI还是一个新鲜事物的时候,产业更多需要的是“AI先驱”,即把AI从零到一开发出来,完成第一阶段的落地。
到现在,AI应用场景已经从单一走向多元,场景数量指数级增长。以近些年重头发展的工业领域为例,中国是全世界唯一拥有联合国产业分类当中全部工业门类的国家,世界500多种主要工业产品当中,有220多种工业产品的产量居全球第一。在这庞大的工业体系中,一项简单的布匹检测大概需要上百种算法,如果计算所有工业门类中细分链条上的AI需求,数量将如浩瀚星辰般庞大。
在需求井喷的基础上,AI产业也正逐渐从过去的垂直整合,走向水平分工,呼唤生产力的大幅提升和生产方式的标准化。所以共达地是在上一个十年AI发展成果的基础上,让更多场景、更多需求得到满足,完成“让AI生产流程标准化”的当代使命,这是一个产业接力的过程。
这个过程类似于八九十年代的PC产业。PC产业最初也是垂直整合为主,每家企业从芯片、操作系统到软件、硬件,都是自己来做。但90年代随着微处理器的出现,PC产业逐渐走向水平分工,产业链条里的角色越来越多,有专门做操作系统的、专门做显卡的、专门做应用软件的等等。
今天的AI产业也在逐渐走向水平分工的阶段。和过去不同的是,今天行业面对的更多是碎片化场景的井喷,我们称之为“超大规模精细化”,AI越来越深入到行业中去。随着技术门槛的降低,行业的Know-how越来越重要,未来AI算法的种类和数量可能没有边际,而生产算法的人才缺口在2025年可能会超过1000万;未来生产AI算法的人,也未必都是AI工程师、算法研究员,而是很多业务人员、产线员工。
共达地希望把AI的能力下沉到各个行业和各个场景中去,赋能行业伙伴。因此我们专注于做好AI算法生产这一件事,AI应用落地的创新会发生在行业之中。
甲子光年:AI目前的行业渗透率是怎样的?
赵丛:过去在各个行业中,AI在安防、金融领域的渗透率是比较高的,安防集中在“人车非”领域,即人脸、机动车与非机动车的识别;金融领域也对AI有很多需求,比如风控、OCR。
但在其他大量的行业,比如园区、医疗、工业制造、能源、水务、农业等等,AI渗透率还不到5%。
甲子光年:AI产业链环节众多,最需要被AI赋能的是哪一个环节?
赵丛:AI产业链条中有很多角色,有数据厂商、芯片厂商、软件开发商、系统集成商、硬件厂商等等。基于前十年AI的示范效应,目前各个环节已经基本具备了分工的基础。
AI落地离不开行业know-how和行业积累,而行业中的软件开发商、系统集成商和硬件设备厂商,是离场景最近的人。
共达地面向的正是软件开发商、系统集成商,是这些定义AI的角色,是具备行业Know-how的中坚力量。我们做的是一个比较开放性的业务,合作方式也是多元的,需要行业人员、产业人员以及AI上下游企业的参与,包括集成商、软硬件厂商、行业协会、科研院所等的共同参与和共同创造。
甲子光年:共达地在AI产业中的定位是什么?
赵丛:AI这件事需要由“低门槛交付”走向“低门槛创新”。低门槛交付,是指大家现在手上有很多AI现成的需求没有得到满足,上述厂商会更加关注这些存量需求;而下一个阶段实际上是低门槛创新,让大家能够更低门槛地突破存量舒适区,去长尾市场创造新的AI应用场景。
共达地专注于提供可规模化的算法生产能力,加速行业完成从低门槛交付到低门槛创新的过渡。
共达地这个名字可以解释为共同到达目的地,因为我们在做的是一件对整个行业有利的事情,希望可以用最开放的生态和合作伙伴一起去共建、共创、共同到达目的地。
甲子光年:系统集成商做 AI 转型的痛点是什么?
赵丛:首先是成本问题。开发一个 AI 算法大概需要3个月,算法与硬件的适配调优又要耗时 3 个月左右,所以单个 AI 算法的平均交付时间大概 6 个月。预计未来三到五年,市场上AI人才缺口达到1000万。以当前AI 算法工程师的薪水来算,一个算法项目的研发需要 5 到 10 人,加上图像数据的标注成本等,AI转型的成本成了系统集成商不可承受之重。
其次,是AI的供给能力。比如,我们跟地产行业的CIO(首席信息官)交流,大家共同的看法是AI在物业、社区等会有特别特别多的应用场景,仅物业人员日常巡查这类重复的、枯燥的工作,就可以转化为300多个AI需求,但这些需求在市场上找不到合适的解决方案商,要么做不了,要么不愿意做,或者交付周期特别长。
首先,现在的AI应用场景,大家会有非常多的想法与需求,但转化是一个很大的问题。比如,我们跟地产行业的CIO(首席信息官)交流,大家共同的看法是AI在物业、社区等会有特别特别多的应用场景,但是在市场上找不到合适的解决方案商,要么做不了,要么不愿意做,或者交付周期特别长。
最后就是想象力。受限于成本和产能问题,当前中国的人工智能应用到产业中,到底能做什么、不能做什么,大家的理解程度还有很大的偏差。很多人以为“人车非”就是AI的全部能力;还有很多人则不理解,为什么一个小孩儿能干的事情,AI却干不了;这些都还需要共创和启发。
2.谈产品:做人人用得起的AI
甲子光年:AutoML通过AI算法生成AI算法,如何保证这种通过 AI 生成的 AI 是有效的、可靠的、满足需求的呢?
赵丛:AutoML本身是代替AI工程师的重复性劳动,尤其是在模型结构设计、损失函数设计、超参数调节、数据迭代等环节,存在大量重复的、琐碎的工作——在AI行业这通常被称为“炼丹”。
所以AutoML的目标,一方面是要把这些重复性的劳动自动化,让机器释放人力;另一方面是要把整个AI生产的pipeline实现连续的、完整的、端到端的自动化。
这从根本上改变了AI与产业结合的方式。以前为了让AI深入产业,必须要求AI科学家学习多种行业know-how,然而AI科学家是稀缺的,行业know-how是无限的。但基于AutoML这种新的算法生产模式,则是提供AI能力给业务专家,AI能力是标准的,业务专家是丰富的。这不仅让AI能够深入场景,更高效的落地与迭代;还可以加速启发在各行业中的售前咨询、需求定义等工作,解决业务与技术之间的鸿沟问题。
所以共达地做AutoML最有意义的地方在于,让AutoML去“炼丹”,让AI工程师有更多精力去做一些有价值的技术突破与创新。
甲子光年:谷歌与国内的BAT也推出过AutoML,共达地与之相比有哪些差异?
赵丛:今天共达地做的事情,更多是把AutoML技术去做端到端的产品化,也就是围绕AI的工程落地去做突破与创新。所以,我们的着眼点未必是单点的技术理论突破问题,而是围绕复杂的、多个环节的突破与创新。
共达地在产品化和落地方面是比较有优势的,比如当我们完成了AI算法生产全流程的自动化之后,在业务逻辑和交互上也做了改善,算法生产的门槛就大大降低了,以前必须依赖专业AI工程师团队,现在普通的业务人员也能像操作流水线一样生产算法。同步的,算法生产效率也大大提升,以前单个算法的生产周期以月度、以季度为单位,现在以小时、以天为单位。此外我们还广泛适配了市面上近百款主流芯片,这不仅能节省算法和芯片适配的时间成本,还能有效保护算法精度,提升算力利用率,这都是非常具体的、核心的问题。
在技术应用方面,共达地和国内其他厂商的路径也不太一样。如何让行业Know-how与AI技术更好的结合?大概有两种路线,第一种就是让AI技术人员、AI专家学会行业知识,这是过去大家经常实践的路线。
第二种路线是共达地的路线,就是降低AI的使用门槛,让业务专家也具备AI的能力。尤其是对于大量的行业人员来说,如果给他们一个AI工程师才能使用的工具,实际上帮助是不大的,开箱即用的AutoML产品会更有价值。
甲子光年:所以这就是共达地与大厂路线的不同。大厂用AI赋能行业,共达地让行业学会AI。
赵丛:是的。共达地选择让业务专家具备AI生产能力,把业务专家定位为共达地平台的用户,让业务专家也能够用起来,而不仅仅是一个面向工程师使用的产品。因为不管是软件开发商还是系统集成商,AI工程师仍然是稀缺的。如果是做一个面向AI工程师才能用的产品,实际上反而是给行业出难题。
甲子光年:共达地现在的市场接受度如何?
赵丛:共达地的路线在过去并非大家的共识。两年前我们刚起步的时候,是一个新事物,市场并不太理解。在我们实现产品化并商业落地之前,大家更多是听一个新故事。
但随着产业结构的调整,行业水平分工越来越明细,当我们的客户真的学会了使用共达地平台来生产算法的时候,实际上他们是非常认可与buy-in的。另一个外部原因是,AI产业逐渐形成了一个共识,就是AI没有办法像水电煤一样去集中供应,AI要到细分行业中去,在具体的场景中完成生产和迭代。
当业务与AI一旦结合,会源源不断催生新的应用场景。今天我们粗略估计,各行业中关于AI的算法场景需求,可能超过数十万了。
甲子光年:让业务人员具备AI生产能力,对于不懂编程、代码的业务人员来说,共达地是如何降低门槛的?
赵丛:其实最核心的部分就是模型的生产。过去为什么称之为“炼丹”?就是因为生产一个AI有很多环节,而且是黑盒,需要不断地试错,一遍一遍loop,没有明确的方法论。
因此,开发一个算法,就是AI工程师不断地调参、调数据、调算法、调算力的过程。到底调哪一个参数会提升效果,其实是一个玄学。所以,大家一般用“有多少个GPU的hour”来衡量AI工程师的经验。
共达地做的最核心的工作,就是用结构化的方法把AI工程师枯燥的工作自动化。正是因为我们做了算法的自动化,才使得芯片适配的难度降低了一两个数量级,所以今天市场上适配芯片种类最多的算法厂商就是共达地。
甲子光年:适配芯片的能力是客户比较关注的吗?
赵丛:这是AutoML的重要环节之一,有些客户非常关注这一点。我们发现过去大家的脱节的地方在于,算法厂商可能适配不了很多芯片,芯片厂商又缺乏算法场景,很多客户在算法与芯片上是凑不齐的。而现在,一些客户只有在共达地这里才能同时找到彼此适配的算法与芯片,软硬件都能满足。
当然,我们并不售卖芯片,客户找芯片原厂才是效率更高、成本更低的,我们的工作聚焦于做好“算法-芯片”的适配和推荐。
共达地AutoML自动化AI训练平台支持的芯片(部分)
甲子光年:业务人员使用共达地的平台,需要经过专门的培训吗?
赵丛:是的。对于一个业务人员完整掌握算法生产能力,基本上经过我们一个下午的培训就够了,而围绕解决方案做集成,还需要一些时间。比如选择什么样的摄像头,摄像头布置的角度,光线要注意什么,应该选择什么样的计算芯片,这些都是围绕解决方案去定义场景。
所以我们现在和一些合作伙伴,去做一些2天的课程,让业务人员完全具备从使用平台生产算法,到制定集成解决方案的能力。
甲子光年:软件行业有一个词叫低代码,共达地算是 AI 的低代码吗?
赵丛:IT领域大家讲低代码更多的是面向程序员工程师;现在市面上其他厂商的低代码AI平台,使用人员也还是AI工程师。
在AutoML中有一个分级,分成L1到L5五个等级。L1到L3用户的定位主要是AI工程师,主要是帮助AI工程师减少代码开发工作量。
共达地目前在做的是L4到L5的全自动化的算法生产,目的是为了让行业的业务人员、技术小白也能够自主开发AI算法,让算法的生产权限完全放开给产业链当中,从集成商、软件开发商到硬件设备厂商的各个角色,让产业+AI真正实现具备规模化落地的基础。
3.谈落地:算法不可能做成标品,但生产算法的能力可以
甲子光年:共达地的产品主要有两个,一个是训练平台,一个算法商城。这两个是分别怎么服务客户的?
赵丛:算法商城里是我们自己生产的算法,是为了连接和启发更多的合作伙伴,满足大家“低门槛交付”的需求;训练平台是让大家自助式生产自己想要的AI,称之为“低门槛创新”。
算法需求量小、解决短期需求的客户,可以直接从共达地算法商城当中采购算法,或者由共达地来帮助定制新的算法;算法需求量大,有长期AI规划,有软件集成能力和项目交付能力的客户,可以直接订阅使用共达地平台,让自己业务人员轻松上手,能够自助式的按需生产自己的算法。
目前共达地已经和很多行业的集成商、软件开发商、AI公司跑通了平台订阅合作,并且完成了落地应用。
甲子光年:这两种产品的交付模式是怎么样?
赵丛:训练平台类似于SaaS,按年收费。客户用训练平台生产算法,与他自己请AI团队生产算法相比,可以节省了大量的人力成本,效率提升10倍以上。而且找别人买算法,算法的所有权是别人的,自己也积累不下来,但通过训练平台生产的算法是可以积累的。
算法商城的交付,跟大家从市场上定制算法类似,按次或者按路收费,就是授权License的模式。
甲子光年:共达地算法商城有900+的算法模型,覆盖很多行业,我们花了多长时间来打造这样一个商城?生成其中一个模型,一般要花费多久?
赵丛:我们大概花了 5-6 个月的时间积累这些算法。算法按种类区分是900多种,如果要基于真实场景,生成不同业务功能组合的算法,或者运行在不同芯片硬件上的话,可能超过几万个算法场景了。
平均下来的话,一个产品经理生产一个算法,包含沟通需求、协调数据、使用平台生产和迭代,操作平台大概需要花费3 个小时。如果再算上等待训练、部署、迭代的端到端落地时间,大约需要一周。
甲子光年:AI这么多碎片化场景,算法数量成千上万,如何实现标准化交付?
赵丛:过去大家都希望做标品,算法也被认为是标品,但实际上做起来会比较痛苦,因为算法本身就不是一个标品,而是场景、行业Know-how与技术的结合。
从我们的角度来看,任何一个算法也都不会是标品,只不过它的这个复用性程度有所不同。有的算法只能应用在特别窄的应用场景,有些算法能够适用比较多的应用场景。
那什么是标品?生产算法的能力可能是一个标品。比如一个 AI 工程师,可能今天干工业,明天干医疗,后天干社区,在不同的行业里面生产 AI 的能力是跨行业通用的。这就是为什么共达地选择今天做训练平台这件事情,我们希望把训练平台、生产 AI 能力这件事情标准化,也解决 ROI 的问题:过去大家在生产算法上的研发投入支出是远大于算法收入的。
甲子光年:现在行业热议大模型,您如何看待大模型的发展?
赵丛:大模型在语音文本NLP领域,取得了非常突出的成就与进展。但大模型不会解决所有的AI问题,因为AI在深入行业与场景的细枝末节。
共达地所做的AutoML适合解决碎片化的场景下的AI生产问题。在今天AI模型实际上都是千变万化的,在每一个场景、甚至每一个设备上面使用的AI模型都是不同的。未来算法的个数甚至可能会超过人口数,因为每个设备都可能搭载独一无二的AI算法。
从AutoML的角度来看,大模型是一个技术手段,可以使用大模型的一些训练思路或训练技巧,但在解决实际问题时,未必要拥有大模型。大模型和AutoML两者是具有互补性的,有时候侧重点不同,比如在NLP语音文本领域大模型承担的作用更多,在视觉领域的碎片化人工智能,更多需要解决的是AutoML的问题。
END.
微信扫码关注该文公众号作者