当一位AI老兵决定“all in”大模型
来源: 甲子光年
文章已获授权
比上一轮AI浪潮更强劲的“推背感”。
“你觉得,你比我更懂战略方向?”2018年底的年会上,A科技公司的CEO对着眼前年轻人问道。
“我没有这样认为,但安防领域凛冬将至,我们应该收缩业务,继续全面投入只会满盘皆输,我不能眼睁睁地看着公司往火坑里跳!”
说这句话的年轻人叫蒋俊,现在是蚂蚁云科技集团的CEO。
而后在2019年,安防设备的价格果然发生了崩塌。一切正如蒋俊所推算的那般,原本每路摄像头软件授权价格一万元的产品,降到了几百甚至几十元。千亿的市场规模也迅速坍缩成了十几亿、几亿元,整个AI行业也因此被拖入寒冬低谷。当时的“AI四小龙”,亏损多则数百亿元,少则数十亿元。
时过境迁,褪去锋芒的蒋俊每次回想起这一幕,都痛心不已。
四年后的今天,上海迎来断崖式降温。与寒冷天气形成鲜明对比的,是上海火热、浓厚的人工智能氛围。尤其在作为上海创新中心重要承载的徐汇滨江板块,汇集了上海人工智能实验室、期智研究院等标杆性新型研发机构,每万人高价值发明专利拥有量达72.2件。
蚂蚁云科技集团的AI大模型研究院及运营中心,就设立在徐汇滨江。
蚂蚁云科技集团是一家专注AI大模型研发、上下游应用开发及产业生态拓展的人工智能公司。2023年12月18日,蒋俊他们迎来了乔迁之喜。从一个人重新开始组建团队,到此刻办公室内座无虚席,蒋俊心中感概万千:“一切终于又回到了起点。”
一路走来,有巅峰、有低谷。如今,蒋俊又一次站在大模型的起跑线上。他坚信:坚持做困难且正确的事一定没错。
1.未雨绸缪的“AI老兵”
作为一名AI行业老兵,今年已是蒋俊深耕其中的第10年。他始终坚持着一条行事原则,就是第一性原理:回溯事物本质,重新思考该怎么做。
蒋俊亲身参与了第一阶段的AI浪潮,其中感觉用一句话概括:眼看他起高楼,眼看他宴宾客,眼看他楼塌了。
而在这一波浪潮中,蒋俊坚持以第一性原理做决策而非感性和通识,很多事情的选择在当时都不被人理解。
2012年,他放弃华为销售总监跑去做华为销售管理部的文员;2016年,放弃上市公司管理70人的事业部总经理职位,去到几十人的小公司从零组建事业部;2018年,在AI如日中天发展时,对身处“AI四小龙”位置公司的老板,提出“公司业务全面收缩”的建议;而在2020年的“AI低谷”时,又提出“50亿AI计划”以突破当前壁垒。
和AI结缘要从2013年蒋俊在苏州的一家安防公司负责公安监控业务算起。
当时,公司虽在安防业内排名第四,可日子并不好过。压力主要来自安防大户海康和大华。他们的硬件价格低廉,销售团队庞大且知名度高。
蒋俊认为,从核心技术来看,安防业务可分为三个阶段:
第一阶段的核心是硬件摄像头。这一阶段最鲜明的痛点是,用户需要在数百个摄像头中下载数千小时的视频,对视频内容进行人工识别。例如在排查可疑人员时,多位民警需要花费大量时间精力及人力,对视频进行“地毯式”排查。
第二阶段的核心是图像应用软件。通过安防图像软件、地图GIS系统和摄像头位置的接力追踪,警方可在数小时内抓到犯罪分子。与第一阶段相比实现了重大突破。
第三阶段的核心则是人工智能。利用AI进行图像搜索,用户只需几分钟甚至几秒钟,就能找到小偷的身份和去向。
当时,蒋俊深知公司在第一阶段落后于海康、大华等。因此他向上层提议,在第二阶段时争创第一,建立公司的“优势护城河”。
于是在2014年至2015年间,蒋俊策划以华为集团军为作战方式,以应用安防图像软件为宣传和销售重点,三个月公安巡展180场,迅速做到国内公安图侦软件第一。
未雨绸缪的行动为蒋俊他们带来了丰厚的销售利润。但应用软件的竞争优势通常只有一年,为巩固第一并通过软件销售推动硬件销售赶超海康大华,在2016年准备更大规模的销售计划时,一件黑天鹅事件打断了蒋俊的计划。
2016年初,A科技公司创始人奔赴苏州,给在安防领域深耕十多年的蒋俊带去了一份检测报告。报告显示,在广州一次人脸识别比赛中,从860万市民中随机筛选出4600张人脸,A科技公司准确识别出其中2100多人,首位命中率达47%,而过去此类比赛的最佳记录仅为5.9%。
“十年未有进展的AI图像识别技术有了数量级的提升。”蒋俊敏锐地捕捉到“行业即将洗牌”的趋势。
在他看来,安防应用系统将基于AI重构,安防领域进入AI阶段势不可挡。公司刚刚形成的第二阶段的护城河因为AI的发展会迅速消失。
所以,蒋俊当即向公司紧急提出收购AI公司的建议。但被坚持自主研发的老板驳回了。
不想错过时代机遇的他,果断辞去待遇优厚的工作,决定加入当时还不到百人的A科技公司,担任安防事业部总经理,从零开始组建安防团队。
蒋俊按照第一性原理分析,AI在安防行业的主要作用是以图搜图。其关键在于,通过比对源图片和比对库图片进行准确度匹配,源图片的清晰度和比对库的大小对系统准确率有着决定性的影响。因此,提高源质量并控制比对库大小是提高AI系统准确率的关键。只有在实现30%至40%以上的识别准确率后,才能成为公安机关实战业务的可用系统。
基于这个理念,蒋俊重新设计了AI安防软件,并在2017年初推出了“火眼”系统。利用“人工智能+大数据技术”,可实时掌握目标人物行踪,预判目标人物时空范围等,拓展了人脸应用的广度与深度。全面提高了公安机关事件精准处置、精准打击犯罪的能力,实现案件快速处置、侦破的目标。
2016年被普遍认为是AI元年。
人工智能在喧嚣和质疑中一路走来,在那一年终于迎来深度学习的关键性突破。最被人熟知的例子是,Deep Mind公司的AlphaGo在围棋比赛中以3:0的傲人成绩击败被称为“人类最后希望”的中国棋手柯洁。
而到2017年的中国国际公共安全博览会上,已有数百家安防公司投入到开发AI系统的大军中,其中几十家同时标榜“自研的AI算法最好”。所有的媒体都在大谈AI,资本也在疯狂倾注AI。
在这场AI算法的“军备竞赛”中,几十家AI厂商在数百上千次的POC测试中展开角逐,算法以每月20%、30%的提升速度演进。最终,鏖战出四位算法集大成者——“AI四小龙”。
蒋俊跳槽到的A科技公司正是“AI四小龙”之一。
当时,该公司规模从几十人迅速扩张到上千人。而蒋俊所负责的部门业绩每年以大约600%的速度增长。
一切都看起来是那么美好!
以传统安防产品生命周期的节奏衡量,此时正是全力扩大市场份额、争取成为市场地位的重要关头。
2018年,互联网乃至整个中国产业都进入“下半场”,人工智能如何发展、如何在各个行业落地,以及它对人们的生活和工作产生怎样的影响,已然成为业内关注的重点。
就在行业进入疯狂冲刺时,蒋俊却重新对安防市场后续的发展进行了思考。在火热的表象背后,他捕捉到了丝丝“寒意”。
当时,安防行业的技术、数据都已经陷入瓶颈期。A科技公司和同行们都有数十亿的资本支持,大家不计成本、不惜“自残”地苦战价格沙场。蒋俊认为,如此趋势产品价格会一路下跌,直到彻底崩盘为止。
对此,他提出了“高筑墙、缓称王和连纵横”策略。
蒋俊认为,首先应该放弃对“安防一哥”的执念。开源节流,精耕细作,将业务收缩到数个公安大客户、省厅客户的节点上;其次改变自己认知的角色,从与客户直接签单转变成为集成商提供“弹药”;此外,融合公司内部各个行业,如安防、金融、交通和商业等领域,以“智慧城市”、“城市大脑”为目标。
然而,这个策略与CEO的规划方向完全背道而驰。CEO希望继续全面进军安防行业,争取市场占有率第一。
激烈的意见冲突不可避免。最终,蒋俊在2019选择退出A科技公司。而结果也如本文开头所描述的一般,“凛冬”摧垮了不可一世的安防市场,也催垮了资本对AI商业化的信心。
“当时许多投资机构认为这群‘搞AI’的人就是在吹牛骗钱。”蒋俊对「甲子光年」无奈地说道。
2.“疯狂”的深度学习信徒
对于深度学习,蒋俊形容自己是它的信徒。他对人工智能的情怀远大于其他追求。
离开A科技公司之后,2020年,蒋俊加入阿里巴巴担任视频和AI行业负责人,希望背靠阿里巴巴的势能做出真正改变AI行业现状的事业。
在蒋俊看来,当时AI技术的发展速度已经开始放缓,甚至陷入停滞。
“从AI三要素的角度看,我们能获取的训练数据已达上限。如何再获得更多的数据?其次,在行业市场崩塌和资本寒冬的情况下,企业不可能花费巨量资金购买算力,或者重新构建比以前复杂数倍的模型。”蒋俊解释道,“想要突破这一难题,就需要量增算力、数据和算法规模更多的资源。在2018、2019年,当‘AI四小龙’动用数亿的AI研发资金,AI算法的进步却停滞变缓时,就需要1个甚至2个数量级才能突破,这至少需要数十亿的投资。”
由此,蒋俊提出了“AI城市”的计划。他独立设计了50亿人民币的AI大模型平台,规划全城市级海量的数据采集训练池和算力,主导阿里达摩院联合五十余家AI公司一起推进中国AI大模型的突破。
他希望在政府和产业资本的合力推动下,让城市中的AI数字化从5%提升到70至80%。他计划通过至少十年的“强制性”推动,让AI数字化覆盖整个城市,整合的到视频、音频和文本感知神经元中。
同时,政府将开放智慧城市中的行业应用,并邀请数十家AI公司基于数据来开发AI算法训练和行业应用。
蒋俊清楚,项目越大,牵涉的环节越多,失败的风险就会数级增长。但为了实现突破,这样的资源和规模是不可或缺的。
最初,蒋俊拜访了许多城市,受访人都觉得他在描述一个“天方夜谭”,甚至某位区长在听完蒋俊的设想后,直言不讳地向推荐人表达:“他是疯了吧!”
但功夫不负有心人,最终某市的领导班子在反复探讨、研究后,同意他们在当地开展这一计划。
只是在2020年11月底,由于阿里巴巴某些不可抗的因素,他们无法与政府合作完成超级项目,蒋俊也黯然离场。
直到今年,所有人都看到,OpenAI历时三年,投入数十亿美元将模型参数从一亿参数逐步升级到千亿级的超级大模型,并最终实现了AI行业的突破。
时间可以证明,当时蒋俊的疯狂是正确的。他心中充满遗憾,三年前这一超前计划,哪怕知道机会渺茫,他也像孤身冲向风车的唐吉柯德,无所畏惧地追求着自己的信仰。
正如蒋俊在阿里巴巴的花名——锐武,锐意十足的武将。他一直以“AI老兵”自称,问及原因,蒋俊解释道:“虽然我叫将军(蒋俊),但近十年一直在做从零到一、开拓创新的工作。这让我必须身先士卒,带领大家在一线一起向前冲。”
3.All in AI:重启征途
离开阿里巴巴后,蒋俊蛰伏了三年,他也终于在今年9月重启征途,加入了蚂蚁云科技。
10年AI行业的浮沉,让蒋俊有把握在这次AI大潮中,站在更高的维度指挥更精彩的战役。从只关心业务本身,到需要考虑政府的方向、联合业务伙伴的力量等,蒋俊肩上的责任也越发重大。他明白,自己必须担起“将军”的重任统揽全局。
今年7月,蒋俊与蚂蚁云科技集团董事长冯乔羽相遇。
短短一个月内,双方合作的两个订单就高达一亿人民币。合作的顺利让冯乔羽格外看好蒋俊,两人对大模型相关的看法也格外统一,他力邀蒋俊加入蚂蚁云科技:“我会全力支持你对大模型事业的计划。”
蒋俊自己也认为,是时候重新开始“All in AI”了。三年前未曾完成的“蓝图”或许可以重新开启。
与其他大多业内玩家“1+N”模式(1个基础大模型+N个垂直领域小模型)不同的是,蚂蚁云科技上海AI大模型研究院主要基于市面上的开源大模型开发,以业务需求为向导,通过创新和研发,为各行各业提供专业的行业大模型,而对基础大模型的开发只是使用开源或对接已有大模型。
“不是不做,时候未到。”蒋俊认为,现在入局大模型赛道虽然起步慢了,但“弯道超车”大有可为。
OpenAI花了三年时间开发了ChatGPT,而国内许多玩家在2023年才开始布局。他推算,或许在2024年,我们才会有大规模的算力需求。
“我对一些公司声称自主完成万亿模型的说法表示怀疑。在未来2~3年间,国内大模型领域的格局将分化清晰,在那时我们再考虑挖掘通用大模型人才和进行更深层次的开发。依照我的判断,3~4年后,通用大模型大概率会发生和2019年视觉AI一样的价格大崩溃。”蒋俊对「甲子光年」说,“所以我们要做大模型淘金浪潮的配套服务提供商,就像卖牛仔裤、卖铲子和做金饰品加工的商家一样。”
蒋俊认为,目前更为重要的是建立数据训练和标注平台,将各行业数据切割成可用于AI训练的形式,并与自身的算力平台结合。在为其他AI公司提供服务的同时,“反哺”蚂蚁云科技的行业大模型。
在他的规划下,蚂蚁云科技集团的核心业务可以简要概括为“一个平台和两个中心”。平台是指承接建设和运营的AI算力平台项目,而两个中心包括数据标注中心和模型开发中心。
蚂蚁云科技的核心业务架构,来源:受访者
AI算力平台由蚂蚁云科技负责搭建和运维。不同于传统的算力中心的构建者,蚂蚁云科技的核心在于帮助地方政府引入大量AI大模型生态,同时承诺AI生态落地企业营收,并对业绩进行对赌。
数据标注中心构建在地方政府的算力中心之上,成为蚂蚁云科技牵引生态大模型公司进入的核心抓手。它不仅为众多标注外包公司提供辅助标注工具和资源人力管理,降低成本并提高效率,同时也为大型模型企业和垂直行业模型企业提供数据收集和标注服务。
“一平台两中心”的建立会为蚂蚁云科技的模型开发中心提供强劲的后备动力。
模型开发中心致力于开发基于开源的通用大模型和行业特定的垂直大模型。除上海AI大模型研究院外,蚂蚁云科技还成立了杭州数字人研究院等。目前,其AI Agent的重要组件已经开发完成。
蒋俊认为,教育、民政等行业是最有可能诞生颠覆性应用的,因此蚂蚁云科技会对上述领域进行独立的AI大模型、应用等开发。对其他行业会的业务铺展将与业内头部玩家共同完成。当前,蚂蚁云科技已和十多家行业龙头诸如第四范式、达闼、算能、浪潮、环球数科、天创等签署战略合作,将行业大模型全力做深做透。
业务进展的迅猛超出蒋俊的设想。用他自己的感受就是:有着比上一轮AI浪潮更强劲的“推背感”。
在搬迁仪式上,蒋俊望着团队有些激动地讲道:“随着团队的发展和业务的扩展,仅一个月的时间原来的办公场地已经无法满足需求,因此决定马上搬至更大的办公场地。但我们的AI大模型研究院注定要‘孟母三迁’了,3个月左右,我们的大模型研究院将突破百人团队,届时将明确总部所在地,并将再次搬迁至一个能容纳300—500人的办公场地。”
2024年,蒋俊计划在长三角、大湾区等地寻找合适区域,陆续成立集团的AI行业全资子公司、和以AI算力建设为核心业务的运营全资子公司,以及和一两家上市公司联合成立的合资行业大模型公司。并将集团IPO上市总部搬迁至新地址,西安将继续作为集团配套业务中心。
(封面图来源:蚂蚁云科技集团)
微信扫码关注该文公众号作者