Redian新闻
>
飞桨突围背后的中国AI框架长征

飞桨突围背后的中国AI框架长征

财经



2012年12月, 美国内华达州太浩湖旁,知名赌场Harrah 酒店的731 房间,一个由瘦弱老头和两个大学生策划的“皮包公司”的匿名线上拍卖收购现场厮杀正酣。

 

不久前,他们才刚刚成立这家“皮包公司”——名字是现取的,产品是没有的,生产计划为零,创始人之外的员工数量同样是零。不过,他们有一个大胆的计划,要将这家公司高价卖掉,而且还要卖给谷歌、微软在内全球最顶级的科技巨头。

 

1500万美金、1600万美金……2500万美金、3000万美金、3500万美金、4100万美金、4200万美金……

 

拍卖会现场,价格正在一轮轮被抬高,拍卖规则,也从一小时加价100万美金,一度上涨到半小时加价500万美金,直至4400万美金花落谷歌。

 

一个戏剧性的插曲是:最后一轮出价最高的,其实是一个报价4500万美金的中国科技巨头,却无奈老头从小脊柱不好,人在美国,坐不了飞机,而被动遗憾出局。

 

结果一出,各大科技媒体头版头条,立刻以震惊体外加大字刊登“谷歌4400万美金收购仅三名员工的创业公司

 

有人嗤笑谷歌,千金买马骨,向来擅长炒作。

 

却不知,年至花甲的老头,正是日后被誉为“神经网络之父”的Hinton。在他加入谷歌后不久,就在谷歌一个名叫DistBelief项目中小试身手,将原本算法友好度奇差的DistBelief进行一番改造,成为了如今AI领域如雷贯耳的TensorFlow,并一举奠定了其在全球人工智能领域的无冕之王地位。

 

那么问题来了,TensorFlow是什么,为什么具备如此大的魔力?

 

一句话概括,TensorFlow是目前全球最主流的开源深度学习框架之一。而所谓深度学习框架,你可以理解为是一个集合了所有主流AI算法模型,以及他们使用说明的大型软件仓库。有了深度学习框架,工程师们在工作时调试算法,就如同厨师有了预制菜做饭,简单又高效。

 

而在AI框架领域称王,无异于微软在PC时代发明Windows,谷歌在移动时代打造安卓。拥有了TensorFlow,谷歌也就拥有了能号令全天下AI群雄的无上权力与责任。

 

一万公里外的中国,随着TensorFlow的风靡,一场激烈的讨论正同步上演:TensorFlow,我们到底是用还是不用?

 

如果不用,在没有好用框架的情况下,想做好AI,巧妇也难为无米之炊。如果用,过去几十年,中国的科技产业因“缺芯少魂”而被卡脖子的沉痛回忆,难道在AI时代,又要任相似的剧情再次重演?

 


01

AI时代,得框架者得天下

 


得框架者得天下,在AI领域,并不夸张。

 

我们常说,AI将带来人类历史上的第四次工业革命。更进一步,好用普惠的框架,则正是驱动AI普惠,缔造第四次工业革命的根本。

 

纵观第一次和第二次工业革命,其根本是以蒸汽机、电力为标志的生产工具向着工业大生产环节全面渗透,使生产力实现颠覆式、飞跃性发展。本质离不开更成熟的内燃机技术,也离不开已经发展至便宜且普惠的电力技术发展。

 

在AI工业革命中,谁将带动AI走向普惠?在2019年的WAVESUMMIT峰会上,百度CTO王海峰博士就曾前瞻性地提出观点:“深度学习的通用性特点,以及深度学习框架及平台的发展,正在推动人工智能标准化、自动化和模块化,进入工业大生产阶段。”

 

如何理解这句话?举个例子你就明白了:如果有现成的AI框架,那写一个算法,可能从模型开发,到应用部署,几十分钟就能搞定;但如果没有AI框架,那你得先花至少两个月写模型,然后训练调参数一个月,最后还得花一两个月根据具体的场景进行算法部署,时间一晃,小半年就过去了,结果还不一定尽如人意。因此,无论是从效率,还是从结果来看,框架是实现普惠AI,进入工业大生产的基础条件。

 

从国家角度出发,框架也是让中国从AI大国变身AI强国的根本。

 

经历了40余年的基础研究与探索,中国已经成为能与全球顶级水平齐头并进的AI大国。然而,大而不强,却始终是中国AI产业的心头之痛。

 

来自学界的数据也很好地证明了这一点:斯坦福大学发布的《2022年AI指数报告》中提到,2021年,中国AI专利申请量占全球总数的52%,专利申请数量居世界首位。但是,在该报告中,同样指出,在更检验质量的授权专利数量一项,排名全球第一的是美国。

 

那么解决办法在哪里?国家战略已经很清晰的为我们指明了方向:最新的十四五规划中,我们国家特地将深度学习框架和AI芯片作为新一代人工智能的前沿科技发展方向重点关注。中国要从AI大国变身AI强国,AI框架强大,是一切的根本。

 

从更具体一些的产业角度看,我们会发现,好的框架不仅将带动AI产业不断向前发展,同时也是关联产业——国产芯片崛起的必备条件。

 

关于框架与芯片的关联,百度CTO王海峰博士,同样做过一个科普“在智能时代,深度学习框架起到了承上启下的作用,下接芯片,上承各种业务模型、行业应用。”一个好的AI框架,与芯片互相配合,可以最大限度的“榨干”芯片的算力,发挥其最高效用。

 

因此,我们不难发现,PC时代,CPU的普及与Windows的发展紧密相关;移动时代,高通处理器总是与安卓架构升级同步完成;AI时代,框架与AI芯片同样如此:过去十多年中,AI的滚滚向前,GPU产业也随之一日千里的飞跃,而谷歌也同样凭借着TensorFlow带动着其自身的芯片TPU妄图在一统天下。

 

只不过,AI市场之大,一个谷歌吃不下,曾在PC时代、移动时代满眼辛酸的我们,也不会允许中国AI产业的根本,再次被卡脖子。

 


02

从两强瓜分,到PPT格局,为什么框架的竞争还在继续?

 


事实上,早在TensorFlow出现之前,AI框架领域就已经硝烟弥漫。

 

其中最具代表性的是2007年加拿大蒙特利尔大学科学家研发的theano框架;在此之后,又有伯克利大学研发的Caffe框架面世,它们都曾成为红极一时的主流框架。

 

只可惜,theano出现太早太古老,是业内一个犹如远古化石般的存在,也因此随着2012年,深度学习代替传统算法成为AI显学,theano随之成为过去式。

 

caffe出现时间上,倒是恰逢其时,只可惜,相比后来的一众主流框架,caffe是个典型的“高玩产品”。如果你是个AI菜鸟,那么打开caffe,2013年前后,你看到的,是大神们一行又一行精妙绝伦的源代码。可到了2015年前后,ResNet为代表的大型神经网络出现,算法层数已经152层起步,别说想拿开源代码修改,就是看得懂,也得费好一番功夫。

 

因此,当TensorFlow带着计算图与可视化理念,通过在业界疯狂营销培养生态杀入AI框架后,很快就凭借着低门槛特性赢得了一众业内同仁的高度认可。国内不少有识之士却也在此时不免默默扼腕,TensorFlow开源框架的出现,是产业之幸,但对于中国来说,国外框架的垄断,无异于在AI领域,重新上演中国PC时代的操作系统之殇。

 

不过,就在谷歌左拥AI芯片届元老TPU芯片,右抱全球最大AI框架TensorFlow开源框架,志得意满地以为以为天下AI开发者尽归我有之时,却未曾想到,对手早已杀至家门前。

 

复盘前面的历史,我们不难发现,世界范围内,AI框架都是在沿着低门槛,以及生态路线不断发展迭代,要想打破TensorFlow的一统神话,秘诀同样如此。

 

尽管有大神压阵,TensorFlow也并非没有缺点。比如,诞生伊始,TensorFlow就将场景瞄准了工业领域,极度追求框架中算法在实际使用中的高效,代价则是灵活性的损失。就像一把好用的玄铁菜刀,无法像一把瑞士军刀一样还可以当牙签剔牙。而偏偏,AI的另一大应用场景——学界,探索的正是“刀具的108种”使用方法,需要算法实现更灵活,以方便算法研发过程中,不断的调整修改与调优。

 

我们都知道,一项技术的发展,一定是从理论,到技术,再到实际应用,而对应的人群,则是科学家、高校教授与学生,再到业界工程师。因为TensorFlow对学界的忽视,框架领域的又一次战争再次被埋下伏笔。

 

谷歌的第一个竞争对手,是2017年正式开源的AI框架PyTorch,通过与本就具备相当用户规模的caffe2合并,PyTorch诞生伊始,就凭借其巨大的灵活性优势受到了学界的广泛欢迎。更值得一提的是,它的背后站着的是Meta,也就是Facebook,因此,无论是做技术,还是花钱搞生态,Meta的实力都不弱于谷歌。

 

另一个对手,则来自中国。还记得那个因为Hinton老教授坐不了飞机,而在拍卖中遗憾出局的中国巨头吗?当年无奈错失Hinton老教授,并没有影响到这家巨头开发自主AI框架的决心。广泛招纳全球AI人才的同时,这家企业早在2012年已经在内部立项,开始了AI框架的自研工作,并在2016年放出大招,带来了第一个国产AI框架的正式面世。

 

看到这里,不少了解AI的朋友肯定已经猜到,这个巨头就是国内的AI龙头百度;而这个第一个国产AI框架,则正是已经比肩TensorFlow、PyTorch,成为全球前三、中国第一大AI框架的飞桨(英文名PaddlePaddle)。

 

不过与TensorFlow过于注重工业,PyTorch专注学界不同,飞桨的特性在于工业学界两手抓,通过动态图自动解析编译静态图的技术,兼顾了学界的灵活,同时也实现了产业界希望的高效。

 

当然,能够同时俘获学界与产业界认可,飞桨所依靠的,绝不仅仅是动态图自动解析编译静态这一个技术突破就能实现的。AI框架的两大宝典,无论是生态建设,还是在低门槛适用,百度无疑都走在前面。

 

先说生态。众所周知,一个好的AI框架与操作系统一样,离不开广大开发者的参与。

 

尽管AI的落地场景,无非计算机视觉、语音语义、搜索推荐等等,但具体到应用,究竟是用在超算中心,还是用在儿童手表;是安全要求极高的金融,还是效率为王的工厂,需要针对具体情况,对算法进行专门的定制。而面对数不胜数的长尾场景,哪怕强如谷歌、百度,也无法以一己之力全覆盖;这时候,开发者生态的重要性就体现出来了。

 

国内的AI框架界,一度流传着这样一个八卦:2018年前后,飞桨发展最迅猛的一段时间里,为了维护国内开发者生态,飞桨团队众多工程师常常深入开发者社区,潜入开发者QQ群中,一层层爬楼参与讨论,收集一众开发者对飞桨的吐槽,然后再第一时间悄悄加班解决。

 

除了线上第一时间回应开发者诉求,在线下,针对学界,飞桨已经开展了全国四千位多高校教师的AI培训;针对业界,飞桨则结合实际需求,在全国多地建设“百度飞桨人工智能产业赋能中心”,通过整合百度的AI技术、AI解决方案以及百度的生态资源,对开发者以及企业客户进行线下展示,增加开发者对飞桨的了解。
 
 

更重要的是,相较TensorFlow与PyTorch,飞桨无疑更懂中国开发者的实际需求。举个简单的小例子,2020年疫情最严重的时候,国内一众AI开发者,都因为疫情而被关在了家里,但飞桨的线上直播课却一直没停,反而通过密集的线上的开发者培训,不仅极大加速了飞桨在国内开发者中的普及,甚至还有开发者们在家基于飞桨,做出了戴口罩人脸识别、肺炎CT影像分析等助力抗疫的AI模型和应用。

 

当然,仅仅凭借更懂国内开发者,并不足以让飞桨真正成为一个世界范围内的主流AI框架,低门槛,是飞桨能够迈出中国,在世界舞台上与TensorFlow,与PyTorch一较高下的根本秘诀。

 

关于低门槛。TensorFlow与PyTorch,尽管相较前一代caffe,已经有了很大改进,但依旧需要使用者至少看得懂算法,也具备一定的编程基础才能使用。而飞桨,则通过推出Easy DL,让普通人在即使没有任何AI基础的情况下,也能在5分钟时间内,上传标注好的数据,来训练出诸如简单的图片识别、动作识别等基础的算法。

 

至此,全球范围内,AI框架的PPT格局初显。凭借着飞桨(PaddlePaddle)在学界、业界齐发,技术、生态共建,以及低门槛、对中国开发者的极大友好,曾一度在操作系统时代落后的中国,这一次,终于在AI框架上,扳回了一城。

 


03
中国的AI框架,走到了哪一步?
 


从无到有只是国产AI框架走完的第一步;从有到强,才是国产AI框架的真正使命。那么,多年发展,飞桨如今走到了哪一步?

 

我们先看看来自第三方机构的统计结果:2021,知名市场调研机构IDC曾公布了一份中国深度学习框架平台市场份额的报告,在中国深度学习领域,百度综合市场份额已经成为为中国第一。前不久,国际市场调研机构弗若斯特沙利文发布的《中国深度学习软件框架市场研究报告(2021)》分析了影响中国深度学习软件框架市场的三大关键要素——产品能力、生态能力、应用能力后,也显示,百度飞桨竞争力综合排名第一,其次是Meta的PyTorch和谷歌的TensorFlow。
 
 
除了第三方的排名之外,刚刚落下帷幕的WAVE SUMMIT峰会,或许也是我们观察的最佳细节切入点。
 

百度CTO、深度学习技术及应用国家工程研究中心主任王海峰博士

 

在技术与产业侧,飞桨仍在不断突围,让AI越来越普惠好用。

 

大模型就是其中最典型的代表。在过去,人们对于大模型大多只闻其名,鲜少在产业中真正应用。而在WAVE SUMMIT峰会上,百度则宣布,百度文心大模型依托飞桨,已经有了实质性的行业进展——会上,百度与国家电网、浦发这两大能源、金融领域的产业龙头联手,发布了两个行业大模型。

 

从空中楼阁,到解决实际问题,在百度看来,大模型落地难的根本问题不在于技术本身,而在于能否做到“更懂产业”,与真正的场景之间有效匹配。

 

具体来说,百度文心给出的解题思路,可以总结为三个关键词:模型、平台、生态。


百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜

 

拆解来看,模型,可以分为基础大模型、任务大模型、行业大模型。尤其值得一提的是,飞桨以文心大架构为能力基础,通过与最懂产业的行业头部伙伴一起构建的行业大模型,是更高效、精准地解决产业的问题的有效路径。

 

平台,指的是一个配套工具平台,可以基于产业应用全流程需求,全方位降低AI使用门槛。

 

生态不必多解释,通过让更多人零距离接触到先进的AI大模型技术,激发更多落地的创新与创意。
 
 
不过,全球知名的AI大模型这么多,为什么只有文心最先做到了产业化应用?
 
“更懂产业”,其实是飞桨赋予文心大模型的先天优势。
 
过往,飞桨已经把各种深度学习技术输送到制造、城市、能源、金融、媒体等各行各业,并催生了AI训练师、5G云代驾、智能办公等新业态、新模式。
 

因此,当大模型要落地产业时,飞桨除了能与其共享工具、平台、生态,还能将多年AI落地经验、行业KNOW HOW,以及飞桨的生态伙伴,都毫无保留地分享。

 

除了是文心大模型最可靠的底层支持外,飞桨本身在产业侧,也仍在不断进化。

 

技术方面,飞桨框架已经进化到v2.3版,已经完成了开发、训练、推理部署的全面升级,并极大提升深度定制开发和自动化能力。

 

面向场景,还发布训练推理一体的导航图、产业模型选型工具、PaddleScience赛桨与飞桨移动工作站,来帮助开发者做好选型与开发,不仅给出最好的工具,也同时给出一个直接参考路径,让AI不仅可用,还更低门槛的好用。

 

当然,飞桨的合作伙伴不仅仅是企业,很多高校、研究机构也都选择了飞桨。在近年关注度不断“破圈”的AI for Science领域,飞桨提供了从算力、到框架、再到工具组件的一整套能力,用AI赋能基础科学研究,并与开发者协同,在诸如流体力学、分子生物学等科学问题的数字化仿真上取得了相当成果。
 
在生态侧,飞桨的生态之树更是稳扎稳打,全面绽放,让AI越来越普惠。
 
 
截至2022年5月,飞桨已经凝聚477万开发者,创造56万个AI模型,服务18万企事业单位,与产学研用协同培养超过200万AI人才。

 

尤其是在芯片领域,飞桨的生态之树尤为枝繁叶茂。自2016年飞桨开源以来,百度就紧密地与国内外芯片企业,如英特尔、英伟达、ARM、华为、寒武纪、瑞芯微等厂商开展软硬一体的芯片联合优化模式。截至2021年底,已有超过20个厂家、30种以上的芯片适配飞桨。
 
 
在WAVESUMMIT峰会上,百度还基于飞桨大航海计划2.0,发布三大共创计划:飞桨产业实践范例库共创计划、飞桨AI for Science共创计划与飞桨硬件生态共创计划,与产业、开发者共建中国最强大的AI开发者生态。

 

技术、场景、生态三大领域同步大步迈进的背后,是以百度飞桨为首的中国自主AI框架,奋力夯实工业大生产底座,让AI加速落地,普惠全行业,一同向上突围的坚定决心。

 


04

尾声:从造芯补魂,到AI普惠,国产AI框架的使命与未来



AI框架的意义是什么?

 

从一个国家角度来看,无异于是AI时代的造芯补魂,让我们从AI大国变身AI强国。而从一个时代来看,飞桨这样的平台存在,是全人类进入AI工业革命,AI成为通用普惠技术的根本。

 

然而,这些命题,对于普通人来说,或许过于遥远。作为一个在上海疫情中被隔离的普通人,我会常常反思,我们的AI技术、AI产业真的成熟吗?

 

如果自动驾驶再普及一点,六七十岁的楼长阿姨,是不是就可以不必在没有电梯的老小区中跑上跑下,配送抗原、蔬菜?

 

如果人脸识别应用再广泛一点,是不是热心的志愿者们,就不必穿着厚重的防护服,与前来做核酸的人近距离接触?

 

如果语音技术的门槛再低一点,是不是基层居委就不必因为担心通知不到位,而一家家一户户电话通知最新抗疫安排而忙碌到凌晨无法入眠?

 

……

 

背后一切的一切,其实并不需要技术领先全球,它的距离仅仅是,通过AI框架,让人人都能成为开发者,让AI的门槛更低,让普通人能够零门槛,普惠的使用AI,让AI参与到整个社会的变革。



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一年融资金额超3亿,单品月销超70W杯,霸王茶姬如何以茶拿铁大单品差异化竞争,突围茶饮红海?看来拜登也怕普京玩命,问题是普京未必真的敢玩命缺芯潮下,国产车规MCU突围战 | 甲子光年业绩增速承压?有CXO企业给出了突围之路关于上海长征福利院,我一直以为只有在小说里才会发生《武汉柠檬茶突围赛》,无资本决战柠檬之巅中国新药临床试验:轰轰烈烈背后的 “巨婴” 业务刚刚!中国第三艘航母“福建舰”下水,背后的意义极度深远以“艺术”为先锋,中国女鞋品牌突围之道在线直播:儿童医院里的中国 | 纪录片《大象出没的地方》背后平局 | 中国超大单购入空客飞机背后的利弊、权衡、博弈和隐忧~镜头背后的「中国视觉」翻台率最高超6,费大厨辣椒炒肉如何从本地突围成为全国湘菜头部品牌从智能安防到全场景!大华乐橙的智能家居“突围战”!习近平引爆第三次世界大战?大国制造系列之中国光伏的东南亚突围苹果将下架长期未更新APP,引开发者不满,不允许游戏研发完么?“远征军后裔”回不了中国?谣言背后的真相是什么中国气候异常背后的底层地理逻辑,究竟是什么?拜登访韩直奔三星,半导体风云突变?中国会如何突围?WiFi 6芯片赛道突围战,本土厂商再下一城特斯拉在上海扩产背后:被马斯克点赞的中国工人落后的中国文化产业,该走向何方?洋河:中国高端白酒突围之路新冠“⻓征”:上海式“动态清零”与新加坡式“渐进共存”又长学问了空中惊魂-----兼谈我与音乐大师温可铮的两次奇遇中国货币研究扛鼎之作,读懂钱币背后的经济和金融咬牙走,不能停——我们一家三代人的长征,与诸君共勉美联储“暴力”加息,中国市场如何突围?芯片厂商突围异构计算我们在圣.帕特里克节绿河畔留下倩影被击穿的新长征福利院中国芯片,如何靠RISC-V突围?A股独立行情背后的中美经济错位
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。