“未来主义者”李彦宏和他的AI少林寺
鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI
在《时代》首次发布的全球百大AI人物中,百度CEO李彦宏获得的评价是:中国最杰出的未来主义者。
这种“最杰出”,指的当然是他本人,但多少也有点他本人正在领导的组织。毕竟还是在这份榜单中,还有吴恩达、Anthropic的联合创始人兼CEO Dario Amodei等AI大牛,而李彦宏,是他们共同的前老板。
被国人熟悉的吴恩达老师以“电脑识猫”打响名气,但后来被更多人所知,核心还是被百度挖来担任了首席科学家。而不那么为人所知的,Anthropic的联合创始人兼CEO Dario Amodei——当前OpenAI最受关注的创业竞争对手,博士毕业后在工业界的第一站,也是百度。
实际上,即便不是因为这份榜单,一直以来谈论“AI人才”话题,百度也是绕不开的关键词。
根据信通院最新《中国人工智能产业创新人才竞争力报告(2023)》,百度在“AI产业创新人才”中以85.5分位列第一,并且在预训练大模型、深度学习、自然语言处理等7大领域均排名第一。
(该报告评价人才团队的主要指标,是“成果规模”和“创新能力”,以全球公开专利数据库数据为依据。)
而且这种局面,10年前就已经种下种子,也与掌舵者的出身和技术视野息息相关。
“最前沿的技术浪潮是等不来的”
在中国的“大厂”创始人中,李彦宏称得上是技术背景最亮眼的一位。
他在1996年提出的“超链分析”技术,率先使用超链接实现了搜索质量的提升。在当时,可以说他本人是作为工程师,亲身走在搜索引擎技术最前沿的。
百度成立的起源,其实也可以看作是李彦宏这项发明专利的成果转化。
而在今天看来,搜索和人工智能的关系已经不需要再做太多的说明——
从Bert到智能涌现的大模型,搜索都是人工智能技术最早的试验田。搜索本质要解决的问题也是人工智能要解决的问题:让机器真正理解人的意图,并做出相应的回应。
2012年,李彦宏与高管讨论了深度学习技术对搜索的改进之后,立刻给全百度产品经理写了一封邮件,鼓励他们了解AI技术的最新趋势。
这或许也就是为什么,当李彦宏在2012年第一次听说Geoffrey Hinton的深度学习研究成果,就下定决定要“竞拍”Hinton——
在谷歌之前,百度就已率先向他抛出橄榄枝。后来Hinton拍卖他与两位学生——如今的OpenAI首席科学家Ilya Sutskever和命名AlexNet的Alex Krizhevsk共同成立的公司时,百度更是和谷歌较量到了最后一刻,一路把竞拍价抬到了4400万美元。
对于李彦宏来说,如此狂热地追逐Hinton,本质上还是出于一种技术信仰。尽管在当时,深度学习才刚刚从学术界的冷板凳上站起身,但李彦宏已经敏锐地察觉到,人工智能技术已经成熟到可以解决搜索问题,并且就像他后来所说,“最前沿的技术浪潮是等不来的,我们必须提前10年、20年去投入和布局”。
Hinton最终因为个人原因选择了谷歌,但李彦宏投资AI的决心反而因此更加坚定。次年1月,在百度年会上,李彦宏宣布深度学习研究院(IDL)成立,并亲自出任院长。
在此之前,全球范围内没有哪一家企业研究院以“深度学习”来命名自己的研究院,这体现的是对于技术的稳准狠洞察。
以及也能解释:为什么百度在AI研发上,有着堪称基建型的投入力度。
十年饮冰,难凉热血
百度在过去10年中对AI的投入,有目共睹:
研发投入常年占到核心收入的20%左右,近10年累计研发投入超过1462亿元;4万员工当中,有六成都是研发工程师……
但现实的挑战也始终存在:以十年二十年为单位来计量的技术投入,很难在短期内看到商业回报。
一方面,“深度学习不够sexy”,诸如此类的说法在大众传播领域不绝于耳。另一方面,即使是在AlphaGo掀起的上一波AI热潮之后,企业界的AI Lab也时不时陷入因投入产出不均衡而动荡的传闻。
但李彦宏不为所动,他像是中国的AI教父,在无数场合,亲身上阵担当起AI“布道师”。
有统计显示,整个2016年,李彦宏在公开场合提到“人工智能/AI” 500多次。
而在2017-2019这个AI热度趋冷的时期,李彦宏的40次公开演讲里,仍然次次涉及AI。
作为全国政协委员,李彦宏更是在连续8年的“两会”中,提出了13份AI相关提案。
2021年,百度回港二次上市时,李彦宏曾发出一封股东信。
信中直接表露了他的心迹:
每当百度徘徊在十字路口,我都会问自己,什么能够让你真正致胜未来?我认为就是两方面:一是你信仰什么,What do you really believe in;一是你有多大的决心,your determination。从过去到现在,我们的信仰没有变,我们相信技术可以改变世界。
我们也有决心,有耐心。我们熬得过万丈孤独,藏得下星辰大海。
机会总是留给有所准备的人。
就在大模型卷起的新一轮风暴中,百度十年饮冰积攒下的成果,终于开始显露锋芒。
在大模型关键的算力、框架、模型、应用四层架构里,百度独树一帜做到了四层架构均有自研技术布局。
芯片层,早在2011年,百度内部就启动了FPGA AI加速器的研发。
2017年,昆仑芯XPU架构发布,次年,百度正式启动昆仑芯AI芯片产品研发。
到了2020年,昆仑芯1代系列产品实现大规模部署。而在昆仑芯科技完成独立融资之后,2021年,昆仑芯2代系列产品成功量产。
2022年,昆仑芯2代系列产品已启动互联网及各行业客户交付。
框架层,百度飞桨是国内最早对外开源的深度学习框架——2016年就已发布在GitHub上。
多项市场调研报告显示,飞桨和TensorFlow、PyTorch同为国内最高频使用的开源框架。信通院《深度学习平台发展报告(2022年)》还显示,在应用规模方面,飞桨超越TensorFlow和PyTorch,成为中国市场第一。
模型层,文心一言并非凭空而来。
文心一言脱胎于百度ERNIE系列知识增强千亿大模型,以及百度大规模开放域对话模型PLATO。
而ERNIE 1.0在2019年就已发布,是中国最早推出的大模型。
……
以上,都起于万丈孤独之时,外界亦不乏唱衰之声。但正是百度内部的坚持,使得在过去看来难以开花结果的技术,在今天成为百度参与新时代竞争的基石。
甚至技术成果本身,还不是最重要的。更重要的,还有产品落地背后的人。
AI人才的虹吸效应
自AI浪潮汹涌以来,江湖上一次次谈论的话题是:AI大牛为什么总是出自百度?
这其中自然因为百度对AI的投入和专注,形成了AI的重镇,而更本质的是因为专注和投入形成的“人才虹吸效应”,特别是AI方向上的人才虹吸效应。
一方面,体现在对外部大牛的吸引力上。
吴恩达就因为百度对AI人才的渴求和对人工智能的坚信,在2014年加入百度。就在他加入百度当天,6位顶级人工智能专家也通过邮件表达了加入百度的意向。
吴恩达在百度的三年间,带领百度人工智能团队增长至1300人,其中百度研究院成员300人。Anthropic联合创始人兼CEO Dario Amodei,就是在这个时期加入了百度硅谷AI实验室。
另一方面,百度本身也成为孵化AI人才的摇篮。
2017年,从吴恩达手中接棒百度深度学习研究院的王海峰,就是百度内部成长起来的AI领军人物。
2010年,王海峰加入百度,先后为百度创建了自然语言处理部、互联网数据研发部、推荐引擎和个性化部、多媒体部、图片搜索部、语音技术部等等。
2013年,王海峰协助创建了百度深度学习研究院。同年,成为ACL历史上第一位华人主席。
接棒吴恩达之后,王海峰逐步成为百度人工智能研发体系的总负责人。2019年,王海峰成为百度集团CTO。
在百度深度学习研究院升级为深度学习技术及应用国家工程研究中心后,王海峰出任主任。
吴华、吴甜同样成名于百度。
吴华是百度人工智能背后的科学家,是百度翻译技术团队的创始人之一。2010年,百度作为首个参与到国际顶会ACL的中国科技企业,送到现场的论文,就来自吴华和王海峰。
现在,吴华任百度技术委员会主席,文心ERNIE 3.0 Zeus也是由她主导。
吴甜2006年从浙江大学毕业后就加入了百度。目前,她作为百度集团副总裁,整体负责百度AI技术平台和智能云AI产品,也是深度学习技术及应用国家工程研究中心副主任。
事实上,在中国AI乃至全球AI行业中,“百度系”人才已是星火漫天,百度已然成为一块AI人才高地。
比如,自动驾驶领域就有百度人才铺开半壁江山的说法:余凯、黄畅、彭军、楼天城、韩旭、顾维灏、陶吉、周光……
根据信通院报告,百度以85.5分位居“AI产业创新人才”全国第一。最近5年,百度AI人才的AI专利申请量和授权量连续5年位居全国第一。
同时,百度计划5年为社会培养500万AI人才,目前已经与全国100多所高校进行深度合作,培养超300万AI人才。
在上游技术备受瞩目的周期里,百度总是最受关注的那一个,也总是最能出成果、最能实现价值的那一个。
大模型浪潮下百度的种种表现,就是最新例证。
甚至有评论称,每当全球有突破性技术来到大众视野,百度总会是国人视线找寻国产同款的第一个。
这自然有玩笑调侃的成分,但也本质地反映出了百度内部的技术底蕴、人才厚度和基础研发氛围。这也能解释,为什么处在一个技术爆炸周期时,百度总是吸走最多人才、培养最多人才的那一个。
因为公式是显而易见的:
当你拥有了时间证明的技术信仰,通过坚定不移投入证明的研发底色,那些真正希望通过技术改变世界的人才也会星聚而来,一起享受从0到1搭建中国AI技术底座和骨架的满足感和成就感。
这也是为什么你很难否认百度的技术力,以及百度技术人才的影响力。
武侠世界有言:天下武功出少林。而在国产AI技术江湖,少林就是百度,百度就是少林。
— 完 —
点这里👇关注我,记得标星哦~
微信扫码关注该文公众号作者