Redian新闻
>
揭秘大模型时代背后,那些平凡的天才们

揭秘大模型时代背后,那些平凡的天才们

财经


在如今这样一个大时代背景下,说到“天才”,人们很容易就能想到那些游走在时代前端的科技开拓者。


今年7月份,在2023年中国互联网大会上,一组中国人工智能产业创新人才竞争力的数据颇引人注目——百度公司在预训练大模型、深度学习、自然语言处理、知识图谱、智能语音、计算机视觉、自动驾驶等七大领域的专利积累和人才储备,都遥遥领先于其他同行。


为什么是百度?这个问题,可能只有他们自己才能回答。


在中国,几乎人人都在用百度。然而,或许也正是因为人们对百度过于熟悉,所以便轻易地忽视了它背后的“机器”一直在如何运转。


实际上,作为一家产业化公司,百度一直在悄悄地“搞发明”。2022年年底,随着ChatGPT在全球范围内掀起了一场大爆发,一场科技赛程的追赶开始了,等到大家回过神来的时候,百度已迅速拿出了自己已锤炼多年的大模型、高端芯片“昆仑芯”、飞桨深度学习平台、量子、自动驾驶等科技前沿成果。


2023年7月6日,上海世博展览馆,参观者走过百度的展台。(图/视觉中国)


据了解,在过去的一年里,百度核心研发费用达到了214.16亿元,占了百度核心收入比例的五分之一。近十年来,百度累计研发投入也是超过了1400亿元。


早在2013年,李彦宏宣布百度将成立专注于Deep Learning(深度学习)的研究院,要做中国人工智能领域的“贝尔实验室”,吸引全球最顶级的人才。多年来,百度高度重视人才培养。2020年,为培养高校AI人才,飞桨启航计划投入总价值5亿元的资金与资源;2021年,飞桨再发布“大航海”计划,3年投入15亿元资金和资源,李彦宏称,要为中国培养500万名AI人才。


如今,随着大模型时代的到来,人们的生活开始慢慢从“数字化”往“数智化”迈进,当越来越多的百度“创造”抵达用户之后,人们不禁疑问,到底是什么样的人,才可以发明出这些了不起的东西?2023年9月12日,百度在北京发布了2023年“百度十大科技前沿发明”,同时也把那些科技幕后的创造者们,推到了台前。


都是普通人,在做不普通的事


说起新时代的科技发明,似乎并不能像学习一个物理公式那样轻松,也无法像理解爱迪生如何发明了电灯泡那样简单。自从互联网诞生之后,人类从物质的三维世界,迈向了更广阔的维度。


为了更清楚地揭秘现在的科技开发者都在做些什么,百度公司的同学们,向《新周刊》介绍了如今的互联网行业,为什么会被称为“大模型时代”——相较于传统的“操作系统+应用”的运行方式,AI时代的到来,将互联网科技的技术栈,拆分成了现如今的四层架构。


这么说来,或许很容易让人费解,但其实简单地说,就是AI技术在传统的运行方式上,植入了一个智能“插件”,只不过这个“插件”,需要芯片、深度学习框架、预训练大模型,以及各种落地应用来共同运转。


就在这样的行业背景之下,百度近年来自主研发的“飞桨深度学习平台”和“文心大模型”,仿佛一对“组合拳”,连接了整个上下游产业链,并且在国内遥遥领先于其他科研机构。


上海2023世界人工智能大会上,百度展示文心大模型(文心一格,文心一言)的核心技术创新。(图/视觉中国)

百度知识图谱部的小凡,2011年研究生毕业就加入了百度,目前主要负责大语言模型推理技术及应用。他说与很多科技工作者一样,自己会有一个通用人工智能(AGI)的梦想,而大语言模型将加速它的实现。据他介绍,正如“文心”出自《文心雕龙》的典故,百度对于大模型的开发就好比雕刻,如何让其能像人一样去思考和推理,是他所在团队的主要工作目标。为了达成这样一个目标,他们基于百度超大规模知识图谱,进行大规模的思维数据构建与模型训练,并通过大量的实验印证,以各种形式逐步提升大模型的推理能力。


如今,这项基于思维链的大模型推理技术,在小凡等人的推动下,大大提升了大模型的推理能力,并且面向涉及复杂推理的应用场景,展现出了强大的技术实力和创新性。


此外,与“文心大模型”联系密切的“飞桨深度学习平台”,自从2016年开源以来,目前已凝聚了超过800万名开发者,广泛服务于金融、能源、制造、交通等领域,稳居中国深度学习平台市场综合份额第一。


据百度深度学习技术平台部的华琪介绍,随着大模型时代的到来,算力的需求越发凸显,对深度学习框架的硬件适配技术,也提出了更高的要求。华琪自2020年加入百度后,便开始主要负责飞桨框架的硬件适配工作。如今,飞桨已经和40多家硬件厂商完成适配。


华琪告诉《新周刊》,为了解决AI技术的三要素——“算法、数据、算力”中的算力,芯片的选型和适配是一个非常大的问题。飞桨多硬件分层适配一体化技术,大大降低了适配开发成本,提升了硬件适配效率,加速了人工智能基础设施的建设,有助于未来更多的技术突破。


飞桨深度学习开源框架。


“我们做的事谈不上多么神秘莫测,除了我本身就容易被前沿技术吸引之外,更重要的是,我们觉得工作应该是件有意义的事情。”华琪说。不过在笔者看来,他们的确与普通人无异,只是做的事都并不普通。


专注如一,不设限,
把事情做到极致


科技的发展作用于社会、造福于人,很多时候不可避免地会向着各种不同行业进行延展,比如生物医药、未来教育,以及驾驶出行等,涉及到社会生活中的方方面面。


百度自然语言处理部的张肖男,本科是数学专业,研究生偏重于电子计算机领域,然而当她开始进入到“生物计算大模型”的研发,看到那些小分子化合物和大分子蛋白质,感觉既熟悉又陌生,这就使得她不得不从0开始学习生物医药方面的专业知识。不过张肖男表示,这种从计算机向生物医药的跨学科相对还好些,有些反过来从其他行业跨入计算机行业的同事,就要难受很多。


据张肖男介绍,随着2020年全球新冠疫情的暴发,AI在生命科学领域的应用取得了突破性进展,比如谷歌AlphaFold2的出现,为人工智能技术的落地开辟了新的思路。突如其来的研究课题,落到百度科技研发团队人员的身上,不仅变成了技术攻坚,同时也成了一种社会责任。


“百度最开始在国内做生物医药的时候,由于此前积累很少,所以受到过不少跨行业人士的质疑。但是这两年多来,我们通过不断学习,坚信自己的实验数据,最终取得的成果也逐渐得到了行业的认可。”张肖男说。


文心·生物计算大模型技术。


学习是永恒的母题。除了对生物计算大模型的研发,百度投身于高性能自研量子芯片的研发,不断地在寻求新的突破。


百度量子计算研究所的舍骝策告诉《新周刊》,随着信息技术的不断发展,量子计算作为一项前沿科技,一直备受关注。我们社会的生活与生产都需要“算力”,无论是ChatGPT,还是文心大语言模型,背后对算力的需求愈来愈强烈。于是,“后摩尔时代”新的计算范式成为大家努力追寻的方向。受益于量子的特性,高性能量子芯片能够在某些复杂计算任务展现“量子优势”,提供超越于经典计算机的算力。


百度研发的量子芯片。


2014年,舍骝策还在法国攻读博士,当他通过新闻留意到美国的IBM和Google公司已经开始投入量子计算的研发,而彼时国内还没有任何一家企业在做的时候,便萌生了投身量子计算产业的想法。后来,舍骝策毕业归国,经人引荐认识了百度量子计算研究所的所长段润尧。经过几次交流后,舍骝策倍受鼓舞,不甘于停留在学术界的他,意识到让量子计算落地才是自己真正想做的事业。


2018年,舍骝策加入百度。作为“高性能自研量子芯片项目”的核心研发人员,舍骝策瞄准“设计—流片—测控”闭环中的核心技术,在Feature Team的团队氛围之下,攻克了不少量子芯片研发中的短板问题。如今他和团队同学所研发的专利技术,为百度量子计算产业化提供了非常重要的量子硬件基础。


“‘专注如一,不设限,把事情做到极致’是我们的信条。”舍骝策善于观察,他说百度的同事之间,都会互相称呼“同学”。“叫‘同学’是百度的文化之一,其实在我们的团队当中,大家教育背景和专业不尽相同,但是无论来自哪里,当大家聚集在一起时,就都成了一种互相学习的关系。”


不断学习似乎成了百度最流行的文化,正如张肖男所说:“如果站在历史的长河里去看百度的产业布局,我觉得任何时候都无法断言它趋于完整,比如国内的开源生态现在也很繁荣,各自都有各自的优势吧。”在她看来,科研的开发永远没有终点,百度只不过是引领了国内大模型的技术产业生态,而未来是不可预测的,也是充满机会的,这个机会对于每个做科技的公司,以及对于每个做开发的人来说,都是均等的。


做这行不太容易“犯焦虑”


“做科研开发的人,很容易被视作‘狠人’‘大牛’,更何况百度的价值导向,是一种长期的技术信仰。”柳长春在介绍自己关于“自动驾驶决策系统”的发明专利时说,为了让汽车在不同的路况环境中做到甚至是超越人眼和大脑的判断,需要不断攻克和解决自动驾驶中的基础问题,这其实还是回到了对深度学习技术的应用,在这个过程里,柳长春只能逼着自己往前走,“因为问题都是可视的,一项一项去解决就好了。”


据柳长春回忆,2015年,百度的第一辆无人驾驶车开上北京的五环的消息,轰动了整个社会。作为当时刚从清华大学自动驾驶专业研究生毕业的他,没作多想,便将自己的简历投向了百度。在加入百度之后的六七年当中,他自觉与自动驾驶技术的研发工作,是一种共同成长的关系,有突破的时候,当然也有低谷的时候,不过只要看到项目推进哪怕一点点、问题解决一小个,他都能重新振奋起来,因为他相信“悲观者看到问题,乐观者改变世界”。


百度无人驾驶车的决策数据闭环系统。


毕业于北京大学的史海波,与柳长春几乎是同一时间加入了百度,不过他所参与研究的领域,是公司的看家本领——“百度搜索”。六七年来,为了让搜索引擎变得更高效,早在ChatGPT-4爆发之前,他便一直在机器问答领域不断摸索,如今研发出了“生成式搜索系统”的发明,为百度搜索的迭代做好了充分的准备。


“学术界关注更多的是科学突破,但是在工业界,想的却是把想法变成现实,真正把东西造出来。”史海波说,“当代的年轻人普遍容易焦虑,不过做这一行就不太可能,因为每天都在解决实际问题。”


相比起年轻人,早在2006年入职百度的秦同学,就是“干实事”的最好例子。作为“凤巢”的首席构架师,他通过搜索变现的方式,曾为百度每年带来上百亿元的收入。他也一直从未停止过想象,怎样才能把推荐算法变得更加智能。据他回忆自己曾经看过的一部电影《Her》,里面那个“陪伴式的智能体”,成了他的愿望和目标。


电影《Her》里的“陪伴式智能体”。(图/《Her》)

直到2019年,秦同学转入推荐策略部后,通过千亿级参数的“文心大语言模型”,他找到了抵达“目标”的关键技术突破口,历时三年终于研发出了“基于用户心智理解的对话式推荐技术”。名字乍一看有些长,但其实不难理解,这是一种从“数字”到“数智”的飞跃。


在秦同学看来,创新的目标是用科技让复杂的世界更简单。在掌握核心技术的百度,一如既往地工作了17年,是他从未后悔过的决定。据他透露,百度内部有一个科技创新最高奖,也是中国互联网行业最高级别的奖,每个奖金是100万美元,而光是他带领的团队,就拿到过六次。


“其实没想那么多,就是做自己最擅长的事,而且百度的企业文化一直是简单可依赖,没有复杂的人际关系,大家自上而下都是懂技术的,所以都在踏踏实实做事情。”秦同学说。


百度量子。


他创新的脚步一直在前行,最近又在推动大模型往个人智能助理的领域发展,这一想法来源于他在生活中观察到的,人们一直期望高效获取信息,获得高情绪价值、教育价值等,在他看来,如果大模型在个人智能助理领域能够成功做到,那么将来就能泛化应用到人们生活的各个领域。


秦同学说:“我们无须过于担心,科技的发展会如何影响人类的生活,其实只要将科技视作一种方法,让社会朝着更良性、更公平的方向发展,一切就都是值得的,也是每个科技研发者共同肩负的责任。”


作者:段志飞


校对:邹蔚昀

排版:小   野

封面:《Her》


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
中国液冷数据中心第一诞生!大模型时代需“冷平衡”一下云天励飞李爱军:揭秘大模型时代,边缘计算芯片进化论丨GACS 2023吹尽黄沙不见金(五十五): 一根麦管大模型时代的程序员:不会用AIGC编程,未来5年将被淘汰?这,就是大模型时代的生产力长篇小说《如絮》第一百五十八章 夏威夷-新加坡-2005年 想回家大模型时代,智能驾驶赛道需要怎样的AI芯片?|甲子光年GPT-4就是AGI!谷歌斯坦福科学家揭秘大模型如何超智能如何快速实现大模型落地?5小时get大模型时代实战密码!生物医学大模型时代三位「盗火者」,窥探生命宇宙的边缘丨GAIR 2023大模型时代的人机关系:不要温和地走进与AI共生的时代小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大知识产权、隐私和技术滥用:如何面对大模型时代的法律与伦理挑战?时代背景下,如何应对职业发展困惑?|职业生涯规划国际认证班他最平凡的一天,吓哭了60万人黄学东:大模型时代需要注重「三个臭皮匠」的联合能力丨GAIR 2023104岁宝藏奶奶的智慧人生:没有平凡的时刻|夜话语录分享第六章 富国强兵和改革开放 (3)AI的大模型时代 ≠ 只有大模型的AI时代大模型时代欧美最夯的18只AI独角兽大模型时代,来外滩大会解锁图智能前沿技术女儿逆袭进入哥大,改变从我鼓励她做平凡的自己开始男人也“外嫁”相聚多伦多(三)移民第一课——不打labour不成活北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型Byzer,一种大模型时代的SQL 编程语言|QCon大模型时代,网络文学正在经历「大变革」大模型时代,「幕后主力军」数据中心走向何方?他的目的要达到了:揭秘大规模袭击背后主谋,哈马斯神秘指挥官穆罕默德·戴夫李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型来,认识下大模型时代欧美最夯的18只AI独角兽揭秘大榭石化背后的人工智能​「奇兵」严睿:大模型时代下的对话式 AI 发展丨GAIR 2023WAIC 2023 | 百度吴华:大模型时代的 AI 原生研发模式梅花创投吴世春:如果大模型时代的“张一鸣”很贵,我肯定不投
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。