过去,开发者用代码来改变世界,未来,自然语言将成为通用的编程语言。 用代码书写历史的程序员会被 AI 取代吗?一个全知全能的大模型能适配一切吗?大模型成本过高怎么办?在这个 AI 时代,什么样的工具才能被称为最好用的工具?这些问题,并非空中楼阁,而是每一个身处技术浪潮中我们所关心的现实问题。幸运的是,在今天举行的 2024 百度 Create AI 开发者大会上,李彦宏的主题演讲也许能够帮助我们找到答案,或者至少是通往答案的线索。在不久的将来,通过 AI 的力量,我们可以打破传统的编程壁垒,让每个人都能够通过自然语言与计算机进行交流,就像与另一个人交谈一样自然和直观。只要会说话,就可以成为一名开发者以后不会存在程序员这种职业了,只要会说话,人人都会具备程序员的能力。 上个月,在接受央视《对话》的采访时,李彦宏笃定地如上说道。今天,李彦宏也再次重申了这一点,未来开发应用甚至就像拍短视频一样简单,人人都是开发者,人人都是创作者。在过去一年的实践中,百度踩了无数的坑,交了高昂的学费,但正是这些经历,让百度找到了属于自己的 PMF,也奠定了未来的发展方向。在李彦宏看来,百度的角色定位就是尽可能为大家提供必要的开发工具,不断地提升整个社会的创造力。为此,百度不仅推出了强大的基础模型——文心大模型系列,还开发了基于大模型的应用定制工具。自去年 3 月 16 日文心一言上线以来,经过一年零一个月的发展,它的用户数量突破了 2 亿大关,每天 API 的调用量达到了惊人的 2 亿次,服务客户数达到了 8.5 万,通过千帆平台开发的 AI 原生应用数量更是超过了 19 万。从 3.0 版本到 3.5 版本,再到现在 4.0 版本,智能化水平不断提升的文心一言正在逐步走进千家万户,改变着人们的工作和生活。在广告行业,从业人员可以利用它整理资料大纲,将原本需要沟通 5 到 6 轮的提案过程缩短到了 3 轮以内,大大节省了宝贵的时间。同时,它还能快速润色创作内容,激发出更多的创意和想法。设计师们也通过使用文心一言的 AI 绘画功能寻找灵感,让不同年龄段的爱好者跨越年龄界限,共同创作出更好的作品。基于文心大模型的智能代码助手 Comate,不仅支持 100 多种语言和所有的 IDE(集成开发环境)平台,还可以深度解读代码库、关联私域知识生成新的代码。上线一年多,Comate 生成代码的采纳率达到 46%;在百度每天新增的代码中,已有 27% 是由 Comate 自动生成的。在发布会现场,李彦宏还正式官宣推出文心大模型 4.0 的工具版。现在,用户可以在工具板上体验代码解释器的功能,通过自然语言交互就能够实现对复杂的数据和文件的处理和分析。它甚至能够生成图表和文件,帮助用户洞察数据的特点,分析变化趋势,为后续的决策提供高效和精准的支持。李彦宏在发布会上表示,文心大模型已经成为了中国最领先、应用最广泛的 AI 基础模型。与一年前相比,文心大模型的算法训练效率提升了 5.1 倍,周均训练有效时间达到了 98.8%,推理成本更是降至原来的 1%。李彦宏手把手教你用三大 AI 开发者神器大语言模型本身并不直接创造价值,基于大模型开发出来的一些应用,才能满足真正的市场需求。 李彦宏在发布会提出了 AI 领域未来发展的三大判断。首先,未来大型的 AI 原生应用,基本上都是 MoE 架构,大小模型的混合使用,能够在保证效率的同时兼顾成本,实现最优的应用性能。其次,小模型具有成本低,响应速度快的优势,在特定的应用场景中,经过蒸馏精调后的小模型,其性能甚至可以媲美大模型,这一点,早在 Mistral AI 的模型上就已经得到充分的证明。然后,智能体能力的提升会催生出来大量 AI 的原始性应用,使得机器能够像人一样可以进行思考和行动。对此,百度精心推出了三款开箱即用的 AI 开发者神器,分别是智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder、以及更专业,支持各种尺寸模型定制的开发工具 ModelBuilder。Agent Builder 的核心理念是零门槛。即便是不懂编程的代码小白,也可以利用文心智能体平台的零代码模式,通过简单的自然语言交互,创建出属于自己的智能体。例如,我们可以创建一个新加坡旅游局的智能体,然后再利用自然语言设定提示词,设定它的功能范围,使其成为一个贴心的旅游搭子。得益于携程等旅游服务的接入,Agent Builder 开发的智能体能够为用户提供更加全面和便捷的旅游服务。无论是酒店预订、景点推荐还是票务服务,都能通过智能体得到有效的整合和提升。更重要的是,百度搜索、贴吧、小度、地图等产品都具备接入智能体的能力。比如在百度搜索新加坡旅游方案,它甚至能直接汇总几个链接的内容,为用户提供精确的答案。这种智能体的集成,不仅提升了用户体验,也为开发者解决了流量分发的问题,帮助他们获得实质性的收益。随着智能体的不断迭代和优化,它们的功能将越来越强大,越来越聪明。号称目前最好用的 AI 原生应用开发工具 AppBuilder 则是百度推出的第二款 AI 开发者神器。百度提前封装和预制了开发 AI 原生应用所需要的各种组件和框架,大幅度的降低了开发门槛。用李彦宏的话来说,最快只需要三步,开发者就可以用自然语言开发出一个 AI 原生应用。今年年初,百度举办了一期 AI 原生应用的开发挑战赛。赛题就是打造一款游乐场的排队规划助手,帮助用户设计出个性化的游玩路线。最终夺冠的选手连一行代码都不用写,成功开发出了相应的应用。华北电力大学则是在智能体的基础能力之上,结合 AI 优化配置的功能,打造了一个华电 AI 助理。这款助理能够轻松应对校园生活中的各种高频场景,如查询校园制度、浏览课程表、充值饭卡、借阅图书等。百度文库则在多模态技术的深厚积累下,通过 AI 重构,成为了内容创作的新起点。其最新推出的智能漫画和画本的生成工具,让每个有创意的人都能轻松做出好作品。以传统的周处除三害故事为例,用户只需在百度文库中搜索相关主题,工具便能根据原文故事情节自动生成分镜,并绘制出满足用户需求的漫画,让传统故事焕发出新的生命力。睡前故事听腻了,父母也能利用百度文库的 AI 画本功能,为孩子创作一个专属的儿童画本,让阅读成为一种全新的亲子互动体验。对于开发者而言,掌握大模型的精调方法至关重要。百度推出的 ModelBuilder 工具,正是为了满足专业开发者的这一需求。ModelBuilder 能够根据开发者的具体需求,定制任意规模的模型,并对模型进行细分场景的深度精调,以实现最佳的性能表现。ModelBuilder 集成了包括文心大模型系列在内的 77 款精选大模型,并提供了全流程的模型工具链。同时,它还提供丰富的 SDK 和全栈 API 能力,能够完成一站式的模型精调。此外,ModelBuilder 还提供了模型精调样板间,在 ModelBuilder 官网即可查看高频场景样板间,开发者只需要跟着样板间一步一步精调,就能做出一模一样的专业模型。正如上文所提到,大型的 AI 原生应用,一般都是 MoE 架构。那么如何组合使用这些模型才能获得最好的性价比呢?为了更直观展示这一概念,李彦宏用大模型加持的小度给我们展示了一番。无论是实时搜索信息、播放新闻,还是处理复杂的行程规划,小度都能通过调用不同的模型来高效完成。值得一提的是,在本次发布会上,小度科技也宣布推出了「全球首个 AI 原生操作系统」——DuerOS X。该操作系统依托于百度文心大模型,并在此基础上进行了深度优化,使得其在多模态感知与人性化表现方面取得了「显著进展」,能够实现小度设备全天候免唤醒的语音交互功能,号称实现「唤醒识别率高达 99% 以上,理解并满足用户需求的能力超过 95%」。多模态被广泛认为是迈向 AGI 的必由之路。基于这样的理念,百度利用超过 1 亿公里的中国复杂的城市道路的测试里程数据,成功训练出了 Apollo 视觉感知大模型。随着全球最大规模、覆盖 360 万公里道路的车道级地图数据的上线,百度地图导航能去的地方,智驾也能到达。正如李彦宏所言,今天的中国有 10 亿互联网用户,有强大的基础大模型,有足够多的 AI 应用场景,有全球最完备的产业体系,为中国的 AI 发展提供了坚实的基础和无限的可能性。在这样的大背景下,比起一窝蜂地跟随底层大模型的热潮,不追求短期的喧嚣和热闹,找到更契合实际的应用场景,让 AI 技术真正落地无疑是一种更为明智和务实的策略。从文心大模型的发展思路,到为开发者量身打造的三大 AI 神器,我们看到了百度对技术创新和开发者需求的深刻洞察。这次的主题演讲,不仅展示了百度的技术实力,也向我们揭示了百度未来 AI 发展的明确方向。在 AI 的浪潮中,百度正以稳健的步伐,全力寻找属于自己的节奏和方向。