思维链加持,现场拔网线,第四范式「式说」大模型改造软件来了
机器之心报道
ChatGPT 兴起,大模型已成为技术革命的核心,大模型覆盖领域极宽,知识足够深,又非常好用,那么它将如何改变产业呢?
4 月 26 日下午,第四范式首次向公众展示了大模型产品「式说」3.0 版,并提出 AIGS 战略(AI-Generated Software):以生成式 AI 重构企业软件。「式说」将定位为基于多模态大模型的新型开发平台,提升企业软件的体验和开发效率,实现「AIGS」。
「二维码在国内无处不在,但在海外的推进速度不快,这是因为人们已经形成了信用卡等支付习惯。同样,用生成式 AI 改造 C 端体验可能提升并不大,而 B 端软件一直面临多级菜单和传统指令的交互方式,」第四范式创始人兼 CEO 戴文渊表示。「这些复杂的交互体验,及其带来的极低开发效率,恰恰为生成式 AI 留下足够大的重构和改造空间。」
在各家公司争相投入大模型研发的同时,第四范式已经开始押注用「式说」重构企业软件这个赛道。
搬进企业场景
造大飞机也能帮上忙
先来看看这个大模型底座,「式说」大模型。
首先和其他大模型一样,它可以聊天、回答问题、写代码:
而作为企业级的生产力产品,式说具备的 Copilot 能力,可以找到并调用多模态的内部数据。第四范式某航空制造客户现场展示了式说应用于工业软件的一个场景,当询问式说「找一个类似零件」:
每个大模型都能和你聊两句,能「思考」和「推理」才是真正是否聪明的关键。第四范式展示了式说的思维链 CoT 能力,AI 自己能找到解决问题的方法,一步一步地执行。
在装集装箱的 demo 中,式说首先列举了装箱的思路,人们可以任意修改堆叠物体的长宽高,AI 很快就能自动计算出堆叠的最优结果,并用图形的方式展示出来,还会显示推理的过程。这种技能放在企业实用性不用多说。
第四范式还在活动现场「拔网线」,展示了一下式说大模型的多轮对话、迅速画图、理解总结等能力:
现场演示写程序。
在发布现场,来自飞机制造、医药、金融等领域的客户进行了产品的 live demo 演示。式说大模型能够在生产环境下普及,提供从几十亿到千亿级的多种大模型,供不同企业按需使用。
大模型做软件改造
没想到这么快
大模型语言能力正在彻底改造传统软件的用户体验、使用门槛,以及降低开发成本。
在 to B 场景下,人们每天面对的软件体验并不友好。「想象一下企业内的报销系统、HR 系统、OA 系统。你可能需要在菜单里面点击多个下拉菜单,才能进入到某个功能,」第四范式联合创始人、首席科学家陈雨强表示。「现在当我们有更强语义理解的大模型的时候,可以通过更好的交互方式去实现功能的调用,实现语音、对话的交互模式,从而使 B 端企业软件的体验提升。」
AI 技术也可以帮助提升开发效率。基于旧开发方式,企业的定制化软件在每次功能升级时需要经历产品经理画界面,设计、开发等过程,至少需要月级开发时间。而由于新的交互形式的出现,功能和逻辑被改写在数据、API 和内容层面,开发效率被提升到了数天的级别。
「和我们对接的合作伙伴和客户经常会询问:这个项目需要多少个懂 NLP 的科学家、架构师。我们会说现在只需要一个架构师和一个产品经理就可以了。」陈雨强表示,「架构师负责架构和 API 描述,产品经理设计场景。式说能够把已有的 API 和代码通过 Copilot 能力进行串联,形成应用。」
式说自身能力也在短时间内实现了快速的提升。
在 3 月发布的 2.0 版式说中,第四范式在生成式上增加了类似于 ChatGPT 插件的企业级 Copilot 能力。在与企业内部应用库、私有数据等进行联网的前提下,AI 可以对信息和数据进行分析,回答人们的问询或执行相关任务,从知识助手升级成为业务助手。
在今天发布的 3.0 版「式说」上,加入思维链(CoT)能力。
在执行任务时,我们需要的往往不止是具体功能。我们可以在 Photoshop 上调整亮度、对比度和色阶,但如果需求是「做一个当季营销海报」,完成任务就需要人类按照顺序,执行多个功能才能实现。
这就是思维链(Chain of Thought,CoT)。「人接在收到任务后,会在大脑里推理出完整步骤去执行。而在软件上,如果 AI 见到足够多的人的操作,通过特定步骤把照片 P 的好看一点,下次就不用告诉它步骤分别是什么,只需要说 P 好看一点就行。AI 已经把套路总结出来,形成了一个思维链,」陈雨强说道。
让软件学「套路」,构建「领域」软件的思维链,可以规划使用软件的行为、自动执行更加复杂的任务。戴文渊把这种思路分成了三大阶段:
第一阶段,Copilot 调动不同的信息、数据、应用,作为助手完成用户的指令。相当于在所有企业级软件系统里,配备一个指挥官。指挥官听用户的指挥,比如「把照片亮度调亮 20%」。
第二阶段,Copilot + 基于企业规则的「知识库」,AI 能够参照规则做复杂工作,进一步丰富了「对话框」的能力。比如 AI 查询了「人像美化」知识库后,能执行把照片修好看的步骤。
第三阶段,Copilot+CoT(思维链)。软件系统的使用行为最终会被大模型学会,形成 AI 针对这个领域的思维链,意味着「把照片处理得更好看」这种复杂指令,AI 能自动地按照步骤完成。
大模型将无处不在
比尔・盖茨曾表示:「在我的一生中,曾见过两次革命性的技术演示,第一次是 1980 年的图形用户界面,第二次是去年的 ChatGPT。人工智能的发展与微处理器、个人电脑、互联网和手机的发明同样重要。它将改变人们工作、学习、旅行、相互交流的方式。整个行业将围绕它重新定位,企业将通过使用它的程度来区分自己。」
第四范式的愿景是「AI for everyone」。第四范式坦言,在 BERT 出来的时候,范式研究院就开始关注并投入在这个技术领域,「过去几年和今年比投入肯定还是有差距的」。GPT3 出来以后,确定性的投入更大了,往后就是变成产品、变成商业化的路线去推。
在第四范式内部也已经使用大模型帮助日常工作。在为客户制定人工智能转型方案的过程中,人们可以在准备资料、预演等任务上借助大模型帮助提高效率,AI 还可以扮演审核员的角色为人类挑错。另外,第四范式还在内部探索了 AI 视频剪辑、辅助科学研究建模等方向。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者