百川智能王小川：医疗是大模型皇冠上的明珠

公众号新闻

2024-07-09 06:07

我们现在处于什么时代？

百川智能创始人兼CEO王小川认为，我们已经从信息时代步入智能时代。而大模型是智能时代的基础设施，可以创造新的价值和伙伴关系，可以带来生产力的直接提升。

在大模型应用落地方面，王小川提到，医疗是大模型“皇冠上的明珠”，大模型有望做到院内、院外的全病程管理，并在预防、诊断、干预环节实现精准医疗。

在近日举办的2024全球数字经济大会人工智能专题论坛，王小川进行了分享。以下为王小川分享内容，经i黑马编辑：

今天整个中国社会，尤其是科技界，都处于一种既兴奋又焦虑的状态。

一方面，我们要跟美国卷模型，要投入十亿、百亿美金去做超级模型；另一方面，又在呼唤大模型落地应用的场景。大家担心，只做落地应用会错过未来，但只考虑未来又没有当下。

百川是去年4月成立的，今年1月份，朋友们给我发微信祝贺，说“2024年元旦快乐”。我回复的是，“智能纪元二年快乐”。

这句话的含义是什么？我们已经进入到一个全新的时代，到了智能时代。虽然现在还没有做到AGI。

我们很幸运，大家是从互联网时代走过来的，享受了互联网20年的高速发展，现在又见证和参与到了智能时代的发展。

通过语言，我们在接近智能

我想用一个关键词来表达对智能时代的中轴的理解，就是把语言转变成数学模型。

我们今天讲大模型LLM的时候，第一个关键词叫Scale，就是规模。从百亿参数到千亿参数到万亿参数，再到号称GPT5的百万亿级参数，数据规模上去之后就能带来智能。到最后变成，大家觉得投入多少钱进去，就能实现智能。同时我们也会欢呼，比如今年视频生成领域Sora的推出，是不是代表了未来的另一种智能。

这些其实都不是完整的答案。因为今天我们走通的人工智能路径，不是在Sora，而在语言。通过将语言变成数学模型之后，能够获得今天这样的人工智能。

很多人说，人和动物的区别，可能是人会语言。

比如图像识别很厉害、无人驾驶很厉害，我开玩笑讲，狗也会无人驾驶和图像识别。区别在于，语言是我们思考、沟通的载体，是文化和知识的载体。因此通过语言，我们在接近智能。今天这个范式体系并没有脱离掉语言，因此我们强调语言为中轴。这是在通用智能里的一个关键逻辑。

另一个关键词是能源。数据、算法、算力，大家都已经很清楚了，但今年上半年以来，提到更多的是能源问题。尤其是在国外，已经开始有可控核聚变，在为大规模的新模式部署做准备。如果说AGI或者人工智能再往下爆发，那算力背后的能源会构成一个大的短板。中国目前为止还没有开始探索这个问题，在电力方面还没有美国这种疯狂的想法。这也是中美大模型发展的区别之一。

大模型带来的是生产力的提升

有个知识管理框架叫DIKW模型，即Data Information Knowledge Wisdom。以前机器产生的是信息，这个时代的智能核心是产生知识。也就是说，大模型带来的不仅是信息的传递，而是能够产生knowledge，代表着对世界的认知。再往后发展，则可以产生智慧。

我们知道，在互联网时代，更多的是改变了生产关系。不管是淘宝、滴滴还有美团，都是通过互联网让更多的商家跟更多的用户连接在一起，提高供需匹配的效率。

但在智能时代，大模型带来的是生产力的直接提升。GPT是这个时代的第一个应用产品，未来我相信会有更多新的应用产生。

在信息时代，我们是用一种工具思维来使用计算机。现在，我们应该把大模型当成伙伴来思考。如果还是把大模型当成原来的计算器来对待，那它能够发挥的作用就太有限了。我们更应该把AI当作可以产生陪伴和服务的伙伴。我预测，在未来两三年，我们可以走出这种工具思维，并且让AI变得像人类一样具备服务能力和陪伴能力。

这种情况下，目前的探索方向，一是赋能千行百业，也就是对生产力的提升。另外还有两个领域：智能助理和虚拟世界。

在个人领域，这种智能助理之前其实做得不太好。目前来讲，Perplexity在智能助理领域应该算是不错的，通过对于搜索的总结，可以提供更好的知识的呈现。GPT4O更多代表的是一种交互模式的革新，是以人的方式来跟用户沟通。我认为，未来智能助理会有新的To C产品形态产生，而不只是在原来的电商、游戏以及其他领域再重做一遍。

在虚拟世界，随着技术的进步，未来3到5年，我们预见到人工智能将在虚拟世界的多个方面扮演更重要的角色，特别是在娱乐游戏行业。随着虚拟世界的发展，它将为全球经济带来新的动力和变革。我们认为，这将是一个从生产关系向生产力转变的过程，最终将实现对虚拟世界的赋能。

目前，我们已经讨论了许多概念，包括搜索增强、多模态、智能体等，这些都是当下提升大模型能力的主要技术路线。这些技术的发展可能会在未来引发一场变革性的力量。

强化学习让大模型具备思考能力

在语言和规模之外，大模型还有一个发展思路是强化学习。OpenAI曾提到，他们的模型可以在某些地方实现超越，包括在18个月之后让大模型达到博士生的能力。这不是在当下这个范式中能够解决的，以目前的范式解决问题来讲，大模型能达到高中生的水平就不错了，所以只能做辅助工作。

但未来会有新的一种范式出现，这是值得大家期待和关注的。这种范式的核心是，用强化学习来改变今天的模型设置。广义上来讲，这就像之前大家熟悉的AlphaGo，专门下围棋的人工智能。AlphaGo跟大模型走了两条相反的道路。大模是数据越多越好，有多少数据就可以带来多少智能。而AlphaGo的第一版本是结合了数百万人类围棋专家的棋谱。但是到AlphaGoZero之后，就不需要人类的棋谱了，不用数据反而变得更加智能。

今天大模型只能解决快思考的问题，其实不具备慢思考的能力。所以大家提到AI超越人类，还需要很长一段时间来通过强化学习产生慢思考。用孔子提倡的学习方法来讲，大模型是“学而不思则罔”，学了很多东西，但是不会思考，并不是特别智能；AlphaGo则是“思而不学则殆”，只在一个领域钻研得很深。因此，将学习和思考系统进行结合，才可能实现智能时代最终的爆发。我们现在掌握的两种技术，还没有融合在一起，这是我对未来的一些基本判断。国内有高校在做这方面的探索，我们甚至预言美国已经在这方面实现了突破。

随着我们自己的实践，我们强调如何平衡理想与现实之间的关系。追求“诗和远方”就是去追赶OpenAI，但没有落地场景。如果去做落地场景，则有可能走不到了大模型的远方，丢掉了“慢思考”，丢掉了大模型所代表的通用智能的可能性。

因此，针对当前中国的情况，包括芯片能力、人才储备和市场环境，我们提出了一种逻辑，即“理想上慢一步，落地上快三步”。也就是说，理想上我们不是不跟，而是通过他们验证之后来确保我们的方向。我们的首要任务是打开落地场景，同时确保我们不会失去对大模型终极理想的追求。因此，我们的目标是既要发展超级模型，也要发展超级应用。所以我们在赋能千行百业时，选择这些知识密度特别高，真的需要千亿模型、万亿模型的场景，然后我们把它降到百亿，这是百川的定位。

百川去年整体发展很快，成为第一批获得工信部备案的八家大模型公司之一，也是唯一一家当年成立的公司。在今年5月，百川推出最新一代基座大模型Baichuan 4，并同期推出首款AI助手“百小应”。

医疗是大模型皇冠上的明珠

百川在落地场景上选择的是医疗领域。医疗是大模型皇冠上的明珠。反向传播之父Geoffrey Hinton强调，医疗将是最重要的AI应用领域之一，将发挥AI的最大潜力。大模型对于知识的掌握，对经验的掌握，大模型的多模态能力、记忆能力、思考能力，大模型减少幻觉、沟通共情的能力，所有这些在医疗领域都能够用到。甚至是模型做得越好，医疗就能越发达。

目前在医疗领域比较成功的是互联网医院，包括好大夫等，需要依靠现有的医生，其实还是对生产关系的改变。因为医生供给是不足的，提升医生供给就是一个重大的机会，所以医疗行业叫做“得医生者得天下”。

同时，我们也对AI医疗进行了等级划分，从L0到L5，这一分级类似于无人驾驶。

L0就是传统医疗，没有AI介入。

L1是依靠单一功能的机器辅助，在单点上可以给出建议。

L2是多模态辅助，AI可以整合病历、影像等多种数据提供信息。

L3是条件自动化诊疗，类似于现在的自动驾驶，已经可以完全取代司机开车，但在关键时刻还需要司机的确认。我们的目标是，在今年到明年，做到L3的水平，让AI给医生做助理，也能为消费者提供后期的健康顾问，但关键决策需要医生确认。

L4就需要AGI的水平了。AGI的能力可以造出医生来，完全像医生一样工作，就是一个通用的人工智能。

L5是完全自动化健康管理，可以超越AGI，从预防、诊断到治疗，可以管理患者的全部健康旅程。到这个时候，我们开始从语言模型走向生命模型，对生命做解码，做到超越医生的水平。

在这个过程中，我们落地了两件事情。一是在前期做全病程的管理，二是在此基础上做精准医疗。

现在医生资源远远不够，不可能有医生一直陪着患者。大模型可以在院内做医生助理，在院外做健康顾问，能做全病程的管理。在这个过程中，大模型可以患者进行尽可能多的数据收集，这对医生来说也就像临床实验一样。因为医生不仅是临床工作者，也是科研工作者，他们需要把自己的观察和经验总结出来，写成论文，变成知识。每个医生的精力是有限的，在中国一个医生一辈子可能只能为3万个患者做诊断。大模型能够快速地迭代学习，可以为每个患者单独建模，最终走向精准医疗，让预防、诊断、干预都达到新的高度。