Redian新闻
>
王小川:GPT-4一直在进步 中国大模型赶上要两三年

王小川:GPT-4一直在进步 中国大模型赶上要两三年

财经

来源:凤凰网财经
作者:蒋浇


9月27日至28日,凤凰卫视、凤凰网联合多家机构举办的“凤凰湾区财经论坛2023”在香港、深圳同步举办。广邀海内外政府官员、专家学者、行业精英围绕大湾区建设、中国经济、全球经济等话题展开讨论。在论坛期间,凤凰网财经对百川智能创始人兼CEO王小川进行了深度采访,王小川分享了他对人工智能发展前景、商业化现状以及国内大模型竞赛格局的看法。
自ChatGPT掀起大模型浪潮以来,国内科技大厂一路狂奔,“百模大战”快速打响。在王小川看来,国内大模型“卷”比“迟”更好。“对于一个企业而言,必须有能力建设基础的大模型,而不是等模型成熟后再着手开发应用。在中国当前的环境下,我们不能依赖美国,必须得自己有公司能顶上。”
谈到国内大模型与ChatGPT的差距,王小川表示,GPT 4一直在不断进步,最近它们推出语音和图像功能。从时间角度来看,我们认为可能需要两年或三年的时间,才能更接近GPT4目前的水平。
王小川认为,国内大模型已过初赛阶段,未来可能会有少量公司加入市场,使百模大战变成十多家公司的竞争。他预计明年中市场格局将会定下来。
大模型“烧钱”,钱是否是决定胜负的最关键因素?王小川表示,资金实力、人才以及卓越的运营能力,都很关键。而更关键的因素是,创造出类似于ChatGPT的超级应用。
需要注意的是,留给大模型讲故事领域的很多,但实际落地场景少之又少。知名投资人朱啸虎认为,今年模型大混战是巨大的泡沫,通用大模型对创业公司没有意义。
王小川认为,就像OpenAI一样,优秀的公司都是在冬天里诞生的。当投资者都对某个领域充满信心时,可能会出现泡沫,并不利于企业本身的成长。投资者的决策与企业的发展策略,不在完全同样的思考维度。
在国内,大模型卷参数、卷应用。而在国外,AI模型竞争主要聚焦“开源”和“开源”两种生态。其中,闭源模型的代表为GPT-4,开源模型代表为Meta AI的LLaMA2模型。谈及开源与闭源之争,王小川称大模型在C端和B端都要落地,所以两者并不矛盾。
今年9月,百川智能发布Baichuan2-53B 闭源大模型,全面升级了Baichuan1-53B的各项能力。此外,还开放了Baichuan2-53B API接口,正式进军To B领域,开启商业化进程。而王小川透露,百川智能最近将会开启新一轮融资,后续还会有多款产品发布。
以下为对话全文:
王小川:有信心同时做好开源和闭源
凤凰网财经《凰家会客厅》:百川智能最近推出了Baichuan2开源大模型,引起广泛关注。主要是百川成立之初,您说要做“中国版的Open AI”,但为什么后来选择开源这个路线?
王小川:没有变化的,我们原计划在三季度发布500亿规模的闭源模型,并在四季度实现千亿规模的闭源模型。然而,在过程中,我们发现在中国的开源生态中,缺少足够商业化和有实力的公司来领军这一领域,而美国在这方面已有Meta AI了。
我们认为,开源对于中国的大规模生态会很有帮助,还能够展示百川智能的技术能力,所以优先发布了开源模型。百川智能在8月8日发布了500亿规模的闭源模型,这是原计划中的,只是增加了开源部分。
凤凰网财经《凰家会客厅》:开源和闭源是两种不同的技术路线,百川智能做开源模型有没有遇到挑战或者困难?
王小川:开源模型和闭源模型的客户群体有所不同,开源模型更多地满足了企业的个性化和本土化需求,通常适用于那些寻求定制解决方案的企业。相反,闭源模型主要针对市场化程度较高的小型企业。这意味着,我们需要为这两个不同的客户群体提供定制化服务,这会增加挺多的压力。
凤凰网财经《凰家会客厅》:国内很少有开源和闭源并行的大模型公司,它们商业化的路径也不一样。
王小川:做闭源模型对资源的消耗更大,技术难度也更高。现在国内企业都在做闭源模型,还没有一家公司能够持平或超越GPT 3.5的水平。我对百川的实力和潜力有更高的信心,认为开源模型也能同步做。如果其他公司不做开源模型,百川智能作为一家创业公司拥有更多的灵活性,可以选择开源和闭源并行。其他创业公司可能灵活够,但资源有限,只能做一件事,我们考虑了两个领域的发展。
王小川谈百模大战:明年决胜负,超级应用是胜负手
凤凰网财经《凰家会客厅》:今年6月,您接受采访时说美国的开源和闭源模型格局已定。那么我们现在国内所谓的“百模大战”,您觉得市场格局已定了吗?
王小川:国内来说,我觉得初赛已经完成了。8月31日,通过备案的8家大模型公司的产品获批上线,表明他们在技术实力和安全性方面得到了认可,可以发布更多产品。未来,可能还会有少量公司进入市场,使“百模大战”转变为10个模型公司的竞争。我们认为,到明年中,国内大模型市场格局会定下来。
凤凰网财经《凰家会客厅》:百模大战中决定胜负的关键因素是什么?
王小川:我觉得有两件事,一方面要有强大的资金实力、高密度的人才以及卓越的运营能力,以确保模型的出色表现。这是其中一个条件。很多公司在这方面都遇到了阻碍,因为资金、运营能力或人才密度不足,训练数据就成了拦路虎。
第二个决定胜负的关键因素,就是创造出超级应用。单做模型的话,其实我们离美国最先进水平还是有距离的。但超级应用方面,我们有机会比美国做的更快,有机会更快地取得成功,这应该成为我们的重要目标。
凤凰网财经《凰家会客厅》:百川智能是自己做应用,还是会像Open AI 一样选择与微软这样的大公司进行合作?
王小川:其实,OpenAI做了三件事。它们不仅与微软展开合作,还开放了API供大家使用,同时自主开发了ChatGPT这样的超级应用。通过ChatGPT,大家开始熟悉OpenAI这个家公司,才看到它与微软的合作关系。我们的内心想法与此类似,我们会采取多种行动,但最关键的是,我们要像OpenAI一样,开发出ChatGPT这样的超级应用。
王小川:GPT-4一直在进步 中国大模型赶上要两三年
凤凰网财经《凰家会客厅》:今年四月,关于中国大模型与OpenAI ChatGPT差距的看法引发热议,现在时间过去了半年,再问您这个问题,我们与Open AI ChatGPT的差距有多大?
王小川:我认为说这个问题,不是要赶上OpenAI这家公司,而是要追赶ChatGPT 3.5这样的产品,这更为合理。在这框架下,我们之前的判断并没有出现严重的错误。虽然过去有一些公司声称他们只差了两点一个月,但整个行业仍然充满了悲观情绪。然而,现在我们看到,到了年底很多公司大概率能够赶上GPT 3.5。
值得注意的是,GPT 4一直在不断进步,最近它们推出语音和图像功能,引起了很大的轰动。从时间角度来看,我们认为可能需要两年或三年的时间,才能更接近GPT4目前的水平。这仍是一个相对长期的挑战。
王小川:与美国相比,中国大模型商业化更难
凤凰网财经《凰家会客厅》;随着首批大模型获批上线,百川智能也正式接受市场检验了。您觉得商业化比较困难的地方是在哪里?
王小川:与美国相比,在中国做商业化更难一些。美国的SaaS市场相对成熟因此,做出标准化产品通常能用到,而中国企业往往需要定制化解决方案,这会给技术公司增加了更大的负担。
美国ToB、ToC生意一半对一半,中国C端是压倒性优于B端,这与中国过去的生态环境有关。现在,各家都在做大模型,也在资本加持下做ToB生意,还是一张名牌。如何同质化竞争时,更多的是看谁成本更低,谁价格更低,这会影响公司的毛利收益。
更难的是,在美国市场,中国企业可能需要用美金支付算力,而收的通常是人民币,这会导致ROI(投资回报率)与美国相比存在较大差距。因此,商业化领域面临着三重压力,会使得B端生意很难做到足够大的规模,和美国一样对齐。
凤凰网财经《凰家会客厅》:外界说你还在搜索框架里做大模型,会介意这种评价吗?
王小川:不介意,但我会告诉大家,搜索对做大模型有很大的帮助,甚至在技术方面比做模型更全面。未来,大家将看到,我们在技术能力上的超越。毕竟在搜狗时期,我们除了搜索还有输入法,当时也做前瞻性技术,比如数字人、同声传译、多模态同声传译等。我们在算法、系统性技术和产品方面积累了近20年的经验,包括商业化和资本运作。
王小川:ToB领域不过度追求收入 研发比例70%-80%
凤凰网财经《凰家会客厅》:作为创业公司,百川智能如何平衡研发和商业化的投入?
王小川:我个人精力更多放在技术和ToC产品里,商业化交给我们的合伙人,原搜狗CMO洪涛先生来负责,这样大家有足够多的信任,他之前在商业技术和商业产品方面有着丰富的经验,尽管我们现在进入了新的领域。
平衡方面,第一是精力上的平衡,其次是公司设定目标和业绩要求上的平衡。
我们并不追求在ToB领域有足够大的GMV(总交易额),很多公司会出于各种原因,比如业绩和上市压力,追求最大化的收入,甚至可能赚得越多就亏得越多,已经上市的ToB AI公司也存在这种情况。对我们来说,更重要的是认真考虑自身的核心能力,不要为了追求收入过度投入精力,做团队不擅长的事情。我们更倾向于通过构建生态的方式来发展ToB领域,与更多的合作伙伴合作,这是我们的追求。
凤凰网财经《凰家会客厅》:方便透露下你们的研发比例吗?
王小川:现在非常高,可能在70-80%左右。
凤凰网财经《凰家会客厅》:最近有没有融资的计划,或者有投资人接触你?
王小川:百川前一轮融资大概两个月前已经完成了,最近应该会开启新的一轮。
投资人不看好大模型 王小川:优秀的公司都是冬天诞生的
凤凰网财经《凰家会客厅》:金沙江创投合伙人朱啸虎说,今年的ChatGPT大混战是个巨大的泡沫,通用大模型对创业公司是巨大的坑。你怎么看待他的观点?
王小川:其实这里面有很多争议。首先我认为,优秀的公司都是在冬天里诞生的,当投资者都对某个领域充满信心时,可能会出现泡沫,并不利于企业本身的成长。投资者的决策与企业的发展策略,不在完全同样的思考维度。
第二,对于一家企业来说,必须有能力建设基础的大型模型,而不是等模型成熟后再着手开发应用。因此,在中国当前的环境下,我们不能依赖美国,必须得自己有公司能顶上。在寒冬中能砥砺前行的公司,最后可能会做出巨大贡献,并能得到最大的回报。
凤凰网财经《凰家会客厅》:最后一个问题,您对百川智能有何愿景?
王小川:在AGI时代,我们有自己的信仰。语言被机器掌握后,AGI时代便已经到来,我认为这样的技术会逐渐变成一种生命。简言之,它将为人类提供更好的服务。所以,百川的目标是更加普惠,让大众获得世界知识或专业服务。从长远来看,在整个AGI的历史背景下,我们的努力将推动AGI的发展,让它繁荣或延续人类的文明。
*由于微信改版,公众号文章不再完整显示头条封面,一不小心,很容易错过我们的更新,甚至有可能再也看不到我们的推送了。

如果您还希望能经常看到我们的文章,建议给凤凰网财经添加一个“星标”哦。

   👇【 热门活动推荐 】👇

凤凰湾区财经论坛2023圆满结束,总阅读超11亿,32个实时热搜,6个全国热搜,4个同城热搜,论坛名字两次登榜,凤凰之星港股最佳上市公司评选头条热榜第10。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
王小川:中国大模型第一梯队不超过5家,我们会是其中之一AIGC日报丨雷军王小川牵手,小米大模型投资布局首次曝光;总算力达400P,武汉人工智能计算中心完成三期扩容周小川:关于数字货币,跟大家分享几点意见每日烧钱500万,OpenAI或已在破产边缘;B站回应莫言账号被封;王小川谈ChatGPT:程序员是自己的“掘墓人”丨邦早报微软深夜放大招:GPT-4 、DALL·E 3、GPTs免费用,自研大模型专用AI芯片45岁王小川,再造一个“搜狗”时间的湾 1王小川月更大模型:530亿参数但闭源,现场拷问室温超导相关问题英伟达推出大模型加速包;Meta将训练对标GPT-4的大模型;ChatGPT等成费水大户丨AIGC大事日报周小川:投资者面临的五个全球性挑战GPT turbo 看了没?!这真是大批失业人员在路上。《 柔板》Adagio免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!百川智能发布Baichuan2,王小川:中国企业用LLaMA2的时代过去了|甲子光年大模型无法替代码农!普林斯顿芝大惊人发现:GPT-4解决GitHub编程问题成功率为0李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型雷军王小川牵手,小米大模型投资布局首次曝光周小川:央行数字货币与支付系统数字化王小川第三个大模型发布!530亿参数、服务B端、文科更强OpenAI:GPT-5 目标人脑超级 AI;被曝抄袭 Meta 大模型,零一万物:将更新代码;华硕、福音战士联名主板印错英文你知道我在等你吗王小川称程序员是自己的“掘墓人”;OpenAI或已在破产边缘;B站回应莫言账号被封;碧桂园境内多只债券今日起停牌...对话王小川:决定大模型的胜负,钱很重要,人更重要扎克伯格公开怒斥马斯克炒作;被停职的王军传重回华为车BU;王小川称用电脑工作时间越长越会被ChatGPT取代丨雷峰早报ChatGPT最近被微软内部禁用!GPTs新bug:数据只要两句提示词就能套走ChatGPT发布一周年了,开源大模型都迎头赶上了吗?王小川谈中国大模型:年底将有3.5的能力,有机会跑在美国前面骑车,hill repeats,一周年现场直击OpenAI开发者大会:GPT-4 Turbo、用户自定义GPT、GPT商店,一切都是硅谷新王的架势周小川:支付系统与数字货币AI公司第四范式IPO上市;雷军王小川联手搞小米大模型;百度发布量子领域大模型;AI新技术90秒识别癌;苹果疯狂购买AI初创公司安大略湖的美丽早晨chat gpt 怎么上不去了? 彻底罢工了百川智能开源最新商用大模型!王小川:比LLaMA更香,下一枪打ChatGPT曝大基金三期将投3000亿!马斯克起诉中国公司侵害特斯拉技术秘密;王小川发布全新开源大模型! | AIoT情报王小川:坐在电脑前的工作大概率会被大模型取代,且坐的时间越长,越容易被取代王小川又发大模型,闭源或许离商业更近神秘的大杂院 (一) 红旗路17号
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。