Redian新闻
>
王小川:GPT-4一直在进步 中国大模型赶上要两三年

王小川:GPT-4一直在进步 中国大模型赶上要两三年

财经

来源:凤凰网财经
作者:蒋浇


9月27日至28日,凤凰卫视、凤凰网联合多家机构举办的“凤凰湾区财经论坛2023”在香港、深圳同步举办。广邀海内外政府官员、专家学者、行业精英围绕大湾区建设、中国经济、全球经济等话题展开讨论。在论坛期间,凤凰网财经对百川智能创始人兼CEO王小川进行了深度采访,王小川分享了他对人工智能发展前景、商业化现状以及国内大模型竞赛格局的看法。
自ChatGPT掀起大模型浪潮以来,国内科技大厂一路狂奔,“百模大战”快速打响。在王小川看来,国内大模型“卷”比“迟”更好。“对于一个企业而言,必须有能力建设基础的大模型,而不是等模型成熟后再着手开发应用。在中国当前的环境下,我们不能依赖美国,必须得自己有公司能顶上。”
谈到国内大模型与ChatGPT的差距,王小川表示,GPT 4一直在不断进步,最近它们推出语音和图像功能。从时间角度来看,我们认为可能需要两年或三年的时间,才能更接近GPT4目前的水平。
王小川认为,国内大模型已过初赛阶段,未来可能会有少量公司加入市场,使百模大战变成十多家公司的竞争。他预计明年中市场格局将会定下来。
大模型“烧钱”,钱是否是决定胜负的最关键因素?王小川表示,资金实力、人才以及卓越的运营能力,都很关键。而更关键的因素是,创造出类似于ChatGPT的超级应用。
需要注意的是,留给大模型讲故事领域的很多,但实际落地场景少之又少。知名投资人朱啸虎认为,今年模型大混战是巨大的泡沫,通用大模型对创业公司没有意义。
王小川认为,就像OpenAI一样,优秀的公司都是在冬天里诞生的。当投资者都对某个领域充满信心时,可能会出现泡沫,并不利于企业本身的成长。投资者的决策与企业的发展策略,不在完全同样的思考维度。
在国内,大模型卷参数、卷应用。而在国外,AI模型竞争主要聚焦“开源”和“开源”两种生态。其中,闭源模型的代表为GPT-4,开源模型代表为Meta AI的LLaMA2模型。谈及开源与闭源之争,王小川称大模型在C端和B端都要落地,所以两者并不矛盾。
今年9月,百川智能发布Baichuan2-53B 闭源大模型,全面升级了Baichuan1-53B的各项能力。此外,还开放了Baichuan2-53B API接口,正式进军To B领域,开启商业化进程。而王小川透露,百川智能最近将会开启新一轮融资,后续还会有多款产品发布。
以下为对话全文:
王小川:有信心同时做好开源和闭源
凤凰网财经《凰家会客厅》:百川智能最近推出了Baichuan2开源大模型,引起广泛关注。主要是百川成立之初,您说要做“中国版的Open AI”,但为什么后来选择开源这个路线?
王小川:没有变化的,我们原计划在三季度发布500亿规模的闭源模型,并在四季度实现千亿规模的闭源模型。然而,在过程中,我们发现在中国的开源生态中,缺少足够商业化和有实力的公司来领军这一领域,而美国在这方面已有Meta AI了。
我们认为,开源对于中国的大规模生态会很有帮助,还能够展示百川智能的技术能力,所以优先发布了开源模型。百川智能在8月8日发布了500亿规模的闭源模型,这是原计划中的,只是增加了开源部分。
凤凰网财经《凰家会客厅》:开源和闭源是两种不同的技术路线,百川智能做开源模型有没有遇到挑战或者困难?
王小川:开源模型和闭源模型的客户群体有所不同,开源模型更多地满足了企业的个性化和本土化需求,通常适用于那些寻求定制解决方案的企业。相反,闭源模型主要针对市场化程度较高的小型企业。这意味着,我们需要为这两个不同的客户群体提供定制化服务,这会增加挺多的压力。
凤凰网财经《凰家会客厅》:国内很少有开源和闭源并行的大模型公司,它们商业化的路径也不一样。
王小川:做闭源模型对资源的消耗更大,技术难度也更高。现在国内企业都在做闭源模型,还没有一家公司能够持平或超越GPT 3.5的水平。我对百川的实力和潜力有更高的信心,认为开源模型也能同步做。如果其他公司不做开源模型,百川智能作为一家创业公司拥有更多的灵活性,可以选择开源和闭源并行。其他创业公司可能灵活够,但资源有限,只能做一件事,我们考虑了两个领域的发展。
王小川谈百模大战:明年决胜负,超级应用是胜负手
凤凰网财经《凰家会客厅》:今年6月,您接受采访时说美国的开源和闭源模型格局已定。那么我们现在国内所谓的“百模大战”,您觉得市场格局已定了吗?
王小川:国内来说,我觉得初赛已经完成了。8月31日,通过备案的8家大模型公司的产品获批上线,表明他们在技术实力和安全性方面得到了认可,可以发布更多产品。未来,可能还会有少量公司进入市场,使“百模大战”转变为10个模型公司的竞争。我们认为,到明年中,国内大模型市场格局会定下来。
凤凰网财经《凰家会客厅》:百模大战中决定胜负的关键因素是什么?
王小川:我觉得有两件事,一方面要有强大的资金实力、高密度的人才以及卓越的运营能力,以确保模型的出色表现。这是其中一个条件。很多公司在这方面都遇到了阻碍,因为资金、运营能力或人才密度不足,训练数据就成了拦路虎。
第二个决定胜负的关键因素,就是创造出超级应用。单做模型的话,其实我们离美国最先进水平还是有距离的。但超级应用方面,我们有机会比美国做的更快,有机会更快地取得成功,这应该成为我们的重要目标。
凤凰网财经《凰家会客厅》:百川智能是自己做应用,还是会像Open AI 一样选择与微软这样的大公司进行合作?
王小川:其实,OpenAI做了三件事。它们不仅与微软展开合作,还开放了API供大家使用,同时自主开发了ChatGPT这样的超级应用。通过ChatGPT,大家开始熟悉OpenAI这个家公司,才看到它与微软的合作关系。我们的内心想法与此类似,我们会采取多种行动,但最关键的是,我们要像OpenAI一样,开发出ChatGPT这样的超级应用。
王小川:GPT-4一直在进步 中国大模型赶上要两三年
凤凰网财经《凰家会客厅》:今年四月,关于中国大模型与OpenAI ChatGPT差距的看法引发热议,现在时间过去了半年,再问您这个问题,我们与Open AI ChatGPT的差距有多大?
王小川:我认为说这个问题,不是要赶上OpenAI这家公司,而是要追赶ChatGPT 3.5这样的产品,这更为合理。在这框架下,我们之前的判断并没有出现严重的错误。虽然过去有一些公司声称他们只差了两点一个月,但整个行业仍然充满了悲观情绪。然而,现在我们看到,到了年底很多公司大概率能够赶上GPT 3.5。
值得注意的是,GPT 4一直在不断进步,最近它们推出语音和图像功能,引起了很大的轰动。从时间角度来看,我们认为可能需要两年或三年的时间,才能更接近GPT4目前的水平。这仍是一个相对长期的挑战。
王小川:与美国相比,中国大模型商业化更难
凤凰网财经《凰家会客厅》;随着首批大模型获批上线,百川智能也正式接受市场检验了。您觉得商业化比较困难的地方是在哪里?
王小川:与美国相比,在中国做商业化更难一些。美国的SaaS市场相对成熟因此,做出标准化产品通常能用到,而中国企业往往需要定制化解决方案,这会给技术公司增加了更大的负担。
美国ToB、ToC生意一半对一半,中国C端是压倒性优于B端,这与中国过去的生态环境有关。现在,各家都在做大模型,也在资本加持下做ToB生意,还是一张名牌。如何同质化竞争时,更多的是看谁成本更低,谁价格更低,这会影响公司的毛利收益。
更难的是,在美国市场,中国企业可能需要用美金支付算力,而收的通常是人民币,这会导致ROI(投资回报率)与美国相比存在较大差距。因此,商业化领域面临着三重压力,会使得B端生意很难做到足够大的规模,和美国一样对齐。
凤凰网财经《凰家会客厅》:外界说你还在搜索框架里做大模型,会介意这种评价吗?
王小川:不介意,但我会告诉大家,搜索对做大模型有很大的帮助,甚至在技术方面比做模型更全面。未来,大家将看到,我们在技术能力上的超越。毕竟在搜狗时期,我们除了搜索还有输入法,当时也做前瞻性技术,比如数字人、同声传译、多模态同声传译等。我们在算法、系统性技术和产品方面积累了近20年的经验,包括商业化和资本运作。
王小川:ToB领域不过度追求收入 研发比例70%-80%
凤凰网财经《凰家会客厅》:作为创业公司,百川智能如何平衡研发和商业化的投入?
王小川:我个人精力更多放在技术和ToC产品里,商业化交给我们的合伙人,原搜狗CMO洪涛先生来负责,这样大家有足够多的信任,他之前在商业技术和商业产品方面有着丰富的经验,尽管我们现在进入了新的领域。
平衡方面,第一是精力上的平衡,其次是公司设定目标和业绩要求上的平衡。
我们并不追求在ToB领域有足够大的GMV(总交易额),很多公司会出于各种原因,比如业绩和上市压力,追求最大化的收入,甚至可能赚得越多就亏得越多,已经上市的ToB AI公司也存在这种情况。对我们来说,更重要的是认真考虑自身的核心能力,不要为了追求收入过度投入精力,做团队不擅长的事情。我们更倾向于通过构建生态的方式来发展ToB领域,与更多的合作伙伴合作,这是我们的追求。
凤凰网财经《凰家会客厅》:方便透露下你们的研发比例吗?
王小川:现在非常高,可能在70-80%左右。
凤凰网财经《凰家会客厅》:最近有没有融资的计划,或者有投资人接触你?
王小川:百川前一轮融资大概两个月前已经完成了,最近应该会开启新的一轮。
投资人不看好大模型 王小川:优秀的公司都是冬天诞生的
凤凰网财经《凰家会客厅》:金沙江创投合伙人朱啸虎说,今年的ChatGPT大混战是个巨大的泡沫,通用大模型对创业公司是巨大的坑。你怎么看待他的观点?
王小川:其实这里面有很多争议。首先我认为,优秀的公司都是在冬天里诞生的,当投资者都对某个领域充满信心时,可能会出现泡沫,并不利于企业本身的成长。投资者的决策与企业的发展策略,不在完全同样的思考维度。
第二,对于一家企业来说,必须有能力建设基础的大型模型,而不是等模型成熟后再着手开发应用。因此,在中国当前的环境下,我们不能依赖美国,必须得自己有公司能顶上。在寒冬中能砥砺前行的公司,最后可能会做出巨大贡献,并能得到最大的回报。
凤凰网财经《凰家会客厅》:最后一个问题,您对百川智能有何愿景?
王小川:在AGI时代,我们有自己的信仰。语言被机器掌握后,AGI时代便已经到来,我认为这样的技术会逐渐变成一种生命。简言之,它将为人类提供更好的服务。所以,百川的目标是更加普惠,让大众获得世界知识或专业服务。从长远来看,在整个AGI的历史背景下,我们的努力将推动AGI的发展,让它繁荣或延续人类的文明。
*由于微信改版,公众号文章不再完整显示头条封面,一不小心,很容易错过我们的更新,甚至有可能再也看不到我们的推送了。

如果您还希望能经常看到我们的文章,建议给凤凰网财经添加一个“星标”哦。

   👇【 热门活动推荐 】👇

凤凰湾区财经论坛2023圆满结束,总阅读超11亿,32个实时热搜,6个全国热搜,4个同城热搜,论坛名字两次登榜,凤凰之星港股最佳上市公司评选头条热榜第10。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
传雷军多次投资王小川 AI 团队;特斯拉新款 Model Y 上市,26.39 万元起;南极海冰出现创纪录低增长 | 极客早知道对话王小川:决定大模型的胜负,钱很重要,人更重要每日烧钱500万,OpenAI或已在破产边缘;B站回应莫言账号被封;王小川谈ChatGPT:程序员是自己的“掘墓人”丨邦早报曝大基金三期将投3000亿!马斯克起诉中国公司侵害特斯拉技术秘密;王小川发布全新开源大模型! | AIoT情报深创投,刚投了王小川安大略湖的美丽早晨现场直击OpenAI开发者大会:GPT-4 Turbo、用户自定义GPT、GPT商店,一切都是硅谷新王的架势AI公司第四范式IPO上市;雷军王小川联手搞小米大模型;百度发布量子领域大模型;AI新技术90秒识别癌;苹果疯狂购买AI初创公司周小川:支付系统与数字货币45岁王小川,再造一个“搜狗”周小川:投资者面临的五个全球性挑战时间的湾 1王小川:中国大模型第一梯队不超过5家,我们会是其中之一百度开大会,王小川伺机宣布新融资雷军王小川牵手,小米大模型投资布局首次曝光百川智能发布Baichuan2,王小川:中国企业用LLaMA2的时代过去了|甲子光年英伟达推出大模型加速包;Meta将训练对标GPT-4的大模型;ChatGPT等成费水大户丨AIGC大事日报王小川谈中国大模型:年底将有3.5的能力,有机会跑在美国前面你知道我在等你吗周小川:关于数字货币,跟大家分享几点意见百川智能开源最新商用大模型!王小川:比LLaMA更香,下一枪打ChatGPT王小川称程序员是自己的“掘墓人”;OpenAI或已在破产边缘;B站回应莫言账号被封;碧桂园境内多只债券今日起停牌...GPT turbo 看了没?!这真是大批失业人员在路上。ChatGPT发布一周年了,开源大模型都迎头赶上了吗?扎克伯格公开怒斥马斯克炒作;被停职的王军传重回华为车BU;王小川称用电脑工作时间越长越会被ChatGPT取代丨雷峰早报chat gpt 怎么上不去了? 彻底罢工了骑车,hill repeats,一周年王小川:坐在电脑前的工作大概率会被大模型取代,且坐的时间越长,越容易被取代王小川又发大模型,闭源或许离商业更近王小川第三个大模型发布!530亿参数、服务B端、文科更强周小川:央行数字货币与支付系统数字化微软深夜放大招:GPT-4 、DALL·E 3、GPTs免费用,自研大模型专用AI芯片独家|深创投,刚投了王小川王小川月更大模型:530亿参数但闭源,现场拷问室温超导相关问题《 柔板》Adagio神秘的大杂院 (一) 红旗路17号ChatGPT最近被微软内部禁用!GPTs新bug:数据只要两句提示词就能套走AIGC日报丨雷军王小川牵手,小米大模型投资布局首次曝光;总算力达400P,武汉人工智能计算中心完成三期扩容
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。