Redian新闻
>
王小川又发大模型,闭源或许离商业更近

王小川又发大模型,闭源或许离商业更近

科技

53B 大模型,是王小川做大模型的第三步,也或成百川智能商业化的第一步。
作者丨董子博

编辑丨林觉民

8月8日立秋,北京总算短暂逃离了持续近2个月的酷暑,气温舒适。在海淀的塞尔大厦,身着黑色T恤的王小川姗姗来迟。

自百川智能官宣创业,已经过了近4个月的时间。这中间,Baichuan-7B、Baichuan-13B 相继开源,几乎2个月一个版本,进展神速。

而他们的第三个大模型——Baichuan 53B(下简称“53B”),也在今天加入了他们的大模型产品矩阵。

在过去的时间里,7B、13B 两个大模型不仅在榜单上跑分不错,而且也被不少公司拿来使用。王小川说,据百川统计,已经有150家以上的公司申请使用他们的开源模型,并且收获的评价也不错。

而此次的 53B 大模型,也集成了他们在前两次探索中获得的经验。

一方面,高质量、多样化、有层次的预训练数据,是百川做大模型训练的基础;

另一方面,有搜狗的基因做支持,百川也将搜索能力和大模型能力结合到一起,以搜索增强对抗幻觉和时效性不足的大模型原生问题——在经过搜索技术的赋能,对用户的意图完成理解、优化之后,来完成用户prompt的调优;

搜索增强技术路径图

而同时,53B 的另一个“有力兵器”是它的对齐调整,多目标优化、多 RM 融合等技术,让 53B 的有用性和可靠性,都获得了大幅度的增强。

而在技术之外,最引人关心的,莫过于百川的开源和闭源之辩。一改过去两款大模型的开源,53B 选择闭源,百川智能有着怎样技术和商业上的考量?

对于开源和闭源的战略,外界有解读:开源是为闭源服务的前置手段,通过免费的服务先积累用户和口碑,再用闭源的、能力更强的模型收取费用,完成商业上的营收。

而近期,曾主管搜狗运营的洪涛回到王小川麾下,也让人对百川未来的商业化路径浮想联翩。

王小川则表示,53B 的闭源,最主要的原因还是模型规模大、部署成本高,相比 7B、13B 规模的模型,体量更大,更适合闭源做简单接口,客户使用起来也会更方便。

而之所以选择在今天做闭源、做商业化,王小川表示,当下的机会很多,开源只是中间的一件事,未来在 To B 服务、To C 产品上,百川不会只专注于一个小赛道。

“我们对自己团队过往的能力也好、经验也好,是有信心的,能同时打好几场仗。”谈到这里,王小川胸有成竹,意气飞扬。

在4月,王小川曾公开表示,在今年 Q3,百川会发布一款参数量级在500亿以上的大模型产品。

8月上旬,Q3尚未过半,百川就完成了他们给自己定下的“KPI”。这不由得让人浮想联翩——4月提到的,“今年年底,对标ChatGPT3.5的模型”,是否也可以如期兑现?

战略执行按部就班,融资也相当顺利。据王小川本人披露,百川已经完成了第二轮融资,估值在5亿美金左右,正稳步向着大模型独角兽的“小目标”迈进。

会后,王小川和AI科技评论进行了深度的对话,讲了半年来他的创业心路历程、如何招兵买马组建团队、以及对未来AGI事业的前沿认知,文章将不日发布,欢迎关注。

也欢迎读者添加作者微信:william_dong,交流认知,互通有无。

更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!


公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
​​李嘉诚将投资千亿在欧洲建5G网络;王小川发布开源中英文大模型;​钟薛高回应21家分公司全部注销;故宫禁止未经允许进行商业拍摄王小川创办的百川智能发布Baichuan-13B 参数量达130亿M3版MacBook Pro或明年发布/王小川回应大模型套壳争议/微博新增VVIP会员王小川、李彦宏隔空交手二十年王小川第三个大模型发布!530亿参数、服务B端、文科更强王小川:GPT-4一直在进步 中国大模型赶上要两三年胜利大会师 – 除了激动还是激动王小川大模型25天再升级!13B版本开源免费可商用,3090即可部署如何更好地蒸馏ChatGPT模型能力:Lion闭源大型语言模型的对抗性蒸馏模型原理及实验工作介绍雷军王小川牵手,小米大模型投资布局首次曝光百川智能王小川:大模型创业100天,我确认找到了属于我的「无人区」坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」百川智能开源最新商用大模型!王小川:比LLaMA更香,下一枪打ChatGPT杨立昆:生成式AI还不如狗聪明;谷歌建议员工不要将机密内容输入Bard;王小川公司发布开源大模型| AI一周资讯杂感王小川:坐在电脑前的工作大概率会被大模型取代,且坐的时间越长,越容易被取代王小川月更大模型:530亿参数但闭源,现场拷问室温超导相关问题王小川大模型首亮相!70亿参数霸榜,清北抢先用王小川称程序员是自己的“掘墓人”;OpenAI或已在破产边缘;B站回应莫言账号被封;碧桂园境内多只债券今日起停牌...王小川的大模型打造秘籍首次曝光:五步走,两个月炼成普京的秘密(2)——化学武器和间谍(1)过往风景素描: 闲暇品味若芳茶对话王小川:决定大模型的胜负,钱很重要,人更重要王小川大模型2个月交卷!开源7B规模里中文最强,GitHub揽星2.2k王小川大模型首亮相!70亿参数霸榜,清北抢先用|独家专访每日烧钱500万,OpenAI或已在破产边缘;B站回应莫言账号被封;王小川谈ChatGPT:程序员是自己的“掘墓人”丨邦早报华为将推盘古数字人大模型;搜狗原CMO加盟王小川公司;首个线性注意力Transformer大模型推出丨AIGC大事日报45岁王小川,再造一个“搜狗”AIGC日报丨雷军王小川牵手,小米大模型投资布局首次曝光;总算力达400P,武汉人工智能计算中心完成三期扩容曝大基金三期将投3000亿!马斯克起诉中国公司侵害特斯拉技术秘密;王小川发布全新开源大模型! | AIoT情报扎克伯格公开怒斥马斯克炒作;被停职的王军传重回华为车BU;王小川称用电脑工作时间越长越会被ChatGPT取代丨雷峰早报搜狗三剑客齐聚「百川智能」!搜狗原CMO洪涛下周入职王小川新公司前搜狗CMO洪涛入职百川智能 与王小川茹立云再度联手创业里斯本超时市场(Time Out Market),热闹非凡王小川谈中国大模型:年底将有3.5的能力,有机会跑在美国前面
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。