字节大模型策略:自研加平台
这周,字节跳动旗下云计算服务火山引擎推出方舟大模型平台,引入了智谱 AI、MiniMax 等 7 家创业公司 / 研究机构的大模型,对外出售服务。相关公司和机构在火山引擎活动会场开设展台,创始人或联合创始人到场宣布未来会和火山引擎有更深入的合作。
为了吸引创业公司把模型放在火山引擎上,字节跳动把抖音等业务的空闲计算资源极速调度给火山引擎,并比同行更低的价格出售算力服务。火山引擎总裁谭待说中国大多数大模型公司都用火山引擎训练,在火山引擎上做推理也顺理成章。
今年初,为了抓住人工智能大模型的机会,字节跳动组建了至少三个团队开发大模型,找英伟达下单超 10 亿美元的 GPU,两年前卸任 CEO 的创始人张一鸣也开始看相关论文,与一些团队交流心得。
投入大量资源的字节跳动,目标不只是像 OpenAI 那样开发出大模型,还希望凭借丰富的 GPU 储备建立一个平台,作为中间商帮创业公司训练、出售大模型。
按照谭待的说法,他们将来还会引入更多大模型,字节跳动自研的大模型,除了应用到业务中,也会放在平台里对外销售。他说这么做基于两个判断:大模型市场不会出现少数几个大模型通吃的局面、企业会用多个模型开发应用或改造业务。
“超级大模型效果好,性价比不高,不是所有问题都需要超级模型”,谭待接受采访时说,再加上不同行业解决问题不同,模型训练数据也不一样,因此会有针对特定行业或者不同参数量(决定成本)的大模型存在。
大模型是中国云计算公司的机会已经形成行业共识。但它们抓机会的方式有差别——百度和阿里都是先自研大模型,然后对外提供服务。腾讯现在还没有发布自研模型,马化腾说 “不急于一时”,腾讯先做的是建立平台,吸引行业方向的大模型进驻,对外提供服务。(贺乾明)
更多互联网行业爆料,以及职场资讯,职业技能经验分享
关注我,给你好看
内容来源于网络,如有侵权,请联系删除。
【回复“健康指南”,Get《程序员健康指南》电子书】
【回复“1024”,Get 程序猿求职面试葵花宝典电子书】
微信又改版啦,如果不星标,很容易错过我们的推送!还请各位小伙伴动动您那将要升职的小手,点击右上角将将西二旗猿圈儿“设为星标”,及时接收每篇推送~
如果您能在觉得信息对周围的朋友有帮助的前提下,分享给他们也了解下,那就是对晚上还在加班的小编最大的鼓励了。
微信扫码关注该文公众号作者