Redian新闻
>
独家对话智谱:开源的大模型越来越多,但智谱选择慢慢来

独家对话智谱:开源的大模型越来越多,但智谱选择慢慢来

科技

“开源和商业不要混为一谈。”

作者丨张进 董子博

编辑丨陈彩娴

作为当前国内最受欢迎的开源大模型之一,智谱AI开源非常早,是国内大模型的开源先锋。

2022年,在国内还没有多少人相信大模型的时候,智谱就将其开发的高精度双语千亿模型GLM-130B进行了开源,ChatGPT爆火后又紧跟着开源了60亿参数 ChatGLM-6B,早于国内的大多数同行。

GLM-130B是智谱在2022年7月自主研发的千亿模型。当时,中国对大模型的理解还普遍较弱,智谱刚在 GitHub 上开源 GLM-130B 时,鲜少为人问津,过了一个月才勉强攒够 1000 颗星,“很多人不会用(大模型),问题也超级多”。

而智谱对开源的理解也比较领先,在7月训练出 GLM-130B后,8月就开始招人做开源运营,专门推广 GLM-130B 的开源生态。

GLM-130B开源的目的主要是为向外界普及大模型。但那时候,全国懂大模型的研究员加起来也不过百来人,他们当时是在大模型的低谷期去推广 GLM-130B,其艰难程度可见一斑。

ChatGPT 爆火后,大模型破圈,大家才开始关注到这位国产大模型尖子生:GLM-130B 在 GitHub 上的星数随之暴涨。今年三月,智谱发布了对话模型——ChatGLM,并重新训练了一个 60 亿参数的模型 ChatGLM-6B 并进行开源。智谱在大模型开源上很快领先。

近日,智谱公开了ChatGLM-6B系列模型在所有开源社区的开源数据:一代和二代达ChatGLM-6B模型达到1000万+下载,累计四周Hugging face趋势榜第一,GitHub 5w+stars。

上半年,智谱的 GLM 在开源上一骑绝尘,这主要归因于其早早布局的先发优势,又抓住了 3 月 ChatGPT 在国内爆火的关键时机进行开源。

但在 7 月,Llama 2 开源免费可商用,成为新的话题。彼时,智谱To B的路线已经渐成共识,关于智谱是否会开源其百亿模型的讨论也在圈内不胫而走,而智谱一直没有公布其下一步开源路线。

直到上个月27号,在2023中国计算机大会(CNCC)上,智谱推出了全自研的第三代基座大模型ChatGLM 3,性能大幅提升的同时,智谱AI CEO张鹏也在会上宣布开源了ChatGLM3-6B。

在ChatGLM 3 系列模型发布后,智谱成为了目前国内唯一一个对标OpenAI全模型产品线的公司:

对标OpenAI但不模仿,智谱选择用开源与闭源同时存在的打法来扩大自己的生态。

开源让智谱的 GLM 系列收获了大量关注,成为最早突围的大模型公司。随之变化的不仅有智谱的名声,还有智谱的估值:短短半年多时间,智谱的估值从10亿人民币飙升到140亿,成为中国第一家估值超过百亿的大模型创业公司。

近日,AI科技评论分别跟智谱AI CEO张鹏、智谱AI新晋首席生态官刘江聊了聊智谱对开源的布局和认知,以及他们对行业的一些认知。谈到开源对智谱、对整个行业的意义,张鹏承诺开源也是智谱未来会一直坚持的事情;以及他们对大模型To C、To B的看法。

还聊到开源对商业化的影响,现在大模型已经进入第二场——加速商业化时代到来,刘江认为开源其实还是为了建立生态,在新的技术背景下,和大家一起成长。

在Llama2抢占国外开源生态的同时,以智谱为首的一众基础大模型厂商不断在开源上发力、奉献,随着开源大模型越来越多,也为国内大模型开源生态注入源源不断的新生力量,促使国内大模型开源生态逐渐扩大、完善。

在日益激烈的竞争中,智谱正在通过各种方式不断完善自己的大模型生态,以此来做大整个产业,这也是智谱作为排头兵的责任,希望未来同行都能在不断做大的大模型盘子中找到自己的位置,而开源生态便是智谱生态中的重要一环。(关于智谱的成长,AI科技评论将推出《智谱狂飙的365天》,欢迎添加作者微信 zzjj752254 互通有无)

以下是AI科技评论与智谱AI CEO张鹏、智谱AI新晋首席生态官刘江的对话:



1

开源版本与商业版本的区别

AI科技评论:最近在忙什么?

张鹏:市场、客户。我现在的主要精力都放在To B市场和研发这两件事上。

AI科技评论:内部怎么看待开源?

张鹏:开源是对智谱很重要的事情,最新成果都是以开源的方式放出来,再有商业的版本。符合开源先行的理念。

AI科技评论:最初为什么会选择开源?

张鹏:开源其实就几个事情:第一、将我们的大模型开源出去,让大家知道智谱在做什么。第二、开源以后,可以让更多的人参与进大模型,用社区的方式、汇集大家的热情一起来推动大模型发展,这是开源最重要的一件事。

并不是说要用开源去赢得市场或者为了追求商业上的利益,要不然就不会选择开源了,这是智谱一直以来对开源的定位。

AI科技评论:如何看待开源与商业的关系?

张鹏:开源的目的和商业不要混为一谈,开源和商业化是整个生态版图里很重要的两块,这两块是有连接的,可以说开源充当着商业化的桥梁。

AI科技评论:开源模型越来越多,对智谱有哪些影响?

张鹏:开源的多了,大家就多了一些选择。可以不用商用的版本,客户直接用开源的版本就好了,但这件事有好有坏。

好处就是说可以低成本、快速地切入使用上大模型。但开源大模型在安全性、稳定性等方面很难得到充分的保障,这也是商业版本能够与开源版本并存的原因。商业版本可以提供更多的服务,更多的保障以及更多后续的服务,这些开源版本不一定有。

AI科技评论:对于开源和闭源大模型,用户应该如何选择?

张鹏:得看他的目的是什么。如果他只是想做一些实验和尝试,那选开源模型没问题,如果想要在上面做一些商业化应用,我觉得大部分人还是会选择商业化版本,因为有保障,能够提供更好的服务。

AI科技评论:未来大模型开源会一家独大吗?

张鹏:不会,未来开源一定会百花齐放。

AI科技评论:如何看待未来开源与闭源的竞争?

张鹏:两者天生不是矛盾对立的,也不是竞争的关系。对于整个大模型行业来说,两者其实是互为补充的。

开源是为了保持社区的繁荣和多样性,能够保证技术、产品能够源源不断补充新鲜的血液和产生新的变化,闭源的商业化的版本肯定是用来满足商业化的需求,商业化的需求是什么呢?是安全、低成本、高效、持续有价值的服务。所以两者的优势并不在同一个位置,就竞争来说,一定是同位的才会有竞争。

从这个角度来看,开源和闭源大模型两者是相互弥补的。



2

更聚焦于 To B 商业化

AI科技评论:行业里前段时间一直在讨论开源和闭源更适合To C还是To B,那智谱对大模型To C、To B的规划是怎样的?

张鹏:我们团队其实大部分的人都是To B经验更丰富一些,今年才加入了一个专门做C端产品的团队,我们整个的商业化重心都在To B上。

To C其实是一个很好地聚拢用户,达成所谓的“用户-数据”飞轮闭环的事情。但在中国,C端用户付费意愿一直不高。

AI科技评论:您觉得大模型领域,To C、To B哪条路更难走?

张鹏:对我们团队来说是To C,但也在慢慢补齐C端团队。

AI科技评论:C端产品主要就是智谱清言,内部还有没有ABC几条产品线同时在做?

张鹏:暂时没有,我们还是希望做的事情更聚焦于商业付费用户这块,而付费用户还是B端客户更多。To C目前还是以免费的方式在推动。

AI科技评论:To B客户主要聚焦哪些行业?

张鹏:现在我们会选择一些行业去做,这个主要还是看市场、看客户的情况。首先得看行业是否具备基本的条件,比如说像基础设施是否发展完备。其次大模型这件事的成本并不便宜,要看客户的预算投入是否支撑得了。

AI科技评论:如何获客?

张鹏:一种是直营,我们自己的销售团队、市场团队去获取的,第二种就是依赖生态,有我们的合作伙伴等,主要是这两种方式。

AI科技评论:做To B时碰到友商次数最多的是谁?

张鹏:没太注意,应该都碰到过,大厂、创业企业都碰到过。

AI科技评论:在To B、To C遇到过哪些挑战?

张鹏:两者遇到的挑战肯定不一样,但有一些共性的挑战。首先是技术上的挑战,无论如何现在大家前面都摆着GPT-4,不管是B端还是C端,大家都会有意无意去拿这个标尺去量你。

客户都不傻,他们也会自己测试,去看国内最好的大模型水平能达到什么程度,这也是智谱最重视的。

你可以想想,如果我们某一天真正能够做到GPT-4的水平,甚至赶超,那么现在面临的很多问题都能迎刃而解。甚至可以连商业模式都不用考虑,只提供API就行,目前大模型本质上就是技术上的挑战。

第二是商业模式上的挑战,这块我们做了很多的探索,也有自己的的想法、理念和突破。比如在To B,智谱给出了三种不同的商业落地解决方案,其实就是解决不同类型用户在不同成本条件下的落地情况,在这一点上我觉得我们智谱应该走的比较靠前。

AI科技评论:这三种解决方案是什么?

张鹏:我们一直在跟大家讲的,我们有三种大模型的使用方法。

第一种就是直接用我们的API就行了,但大家都一样,API都是一样的,能力也都是标准化的。

第二就是当标准化的版本还不能满足需求的时候,例如客户需要做一些模型侧的微调优化、数据隔离、专属的算力支持等等,智谱就会提供在线的云端私有化方案。

第三种就是完全私有化,这也是最具中国特色的B端解决方案。

AI科技评论:哪一种方案占比较多?

张鹏:没有一个占绝对优势,但我们判断未来市场主流会逐渐转向云端私有化。

AI科技评论:云端私有化,客户会有安全性的考虑吧?

张鹏:这就要看客户如何平衡了。我们也会充分考虑这件事,会从技术侧提出解决方案。

AI科技评论:商业化上遇到哪些挑战?

张鹏:目前最大的挑战是,我们经常要向大家回答大模型到底能干什么?能给大家创造什么样的价值?我觉得这是因为大家对大模型这件事的认知还没那么深。早期的时候确实很难想明白,像今年年初ChatGPT发布之前,我们跟投资人聊的最多的就是问怎么商业化?谁会买它?

3月ChatGPT彻底出圈后,大家不再问这些问题,觉得这些都不是问题,但现在大家又开始回过头去关注这些问题。

AI科技评论:现在为什么又开始问这些问题?

张鹏:GPT爆火一下子把天花板捅破了,大家就会觉得商业化落地这个事情就找到了一个巨大的出口,但它只是技术上的一个出口,但大家就会脑补,把期望值拉得特别高。

一旦整个行业热情势能爆发,但模型能力的发展并不能持续支撑这种势能时,大家就会冷静下来,重新思考。

AI科技评论:那智谱有答案了吗?

张鹏:我也不知道这个答案最终是什么。可能也没有人能给答案去评一个分,或者设定一个标准答案。但这一年我们一直在和我们的合作伙伴、行业用户一起去探索这件事的答案。由于我们对底层技术的全盘掌握和资源的深入掌握,认知会更深刻一些,也会更快地去落地一些解决方案。

AI科技评论:能举个例子说明吗?

张鹏:比如模型擅长什么,未来发展趋势,我们积累的算法这些技术优势在商业化方面的优势,以及在用户的特别苛刻的情况下智谱如何去配合模型,即配合系统、配合应用开发去满足用户苛刻的指标要求。这些事情我相信只有对核心技术掌握得特别清楚的团队,研究特别深的团队才能做到。

AI科技评论:智谱未来的重心?

张鹏:就两条腿走路,一条腿是继续追求技术上的领先,另一条腿是持续商业化落地。

AI科技评论:相对于其他创业公司,智谱最大的特色是什么?

张鹏:我觉得我们最大的特色就是从核心技术出发到整个商业化落地过程,我们都有自己的想法,是自主可控的核心技术,以生态为主的商业化落地的打法。技术上比较简单,我们就对标全球最好的,商业化落地的目标是把生态做的更大。

AI科技评论:以生态为主的商业化落地的打法怎么讲?

张鹏:这是我最近感触非常深的一件事。其实从商业化落地的角度来讲,很多时候大家看到的都是天花板以下的,假设市场就那么大,那我们要做的就是抢到更多份额,但在抢的过程中就会忽略掉蛋糕是不是可以做的更大,这样大家存活的空间就会更大,我们就在思考有没有可能实现共赢?

现在我们商业化的思路会偏向于生态共创,就是说我们不是杀到某个行业中去抢蛋糕,而是拿着我们的技术、工具、产品去赋能客户,去给客户创造价值,赋能我们的合作伙伴,希望在这个产业中我们的合作伙伴越来越多,最后跟合作伙伴一起把整个市场做大,把蛋糕做大,收益也就更大。

AI科技评论:具体到大模型行业怎么做呢?

张鹏:我们会告诉大家智谱的定位就是做基座大模型,那么对于上层应用,贴近用户侧的事情交给合作伙伴去做,如果大家愿意跟智谱一起合作,加入到智谱的生态中来用新的生态的方式去做,智谱很欢迎。

目的是希望用了智谱的大模型以后,能够一起改变了整个产业原来的生产流程或者生产的范式,就等于提升了整个产业的天花板,受益的是生态里面的所有人。

AI科技评论:什么时候有这种感悟的?

张鹏:也就今年的事儿,To B的前期,我们真正做这个事情的时候才发现确实是这样,大家考虑问题的方式确实不太一样。



3

未来的关键节点:

看谁的大模型能率先追上GPT4

今年10月智源副院长刘江宣布加入智谱担任智谱首席生态官,智谱的核心团队再添新面孔。

AI科技评论:首席生态官主要是做哪些事情?

刘江:所谓生态,就是一个产业需要很多角色,角色之间是互相支持、共同发展和繁荣的关系,缺少了某些角色,整个产业的发展就会有问题。

大模型赛道还处于早期,这时候寻找、培育和联合更多志同道合的伙伴,补短板,形成生态,大家共同把产业做大,是非常重要的。

AI科技评论:这里头涉及哪些方面?

刘江:目前比较重要的主要是几个方面。

首先,如何降低大模型的使用门槛,使它可以在更多行业和场景落地,除了大模型自身能力的不断增强,也需要工具链、中间层的支持。

由于大模型行业处于早期,市场还在培育阶段,技术变化又很快,应用层的创业者很不容易。而应用层的繁荣是产业发展至关重要的。

最后,我们也希望学术界有更多优秀的学者、学生参与到大模型的研发中来。智谱AI前段时间发起了扶持大模型创业公司的“Z计划”,也与中国计算机学会和中文信息学会联合设立了大模型方向的学术基金。

AI科技评论:您对开源怎么看?

刘江:开源其实发源于学术界,科学研究成果天生就是开源的,因为需要同行评审和复现,也有助于新科技的传播。智谱AI是清华大学科研成果转化而成立的,因此从一开始就拥抱开源,有很多知名的开源项目,比如国内最早开源的千亿大模型GLM-130B,还有ChatGLM-6B,各版本在GitHub的star数累计是所有开源大模型里非常靠前的。

开源是一种非常好的与技术同行交流和合作方式,能让更多人知道你、熟悉你,其中很多人进一步还能为项目本身做贡献。

开源也是一种技术实力的验证。没有一定的技术底气,你是不太敢开源的。

AI科技评论:您觉得开源面临哪些阻力?

刘江:在企业做开源,最常见的问题是基本功能开源了,大家该如何设计商业模式。

AI科技评论:对比一众大模型公司,智谱的优势是什么?

刘江:应该是产学研用深度融合,我们有用户量较大的C端应用,也有很强的大模型B端商业化交付能力。

AI科技评论:具体怎么讲?

刘江:大模型是一个科研属性非常强的技术产品,在某些关键技术点上,需要顶尖人才的灵光闪现。智谱源自高校科技成果转化,这方面是有独特优势的。

另外,智谱是国内最早开始做大模型的团队之一,技术沉淀比较厚,也较早地开始做相关的产品化和商业化交付,落地经验丰富。在今年ChatGPT大火之前,它已经有了一定的先发优势。再加上创业公司本身节奏比较快,比较灵活,这在快速发展的市场上也是很重要的优势。

AI科技评论:整个行业本质上还是比拼什么?

刘江:最后比拼的还是长期的技术实力,大家的目标都是AGI,看哪个团队最终可以把AGI的路跑通。其他都是为了这个目标创造条件。

本文作者长期跟踪大模型发展状况、背后的团队与AI领域故事,欢迎对AI发展,大模型感兴趣的行业内人士、读者添加作者微信(zzjj752254)和(william_dong),互通有无。

更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!


公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
谁又会想得到,鲁迅这民族魂,居然不match 这个民族了。 ——— 忒忒绿,你瞎想,我瞎答航空公司附加费用越来越多,引参议院调查57 青城山的邂逅对话智谱AI CEO 张鹏:让追赶OpenAI成为可能涂防晒霜的人越来越多,皮肤癌的发病率也越来越高要解决巴勒斯坦难民问题,第一步是解散巴勒斯坦难民署! 这个难民署不死,巴勒斯坦难民只会越来越多 ! 问题越来越大!在日本,被熊抓伤、咬死的人越来越多,徒步遇到熊应该怎么办?租房越来越难、租金越来越贵,月入9500欧在巴黎找房花了八个月!买房首付也越来越高随身行李越来越多,加拿大多家航空开启收费模式,专家:不是解决办法房市卖家越来越少 骗子越来越多?真正的有所成,只能是慢慢来UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源国剧出海拿奖越来越多,是美美镀金还是挖土跳坑?北京/杭州内推 | 阿里通义实验室对话智能团队招聘大语言模型方向算法专家LLM吞吐量提高2-4倍,模型越大效果越好!UC伯克利、斯坦福等开源高效内存管理机制PagedAttention文档字越多,模型越兴奋!KOSMOS-2.5:阅读「文本密集图像」的多模态大语言模型在快时代,他们却叫我“慢慢来”苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型对话智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞争已步入混战后期华东师大教授2023毕业致辞:我想说的话越来越多,我能说的话越来越少葡萄牙Nazaré 纳扎雷,月牙海滩【尘封档案】系列之184:妯娌命案56 青城山下找工作也要有运气的,慢慢来智谱AI推出新一代基座模型GLM-4,发起大模型开源基金中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生AI早知道|知网推出AI写作选题;智谱AI发布大模型GLM-4;华为开源GenImage数据集四面出击的智谱:这家最像OpenAI的中国公司在干什么陌上南京007 慢慢来是一种诚意|气象学硕士,咨询行业,开朗阳光模型越大,性能越好?苹果自回归视觉模型AIM:没错李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型未婚男青年越来越多,这地发文:奖1000元激励红娘帮找对象免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!美国“Junk Fees”越来越多,每年约支付$280亿隐藏杂费!加州推新法限制商家收取隐藏费用一场小感冒,孩子差点没了!这几年相似悲剧越来越多,背后主因出奇一致
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。