Redian新闻
>
对话值得买科技 CTO 王云峰:大模型最大的掣肘不是算力、经费或场景,而是缺人丨AGI 十人谈

对话值得买科技 CTO 王云峰:大模型最大的掣肘不是算力、经费或场景,而是缺人丨AGI 十人谈

科技
钱可以解决算力,但很难解决人才短缺的问题
作者丨何思思
编辑丨林觉民
从一个博客到一家集团型公司,值得买科技已走过了13年的时间。
2010年,秉持着为中国消费者推荐优质商品和服务的初心,值得买科技创始人、董事长隋国栋搭建了自己的个人博客,在博客快速发展的过程中,隋国栋深刻地感受到仅凭一己之力很难满足消费者的差异化需求,因此隋国栋选择扩张团队,“什么值得买”也由一个博客发展成一个平台,并培养了一批专业的消费编辑团队。
而后面对内容重塑消费产业格局的大背景,值得买科技在保障“什么值得买”主营业务正常运行的情况下,开始探索多种创新业务,最终形成了“消费内容+营销服务+消费数据”的多元业务格局,由单一业务成为了拥有多元业务的科技集团。
回首过往13年,值得买科技的业务在不断扩大,但不变的是其使命和愿景,即让每一次消费产生幸福感,和成为全球最懂消费的科技公司,创造消费信息自由流动的美好世界。
如今,进入大模型时代,一向以“科技驱动消费进步”作为slogan的值得买科技,也选择积极拥抱这项新技术。其实谈到AI,早在2017年其主营业务“什么值得买”就开始尝试通过算法和机器的方式生产内容,2022年,此类内容的占比已高达20.31%。
“值得买有消费内容、营销服务、消费数据三大核心业务,对我们而言,大模型对业务的挑战是很大的。现在业界有一个说法:未来互联网上百分之90%的内容是由AI生成的。”谈到大模型给公司业务带来的冲击时,值得买科技CTO王云峰如是说。
AI科技评论了解到,为了应对此次冲击,值得买今年年初从原来的各Team中抽调出一部分人,成立了AI Lab团队,并率先开展了内容应用层面的研究。据王云峰透露,值得买在文、图、短视频、直播领域都在推进产品的开发,相应的应用也会陆续开始面对消费者和客户。
谈及为何这么做,王云峰表示,一项新技术的出现会伴有大量的不确定性因素,这个不确定性是需要通过预研的方式消弭的,也就是说一个新东西到来,你不知道谁比谁的好,也不知道最终应用的路径是什么样的,这时就需要有专门的资源做对应的研究和尝试。
据王云峰介绍,在模型训练层,值得买已经在60亿参数的模型基座上完成了全参数的Post-Training,正在130亿参数的模型基座上开展全参数的训练;应用层面,则主要围绕多模态的内容识别和生成、智能的用户画像和推荐、智能的营销策略三个方向开展研究。
“其实对于大模型而言,相比算力、经费和场景,更缺的是人才”王云峰补充道。
对此,AI科技评论还了解到,为了解决人才短缺的问题,除了抽调原Team内的成员外,值得买还积极和国内高等院校和创业公司展开合作。
以下是AI科技评论和王云峰的对话:



1

AI概念早就有,大模型不是万能的,

还不能解决垂类问题
AI科技评论:大模型今年一下就在国内火了?速度还是很惊人的。
王云峰:其实AI不是一个新概念了,AI技术的发展已经有60多年,GPT也可以叫做生成式AI——AIGC,算是一个相对新的概念。
AI科技评论:那GPT和之前的AI有什么不同?
王云峰:之前AI的功能是classification的概念更多一点,当然它也是AI的一部分,但更倾向于识别领域,新的AI技术其实更多的是生成式AI。
例如之前的MGC,即机器生成内容,机器生成也会用到大量的AI技术,主要是做前期的一些处理,但是它的生成过程不是靠AI,而是靠机器基于某些规则的方式来做。
去年年底国外的生成式AI确实给人们带来了一个很惊艳的感觉。最早的生成式AI走了两条不同的技术路线,以GPT为代表的这条技术线,去年年底真正“涌现”了出来。
AI科技评论:其实现在人们对大模型还是非常看好的?
王云峰:对,现在大家更多的是把它当成一个很惊艳的东西看,认为它有无限的可能。实际上,还没有完全弄清这个东西最终的应用限制会在哪里。大模型通用的学习和适应能力还是很强的。
但是它也有一定的局限,比如我们和GPT或国内模型对话时,举个例子,比如问怎么挑选茶叶的问题,它只会泛泛的告诉你要注意什么?很多时候,输出的内容并没有能够真正帮助消费者去决策。
现实生活中,和卖茶叶的导购对话他通常会很细致的回答你的问题,也会通过和你的对话来了解你的需求。但模型本身的特性,就意味着这个模型原始的语料是什么样的,学到的知识就是什么样的。这些知识它没有学过,所以有时候在某些领域的效果并不是很理想。
现在各种公众号喜欢举例的都是一些富有创造力、想象力的领域的东西,是那种说出来后没有所谓对错,看上去很新奇的内容,所以大模型可以很好地发挥,一旦落到非常垂直的领域,它的表现并不像其他领域那么理想。
AI科技评论:为什么解决不了实际问题?毕竟很多人都认为大模型是万能的。
王云峰:单纯的用现有的模型来构建应用,就是既没有微调,也没有自己做进一步的预训练,用的都是别人的东西,但是因为它的参数很大,所以看上去很智能。
问题是某些垂直领域的原始知识,现有的大模型根本覆盖不到,所以没办法做很成型的应用,比如问一些行业的问题,可能输出的答案看着不错,但实际上会有错误。如果问它一些原始语料中不能覆盖的,且相对聚焦的问题,它的效果远没有预期的好。
AI科技评论:那应该怎么解决?
王云峰:一种是在别家大模型的基础上做进一步的训练,相当于把自己服务的行业内的知识灌进去再做训练。我们知道大模型最开始是通过预训练的方式学习知识,然后通过微调的方式让它产生某种风格。这是一种做法。



2

蒸馏法训练垂类模型,

应用层三条线齐头并进
AI科技评论:大模型火了之后,值得买内部有哪些调整?
王云峰:我们成立了AI lab,其实成立AI lab 的核心原因在于,我们知道一项新技术的出现会伴有大量的不确定性因素,这个不确定性是需要通过预研的方式消弭。意思是一个新东西到来,你不知道谁比谁的好,也不知道这个东西最终应用的路径是什么样的,这时就需要有专门的资源做对应的研究。
所以今年年初我们从原来各team 里抽调出一部分人,成立了AI Lab这个新组织,目的是隔离资源,针对当下的新技术做预研,给出一个可使用的路径。
AI科技评论:对大模型对业务的冲击,值得买有哪些应对措施?
王云峰:现在业界有一个说法:未来互联网上百分之90%的内容是由AI生成的。所以我们必须提前做好应对。其实从今年年初时候,我们就开始研究生成式 AI 方面的应用了。最开始是用Prompt的方式来用,就是我不对模型本身做额外训练,我只是告诉它用某种方式帮我总结这段话的意思,这段文字看上去像是人写的。在这种情况下,对原来的内容生产方式就有一个很大的冲击了,所以我们很早就在内容生产方面开始尝试了。
但是我们做的更深入一点,我们训练自己的模型。除了语言模型,有一些“多模态”的工作,比如直播的支持、短视频的生成工作,我们也都在做。应对措施就是拥抱它,赶紧投入力量来做,脚踏实地地做。
AI科技评论:具体有哪几个项目?
王云峰:对于“多模态”的话,一是图生图的模型,包括图片批量生成,比如换背景图,换主图,其实都可以用自动生成的方式;我们内部搭了一个服务已经开始在用了。以及文生图的模型也在实际应用。
二是短视频脚本的生成。短视频脚本生成比较容易,然后就是短视频的自动生成;这个项目的难度要大一些,耗时也会更长。
三是直播数字人,月底数字人直播应该会先发一个内部的Demo。
AI科技评论:为什么数字人直播难度大?对模型的要求高?
王云峰:数字人直播包含两个技术,一是形象,二是驱动。形象技术已经非常成熟了,难点在驱动方面。
在设计直播数字人时,你不可能让主播单纯地不停地说同一件事,直播间是要互动的,比如有人问你玉米口感怎么样?为什么这么贵?你是要回答问题的,有时候还有在直播间聊天的,你还要把他拉回来,这就要靠大脑驱动完成,这个大脑是要专门训练的。你不仅要了解产品,背后还要有一个对应的知识库做支撑,这个模型就是主播的大脑。
所以形象加上背后的大脑才是完整的数字人直播。形象基本是靠成熟的技术,也有很多供应商,后面的大脑就要自己训练了。
AI科技评论:所以这三部分是在同时做?还是分步做?
王云峰:我们在同步做,因为每个产品的难度不一样,所以推出的顺序也不太一样。现在有些东西已经开始逐步露出了,下一步可能会把某些能力包装成独立的产品。
过段时间会放开评论区对话机器人,到时候可以和机器人直接对话,但是也需要灌大量的数据做训练,数据越多,效果就越好。
AI科技评论:除应用层外,大模型方面有什么成果了吗?
王云峰:我们通过灌自己的数据、历史长文、历史攻略等做对应的训练动作,这个训练周期会比较长。因为是垂直领域,所以我们采用了蒸馏的方法。
AI科技评论:选的哪家的大模型?
王云峰:像垂类模型的训练我们尝试了不少的方案,但在实际过程中发现基础模型对结果的影响确实很大。
国内用的是GLM6B开源的60亿参数的模型,冻结了一些层,训练出了自己的一个模型,用于垂类消费内容的生产。现在正在做的是基于百川发布的13B的模型做训练。
AI科技评论:至于选哪家大模型,有评测标准吗?
王云峰:我们有一套标准的测试集,根据测试结果打分,然后再看整体分数。
AI科技评论:没有尝试国外的模型吗?毕竟现在国外的水平要高于国内的。
王云峰:国内外的都用过,包括Meta开源的Llama系列都尝试过。但最终还是选了国内的,因为我们觉得中文支持这件事是非常重要的。
AI科技评论:具体训练出来的参数量有多大?
王云峰:目前已经训练出了一个60亿参数的模型,正在训练130亿参数的模型。



3

算力可以用钱解决,

人才是最大的难点
AI科技评论:做模型训练包括应用层产品的研发,消耗的算力大吗?
王云峰:如果推理的话,类似3090的卡就能跑起来,训练的话,对卡的要求就比较高了。
AI科技评论:算力是难点吗?好像现在大家都挺乐观的?
王云峰:对,我觉得算力问题会被逐步解决,但需要时间。其实算力分为两部分:一是训练,二是推理。推理用低端的卡能跑的动就行,训练的算力要求就很高了,但是从目前来看,我们自己储备的训练的算力还是比较理想的。
AI科技评论:解决算力主要看芯片吗?还是?
王云峰:我觉得最大的问题不在于芯片,而是生态问题。从长远看,算力问题一定会被解决,只是在目前它仍旧是个问题。但是生态问题就比较复杂,比如英伟达的A100或者H100,它本身就有一套自己的开发包cuda,有完整的生态。国内虽然也有卡,但问题在于没有构建起完整的生态体系。
比如现在要在国内的卡上跑模型,是要做很多的所谓的“算子”的适配的。也就是说,想在N卡之外的卡上跑是要迁移的,且迁移成本还挺高的。我们现在也在和国内的合作伙伴,一起做国内的卡的适配。
AI科技评论:对值得买来说算力消耗的不大,那主要困难是什么?
王云峰:主要是人力不够,为了弥齐人才短板,我们除了从各Team抽调外,还和大量的外部机构合作,比如和人民大学的高瓴人工智能学院一起在做多模态的工作。
因为现在大部分人不仅选择文字交互,还可能用图片、视频等交互方式。像消费领域,有很多内容也是用视频这样的方式来承载的,所以我们选择和人大合作,预计9月份第一版的模型结果会出来。
所以我们是通过两种途径补足AI Lab的能力,一是从各Team里抽调,二是和外部的创业公司或者高校实验室合作。
AI科技评论:所以最大的挑战是人才?
王云峰:对,算力是能用钱解决的,但是人才问题不是用钱就能解决的了的。过了算力这关你会发现有算力也没用,因为想要拿到一个好的结果,这个过程应该怎么训练,用什么样的方式训练是需要人去选择的。
大模型的应用有几种方式:一是纯粹的Prompt的方式,二是在大模型基础上做训练,三是把大模型作为框架中的一部分,再加上自己的逻辑框架。
其实是有一些框架的,比如把大模型作为前面的交互入口,后面挂一个知识库,这个知识库不是纯粹的像MySQL一样的知识库,它可能是一个知识图谱、一个向量数据库、一个基于embedding 的数据等等。
那你究竟用什么方式、怎么串联起来,才能克服幻觉的问题拿到好的结果,这些都不是算力能解决的问题,是需要人去做选择的。
比如我们做的对话机器人就有很多选择:第一种,直接和大模型对话,通过提示的方式,把问题给到大模型,但是这个过程中,你会发现大模型的输出能力是有限的,每秒钟也只能输出几十个TOKEN ,一次交互下来 30 秒出去了,用户肯定接受不了;
第二种,比如现在有一些对话框架的,就实际上它自身是一个框架,再外挂一个模型做识别,以保证交互的效率;
第三种,把模型本身做入口,然后做一个插件,通过这个插件返回外部的数据库拿到事实后再进行内容输出。
究竟哪种方式可以,哪种是未来的趋势和方向是需要思考和判断的。
AI科技评论:也就是说大家还在试验阶段,还不清楚哪种方式更适合?
王云峰:对,这确实是个问题,或者说不同的场景下,用什么方式还没有范式。比如我们和合作伙伴沟通,有的建议先搭好大模型的框架,然后做插件,这样就可以利用大模型泛化的能力解决问题。但也有不同的意见,究竟哪个更好,现在谁也不知道,需要根据自己的实际情况判断,所以最后看的还是人才。



4

大模型市场越来越繁荣,

是好事也是坏事

AI科技评论:从年初到现在对大模型(GPT)有没有改观?
王云峰:能力越来越强,进化速度越来越快了。主要是工程能力和智能能力变化的非常快,每天都有新的东西出现,但是我觉得还在发展中,还没有完全定型。
AI科技评论:随着大模型的火热,国内外做大模型的越来越多,您怎么看?
王云峰:是好事也是坏事,好事是有很多选择,坏事是选择实在太多了。
AI科技评论:为什么这么说?
王云峰:我觉得国内大模型还处在早期阶段,还没有形成固定的格局。从服务能力上看,国内的模型,当下和ChatGPT还是有很大差距的,这是大家都承认且没办法的事情。
另外,因为开源模型可以直接用,所以开源模型已经霸屏了,都在抢宣传位。
AI科技评论:那国内的您比较看好哪家?
王云峰:我可能比较看好一些创业型公司,我会觉得大厂之外的大模型公司可能更纯粹一些,机会也更多一些,包袱比较小,完全可以用创新的方式去做,比如百川。其次是高校,中国高校发展的比较早,确实抢占了先机,虽然目前偏重研究而不是工程,但我觉得其实只要适当地做到研究成果工程化,就未来可期了,比如智谱。
AI科技评论:大厂中有没有比较看好的,或者是有潜力的?
王云峰:我比较看好华为,华为其实属于大模型另外一个赛道里的玩家,从一定程度上讲,华为是有大模型积累的,它既有算力、有硬件、有软件,也有自己的模型,它完全可以给行业做深度服务,所以我觉得华为比较厉害。



5

垂类模型比拼的是

算力、人才和行业Know-How
AI科技评论:通用模型和垂类模型哪个更容易商业化推广?
王云峰:我觉得垂类模型可能场景更聚焦一点。各有自己的市场。
但是垂类模型的难度并不比通用模型小,因为垂类领域的要求更高。
AI科技评论:难在哪里?做垂类模型比拼的是什么?
王云峰:比拼的是大家对行业的理解,如果你正常设计一个直播数字人的话,如果没有行业的理解,很有可能是一个端庄,颜值很高,说话语气很舒缓、手部有一些简单的动作的产品,事实上直播完全不是这样的。
所以你必须知道大家平均在直播间停留的时间有多长、必须知道直播有忙时有闲时、必须知道什么时候全身出镜什么时候半身出镜、必须知道直播间里的人的分工和配比,背后的模型,也就是大脑的训练是要结合主播的语气、主播的风格,甚至要跟这个行业相匹配的方式做对应的串联,这样才能保证大家看到的是一个真实的东西。否则就会设计出来一个傻傻的主播。
很多专业领域也一样,要知道哪个环节是容错率高的,哪个环节是容错率低的,这样才能保证是一个好的应用,否则就是一个泛泛的、拉平的东西。
AI科技评论:所以咱们的产品刚设计出来也是这样的?
王云峰:对,我们的产品最初设计出来就是这样的(笑),极傻。
所以我认为,大模型本身需要人才,但如果做垂类的话,除了模型本身外,还要了解行业Know-How,否则是做不出来的。
AI科技评论:听下来感觉做一个应用并不比做大模型简单?
王云峰:其实是这样的,大模型也是经过很长时间才突破到现在这个程度的,突破之前没有人知道它是谁。我们观察发现现在国内还没有一个特别成功的应用出现。为什么?中国缺聪明人吗?不缺。中国缺场景吗?不缺。中国缺钱吗?不缺。那是为什么?只能说明一件事,大模型的应用也的确有难度。
本文作者:何思思,微信ericahss1224。长期关注国内外各企业在AIGC、大模型及应用层等方面的动向,欢迎添加作者微信互相交流、互通有无。

更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!


公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
对孩子影响最大的,不是家境,不是智商,而是这4件事CTR提升113%,ROI翻三倍,月曝光200W...万相台无界版助力商家万千场景,一招制胜一个家庭最大的悲哀:不是困于贫穷,而是毁于期待真正能给自己撑腰的,不是家人,不是贵人,不是朋友,而是…被污染的美国自由女神早鸟报|淘宝更改销量展示规则;字节跳动回应AI对话产品豆包上线;快手公布自研大模型最新进展...图灵奖得主姚期智:大模型有无限的产业应用前景,能影响各个行业实测商汤医疗健康大模型「大医」:紧贴实际场景,可塑性超强,还能自定义提示工程!长寿最大的秘诀,不是运动,不是药补,而是这一个字专访恒生电子董事长刘曙峰:大模型金融应用的“皇冠”是投研三访英国湖区(3):以诗结友、跑步赏景笑谈邂逅(15)热情厚道敬业的张良谟老师李玫瑾:对孩子影响最大的,不是家境,不是智商,而是这4件事对话原钉钉 VP 张斯成:生成式 AI,能否避免「中式 SaaS 」的陷阱?丨AGI 十人谈嫉妒很可能是没有底线的内向不是缺陷,而是一种天赋!图灵奖得主的20条判断:人工智能最大的威胁不是超越人类,而是人类过分依赖低级的人谈能力,高级的人谈能量!(深度好文)对话潞晨科技尤洋:AI 大模型没有知识产权,只有开源才能走得更远丨AGI 十人谈深度对话长城汽车杨继峰:大模型不是车企的杀手锏|甲子光年度小满CTO许冬亮:金融行业是大模型落地应用的高潜场景,但有三大挑战需解决胡润G500专访 | 汇丰银行王云峰:搭建新丝绸之路金融桥梁“色斑”最怕什么?不是柠檬,也不是生姜,更不是医美,而是……腾讯:产业场景是大模型最佳练兵场OpenAI 是缺钱还是缺后劲?360 周鸿祎:大模型不是「原子弹」,而是「AK47」生成式AI投资反思:幻想最多的可能不是大模型,而是AIGC中国目前最大的难题不是美帝,也不是台湾,而是......夫妻相处,女人最大的底气不是男人的爱,而是……幼师王云已被执行死刑!投毒25名幼儿,致1人死亡亿铸科技熊大鹏:大模型时代,AI大算力芯片急需破除“存储墙”丨GACS 2023对话澜码周健:大模型不是万能的,也不会弯道超车丨AGI 十人谈CIPS ATT | 一线国内大模型研究学者系统讲授大模型基础及应用前景,速览课程要点!对话 HiDream.ai 梅涛:做一家对标 MJ 和 SD 的公司,比扎堆做 LLM 机会更大|AGI十人谈九剑一魂 - 第24回 汉胡同源 九剑一魂(十)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。