Redian新闻
>
AI四小龙闯关大模型

AI四小龙闯关大模型

财经
过去的两个月里,商汤科技、云从科技分别面市了“日日新SenseNova”大模型体系和“从容”大模型,反观旷视科技与依图科技,则被质疑“难产”。
作者:钱玉娟
封图:图虫创意






当被称为“AI下一代风口”的AIGC时代启幕,ChatGPT激起的大模型浪潮也涌入中国后,原本深耕于AI赛道中的独角兽们,被认为是红利当头、最应顺势而为的那个。


然而,要与一众科技巨头展开大模型竞速,靠计算机视觉算法能力占领AI领域的“四小龙”——旷视科技、商汤科技、依图科技和云从科技,在本就分化的发展路径上,各有不同的故事在发生。


过去的两个月里,商汤科技、云从科技分别面市了“日日新SenseNova”大模型体系和“从容”大模型,反观旷视科技与依图科技,则被质疑“难产”。


被记者问及大模型的创新推进情况时,5月25日,旷视科技方面援引CEO印奇的话作出回应,“在过去四五年时间,我们对大模型这件事情一直非常深度follow的。”


印奇认为,大模型方向是确定的,旷视也会对其中的技术能力进行坚定投入,但“我们不会去赶这个热点”。


同样的疑问抛给依图科技,尽管其创始管理团队未予以答复,但内部一副总裁向记者透露,“作为AI公司,依图很早就在关注Transformer和做相关方面的研究工作。”不过业务侧进展如何,其表示目前没有可以对外公布的讯息。


谈及上述两家公司的“低调”,来自云从科技的一位管理中层有种个人理解,“我们和商汤比较幸运,在最困难的时候,登陆了二级市场,不然现在肯定也很难。”




做大模型,烧钱


上述管理中层人士以云从科技为例指出,在投入基础训练模型的同时,还要做行业模型,“行业模型天然就是需要算力的。”他觉得云从敢这样做,底气在于有资本的原始积累。


云从科技在其2022年年报中披露,过去一年因筹资活动产生的现金流入达29.4亿元,其中59%为其当年上市融资所得。


需要注意的是,大模型不但开发成本高,其因需求高算力,训练成本也不容小觑。之于云从科技,想要跨过算力这道门槛,其董事长兼总经理周曦的理解是,投入得到位,于是,重视研发投入的云从科技,决定“一定要投一二十个亿来做这件事”。


如何衡量云从科技面向大模型的这笔投入,一组数据显示,2019年-2022年的四年间,云从科技在研发侧的费用支出总计也就21亿元。


舍得投入的同时,云从科技不是没有资金压力。“现在买卡很紧张,买不到,就相当于无米之炊了。”上述管理中层人士给记者算了一笔账,做一个ChatGPT大约需要耗费3万张显卡,参考英伟达最新的GPU芯片H100,“一张卡动辄数十万人民币”,一个大模型仅在算力这一基础投入上,至少花费几亿元人民币。


据他透露,云从科技虽然储备有几万张显卡,但目前能用来做大模型训练的却很缺乏。一个更为严峻的现实,当下英伟达H100、A100、A800等几款GPU芯片,都出现了全球断货现象,包括云从科技在内的正在进行大模型训练及优化升级的企业,都在寻找算力卡的替代和解决方案。


竞争之下,云从科技抛出了定向增资计划。距离“从容”大模型面市也就一个半月前,云从科技公告称,欲为“行业精灵”大模型研发项目,募集资金不超过36.35亿元。


由于云从科技去年5月27日才登陆科创板,上市未满一年便进行如此大规模募资,也引发监管机构疑虑。在“从容”大模型发布前两天,云从科技披露公告称,收到上交所下发的《关于云从科技向特定对象发行股票申请文件的审核问询函》。


这一消息发出当天,5月16日,云从科技的股价低开走低,盘中一度逼近跌停。整整十天之后,截至记者发稿前,上述云从科技管理中层人士表示,定增计划的审核结果“应该还有一段时间(才能公布)”,他希望这笔钱能让团队,“多采购一些不同的算力卡,以备模型的迭代升级和优化。”



商业化故事,难讲

其实,在推出“日日新”大模型体系时,商汤科技联合创始人、大装置事业群副总裁陈宇恒就当场纠正了一个误区:不是“买了很多GPU,就可以去搭建超大规模的训练集群。”


不过,记者看到,彼时的商汤对外展示出了自己的“雄厚实力”:历时五年建设的大装置上,总共有27000块的GPU芯片卡,是亚洲目前最大的智能计算平台之一。


“秀肌肉”的同时,商汤科技董事长兼CEO徐立还不忘对外释放AI大模型的商业化前景,“商汤并不需要再额外投入太多,甚至已经开始通过大模型获得收入。”


不过,讲好大模型的故事,并没有那么容易。


尽管商汤科技的2022年度财报,首次实现了五年以来的亏损收窄,其研发支出也同比实现双位数增幅,但因其大模型发布当天,对“秒画”平台的操作演示环节涉嫌“抄袭”AI模型站Civitai上的图片,瞬时,商汤科技“匆忙”闯关被热议,其大模型的实际效果更被质疑与业界预期不符。


商汤科技、云从科技等以视觉算法技术见长的企业,虽是AI 1.0时代的宠儿,但在《ChatGPT:读懂人工智能新纪元》一书作者、前沿科技领域观察分析人士陈根看来,迈向AI 2.0时代,尤其大模型浪潮涌起,上述企业在自然语言模型相关的技术储备和路径上都欠缺。


“发布大模型,只是为了迎合技术概念热潮。”陈根直指商汤科技当下的现实境遇,初始投资者没有实现良好的收益,“它正面临投资人退出的压力,要么通过改善公司盈利能力来促进股价,要么就是抓住资本热点来促进股价。”


显然,从商汤科技的经营层面来看,扭亏虽然有趋势,但转向盈利“基本看不到希望”,陈根对于AI企业借助概念热点“讲故事”的方式,不置可否。即便旷视科技、依图科技当前没有对外实际公布,他也不觉得这些企业在大模型上存在“难产”。


“本身就是个技术故事,只是这个故事还一直在研发中心研发。”陈根说。


在接受媒体采访时,印奇有这样一句话令人印象深刻,“我们不会做纯对话的事情。”他对ChatGPT进行解构后,发现对话应用背后的大模型,包含知识引擎和逻辑引擎两部分,而印奇对旷视科技在逻辑引擎方面的能力予以肯定,他透露,旷视科技专门成立了一个叫“Foundation Model”的小组,“只做核心的模型设计,不做工程化的事。”


印奇认为,在当下大模型已经形成“大一统”的局面,多模态发展共识下,核心看谁在深度学习的模型领域有更深的理解和更强的模型设计功底。




新风口下,蓄势


旷视研究院主任研究员张祥雨,目前就担任“Foundation Model”小组的负责人,他自ChatGPT发布以来,基本上每天都在使用,除了摸索这个智能机器人拥有的知识储备,“我更关注它的逻辑推理能力。”


在张祥雨看来,目前包括ChatGPT在内的大模型技术应用,其实背后的逻辑是,在一个AI模型里,不断增加数据和模型大小,来实现性能的持续提升,这与规模化效应有关。当旷视科技也进入其中摸索,面临的挑战是,视觉与自然语言的差异。


身在旷视科技,张祥雨正在思考,如何把视觉模型中的数据有效利用起来,再设计相关的无监督、自监督的方法,让模型能在其中进行深度的理解学习。


“我更希望看到创业公司一边赚钱、一边赚数据,一边赚知识。”蓝驰创投管理合伙人朱天宇觉得,企业迈向AGI时代,除了大模型应用,还要考虑切入的场景中,能否持续获得新数据,数据能否反哺AI模型的训练,从而让场景中的智能化服务的质量效率更高。


不难想象,这是一个可以循环起来的闭环。微观AI四小龙,除了旷视科技、依图科技仍被资本市场拒之门外,每家公司都凭借各自的技术特点,在智慧城市、安防、物流、医疗等垂直领域形成了一定的优势壁垒。


陈根对依图科技有所关注,这家AI公司在人工智能医疗领域的优势,完全有机会基于医疗这一垂直领域“打造一个GPT医生”。这样的例子不胜枚举,再比如商汤科技,在智慧城市治理方面,也有独特的数据与技术优势……陈根呼吁外界,在通用大模型技术应用外,更多关注AI四小龙“是否能打造出更多垂直领域应用的专业化GPT”。


朱天宇则强调,不能迷信大模型,反倒要非常重视大数据,“人工智能还是源于大数据蓬勃发展,没有数据,人工智能也是无米之炊。”来自云从科技的管理中层也有共识,“闭门造车”式训练AI模型,没有来自千行百业的数据,根本训练不出来一个真正智能化的大模型。


“没有深入这个行业,你连数据长什么样,业务怎么样,都不了解。”目前,这位云从科技管理中层就专注于借助“从容”大模型,深入不同行业进行优化测试,从而研发出专属于某垂直领域的行业大模型。


当然,行业落地需分阶段,上述云从管理中层看到,一些厂商号称“敢去做行业模型”,但从现实看,其推出的基础大模型多停留在互联网产业,“卡就那么几万张,训练万亿数据规模的大模型,卡都占了一大半,哪有资源来训练行业模型?”


采访的最后,上述企业管理中层透露,目前云从科技的算力卡资源,倾向于行业模型训练,“基础模型训练的算力芯片,最多不能超过1/3。”



惠州楼盘大降价调查坏消息:第二波疫情提前来袭 好消息:目前绝大多数人处于群体免疫保护下人口拐点时看发展与转型

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一览科技CTO陈锡言:大模型阴影下的技术创业机会——链接大模型与用户|量子位·视点分享回顾令我们的子孙后代感到发笑的事情A-Level心理学不简单,相关大学专业的申请也同样具有挑战性!To B大模型,一场重塑企业软件的大模型革命李彦宏:大模型即将改变世界,百度要第一个把全部产品用大模型重做一遍坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」刚刚!加拿大机场将推出全新“旅客验证计划”!大批华人回国被严查:遭遇海关大锁,疯狂被税!又一新能源车企被申请破产,曾并列造车新势力“四小龙” ;长城汽车称理想汽车是“微博之王”;俞敏洪称新东方差一点进入房地产丨邦早报对话李志飞:大模型的关键在于如何把大模型用起来|年度AI对话又一新能源车企被申请破产,曾与蔚来小鹏等并称“四小龙”大模型的思想钢印:如何让ChatGPT相信水是有毒的?​中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制春樱出海四小龙鏖战欧洲,AliExpress领先SHEIN、TEMU中国出海“四小龙”想到一块去了阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl黑马天启CEO杨昕:天启科创大模型正式发布,未来可能会有几十万家企业受益于大模型这项技术我国领跑世界,还诞生了“隐私计算四小龙”数十家企业参编中国大模型标准;大模型创企获2.5亿美元投资;微软签署数十亿美元AI算力协议丨AIGC大事日报对话中国大模型的最早推行者黄铁军:全球可能只需要三个大模型生态大模型变“小”:黑马天启开创AI模型“重度垂直”新思路,入选北京大模型行业应用典型案例“登基”前一波三折,心情像坐过山车百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报三行代码调用PandaLM大模型自动实现保护隐私、可靠、可复现的大模型评估智源连甩多个开源王炸!悟道3.0大模型数弹齐发,大模型评测体系上线可复现、自动化、低成本、高评估水平,首个自动化评估大模型的大模型PandaLM来了下岗的洗碗机和殷勤的义务清盘工大模型综述来了!一文带你理清全球AI巨头的大模型进化史只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型​“我被附身了!”澳洲男子在印尼变了个人,赤裸撞人后被关大牢!国内大模型争霸赛,你最看好哪家?这是你心目中的大模型排名吗?AI大模型如何在行业实际落地:企业对话场景拥抱大模型之路从朱元璋定都看1949年到底定都何处会最少争议?出海四小龙,谁会笑到最后?| 跨境电商专题谷歌将推新版大模型;抖音发布AIGC平台规范;宇视推出行业大模型 | AIGC日报中国团队自动驾驶大模型斩获CVPR最佳论文;Stability AI推出新文生图模型;京东大模型即将发布丨AIGC大事日报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。