Redian新闻
>
商汤版ChatGPT来袭,中国激战千亿“大模型”

商汤版ChatGPT来袭,中国激战千亿“大模型”

公众号新闻

大模型只是起点,奔向 AGI 之路才是重点。


来源 | 钛媒体
作者 | 林志佳
出品 | 资人说(touzirenshuo)



随着ChatGPT为代表的预训练大模型带来新一轮人工智能(AI)热潮爆发,继百度、阿里、360之后,又一家大厂推出GPT大模型产品。

获悉,4月10日,AI 公司商汤科技正式发布全新“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”(SenseChat),参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。

商汤科技董事长兼CEO徐立表示,上述这些生成式人工智能(AIGC)产品将在医疗、短视频、教育、营销以及开发等产业领域应用落地。

商汤科技联合创始人、首席科学家王晓刚表示,目前已经有一些合作伙伴和客户开始内测其产品。

未来,商汤版的GPT主要面向企业端(B2B)业务。

此外,商汤“日日新SenseNova”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,而且商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等API接口。

事实上,自2022年12月开始,美国OpenAI公司推出的 AI 产品ChatGPT以及背后的GPT大模型,已经引发了一场 AI 新浪潮。

但 AI 技术的终极目标通用人工智能(AGI)可不是谁都能获得的。

《奇点临近》作者雷·库兹韦尔曾表示,直到2029 年,人类才有超过50%的概率开发出AGI。

而作为 AI 技术积累最深厚的中国公司,如今商汤抓住了大模型这波新浪潮,以期在未来几年内实现重大突破,从而迈向 AI 领域这颗皇冠上的明珠——AGI的前沿研发与商业化进程。

01

GPT大模型热潮来袭


如今,火爆全网的 AI 聊天大模型应用ChatGPT访问量已飙升至8.89亿次。

它也是历史上最快达到1亿月活的应用,而且整个热潮已蔓延至微软、谷歌等很多大厂开始关注大模型。

过去40天,大模型集中爆发,GPT-4、微软Microsoft 365 Copilot、Midjourney V5、Google PaLM API、英伟达新显卡接连出场。

尤其是微软,将GPT-4接入Word、Excel、PowerPoint等Microsoft 365 Office办公套件中,即推出一款新的 AI 驱动的产品Copilot(副驾驶),像助手一样用 AI 帮助人们生成文档、电子邮件、PPT等,从而让 AI 接入了生产力。

此外,创造出ChatGPT的美国OpenAI公司还推出插件功能,实现了“App Store时刻”,让生成式 AI 真正变革了人类的生产力。

 GPT-4加持的微软Word平台,支持自由编辑 AI 生成的文本

天津大学自然语言处理实验室负责人、教授熊德意表示,从 AI 发展角度看,这是一个重要的里程碑,其意义要高于7年前的“阿尔法狗”。

实际上,过去60多年间,利用 AI 技术,智能化、数字化和人口红利共同推动了中国工业与产业快速发展,尤其是深度学习十年间的快速进步。

真正让 AI 在很多领域突破了“工业红线”,在诸多特定的垂直场景中带来了效率的提升。

不过,定制化AI模型的开发模式,依然面临研发成本高、周期长等问题,而且现在80%的应用场景都是低频的、长尾的需求,但却面临投入大量人力、收集巨量数据,却不能解决小数据、小样本等实际应用问题。

而谷歌2017年发布的Transformer框架催生了新的研究范式,即基于一个强大的多模态大模型,使整个网络结构完全由Attention机制释出。

让机器同时学习大量的文字,通过强化学习和人类反馈不断强化大模型的学习能力,从而更高效地解决海量的开放式任务,让 AI 实现了从“数据飞轮”到“智慧飞轮”的演进,最终迈向 AGI 人机共智。

AI 对于开发者来说是一种模式的变化,下一步对很多内容创作者来说,一样会面临工作模式的巨大变化。

未来人们不需要具备底层的制作能力,而是需要更多畅想、连接、协同的能力,这些能力才是跟AI协同共创的核心商业能力。

而这种生产力模型的变革,可能会产生互联网SaaS(软件运营服务)应用和工具链,或者基于这些工具链新生成的社区,也就是我们可能会拥有下一阶段的‘小红书’、B站等一系列互联网应用。

商汤科技董事长兼CEO徐立,今年2月谈及ChatGPT引发的商业产业变革时表示。

作为 AI 行业的领头羊,商汤科技拥有很强的技术实力和积累,能够参与到这场大模型军备赛当中。

自2018年起,商汤科技便致力于 AI 大模型的研发,有着超过5年的技术积淀和实践经验。

目前,商汤已成功研发了320亿参数量的全球最大的通用视觉模型,在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。

“‘好的原材料’就是要深入到各个行业里积累非常多的know-how。美国公司OpenAI能够把ChatGPT做出来,背后也有多年积累,从小模型到大模型的研发,中间积累了非常多的know-how。”

王晓刚表示,商汤具有非常类似的优势,内部有非常多的研发人员能深入到一线,用大模型去解决实际问题,有很好的技术积累。

王晓刚强调,我们要拥抱全新研究范式,这里面的关键是我们要转变观念。

十年前,商汤还没有诞生,我们创始团队在当时做的决定就是-All In Deep Learning(深度学习)

我们之前在传统视觉技术里也有较长积累,但是,当新技术来了,我们就果断地去拥抱新技术。

今天也一样。

实际上,本轮国产大模型竞赛中,有三个能力极为重要:

算力、数据和应用场景。

而在国内致力于To B(企业端)业务的大厂中,商汤处于第一梯队。

商汤科技前瞻布局,既依托SenseCore AI大装置,以5000 Petaflops超大规模算力和出色的并行计算能力,为大模型研发提供强大的算力基础设施,堪比芯片行业的“光刻机”;

同时还有数据算法和强大的产业化能力,在智慧城市、智慧商业等领域的长期耕耘,商汤积累了海量真实世界的高质量视觉数据,支持商汤在视觉技术方面的持续突破。

领先的算力布局,以及丰富的视觉数据和技术积累,为商汤多模态大模型的研发提供有力基础。


徐立曾表示,AI 的核心是解决“工业红线”问题,而商汤SenseCore AI 大装置相当于粒子对撞机,成为业内稀缺的大模型专用基础设施,可以解决 AI 软件所需算力支撑挑战——类似光刻机,解决芯片的“工业红线”。

因此,如今基于“大模型+大算力”,商汤拥有了 AGI 时代的“光刻机”,成为 AGI 和大模型时代的基础设施服务领导者,对整个行业具有重要的应用价值和战略意义。

“需要好的顶层设计,很好地把原材料设计成一个体系,商汤能朝着 AGI 的目标努力。除了大装置和基础设施以外,还要能从算法、框架上,把整个系统设计好。”王晓刚表示。

王晓刚称,如今,商汤研发想要做的事情就是怎么样去用好这些新技术。

它带来的新范式包括人机共智,一起去创造新智慧。

核心在于怎样用好我们的这个大模型,能够去形成正向的反馈,而不是一味地说“很害怕被颠覆了”。

02

千亿商汤大模型有何新亮点


最近几天,国内科技大厂的GPT AI 大模型密集呈现,从百度的文心一言,到阿里通义、华为盘古和京东言犀,引发国内企业的大模型“逐鹿潮”。

相对于其他大模型产品,商汤此次推出的千亿大模型真正服务于To B(企业)端客户,而非一个被网络调戏的工具。

我们梳理了四大亮点和优势,从体系、语言大模型平台,到应用场景和行业落地,打通大模型产业闭环。


首先是国内首个大模型体系。

4月10日,商汤科技正式发布商汤“日日新SenseNova”大模型体系,基于数据、模型训练以及部署的三位一体的飞轮,提供自然语言生成、图片生成、感知模型预标注、模型研发等多种能力,并持续更新多模态大模型,同时结合决策智能大模型,是实现AGI的重要起点。


据悉,商汤“日日新SenseNova”大模型体系的名称取自《礼记·大学》中,汤之盘铭曰:

“苟日新、日日新、又日新”,商汤希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI更多可能。

实际上,大模型最核心的需求就是构建体系架构。

而在前期,商汤前瞻性打造了人工智能基础设施SenseCore AI大装置——27000块GPU(图形处理器)芯片,5000 Petaflops超大规模算力、是亚洲最大的智能计算平台之一、支持20个千亿参数超大模型同时训练、支持最大4000卡并行单任务训练,可持续7天以上不间断稳定训练——这是国内为数不多接近GPT所需算力的重要基础设施公司。

如今,基于AISaaS服务架构,商汤已经打造了CV(计算机视觉)、NLP(自然语言处理)AIGC(人工智能内容生成)多个AI大模型。

未来基于这些核心优势,在“日日新SenseNova”大模型体系和SenseCore AI大装置的支持下,商汤的多模态大模型持续演进,同时结合决策智能大模型,为AGI的实现提供重要起点。


第二大亮点是首个自研中文语言大模型应用平台。

在“日日新SenseNova”大模型体系当中,商汤科技4月10日还推出了自研的中文语言大模型应用平台“商量”,具备领先的语言理解、生成能力,将科技与人文相互交融。

作为高效聊天助手,它可以秒解复杂问题,提供定制化建议,还能辅助创作一流文本,并具备不断学习进化的特性等。

具体来说,在用户价值方面,“商量”可以实现单轮、多轮对话和超长文本理解能力,而且凭借“商量”中文语言大模型强大的长文本理解能力,帮助用户快速通过与大模型互动来获取知识、寻找答案;

在技术能力优势方面,商汤拥有千亿参数中文语言大模型,具备问答、理解与生成等全面的中文语言能力。

支持企业服务、城市管理、汽车出行等600+垂直领域,并拥有逻辑推演与智能、兼具理解广度与深度、知识自动及时更新等能力。


无论是一人一句编故事,还是连续对话能力,“商量”都能准确、快捷的回答出来。


此外,“商量”已经在行业实现了应用,尤其在医疗行业和编程领域。

从现场实际demo当中可以看到,基于大模型应用平台,它能够准确、快捷地回答关于腹部痛等关键性问题,给出医疗参考方案。

第三大亮点是生成式AI应用,真正为短视频、直播产业带来生产力提升。

此次,商汤把GPT大模型应用于生成式 AI 领域,重构人与空间在数字时代的结合。

商汤基于“日日新SenseNova”大模型体系,自研了包括秒画、如影、琼宇、格物等视频内容的制作和生成工具平台,为短视频、直播产业带来生产力的提升。


以“秒画”为例,其是商汤科技打造的AI内容创作社区平台,可帮助用户轻松地创作高质量的艺术作品,自动生成元素和细节,并可不断学习与提升。

其中,“秒画”具备超10亿参数自研文生图生成模型,支持二次元、三次元等多种生成风格;

推理速度快,单卡支持每2秒生成1张512分辨率的图片;

用户可基于单卡A100,5分钟内定制属于自己的LoRA模型20张训练图片;

汇聚了1万+开源模型,基于平台发布的模型可设置为ToB服务API,结合商汤大算力对外提供商业化服务,支持用户训练个性化绘模型,满足不同绘画风格需求。

“秒画”带来个性化文生图能力(来源:商汤)

而另一种“琼宇”、“格物” 3D内容生成平台,是商汤科技基于神经辐射场技术(NeRF)的3D内容生成平台,分别是指琼宇大空间3D内容生成应用、格物小物体3D内容生成应用,可基于 3D 内容生成技术实现对空间和物体的复刻与交互。

传统人工建模10000人/天的建模任务,通过“琼宇”只需要2天即可完成(算力为1200 TFLOPS)

商汤表示,上述两套平台生成的各类3D内容都够进行再编辑再创作,通过海量高精度数字资产的生产,满足影视创作、建筑设计、商品营销、数字孪生管理等各类对可交互3D实景内容有强烈需求的应用场景。

最后一个亮点就是独特的行业赋能。

商汤让大模型对外提供API接口,以及多元化、多种大模型即服务(MaaS)

具体来说,在“一平台四支柱”的战略体系下,商汤“日日新SenseNova”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,打通了多个领域、行业的应用闭环。

而且,基于“日日新SenseNova”大模型体系,商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等API接口。

客户可根据实际应用需求,灵活调用商汤大模型的各项AI技术能力,低门槛、低成本、高效率地实现AI技术在实际业务环节中的部署,或进行二次开发,创造更多价值。

此外,基于商汤AI大装置和大模型体系,商汤将面向客户提供涵盖自动化数据标注、大模型推理部署、大模型并行训练、大模型增量训练、开发者效率提升等多种大模型即服务(Model-as-a-Service),包括自动化数据标注、大模型推理部署、大模型并行训练和大模型增量训练服务、开发者效率提升等。

“这绝对不只是说训练一个参数量非常大的模型,它是一个体系化的大工程。”王晓刚表示。

王晓刚提及,“涌现”这个现象的出现意味着大模型会不断给你惊喜,大模型能有新能力。

而商汤在大模型训练本身,以及know-how任务理解都有这样的技术实力。

结合自身的特点,具有通用性的商汤大模型,能够真正去帮助客户解决需求和问题。

“未来,我们也是希望能够依靠社区的力量把我们的这些模型进行调教,不只有原始模型,还有各种各样的这样的一些模型存在,能够更好的往前推进。”王晓刚坦言称。

03

大模型只是起点

奔向 AGI 之路才是重点


对于整个 AI 技术进程来说,大模型绝对不是 AI 发展的终点,而只是起点。

1950年,才华横溢的计算机科学家艾伦·图灵提出了一个他称之为“模仿游戏”的思想实验。

面试官通过打字机与两个对象交谈,知道一个是人,另一个是机器。

图灵建议,如果一台机器能够始终让面试官相信它是人类,我们就可以说它有能力思考。这就是著名的“图灵测试”。

后来的70年间,整个 AI 行业都为之努力,希望打造通过“图灵测试评估”能力的 AI 技术。

如今,AI 算法、算力、数据“三驾马车”同步突破,AI 技术已经蓄能完毕,所有人终于可以大展身手了。

作为中国 AI 领域竞争与发展的核心玩家,商汤拥有 AI 行业全栈性研发能力。

商汤科技联合创始人、大装置事业群副总裁陈宇恒表示,所谓的通用人工智能新的创新范式,可以极高的体现商汤现有的一些 AI 产品的模式和能力。

从大的方向上,商汤作为人工智能的头部的企业,未来肯定还是要去挑战更大的模型。

因为现在很明显的趋势就是,每一代的大模型 AI 和算力有很大的相关性。

下一代人工智能比上一代,比如说 GPT-4 比 GPT-3可能是百倍级的算力的需求,甚至它的参数量是十倍以上的需求,对应也需要更多的数据去完成训练。

所以要不断地去接近所谓的通用人工智能或者 AGI 的路线上,肯定是要把基础的超大模型越做越大。

这是未来 2 到 3 年,整个无论从学术界还是从工业界,还是从我们自己的对 AI 的理解上,都是比较明确的方向。陈宇恒表示。

此前,商汤科技发布了2022财年报告。

财报显示,2022年,商汤研发支出达38亿元人民币(扣除以股份为基础的薪酬开支),同比增长24%,2018年至今累计研发投入达128.47亿元;

人均每年研发模型数相较于2021年进一步提高了90%,累计生产的商用模型数提高了93%,至6.7万个。 

当中国大力发展 AI 技术的重要时机下,商汤大量投入技术研发,不断推进数字化、智能化、产业化升级,符合科技创新下的时代特征。

如今,商汤高强度的研发投入正在开花结果,在国内大模型军备赛中实现了第一梯队的飞跃,成为行业极稀缺的“头雁”。

伟达CEO黄仁勋曾表示,当下“我们正处于 Al 的iPhone时刻”,而商汤,也正在迎来属于自己的“iPhone 时刻”。

“AI是生产‘生产力工具’的工具,它将开启软件开发新范式,把我们带入‘新二八定律’的时代,80%的工作由机器完成,20%的工作由人来做。”

徐立认为,持续的大规模技术投入带来创新,再有商业模式发展,这是一条罕有人走的路。

商汤始终坚信 AI 技术变革带来增量价值,必将推动普惠和公平的智能时代到来。



  ·   END   ·  



近 期 活 动


----------------------------------------

----------------------------------------


阅 读 推 荐


· 从8位大佬在乌镇互联网大会的演讲中,我看到了这个趋势

· 沃衍资本魏斌:制造业投资大有可为,选对方向才是关键

· 雷军小目标:做世界TOP5,每年至少1000万辆

· 沈南鹏:15年投了上千创业者,我发现这样的CEO能成事

· 张一鸣:为什么我不赞同控制人力成本?


视 频 推 荐


合 作 对 接


寻求报道、商务合作、投融资对接媒体互推、开白、投稿、爆料等……

扫码添加投资人说运营者微信,备注「商务合作」详细沟通。



超 级 社 群


【投资人说】正在组建超级投资者社群、超级创业者社群、超级读者群、超级媒体群等,目前总人数已超1000人。


关注【投资人说】微信公众号,发送信息「进群」,与各行业精英直接交流,共同进步。

旗 下 媒 体


发现在看了吗,戳下看看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【城事】巴黎市长将重修Châtelet 广场以方便行人ChatGPT 核心技术大起底——InstructGPT:研究人类反馈数据比加大模型规模更重要!网文版ChatGPT来了:大模型辅助写作,澜舟和中文在线联手出品开源中文医疗大模型华佗GPT来了,真人医生盲测效果优于ChatGPT【酥炸虾饼】聊聊辟谷(一)视觉版ChatGPT来了!吸收AI画画全技能,MSRA全华人团队打造,微软16年老将领衔立即体验!直接可用的中文版ChatGPT来了突发利空,中移动减持!复旦放大招:中国版ChatGPT来了,名字叫"MOSS"!大利好,私募基金可投住宅!河南人口负增长马斯克着手开发TruthGPT来最大限度寻找真相,以对抗ChatGPT|环球科学要闻大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型巴黎市长将重修Châtelet 广场以方便行人马云,刘强东,王健林的老婆,都是利害的娇娘子!17岁嫁54岁将军,婚后32年怀孕16次,死后葬在八宝山,名字家喻户晓阿里版ChatGPT上线,谁会是大模型生态的下一个卷王?集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布阿里版ChatGPT已接入钉钉,张勇:未来所有业务都有大模型加持对话元语智能创始团队:做中国版ChatGPT,为什么坚持大模型开源路线?|甲子光年大裁员和ChatGPT来袭,IT行业员工如何"活下去"这是Meta版ChatGPT雏形?开源、一块GPU就能跑,1/10参数量打败GPT-3Meta版ChatGPT惨遭“开源”?最新大模型LLaMA被泄露,已在GitHub收获7k+星商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此阿里版ChatGPT突然上线邀测!大模型热战正剧开始,这是第一手体验实录讯飞星火大模型抢先进入​「升级战」:中国版ChatGPT来了开源版ChatGPT要来了?这个AI做图神器团队,想让人人都能做自己的大模型声音Meta版ChatGPT来了?小扎、LeCun官宣650亿参数SOTA大语言模型LLaMA又一大模型惨遭泄漏,Meta版ChatGPT被迫开源!持续打磨“大装置+大模型”,升级业务矩阵,商汤正变得越来越稳健刚刚!商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此开源版ChatGPT来了?多数任务效果超越GPT3,已开源!中国版ChatGPT来了!能讲四川话会算鸡兔同笼,但我兴奋不起来刚刚!李开复宣布筹办新公司,进军大模型:不仅是中国版ChatGPT,全球广招顶级人才。。。商汤版ChatGPT,要和你「商量」一下:第一手真实体验来了GPT-4加强版Copilot来了!动嘴就能编程,测试申请已开启,网友:程序员已死
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。