Redian新闻
>
只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理

只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理

科技



  新智元报道  

编辑:编辑部
【新智元导读】从今天起,千元级就能解锁专属大模型了!这款搭载首颗纯国产14nm Chiplet大模型推理芯片的「深目」AI模盒,可以轻松实现百亿级参数多模态大模型的推理+微调。各种碎片化长尾算法,直接秒级生成!

就在昨天,大模型落地的最后一公里,被打通了!
这款重磅发布的训推一体盒子——「深目」AI模盒,不仅搭载了国产自研大模型推理芯片DeepEdge10,以及多模态大模型「云天天书」,还具备边缘AI在线学习能力。
更值得一提的是,它的售价只有千元级,轻到单手就能托起。
可以说,大参数、大算力、大参数,和十年团队的核心技术,全被装在了这个小小的边缘计算设备之中。
而有了这个AI模盒,每个企业都能同时拥有专属于自己的大模型和训练设备,并基于此轻松地实现:

- 覆盖场景超90%

- 算法精度超90%

- 使用成本降低90%
那么问题来了,性价比如此之高的「盒子」,是如何破解大模型最后一公里难题的呢?

千元级解锁专属大模型,加量不加价

ChatGPT、Sora让全世界科技企业都变了天。
最近来自a16z企业人工智能报告指出,2024年企业在大模型上的平均预算,要增加2-5倍。
然而,专属大模型这条路,却不是人人都能走的。
首先,需要企业提供大算力、大数据。
目前,训一次大模型,成本至少千万元,而主流的训推一体机,价格普遍在百万元。如此高昂的成本,是绝大多数企业都无法承受的。
其次,通用大模型也还需要经过专有数据的深度微调,才能适配实际中的碎片化、长尾场景。
这样算下来,要拥有专属大模型,企业的花费至少是在「亿级」。
能否打造一款能够在边缘设备中,让大模型解决长尾场景难题呢?
云天励飞给出的答案,就是「深目」这个边缘训推一体AI模盒。


红色飞跃线代表着云天励飞二次创业第一款具有划时代意义的产品
别看小瞧这款「巴掌大」的小盒子,它可是实现了三个90%——90%场景全覆盖,90%算法精度、使用成本降低90%。
最重要的是,「深目」AI模盒的小小身材,不仅「装下」了大模型,还得到了最强推理芯片加持。
首先大模型的能力,是来源于多次霸榜C-Eval、CMMLU等权威测试的,云天励飞自研多模态大模型「云天天书」。
它不仅是国内为数不多通过网信办备案的可商用大模型,而且自2023年年初正式发布1.0版本以来,已经经过3次迭代,预计还将在今年6月发布全新4.0版本。
大模型是有了,云天励飞如何将其装进AI模盒中?
研究团队对大模型进行了优化,包括对多模态大模型的分层结耦、量化,让其能够高效运行在一个边缘算力设备上。
甚至,他们在模型架构上做了诸多创新,帮助多模态大模型完成推理,以及微调等一系列任务。
其次,「深目」AI模盒的算力基础,来源于云天励飞推出的第一颗基于纯国产工艺、可承载百亿级多模态大模型边缘推理计算的芯片——DeepEdge10。
具体来说,基于14nm成熟工艺节点的DeepEdge10,采用了自主可控的SoC和国产RISC-V核心,算力在INT8精度下可达48TOPS。
而且,在Chiplet架构的加持下,DeepEdge10更是实现了四颗Die的封装。
最重要的是,这颗边缘芯片不仅能实现百亿级大模型的高效推理,还能够做微调训练。
综上,经过一年多的时间打磨,云天励飞团队分别从大模型和处理器两个维度,进行了联合优化设计。
通过算法和芯片一体化设计,在用更小的内存、更便宜的INT8和FP16替代掉传统、高昂的服务器设计的同时,维持了模型的尺寸和性能。
由此,才有了我们现在所看到的「深目」AI模盒——一个成本可接受,又能运行大模型的盒子。
「深目」AI模盒正是云天励飞的算法演进和芯片演进技术,在十年后又一个全新交叉的产品,也是团队二次创业推出的第一款产品。
云天励飞希望看到的是,深目2.0可以给AI行业带来全新的体验,让大模型唾手可得。
如今,在海量业务场景需求,和高昂算法生产成本面前,我们正处于「技术找场景」和「场景反哺技术」转换的关键期,有人称之为冰山之下的「死亡之谷」。
值此之际,「深目」AI模盒的诞生,可谓众望所归。

秒级生产长尾算法

那么,这个只卖千元级的AI模盒到底怎用?好不好用?
发布会现场,云天励飞副总裁罗忆用实际场景演示了「深目」AI模盒是如何在数据少、无数据等极端情况下,快速完成算法训练。
场景演示一:只需5张照片,算法精度即可提升10%以上
在算法训练初始阶段,面对仅有少量样本,却又希望得到高精度算法的难题该怎么办?
在传统模式下,对算法精度要求越高,就需要大量的样本。
但问题在于,数据收集的难度非常大。
如果能够在边缘侧,针对场景化的算法进行微调,所需数据就会减少,迭代周期就会变短,就会节省大量效率。
也就是说,通过少量样本,即可实现场景的自适应。
以城市治理中最常见的问题之一——店外经营举例。
当用户需要训练识别算法时,可以利用云天励飞训练平台的基础数据集完成算法的初步训练。
得益于多年的积累,目前云天励飞能够提供覆盖14 个大类、100+个小类、千余种算法,可直接调用的算法。
与此同时,云天励飞在城市治理深耕多年,也拥有该领域的丰富数据积累。
完成初步训练后,用户再将自己拍下5张场景示例图片上传,在平台上完成简单标注,即可将初步的算法迭代升级。
通过测试,迭代后的算法精度从过去的76%,直接飙升至95%。
场景演示二:零数据样本,用AIGC数据训AI
那要是没有数据怎么办?
当面对自然灾害、安全隐患等这样的极端场景,训练数据几乎空白,难以通过模拟收集,但偏偏对对数据质量要求极高,容错率低。
这就是低频事件面临的算法困境。
就拿「加油站吸烟识别场景」为例,这类行为的数据极难获取。因为这类危险行为的发生,往往伴随着不可挽回的后果。
现在,真正有效的策略便是,通过AIGC自动生成模拟数据。
云天励飞训练平台能够利用大模型能力,以加油站为背景,生成在该环境抽烟行为的人物,并将数据用于算法训练中,填补训练数据的空白。
目前,云天励飞已经通过AI生成数据训练和测试算法。
通过自有的城市治理算法进行测试,不同算法在加入微调数据之后,精度发生了变化。
可以看出,城管算法识别准确率随着样本数量增加,精度也大大提升。同时交付场景比例扩大。
另外,还有非常重要的一点是,使用AI合成数据来训练算法,不仅能够填补数据空白,还能够规避隐私安全等问题。
显然,AI自动生成数据逐渐成为大模型时代下,训练新算法和提升算法精度的一条重要路径。
场景演示三:识别对象标准不统一,大模型泛化能力解决问题
还有一种场景是遇到对象不统一,如何去解决算法训练难题?
举个栗子,大型购物中心一般没有统一的结算中心,因此难以掌握逛街顾客是否消费,也难以评估营销活动对实际消费转化的效果。
而顾客是否提购物袋,是大型商场判断顾客是否消费的重要标准之一。
但是,各种品牌购物袋的大小、颜色、款式均不统一,而且难以与顾客的背包区分,导致算法难以精准识别。
面对这样的场景,很难仅用一个算法去解决。
但是基于云天励飞训练平台,可以借助大模型的「泛化」能力,实现「千店千袋」的识别。
简单来说,首先需要调用「拎手提袋识别」的算法,对所有手提袋进行识别。
然后,再基于识别结果,进行特定手提袋的识别训练,最终得到特定手提袋的识别算法,就可以实现对各种类型手提袋精准识别。

十年深耕,只做物理世界「解码者」


作为国内领先的AI企业,成立于2014年的云天励飞,便一直秉持着将AI技术与物理世界相结合理念。
这也是这家公司自成立之初,自研芯片的重要原因。
因为芯片是AI物理世界的连接器,AI通过芯片赋能现实,与此同时,物理世界的数据又通过芯片反哺AI,推动AI进步发展。
就这样,通过算法芯片化,无形的技术和有形的世界构建出了一座通道。
从此,AI不仅是虚拟世界的工具,而切实地转化为物理世界的生产力。
ChatGPT引爆生成式AI革命后,百模大战,甚至是大模型开源战愈演愈烈,导致当下最不缺的就是LLM。
显然,现在的重点不仅是卷参数,而更重要的是大模型的应用落地如何破局?
陈宁博士表示,「AI商业化发展有三个阶段:AI方案化、AI运营化、AI产品化」。
在第一阶段,当然就在项目中满足不同垂直领域客户的需求。
如今,云天励飞已经在公安、城市治理、智慧交通、人居生活等领域打造了多个标杆项目,还在低空经济、智慧教育等领域持续探索中。在深圳、成都、青岛,都已打造了城市级的样板工程。
正是因为有大量行业的落地经验,云天励飞已经形成了数据运营、新能源运营平台,走向了AI运营化。
大模型的火爆,预示着AI将快速进入标准化产品的时代。因此,云天励飞还逐步走向了AI产品化。
去年,云天励飞与华为异腾联合推出基于天舟大模型训推一体机,如今又推出面向边缘训推场景的「深目」AI模盒。
此外,云天励飞还通过资本纽带,进军智能穿戴市场,形成日益完善的大模型产品体系。
而在这三个阶段中,云天励飞始终践行的,就是做物理世界的「解码者」。
真实场景演示
具体来说,云天大模型基于真实场景算法,可以应用到各类场景——
交通拥堵识别和违章驾驶识别:
城市CT巡检:
海洋污染识别:
产品视觉检测:
燃气灶未关识别:
老年人跌倒识别:
夜间可疑人员识别:
而且,只要使用简单的提示词,就能高效地秒级生产算法、解锁更多场景了。
如今,针对各类场景应用,云天励飞已经有了千余种成熟算法。

比如最近大热的低空经济

「深目」背后的故事


其实,「深目」这个名字,10年前就已经存在了。
2014年,云天励飞凭借对深度学习的深刻理解,就推出了一款基于CV小模型的AI产品「深目」,为「AI+公共安全」市场开启了新纪元。
如今,进入大模型时代的云天励飞,在奇点时刻选择了二次创业。
这次推出的AI边缘训推一体产品,依然选择了「深目」的名字。
虽然名字未变,但「深目」已经从最初的AI方案化构想,变身为如今成熟的产品化现实。
带着焕然一新的技术底座,「深目」将赋能更广阔的长尾场景,为云天励飞开启二次创业的征程。

One More Thing


最后来个小彩蛋,「云天天书」从今天起限时免费开放了,限额50名。
想要免费体验的伙伴们,赶快扫码申请吧。
参考资料:
https://www.intellif.com/



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
万字长文总结多模态大模型最新进展(Modality Bridging篇)北大等提出MoE-LLaVA:将多模态大模型稀疏化「国家队」入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资7033 血壮山河之枣宜会战 “扑朔迷离”南瓜店 10国产多模态大模型狂飙!颜水成挂帅开源Vitron,破解图像/视频模型割裂问题AI早知道|首个正版华语AI歌声平台;百度智能云宣布国内首家支持Llama3全系列训练推理北京/上海内推 | 小红书智能创作团队招聘多模态大模型算法工程师/实习生五光十色的多模态大模型:浅探视觉-语言大模型的关键模块设计相请不如偶遇颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑多领域文献阅读超越GPT-4!深势科技发布科学文献多模态大模型Uni-SMART技术报告AI早知道|阿里云全方位支持Llama 3 训练推理;讯飞星火即将发布新版本腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布中科院,CMU,Meta等联合出品:去除LLM先验对多模态大模型的负面影响先生的头像将多模态大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B​第一个基于Llama 3的多模态大模型!Bunny-Llama-3-8B-V上线!AI早知道|苹果播客应用新增转录功能;上海智能实验室推图文多模态大模型;国产短剧AI换脸出海降本增效ICLR 2024|把图像视为外语,快手、北大多模态大模型媲美DALLE-32024年AIGC行业研究:多模态大模型与商业应用|36氪研究院看“单亲妈”系列有感,家有儿女的必读大模型应用成本卷到了千元级!云天励飞发布“深目”AI 模盒:搭载自研芯片,单手可托起一幅我画的素描超越 GPT-4V 和 Gemini Pro!HyperGAI 发布最新多模态大模型 HPT,已开源北京内推 | 阿里淘天集团招聘大模型/多模态大模型算法实习生详解多模态大模型:LLaVA+LLaVA1.5+LLaVA-Med8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便iPhone动嘴10秒P图!UCSB苹果全华人团队发布多模态MGIE,官宣开源人人可玩GPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评CVPR 2024 | 通过细粒度人类反馈对齐数据,提高多模态大模型可信度亚马逊向人工智能初创公司Anthropic追加27.5亿美元投资;钉钉AI升级多模态,新增图片理解、工作流等丨AIGC日报AI早知道|Apple 发布 MM1多模态大语言模型;xAI 是市场上薪酬最高的人工智能公司文末送书 | 中山大学HCP实验室专著《多模态大模型》重磅发布
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。