Redian新闻
>
这款AI大模型种草神器,竟让银行秒省数百万?0门槛开发/4小时训练/5分钟部署,推出即爆火

这款AI大模型种草神器,竟让银行秒省数百万?0门槛开发/4小时训练/5分钟部署,推出即爆火

科技



  新智元报道  

编辑:编辑部
【新智元导读】这个国产大模型种草神器一经推出便爆火!4小时零门槛自研应用,竟然让银行一下子节省了数百万成本。

就在前段时间,继ChatGPT迎来「iPhone时刻」之后,OpenAI又计划推出LLM版的App Store。


简单来讲,OpenAI打造独属的「大模型应用商店」,就是要把市面上的大模型拉进一个双向对接的平台。


这样,开发者根据特殊用途,去出售基于ChatGPT定制的AI模型。而企业也能够根据自身需求快速找到适配的LLM。



OpenAI此举,意味着生态系统将实现融合,大家能够更容易去获取使用各种应用,无需重复「造轮子」。


无独有偶,国内的浪潮信息在走这样的生态开放之路。


更有趣的是,浪潮信息打造了AIStore,作为元脑生态的内容承载平台。LLM爆火之后,OpenAI也顺势打造了APPstore。


元脑AIStore,智算时代的「App Store」


浪潮信息的生态开放之路是怎么走的?


其中一个生动的例子,就是它打造的元脑AIStore平台。



在这里,「左手伙伴」负责提供场景化应用和技术;当「右手伙伴」有业务创新需求时,就可以在平台上根据提供的信息寻找合作。


同时,「右手伙伴」也可以在平台上发布自己的需求,由左手伙伴承接,然后提供定制服务。


而作为「平台」的AIStore,就是把二者连接起来,依托算力、算法、资源平台等全栈化的生态优势,助力伙伴双方实现技术和商业的双融合,助力大家进行更高效的合作与营销。



如果说,小红书是C端的种草内容生态,AIStore平台可以理解成是B端应用的线上社区化商城。


元脑生态致力于牵手伙伴输出技术领先、落地性强的联合方案,不断提升方案的可服务性、开放性和易购性,满足客户需求的同时,助力伙伴获取更多商机。


这个过程中,体现的是连接、信任、合作,是这种合作模式的价值认同。也正是在这样的实践探索中,浪潮信息的生态伙伴数量在不断增加,据了解,截止至2022年底,浪潮信息的生态伙伴数量已达20000余家。


如今,在元脑AlStore平台上,我们已经可以看到很多面向不同AI业务场景的解决方案,其中有不少是两家以上合作伙伴联合开发的。


此外,为了方便客户获得更直观的体验,浪潮信息还在元脑AIStore平台加入了部分解决方案的demo。


比如打开「合合信息OCR」,就可以一键试用各种票据和证件的识别。



据介绍,目前元脑AlStore已经入驻了超过1200家伙伴,上线产品和解决方案超过150个,有几十家伙伴的产品方案通过了元脑认证。


其实早在2019年,浪潮信息便提出了智算时代之下的生态新范式——元脑生态。


元脑AIStore正是元脑生态的内容承载平台,不仅如此,AIStore还是合作伙伴的营销平台。


而2022年底生成式AI爆火后产生的产业需求,更是验证了这一路线的前瞻性。


技术落地,建立开放产业生态环境


ChatGPT引爆技术革新,彻底带火了生成式AI等新一代技术的突破。


如何将技术和场景融合,赋能产业,已经成为新一轮时代科技革命的一个重点。


那么在这样大背景之下, 生态又将如何重构?「变」与「不变」的革新又在于何处? 


这是新型产业化落地最后一公里面临的困境。


我们看到,大型语言模型的发展越来越成熟,如何实现转化,才是展现大模型真正实力的关键一环。


技术与产业的关系犹如毛与皮的关系,有「皮」的存在,「毛」才有存在的可能和价值。


「皮」是产业,更是市场需求,技术通过真正地赋能场景,解决市场需求,才能够持续获得收益而发展。


对于一些特定场景,如果没有定制化的适配,就无法100%发挥技术的价值。


或者说,若没有多配套的产线支撑与需求市场,做出的技术也将偏离产业化初衷。


而OpenAI计划打造的LLM「应用商店」,正是要推动技术赋能场景的一个新生态的形成。


比如,教育APP制造商Khan Academy(可汗学院),就是在ChatGPT的基础上,开发了个性化AI导师Khanmigo。



而另一家企业AI平台Aquant,则利用独有数据微调了ChatGPT大模型,打造了聊天机器人应用Service Copilot。开发的产品能够智能回复客户有关设备维护、维修等方面的问题。


由此可见,面向未来产业的发展,生态亟需应势而变,在变局中以「竞争、合作、开放」的姿态变革重构。这样做的优势在于:


首先,从场景实践中提升技术的创新能力。技术推动产业发展,进而反哺技术创新。


通过跨界融合,能够促进数据、技术、知识等业务共享和协同,由此再推动不同领域的创新。


用「开放共赢」的姿态提升个体伙伴的竞争力,以此提升整体产业的效率与竞争力。


其次,优化产业布局,发挥生态内的单一环节的竞争优势。


未来的产业生态,需要根据不同环节的发展特点和优势,将单一伙伴的价值最大化,实现产业优化升级和可持续发展力。


浪潮信息的元脑生态,从2019年开始,一直就走在这种合作新范式的路上。


即用技术赋能场景,用「智算」聚生态之力,建立场景共同体,打通产业AI落地的最后一公里。




元脑生态,智算时代的生态新范式


元脑生态,正是要开启一个新时代的生态范式。


现在,浪潮信息打造的元脑生态中,已经有了500余个左手伙伴,4500余个右手伙伴。


他们始终倡导所践行的「聚合产业力量」,便是指具备AI开发核心能力的「左手伙伴」和具备行业AI整体方案交付能力的「右手伙伴」。



简言之,元脑生态不独属于某一个企业,而是左手伙伴+右手伙伴+浪潮信息的三元素结合,是热带雨林式的合作范式,从而实现优势互补、各取所需、合作共赢的局面


也就是说,元脑生态将成为一片肥沃的土壤,促进AI行业融合和落地发展。


这一生态构建,已在具体实践中取得了卓越成效。


聚生态之力,用AI赋能场景落地最后一公里


在金融行业中,许多业务已实现了数字化转型,并实现效率提升。


不得不承认的是,目前仍存在一些无法用AI亟待解决的问题。


比如,在票据处理方面,许多银行还依旧采用人工录入的方式,不仅耗时且成本高昂,柳州银行便是其中一个的代表。


当前,OCR技术的发展,已经能够将图像文件中的字符快速识别,并转化成文本。


而且在算法的加持下,即便遇到票据背景复杂、清晰度不高、文字倾斜等情况,也能实现智能提取。


一直深耕智能文字识别领域的合合信息(左手伙伴)便是典型代表。它在智能文字识别技术上破解了传统OCR应用识别难题,推出的TextIn Studio智能文字训练平台,能够提供上百种文档图像处理服务。


另外,与其他行业不同,「高网络安全性、高数据备份要求性、高监控和审计能力性、高应急响应能力」的银行特性,让金融行业落地的挑战变得更加困难。


而深耕金融隐私计算领域多年的可利邦(右手伙伴),能够提供整体的IT、金融化信息的解决方案。


立于元脑生态,合合信息和可利邦,能够全面利用浪潮信息提供的AI计算平台、AI资源平台、AI工具平台的能力。



那么,有了这个行业AI大脑,浪潮信息的左右手伙伴在柳州银行案例中是如何发挥所长,打造生态新范式?


在柳州银行OCR智能平台建设中,面临着极为两难的现实问题:


一方面,银行面临数据繁多、场景复杂的核心瓶颈,随着高爆发、高增长的数据量,都对模型训练和推理提出了更高要求。


另一方面,就用户数据安全维度考虑,定制模型的所有数据标注、训练,都必须在银行内网完成。



由此,针对柳州银行「算力资源少,场景应用多」等实际落地的困难,合合信息携手可利邦联合打造了业内领先的一站式智能OCR解决方案。


这样,通过生态的协同优势,跨越产业落地鸿沟,打通金融数智化转型的最后一公里。



那么,他们具体又是如何基于浪潮信息元脑生态,帮助柳州银行解决业务中的痛点?


首先,从算力方面入手。


AIGC时代来临,许多大语言模型基于海量数据集进行训练和推理时,对算力提出极大需求。


传统银行业务在技术侧方面,对高爆发、高增长业务数据处理、以及大量定制模型训练提出了需求。


只有底层算力系统,足够强大才能满足这一极高的要求。


然而,当硬件性能已经到顶,就需要用软件平台对算力实现更精细调度。通过优化底层资源调度,实现算力最大化利用。


针对柳州银行业务流量潮汐特征,合合信息与可利邦进行了解决方案算力调配的快速移植与优化,从而实现算力资源均衡分配。


具体来讲,基于业务流量波峰波谷特征,进行算力的自动弹性收缩,在保障业务不受影响的前提下,将资源利用率提升约40%。



另外,基于银行多业务场景常规并发需求,通过算力资源的细粒度切分,实现一卡多用。


最大化提高算力利用率,在几乎零性能损失情况下(≈1%),将算力利用率提升至3-5倍。



其次,从算法框架来看。


合合信息针对柳州银行初始化样本不足,缺少数据标注、凭证板式复杂等问题,进行了模型定制,然后针对复杂的单据、票证进行针对性训练。


由此,构建了高敏强化学习训练机制,让OCR票证识别精度和效率大幅提升。



这一方案,将合合信息的算法识别能力发挥至极致,实现了一站式覆盖端到端AI业务。


而元脑生态之下的资源平台AIStation,则助力其实现了模型的一键部署,能够将人证核验、图像定损、单据识别等AI 应用快速嵌入到银行业务流程中。


值得一提的是,整个过程中,模型训练时间也大幅缩短,从2天削减到4小时,部署时间也从2天缩短到5分钟。



一站式智能OCR解决方案,能够让金融机构「0门槛」开发OCR。基于几十张票证小样本,开发者便能完成OCR模型开发,实现快速部署与训练。


显然,这可以大大加快金融机构智能OCR应用的开发与上线的速度。同时,最大化满足特定场景智能OCR应用需求。



实践证明,一站式智能OCR解决方案,将柳州银行票证录入效率提升百倍以上,人力资源成本节省数百万元,实现业务提速。


未来,这个OCR解决方案,也不仅限于柳州银行,甚至在证券、保险等金融机构,同样适用。


除了算力、算法,在智能平台运维方面,基于浪潮信息的AIStation平台,通过建立稳定的智能容错机制,不断强化上层应用的业务安全保障能力。


真正实现了为金融数智化转型的最后一公里保驾护航。


全流程「保驾护航」:AIStation一键部署,高效算力平台管理,加速技术迭代革新


可以看到,在方案的落地过程中,一套稳健的人工智能应用系统必不可少。


而浪潮信息推出的智能业务生产创新平台——AIStation,满足的正是这个需求。


具体来说,AIStation是专为人工智能开发和部署打造的端到端平台,可以实现从模型开发、训练、部署、测试、发布、服务的全流程一站式高效交付。


基于资源管理调度、平台流程支持能力,它在异构芯片、创新生产工具、行业伙伴应用、客户方案等不同层面,与元脑合作伙伴展开了大量适配对接认证工作,并积累了大量经验、模式与方案,成为了元脑生态的重要承载平台。


举个例子,比如智源研究院的FlagAI一站式大模型工具,就是基于AIStation平台进行本地化部署的。



我们都知道,大模型的训练,需要构建包含计算、网络、存储、框架等在内的系统性分布式训练环境。传统的分散化管理,让平台的整体协同性较差,训练效率低。


而AIStation实现了异构算力集群的统一池化管理,通过自适应系统将训练底层的计算、存储、网络环境自动化配置。通过多种资源高效管理和调度策略,AIStation能实现万卡集群的毫秒级调度,提升整体资源利用率到70%以上。


通过数据缓存机制,AIStation可以让模型训练效率获得200%-300%的提升。并且,还达到了健壮性与稳定性这样的大模型训练的强要求。


根据服务资源需求的变化,AIStation可以及时调整资源配给,实现秒级服务扩缩容,可支持百万级高并发的大规模AI推理服务场景,服务响应平均延迟低于1ms,突发的访问高峰的响应效率提升50%。 


就在6月25日,AIStation凭借着专业的AI开发与部署能力支撑,有效降低大模型时代的大规模分布式AI算力平台的配置与维护门槛,荣获了2023全球人工智能产品应用博览会「产品金奖」。



水利万物,普惠AIGC


从元脑生态的角度来看,浪潮信息布局产业AI是率先布局、并率先入局,从2019年到现在,短短四年间,获得了极多合作伙伴的支持。


今年AIGC才开始迸发出来,之前大家都处于探索期。


在实践中可以发现,大家都在面临着可落地的商业化途径的问题,比如量化金融智能客服,大模型+数字人等等。


许多客户都有非常理想、非常美好的需求,但实现起来并不那么容易。


有的客户是有数据、有资源,他们的诉求是希望基于自己的数据进行挖掘,从而让它变得更智能;有的客户是有场景,希望能让场景变成更智能化的体验;有的是中间的集成方软件服务商,希望被赋能。


这就对生态提出了全方位的考验。


相对来说,元脑生态不是中心化的生态,不强调谁依附于谁,更开放。


不同企业的产品落地,所面临的鸿沟,以及面临的困境,是完全不同的。在快速迭代的时代背景下,生态需要去融合、去重塑。


这也正是元脑生态中所谓「水利万物」的要义。


而出乎意料的是,元脑生态真正上线之后,许多客户都表现出了意想不到的热情。


这是因为,在此期间,客户发现了浪潮信息具有的独特优势——


1. 围绕大模型提供的算力算法,具有一个全栈的基础设施方案服务能力。


尤其是在超大规模的算力集群中,可以围绕迁移参数的算法进行调优优化。


浪潮信息作为基础设施厂商,在这方面有得天独厚的优势。


有算力,但更懂如何去用好算力。犹如足球比赛中的教练,赛前根据「对手」情况部署战术安排,临场根据比赛进程实时进行人员和位置调整。此外,还要善于激发每名球员的潜能。


2. 作为多元化的算力平台,浪潮信息信息提供的是更开放、更多元的平台。


既能支持目前国际领先的GPU,也能率先支持数十种国产算力。


不管是围绕大模型的超大集群训练场景,还是针对于特定的AI推理场景,都有更多元化的算力产品和适配能力。


3. 通过元脑生态,打造AIGC时代的生态链。


不论是浪潮信息自身推广的算力算法服务,还是围绕更多的合作伙伴,基于这种生态把伙伴的能力开放共享给更多的终端客户。


在这个过程中,或许有人是锁,有人是钥匙,一旦锁找到了钥匙,就是迸发中心的商业模型。


To B领域的业务正在AIGC的时代被逐个重塑。也许新的商机就在不远处。


面对如雨后春笋般的大模型,我们是否真的已经准备好了掘金AIGC ?


除了面对技术的挑战之外,在技术与产业的这台天平上,通过生态形成协同优势的重要性,也渐渐显露了出来。


聚生态之力,普惠AIGC,让AIGC真的成为像「水一样的利万物」,是当下最好的答案。


而这,也是浪潮信息元脑生态始终在践行的。


参考资料:
https://mp.weixin.qq.com/s/x0AETTy_461fWh8NKJMg3A



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
阿里组织变革后净利润增长48%;李宁上半年收入增长13%;蓝瓶咖啡在内地推出即溶产品... | 刀法品牌热讯中国团队自动驾驶大模型斩获CVPR最佳论文;Stability AI推出新文生图模型;京东大模型即将发布丨AIGC大事日报zt事不三思恐怕忙中有错气能一忍方知过后无忧道理服人那怕英雄是虎律条不犯甚么官法如炉第 三 章支持全栈编程语言、随取随用、一键部署,谷歌推出浏览器AI开发环境IDX瓦格纳开始在白俄罗斯部署,这两国慌了百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报5分钟端侧部署视觉大模型!专为Transformer优化的AI芯片来了​找室友合租|无中介费|9.1入住|近红线地铁站步行5分钟/MIT步行15分钟/哈佛步行13分钟高级公寓两室一厅两卫3800中央重磅部署,促进民营经济!关于这款爆火的英语学习神器,你们关心的问题都在这!大话三国227:赤壁之战的兵力部署,周瑜和诸葛亮的调兵安排?第 四 章PromptAppGPT重磅更新!AI助手0门槛开发+运行:几十行代码即可实现AutoGPT只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型中央财经委员会定调!国常会最新部署,1700亿半导体龙头遭减持…周末影响一周市场的十大消息(新股+点评)经历生后方秀惟的格少了年轻时的冲劲但多了一个份从容内心平静就犹如一滩泉水几分钟搞定一篇博客,网友:有了这款神器,还要啥谷歌文档、Apple Notes?Ins版推特上线即爆火! 马斯克笑不出来了...美国甜心美少女出道即爆火,却被亲妈下药控制当赚钱工具,团队还让她献身小李子?10门AP5分成新常态?美高妈妈给娃安排了10门课程的暑期学术计划...降价|无中介费|9.1入住|近红线地铁站步行5分钟/MIT步行15分钟/哈佛步行13分钟高级公寓两室一厅1.5卫3900中美外长会谈!国常会最新部署,A股迎史上第四大IPO…周末影响一周市场的十大消息(新股+点评)发布即爆火的ET5T:我们都“小看”蔚来了上市即爆款的这款复古电动车 北美版亮相了!火山引擎推出大模型平台;云知声提交上市申请;联通推出首个运营商大模型丨AIGC大事日报阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl石黒 一雄Sir Kazuo Ishiguro OBE FRSA FRSL, Nobel, Japanese-British n一句话让AI训练AI!20分钟微调羊驼大模型,从数据收集到训练全包了十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型9.1入住|近红线地铁站步行5分钟/MIT步行15分钟/哈佛步行13分钟高级公寓两室一厅两卫4500半中介费|八九月入住|近红线地铁站步行5分钟/MIT步行15分钟/哈佛步行13分钟高级公寓两室一厅两卫4250+无中介费|随时入住|近红线地铁站步行5分钟/MIT步行15分钟/哈佛步行13分钟高级公寓两室一厅两卫4250用计算机视觉识别模型种生菜?“科技+农业”还能这么玩!5小时get大模型时代提效神器:写出高价值大模型Prompt!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。