Redian新闻
>
加速AI推理,探索英特尔® 至强® 可扩展处理器在OCR应用落地方面的实践

加速AI推理,探索英特尔® 至强® 可扩展处理器在OCR应用落地方面的实践

公众号新闻

利用AI加速企业业务的自动化进程,推动业务流程的数智化重塑或升级,已经成为企业提升工作效率、助力商业创新的重要方式。在此过程中,由AI赋能的智能光学字符识别 (OCR) 应用发挥着日益重要的价值。

随着人工智能技术的发展,由AI赋能的OCR已经在金融、政府、制造、互联网、医疗等行业的单据识别、信息流入、图片翻译、车牌识别等场景得到广泛应用,帮助企业有效地释放人力资源,提升工作效率,为广泛的数智化应用提供基础能力支撑。

部署智能OCR应用能为企业业务及AI应用布局带来哪些回报?

用友算法工程专家宋祺、亚信科技产品运营专家吕莹、东软集团医疗保障事业部产品发展部部长黄小卫、英特尔人工智能软件架构师桂晟、虎博科技创始人&CEO陈烨,围绕《从OCR起步推进企业AI应用落地》这一主题进行了精彩的分享。

AI 赋能 OCR,助推企业增效降本

随着当前大语言模型的发展,OCR技术将会成为大语言模型应用的一个重要入口和前置的输入来源。OCR本身是个很大的市场,其算法和程序需要部署在很多地方,可能是公有云、私有云,或者是边缘的本地服务器,甚至是一些终端设备上。

有非常多的软件开发商和算法供应商参与其中,厂商们通常需要一个更有成本优势、硬件适配性更广的解决方案。

总体看来,用户有如下亟待解决的两个问题:

一是要解决使用GPU带来的高成本和难部署问题;二是要提高 CPU 的计算性能。

为此,用友、亚信、东软选择与英特尔合作,借助英特尔® 至强® 可扩展处理器的强大性能和内置AI加速器提升OCR应用性能,赋能客户加速数智化转型。

优化OCR应用性能,充分释放CPU计算潜能

用友算法工程专家宋祺分享了《英特尔AI加速技术在用友OCR场景的应用》。

为了兼顾GPU利用率和调用峰值服务的可用性,在月末报销量大、服务调用都集中时,用友采用了一套异构处理器的服务架构,即利用搭载了OpenVINO™️ 工具套件的英特尔® 至强® 可扩展处理器将高峰期的数据分流。仅需增加两台16核的CPU服务器,即可满足峰值,使峰值时的GPU使用数量降低了50%。

经过OpenVINO™️ 工具套件优化的算法服务,响应时间降低到3秒以内,使得在切换整个处理架构时不会影响整体的业务响应时间和对应的时延,对用户是无感知的。

亚信科技产品运营专家吕莹介绍到:亚信科技机器人流程自动化平台(AISWare AIRPA)是通过模拟并增强人类与计算机的交互过程,实现工作流程自动化的平台。其在RPA功能的基础上,提供了强大的智能OCR支持。

在智能OCR应用中,亚信科技通过第四代至强® 可扩展处理器和英特尔® AMX支持实现从FP32到INT8/BF16的量化,从而在可接受的精度损失下,增加吞吐量并加速推理。

从结果上来看,相比传统人工方式,成本降到至1/5到1/9之间,而且效率还提升约5-10倍。

东软自研的OCR识别算法是基于深度学习主流技术实现的,能够在复杂的背景下识别出不同医院、不同格式的票据、处方、发票、费用清单、明细等票据信息。在英特尔® 至强® 可扩展服务器和OpenVINO™️ 环境下,它能够获得更高的识别准确率和更快的识别速度。

并且东软在方案设计的阶段就和英特尔公司合作,采用不同代际的至强® 可扩展处理器的服务器来进行整体算法性能的验证。最终实验结果表明,在第四代英特尔® 至强® 可扩展处理器上采用OpenVINO™️ 进行模型推理加速将大幅提升OCR的识别性能。

这些OCR应用的成功应用,都少不了英特尔软硬件产品的加持。

英特尔人工智能软件架构师桂晟表示,随着英特尔® 至强® 可扩展处理器的演进,单个CPU的核心数量不断增加,从第一代的最多28核增长到第四代的最高60核,核心数量的增多带来了更加强大的算力。

除此之外,英特尔还在CPU指令集方面专门为人工智能应用进行了很多优化,例如英特尔® AMX。英特尔® AMX 针对广泛的硬件和软件优化,通过提供矩阵类型的运算,显著增加了人工智能应用程序的每时钟指令数 (IPC),在AMX加速引擎的助力下,至强® 可扩展处理器不仅能用来做推理,还能用来处理一些机器学习训练的工作负载。

大模型技术驱动下,OCR 未来路在何方

大模型技术会为 OCR 及相关应用带来哪些新的变革?将如何为各行各业赋能?在本场研讨会的最后,虎博科技创始人&CEO陈烨围绕《大模型落地应用思考,展望OCR及相关应用的新技术发展》进行了详细的分享。

谈到智能 OCR,陈烨表示其产品的关键点主要有两个:一是知识库建立要准,要真正把文件理解好,把它转化成知识库和大模型能够理解的形式;二就是大模型。

而虎博科技的定位就是给大家提供一个基础模型,使用户可以基于基础模型迅速打造出自己领域里的大语言模型和应用。

陈烨认为这整个旅程才刚刚开始,虎博科技很期待和大家、生态伙伴、开发者、应用者,一起来见证接下来人工智能NLP大语言模型令人兴奋的、繁荣的几十年。


如果您对本文涉及的基于英特尔® 至强® 可扩展处理器对及英特尔® AMX如何显著提升OCR推理性能的技术细节感兴趣,如果您也想了解虎博科技在大模型落地应用思考,英特尔《至强实战课》之《从OCR起步推进企业AI应用落地》将为您带来更加全面且详细的真人讲解,欢迎大家扫描海报中的二维码注册收看;

点击“阅读原文”也可以了解更多英特尔® AMX对OCR多场景应用的性能提升。

*本文系量子位获授权刊载,观点仅为作者所有。


—  —

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
英特尔处理器命名大改,贴纸标识全面焕新英特尔处理器命名彻底改变 将正式淘汰酷睿i7中的“i”16家芯片顶流火拼Hot Chips!英特尔揭秘第六代至强架构,披露未来3年产品硬核观察 #1035 英特尔开始出货量子处理器直播预告:主讲特定领域处理器设计与加速后量子密码学应用的ASIP4 岁就能玩!又萌又硬核,培养空间推理+逻辑推理,从这套桌游开始英特尔酷睿 Ultra 1 代处理器现身:核显配备 128MB Foveros 3D 缓存英特尔放弃 “i” 处理器,重塑酷睿美元即将贬值全新酷睿 Ultra(Meteor Lake)处理器将至,英特尔“创新 2023 ”活动细节披露北京:“伙伴计划”加速AI大模型应用落地中国学者突破表面码重复多轮纠错难题,攻克量子计算可扩展化和实用化关键技术你以为第一共和银行倒闭了就完了吗?LLM推理提速2.8倍,CMU清华姚班校友提出「投机式推理」引擎SpecInfer,小模型撬动大模型高效推理硬核观察 #1012 Meta 公布革命性可扩展模型架构 Megabyte全新酷睿 Ultra 系列官方确认,英特尔 14 代 Meteor Lake 处理器改变命名方案奥迪回应向中国车企买电动车平台授权,吉利雷诺成立合资公司,英特尔推出AI处理器,塔塔集团或收购纬创工厂,这就是今天的其他大新闻!英特尔酷睿Ultra 1代处理器核显曝光,最高1024流处理器消息称英特尔 14 代 Raptor Lake Refresh 处理器较 13 代酷睿平均涨价 15%无限量访问GPT-4!ChatGPT企业版来了,可扩展32k上下文,代码解释器随便用万字长文概览大语言模型对齐(欺骗性对齐、可扩展的监管、机械可解释性、工具性目标趋同)微星海外推出 Cubi 和 Pro DP 系列迷你主机:搭载英特尔 12/13 代处理器,雷电 4 接口英特尔“创新2023”活动细节曝光,全新酷睿处理器将至拓展XR应用场景,业内首个XR产业加速器启动招募2023年美国宜居最佳10城消息称英特尔 Arrow Lake-S 处理器大核 L2 缓存将升级到 3MB1999 元,宏碁推出优跃 Air 笔记本电脑:搭载英特尔 12 代 N100 处理器全文 | 广东数字政府2.0:探索公共数据资产化管理,探索建立“数据海关”,完善数据交易监管机制AIGC在保险行业有哪些应用落地的可能性?实锤!豪言一年要卖150万片的国产处理器竟是贴牌英特尔波函数纠缠好,就是神有余,则笑不休关于高可用、高性能、可扩展架构设计的14大要点详解 | 极客时间What they forgot to teach you at school __笔记节选英特尔酷睿 Ultra 7 1002H 处理器曝光,16 核 22 线程【WWDC 2023】如何将现有Unity VR应用和游戏带到VisionOS中?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。