Redian新闻
>
4.5K Star! 这个图像识别工具太强了

4.5K Star! 这个图像识别工具太强了

公众号新闻

图像识别作为深度学习算法的主流实践应用方向,早已在生活的各个领域发挥作用。如安全检查、身份核验时的人脸识别;无人货架、智能零售柜中的商品识别,其背后的关键技术都在于此。

 图1 PP-ShiTuV2实际预测效果示意图
然而实现理想的识别效果却并不容易:
  • 难点:针对海量数据,不同场景均实现优秀的表征能力,能否一套方案全搞定?

  • 难点二:不同物品的差别极其微小,或者同类物品由于受到外界干扰却呈现不同形态,究竟如何进行有效区分?

  • 难点三:识别需求更新频繁,使用单一模型必须不断重训模型,怎样才能降低开发成本,快速跟上迭代步伐?

此次PaddleClas最新升级发布的通用图像识别系统 PP-ShiTuV2完美解决以上难点,无需训练,一套模型即可完成20+高频场景的图像识别,对于新增类别更是需两步即可添加入库,实现精准识别

上下滑动查看所有内容

图2 PP-ShiTuV2覆盖场景列表

⭐ 项目链接 ⭐

https://github.com/PaddlePaddle/PaddleClas

数据集下载方式见文末

不仅如此,此次更新更是联合AI Studio精选项目作者——国内Qt论坛总版主小熊宝宝,发布全新图像库管理工具,通过可视化的界面即可完成检索库类别、图像管理,还支持一键更新索引库

图3 图像库管理工具效果示意图

⭐文档链接⭐

https://github.com/PaddlePaddle/PaddleClas/tree/release/2.5/deploy/shitu_index_manager

同时还提供了移动端基于飞桨轻量化推理引擎Paddle Lite部署教程,手机上也能轻松实现图像识别,还有Android APP可玩,扫码下载即可体验:
图4 PP-ShiTuV2 APP效果展示

本APP已预置196种常见饮料检索库,支持对拍照/本地上传的图片进行识别;同时支持通过拍照/本地更新检索库,可快速适应新增类别的识别需求,构建自己的专属识别APP。



图像识别系统

PP-ShiTuV2核心技术解读

这样的特殊能力,得益于PP-ShiTuV2通过集合目标检测度量学习图像检索等技术,形成完整的图像识别系统;但其中每个模块又相互解耦,并将每个模块性能最大化,结合自研PP系列骨干网络,才实现了量化后仅15M的All-in-One超轻量图像识别系统
图5 PP-ShiTuV2结构示意图
  • 轻量骨干网络PP-LCNetV2,配合SSLD蒸馏算法,模型精度大幅提升。
  • 超轻量主体检测算法PP-PicoDet,快速检测出图像中的目标物体。
  • 基于ReID Strong Baseline等方法,对特征提取模块进一步优化,精度提升8个点。
 表1 PP-ShiTuV2性能对比
  • 更多详细文档,请参考:

https://github.com/PaddlePaddle/PaddleClas/blob/develop/docs/zh_CN/PPShiTu/PPShiTuV2_introduction.md



助力开发者

共建开源生态

自PP-ShiTu发布以来,引起了众多开发者的广泛关注。在诸如自助零售柜、生鲜结算台、菜品无人结算等场景实现业务落地。

图6 基于 PP-ShiTuV2的生鲜智能结算方案

深圳市银歌云技术有限公司将深度学习图像识别技术与传统结算流程结合,基于 PP-ShiTuV2,完成了生鲜自助结算系统的开发落地,识别精度高达98%,整个流程在1秒内即可完成,无需人工干预完成结算,减少人工成本的同时,大大提升了结算效率和用户体验。

图7 银歌云生鲜智能结算系统实际效果展示

与此同时,我们也力求为开源社区的繁荣作出贡献,希望PP-ShiTu算法以及优化思路,可以给业界开发者带来更好网络的同时,也带来更多的算法优化启发,为中国的开源发展贡献一份力量




加入 PaddleClas 技术交流群

本次PaddleClas团队为大家准备了精彩的直播课讲解,11月1日-11月3日每晚20:30,百度资深工程师们将在直播间为大家从技术算法解读、企业落地应用及产业实践范例,大家如果有任何问题也可以在直播间进行互动交流!

入群福利

领取20G重磅PaddleClas学习大礼包,内含:

  • 20+场景数据库,包括各类商品、动植物、航拍图像等数据集

  • 场景应用模型集合:包括人员出入管理、生鲜品识别、商品识别等

  • 70+前沿图像分类与识别论文、历次发版课程视频、PPT与优质社区项目等

入群方式

  1. 微信扫描下方二维码,关注公众号,填写问卷后进入微信群

  2. 查看群公告领取福利

【精彩内容抢先看】

【更多精彩直播推荐】

相关地址

  • 官网地址

https://www.paddlepaddle.org.cn

  • PaddleClas项目地址

https://github.com/PaddlePaddle/PaddleClas
https://gitee.com/paddlepaddle/PaddleClas

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
“新十条” 发布一周后的六个图;携程国内酒店业务出人意料地恢复至疫情前OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了新的加强针又来啦!Moderna 说,新的 COVID-19 加强针增强了对亚变体的免疫反应OpenAI 宣布开源多语言语音识别系统 Whisper,英文识别能力接近人类水平戈尔巴乔夫、蒋经国,兼答文友不打针不吃药,轻松甩掉血糖Top 1咨询公司新版PPT发布,这21个图表一个字!绝Chase Southwest Plus 信用卡【75k 开卡奖励】爆火的 ChatGPT 太强了!写代码、改 bug,网友:可取代 Stack Overflow 了小哥在卧室建出一缸热带雨林,食物链环环相扣,甚至能打雷下雨!太强了!Spring 6.0 要来了,太强了!“网友喝醉后跟前女友表白结果…” 哈哈哈哈哈哈求生欲太强了!!这个开源太强了!智能标注10倍速、精准人像分割、3D医疗影像分割!基于PyTorch、易上手,细粒度图像识别深度学习工具库Hawkeye开源忍无可忍?欧盟向美国发出书面警告:已成立特别工作组,将考虑报复!还是自家菜最好吃在 Linux 中使用 “Converter” GUI 工具转换和操作图像 | Linux 中国内核代码量不到一万行、GitHub star超5k,国产开源物联网操作系统TencentOS Tiny的探索与实践Stable Diffsuion还能用来压缩图像?压缩率更高,清晰度超越JPEG等算法3行代码建模,训练速度提升200%?这款时序开源神器PaddleTS太强了!ProGAN、StyleGAN、Diffusion GAN…你都掌握了吗?一文总结图像生成必备经典模型(一)一张令人泪目的婚礼照【八卦】偶遇李安国外路边小店吃饭 用一次性餐具太真实太强了,全面解析缓存应用经典问题Meta发布Make-A-Video,这个AI文本生成视频工具太神奇了!比杭州更「江南」的重口味小城!时光停驻、光影斑驳,它的故事感也太强了!“妈妈,你的肛门还疼不疼?”人类幼崽让爸妈当场“社死”,杀伤力太强了哈哈哈哈中国这个数据太强大了!美国羡慕嫉妒恨太强了!地理老师随手画出“教科书式”板书......听,教育早新闻来啦!图像生成模型 Stable Diffusion 现已开源 | Linux 中国免1年物业费+5k【买房/高级公寓/投资】Brighton地区 | Stratus高端公寓住宅 | 预售 $56.99万起!AI 也能被 Cosplay,太强了渔歌子(2):摄影欣赏:清新淡雅画屏幽AmEx Platinum for Morgan Stanley “信用卡”【125k 开卡奖励!】文件更小,质量更高,大火的Stable Diffusion还能压缩图像?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。