Redian新闻
>
英伟达的这款炼丹神器太强了!

英伟达的这款炼丹神器太强了!

科技

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

众所周知,深度学习的训练比较玄学,大家经常调侃就像"炼丹"一样。如果你有个好工具,科学"炼丹"的效率就会显著提升!



Amusi 这里给大家介绍的是 NVIDIA 官方推出的 TAO 工具套件,即一个基于 Python 的工具包,通过优化预训练模型和应用迁移学习来加速模型训练以实现更高性能的 AI 系统,目前支持 TensorFlow、PyTorch 等深度学习框架。

TAO 工具套件


NVIDIA 训练、调整和优化 (TAO) 工具套件 (TAO:Train, Adapt, and Optimize)是一款基于 CLI 和 Jupyter Notebook 的低代码(low-code) AI 模型开发解决方案, 方便对 NVIDIA 预训练 AI 模型进行调优,主要支持计算机视觉和对话式 AI 两大领域。



TAO 工具套件特性

  • 训练更轻松

  • AI 高度准确

  • 推理优化(低延迟/高吞吐)

  • 部署更容易


目前 TAO 工具套件支持超过 100 种经 NVIDIA 优化的模型架构和 Backbone (主干) 的组合,例如图像分类模型:ResNet、VGG、EfficientNet 等;目标检测模型:YOLOv3/v4、RetinaNet、Faster R-CNN 等;分割模型:Mask R-CNN、U-Net等。


此外,还有一些偏应用落地类模型,比如可用于新零售领域和社交距离计算的 PeopleNet;可用于停车记录的 License Plate Detection 等。


NVIDIA 预训练库提供的部分 CV 模型及 Backbone 如下图所示:


当你选择好合适的模型之后,就可以使用 TAO 工具套件来训练、微调、剪枝和导出高度优化且准确的 AI 模型,最后,还可以用部署框架将生产级模型部署应用起来,比如计算机视觉模型可以搭配 DeepStream,而对话式 AI 模型可以搭配 Riva 来构建端到端服务和部署方案 。


TAO 工具套件流程框架图


NVIDIA PeopleNet 行人检测的演示效果图


TAO 工具套件 3.0-22.05 版本亮点


就在前些天,NVIDIA 发布了最新版本的 TAO 工具套件(版本 3.0-22.05 )。该最新版套件提供了更多的视觉和语音预训练模型,还上新了很多新功能,比如支持了 TensorBoard、自定义 ONNX 模型权重导入等。


值得说一下,从 TAO Toolkit 3.0-22.05 开始,提供的目标检测模型都支持 COCO 格式。下面将重点介绍 TAO 最新版本的部分亮点:


1. 使用 TensorBoard 进行可视化


训练过深度学习模型的同学应该都知道大名鼎鼎的 TensorBoard,可以称为 TensorFlow 和 PyTorch 深度学习框架的可视化炼丹神器!比如看到这行命令,你应该非常熟悉:

tensorboard --logdir

TAO 工具套件这次更新后,大家可以在 TensorBoard 中可视化很多重要数据(比如训练/验证的损失及变化曲线、模型权重的直方图和预测中间图/结果图等),进而来了解模型的训练性能。


当有了数据可视化,大家就方便更改超参数来对比实验,一步步训练出满意的 AI 模型。



2. 使用 Rest API 将 TAO 工具套件集成到你的应用中


TAO 工具套件现在可以部署为具有 REST API 的服务,这意味着开发人员通过 REST API 构建新的 AI 服务或者将 TAO 工具套件集成到现有服务中,并在 Kubernetes 上管理框架。



3. 通过 BYOM Converter 使用自己的模型权重

BYOM(Bring Your Own Model)是一个基于 Python 的工具包,可以将任何 ONNX 模型转换为与 TAO 工具套件兼容的模型。大家借助 BYOM 工具就可以使用 TAO 来微调和优化自己的模型。比如从 ONNX 导入预训练的权重,进而可以在自己的模型上利用完整的 TAO 功能,例如训练、剪枝和量化等。


注:ONNX 模型的获取方式比较多,你既可以从 ONNX 官网提供的模型库中选择合适的模型,也可以将自己的模型通过 ONNX 工具来转换成 ONNX 格式的模型。



具体来说,TAO BYOM Converter 是提供了一个 CLI 来导入 ONNX 模型并将其转换为 Keras。转换后的模型以基于 EFF 的 .tltb 格式存储。



4. 新增预训练模型


最新版本的 TAO 工具套件中新增了不同领域的代表性模型,涉及 3D 目标检测、动作识别等方向。


PointPillars:3D 目标检测的的代表工作之一,谷歌学术引用量 1100+,已广泛应用于自动驾驶、机器人等领域。



PoseClassificationNet:将一序列骨架(身体姿态)作为网络输入,并预测这些帧中一个或多个人的动作。最新版本中支持的模型是 ST-GCN 。ST-GCN 可以称为将图卷积神经网络(GCN)应用在基于骨架的动作识别的开山之作 ,谷歌学术引用量1900+,已广泛应用于视频理解、智能零售等领域。



这次更新的内容还有很多,这里就不一一介绍,感兴趣的同学可以去 TAO 工具套件官网查看。


落地案例介绍


这里再分享一个"智慧农场"的有趣落地案例:OneCup AI 公司利用 NVIDIA TAO 工具套件、DeepStream、Triton 和预训练模型开发了 BETSY(OneCup 的动物人工智能产品),可以帮助牧场主跟踪和监控他们的牲畜(比如奶牛、绵羊等),方便让他们更深入地了解牲畜的健康情况、生长和活动信息。据称在部署的边缘设备上以 2K 分辨率实现高达 30 FPS 推理速度。



总结


如果你想快速上手训练一个模型?

如果你想快速部署应用一个模型?

如果你没有较大的数据集,但想通过迁移学习来获得高度准确的 AI 模型?


那么可以尝试使用 TAO 工具套件!助力你的深度学习科学"炼丹"。


Amusi 期待 TAO 工具套件开放更多的模型,比如大火的 Transformer、Vision Transformer 、NeRF 等,也期待更多新的功能和优化!


附上 TAO 工具套件的资源链接,推荐大家使用!

官网:https://developer.nvidia.com/tao-toolkit

中文官网:https://developer.nvidia.cn/zh-cn/tao-toolkit

TAO 工具套件技术文档:

https://docs.nvidia.com/tao/tao-toolkit/text/overview.html

从 NGC 下载计算机视觉或对话式 AI 模型:

  • 计算机视觉模型:

    https://catalog.ngc.nvidia.com/orgs/nvidia/collections/tltcomputervision

  • 对话式 AI 模型:

    https://catalog.ngc.nvidia.com/orgs/nvidia/collections/tltconversationalai



整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
英文诗译: 等她来 - Wait for her: Mahmoud Darwish意大利72岁老太想徒步走过丝绸之路,用3年走到北京?!太强了!英伟达Omniverse还在变强?英伟达新一代以太网助力英伟达的汽车局中国造芯新势力,哪家强?下一个英伟达或许就在其中! | 王煜全太突然!洛杉矶这款随处可见的亚洲下饭神器,要吃不到了!我的打鸟日记(75)七天如一日斯坦福&英伟达:两篇研究揭示人工智能爆发机会|科技特训营GPU降价利好英伟达?AI下一个腾飞机会已经出现了!|王煜全放弃西城千万学区房读国际校,帝都爸爸:主要是数学资源太强了!英伟达显卡被破解,矿工狂喜,等等党哭了一只包裹的奇遇在美国74.第一次过大节一块英伟达3090单挑180亿参数大模型,国产开源项目这回杀疯了试了6款网红防磨脚神器,这款真是让人栓Q!这个人叫萧军— 无法化解的情缘英伟达这个芯片,依然难逢敌手英伟达另一大生态,DOCA正在崛起“叫板”英伟达和Meta,微软首提工业元宇宙英伟达这篇CVPR 2022 Oral火了!2D图像秒变逼真3D物体!虚拟爵士乐队来了!英伟达在提升 Linux 上的 GPU 使用体验上迈出了一大步 | Linux 中国游戏对硬科技有多重要?英伟达因游戏业放缓,芯片卖不动了!失去底线,但“赢”的信念更强了!美网拭目以待英伟达的这款GPU太强了!冲上热搜!红杉中国曝出面试现场全过程,这位新晋女员工太强了…硬核观察 #634 英伟达开源 Linux GPU 内核驱动Sky Top《龙珠》巨猿贝吉塔:扑面而来的绝望压迫感太强了!王煜全:科技芯时代,下一个英伟达在哪里? | 直播博通唱衰,英伟达假摔,半导体还能繁荣多久?王煜全:科技芯时代,下一个英伟达在哪里? | 直播预告PPT怎么显高级?苹果这个骚操作,真的太太太强了!PPT图表怎么显高级?麦肯锡这个骚操作,也太太太太强了!笑疯!Meta后院失火!自家AI是川普忠粉!疯狂吐槽扎克伯格:“我不喜欢他,操纵欲太强了…”AI之战,英伟达赢麻了英伟达与斯坦福合作开发超薄 VR 眼镜,只有 2.5 毫米
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。