Redian新闻
>
Apple 机器学习和视觉生态系统更新:Core ML、Create ML 和 VisionKit

Apple 机器学习和视觉生态系统更新:Core ML、Create ML 和 VisionKit

公众号新闻

作者 | Sergio De Simone
译者 | 明知山
策划 | 丁晓昀

在 WWDC 2023 开发者大会上,苹果公司展示了其机器学习和视觉生态系统的许多扩展和更新,包括对 Core ML 框架的更新,Create ML 建模工具的新功能,以及用于图像分割、动物体态检测和 3D 人体体态的新的视觉 API。

苹果工程师 Ben Levine 解释说,第一个有关 Core ML(运行在 iOS 设备上的机器学习框架)的改进是更快的推理引擎,不需要重新编译模型或修改任何相关代码就可以获得这种提速。Levine 没有提供与速度提升相关的数据,他说具体将取决于实际的模型和硬件。

Core ML 还扩展了其支持异步工作流的能力,新增了 Async Prediction API。以前,Core ML 支持批量预测,适用于已知工作量并且可以预先计算所有组件批次输入的情况。有了新的 Async Prediction API,你现在可以将预测分派到后台线程,这意味着你可以同时运行多个预测。此外,API 还可能支持取消预测请求,这在某些情况下可以进一步提高响应性。

例如,Levine 演示了一款使用 Core ML 对一系列图像进行着色的应用程序,并展示了新的 Async Prediction API 如何通过将推理时间减少大约一半来改善滚动体验。然而,并发推理也有需要注意的地方。具体来说,Levine 提到了由于在内存中加载多个输入和输出而增加的内存需求,这个问题必须得到解决,例如可以通过限制应用程序执行的并发操作数量。

除了 Core ML 推理能力外,苹果还通过新版的 Core ML Tools(这个工具可以帮助开发人员优化机器学习模型的大小和性能)改进了模型转换选项。苹果公司表示,随着应用程序开始集成越来越多、越来越大的 ML 模型,这一点至关重要。该工具现在支持几种技术,包括权重修剪、量化和调色板化,在训练新模型时都可以使用它。

在建模方面,苹果对 Create ML 进行了扩展,支持多语言 BERT 嵌入和多标签图像分类。

今年,我们设计了一个新的嵌入模型,并在数十亿个标记文本示例上进行了训练。它是一个双向编码器表示变换器模型,简称 BERT。

据苹果公司称,新的 BERT 模型也可以提高单语文本分类器的准确性。

最后,新的 Augmentation API 可以在只有有限训练数据的情况下提高模型质量。数据增强是一种使用变换从现有示例生成新训练示例的技术。Augmentation API 将使开发人员能够通过组合不同的转换步骤来构建自己的增强管道。苹果公司表示,Augmentation API 使用了结果构建器,并为使用过 SwiftUI 的开发人员提供他们熟悉的结果。

最后要注意的是,苹果公司为其 VisionKit 框架增加了新功能,包括:检测动物体态并实时跟踪它们的关节;将主体从图像中提取出来并将其与背景分离;使用新的 Segmentation API 区分同一图像中的多个个体。

如果你有兴趣深入了解即将发布的 iOS 17 中所有新的 ML 和视觉功能,请查看 WWDC 2023 大会录制清单。

原文链接:

https://www.infoq.com/news/2023/07/coreml-createml-vision-ios-17/


你也「在看」吗? 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
汇聚机器学习发展前沿,「第十九届中国机器学习会议」即将开幕EAST、PixelLink、TextBoxes++、DBNet、CRNN…你都掌握了吗?一文总结OCR必备经典模型(二)精选SDE岗位 | Tesla、Intel、Apple等公司持续热招!南洋理工大学最新视觉语言模型综述:预训练、迁移学习和知识蒸馏啥都有南洋理工最新视觉语言模型综述:预训练、迁移学习和知识蒸馏啥都有政府发出警告!快将PayPal、Venmo、CashApp和Apple Cash里面的钱转走!政府发警告!快将PayPal、Venmo、CashApp和Apple Cash里面的钱转走!推出皮肤健康生态系统,这家国货护肤企业新增三大赛道比Python快68000倍!Mojo正式发布,网友:Python生态系统最重要的升级来了Graphcore AI工具生态系统再扩展,UbiOps增加IPU支持杰出华裔女精英上任新职Apple Watch也太煽情了:“已超额完成活动目标,今天的完成度堪称教科书级别”【手机摄影活动】Apple Park Visitor Center【城事】巴黎市长将重修Châtelet 广场以方便行人《新兴产业合作倡议(深圳倡议)》发布,中国呼吁与东盟各国建设区域性创新生态系统杰出华裔女精英上任新职深度学习机器视觉与生成式AI 「云集|职挂云帆」ML学习小组《Python机器学习》畅销书作者又出新书了,全方位扩展你的机器学习知识你爱着Rust综述:生态系统的当前趋势和缺陷CVPR 2023 | LeCun世界模型首个研究!自监督视觉像人一样学习和推理!政府发出警告!快将PayPal、Venmo、CashApp和Apple Cash里面的钱走!LeCun世界模型首项研究来了:自监督视觉,像人一样学习和推理,已开源开源了!UniControl:可控视觉生成的统一扩散模型最痛苦的事情就是看到别人走错了路而自己无能为力ICML 2023|CMU大牛全面总结「多模态机器学习」六大挑战:36页长文+120页PPT,全干货!比 iOS 17 更值得关注的苹果系统更新,藏着下一代 Apple Watch 的秘密NVIDIA全面升级Omniverse,扩展OpenUSD生态系统惊喜!直击澳洲Dcoreum商业生态系统颁奖现场:1500美金、iPad等丰厚奖品获奖者公布!Apple AirTag有好deal了,4 Pack $80复旦发布「新闻推荐生态系统模拟器」SimuLine:单机支持万名读者、千名创作者、100+轮次推荐精选MLE岗位 | Bungie、Applied Intuition、Apple等公司持续热招!大模型混战背后:科技“生态系统”是否会出现新格局?政府发出警告!快将PayPal、Venmo、CashApp和Apple Cash里面的钱取走!Meta VS Apple: Meta产品做的差 Apple产品做的好 和员工福利待遇的关系nǚ hóng?nǚ gōng巴黎市长将重修Châtelet 广场以方便行人会议通知 | 首届机器学习与统计会议暨中国现场统计研究会机器学习分会成立大会笑谈邂逅(6)大会发言后还认识了何宝民先生
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。