Redian新闻
>
英特尔将OpenJDK的数据排序速度提高7-15倍

英特尔将OpenJDK的数据排序速度提高7-15倍

公众号新闻
出品 | OSC开源社区(ID:oschina2013)
今年早些时候,英特尔发布了一个利用了 AVX-512 的 x86-simd-sort 快速排序库;当 Numpy 将 x86-simd-sort 代码进行合并后发现,对于 16 位到 64 位的数据类型,排序速度提高了 10~17 倍。
如今,英特尔软件工程师又发布了 x86-simd-sort 3.0,OpenJDK 也已经将这一修改版进行了合并。

x86-simd-sort 3.0 添加了一个新的 “avx512_argselect” 方法,用于计算 arg nth_element,该方法返回一个对数据数组进行分区的索引数组。

x86-simd-sort 3.0 版本还对其 benchmarks 进行了改进,现在使用 __builtin_cpu_supports 而不是 querying cpuinfo,并进行了各种其他更改。

目前,x86-simd-sort 3.0 已合并至 Numpy 主分支中,它提供了 np.partition 和 np.argpartition 的 AVX-512 矢量化版本。将 np.partition 的 16 位速度提高了 25 倍,将 32 位 dtypes 的速度提高了 17 倍,将 64 位 dtypes 的速度提高了约 8 倍。

与此同时,新的 avx512_argselect 方法还使 np.argpartition 的速度提高了 6.5 倍。

据介绍,合并到 OpenJDK 的 x86-simd-sort 是一个略有修改的版本,该版本将 32 位数据排序速度提高了 15 倍,64 位数据排序速度提高了约 7 倍。

相关链接
  • https://github.com/intel/x86-simd-sort/releases/tag/v3.0
  • https://github.com/openjdk/jdk/pull/14227

往期推荐



越来越多开源项目停更,Java 生态受影响最大
“根本不需要 TypeScript,JS+JSDoc 够了”,大佬说我想多了
新平台、新芯片组、性能更强!Raspberry Pi 5 终于要发布了




这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Java近期新闻:JDK 22 发布时间表、巴比伦项目、Helidon 4.0-RC2、MicroProfile 6.1-RC1专访丨积家CEO Catherine Rénier:情感联结和艺术表达对腕表也至关重要OpenAI 将 GPT-4 引入内容审核;英特尔 54 亿美金收购告吹;宁德时代发布超充电池:充 10 分钟续航 400 公里实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万、下载超20万PyTorch官方认可!斯坦福博士新作:长上下文LLM推理速度提8倍Java 近期新闻:Helidon 4.0、Eclipse Serializer 1.0 和 JDK 22 JEP“九章三号”来了!速度提升一百万倍,再创世界纪录大量搭载英特尔酷睿 Ultra 7 155H、155U“Meteor Lake”处理器的笔记本电脑现身 Geekbench澳洲学签执行4大新规!学生签证申请难度提高?银行存款金额提高17%?飞到世界各地去看野生动物德州人承受了太多!权威数据排位天气最恶劣城市无题iPhone专家透露了两个简单的设置调整,可以让你的手机充电速度提高四倍5G专利数急剧增加,华为遥遥领先;AMD宣布收购开源AI软件公司;沃达丰将与英特尔合作打造Open RAN芯片组|AIoT情报深度好文|30K和8K的数据分析师,是差在学历还是差在人品Spring 6.1 M4发布,已兼容虚拟线程和JDK 21Java 近期新闻:JDK 22 的 JEP、Spring Shell、Quarkus、Apache Camel、JDKMon无题AIGC日报丨华为云发布盘古汽车大模型;英特尔将为Stability AI打造超级计算机;Midjourney将于年内升级联手 OpenAI 最强竞对展开生成式 AI 反击战:亚马逊云科技将 S3 写入速度提升 10 倍、推出全新三层技术栈速度提升30%,Astro 3.0正式发布4K画质3D合成视频不再卡成幻灯片,新方法将渲染速度提高了30多倍单点端到端文本检测识别框架速度提升19倍!华科、华南理工等联合发布SPTS v2硬核观察 #1134 英特尔 CTO 建议使用 AI 将 CUDA 代码移植到英特尔芯片重磅!Spring 6.1 M4发布,已兼容虚拟线程和JDK 21"妈妈让我来自首",7岁男孩在派出所写下"bǎozhèng书"英特尔 BE200 Wi-Fi 7 网卡公布,速度可达 5Gbps2023第二营 - 夜宿Radium RedstreakSpring Framework 6.1正式GA,兼容虚拟线程和JDK 21有史以来最快的半导体,能将芯片速度提升千倍Java 近期新闻:外部函数和内存 API、OpenJDK JEP、Apache Tomcat CVE爆火!清华提出LCM火了!让实时文字生成图像速度提升5-10倍,浏览超百万!下一代 Docker 来了!构建速度提高了 39 倍4K画质3D合成视频,渲染速度提升30多倍,论文作者带你解读新研究癸卯立秋 临孙过庭《书谱》
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。