Redian新闻
>
通用CPU性能基准测试研究综述(2023)

通用CPU性能基准测试研究综述(2023)

公众号新闻

摘要:CPU技术发展迅速,性能基准测试也在不断演进。本文内容选自“通用CPU性能基准测试研究综述(2023)”,对包含SPEC CPU在内的主流基准测试进行了研究,从测试目标、测试方法等角度,综述主流CPU基准测试的演进过程、最新研究成果,以及通用CPU性能指标和基准测试需求,分析了通用CPU性能基准测试所面临的挑战,并对今后可能的研究趋势进行了展望。
信息基础设施自主可控逐渐受到各国的重视,研发推广X86 架构之外的通用CPU,例如 ARM,RISC-V,Alpha,MIPS等指令集架构,已成为推动信息产业变革发展的主要路径之一。 近年来,采用 X86,ARM 等不同指令集架构,常用于服务器和桌面计算的异构通用CPU加速迭代升级,不同架构CPU在功耗、适用场景等方面各有优势。但主流CPU性能测试工具与方法主要围绕 X86 架构芯片设计,如何对异构通用 CPU 的质量水平进行科学评价,成为引导技术突破、支撑重大信息化工程建设和促进行业发展的关键。
本文从测试目标、测试方法的角度综述了 CPU 基准测试的发展现状和趋势,并对测试工具的演进和最新成果进行对比分析,旨在为研究者提供一个覆盖 SPEC、TPC 等多类性能基准测试工具和多线程、跨平台等各类场景,以及包含速度和速率性能指标分类、基于预置模型的测试结果修正等创新方法的说明,增加相关人员对通用 CPU 性能基准测试研究的理解。
一、常用的性能基准测试
1、SPEC基准测试

SPEC 性能基准测试于 1988 年由标准性能评估机构SPEC 提出,目前已发展成为包含 CPU 性能、服务器能效、文件系统性能、高性能计算、Web 应用性能等在内的基准测试簇。其中 SPEC CPU系列基准是公认的、具有事实性影响力的CPU性能基准测试标准,通过测试程序在被测系统和基准系统中执行时间的比值来考察系统CPU运算性能。


多年来,SPEC CPU性能基准测试与CPU的发展相互促进,基准测试程序不断演进升级,CPU技术和产业应用也加速创新发展。

SPEC CPU 92 通过调整测试基准来应对行业需求,迅速取代MIPS 度量,成为产业界公认的事实标准,也驱动各界在提升整型运算和浮点型运算的同时,积极寻求新的 CPU 技术突破方向随着技术的创新迭代,CPU时钟频率加速攀升,高速缓存容量持续增大、性能不断提高,也使得SPEC CPU 92 的性能测试受到较大的影响为进一步提升测试准确性,业界推出了 SPEC CPU 95,在应对新的容量、性能测试需求时,提供了更全面的场景来丰富 CPU 性能测试能力,引导技术创新由局限于关注裸性能向注重实际场景应用效果转变。SPEC CPU 2000延续了 SPEC CPU 95 由两套基准测试程序分别测试 CPU整型运算性能和浮点运算性能模式。 同时,为更好地应对不断普及的多核处理器计算系统测试需求,保证测试结果的科学性和合理性。

为了满足更多场景的测试要求,SPEC 再次对测试基准进行完善,推出了 SPEC CPU 2006. SPEC CPU 2006 新增的测试套件涵盖到 CPU、存储系统、编译器等。

经过10年的沉淀,在SPEC CPU 2006的基础上推出的 SPEC CPU 2017,进一步丰富应用场景,具体包含 43 个基准,分为两类四个套件 其中,SPEC speed Integer 和 SPEC speed Floating Point 套件用于比较计算机完成单个任务的时间,SPEC rate Integer 和 SPEC rateFloating Point 套件则可以测量每单位时间内的吞吐量或工作量。这也是第一次对速率(rate)和速度(speed进行区分,以有效满足复杂场景下对性能基准测试的稳定性提出更高要求,进而指导CPU发展。

2、TPC基准测试

不同于 SPEC 从最初关注裸性能不断拓展到系统性能,TPC性能基准测试在设计之初就将系统级应用的综合性能测评作为关注的重点。

用于度量系统对该类事务处理性能的主要测试基准包括TP1Transaction Process 1)和 DebitCredit。该类测试基准由于缺少对测试执行过程和综合测评结果的有效监督,易出现测试过程不规范,甚至给出误导性测试结果的情况。20 世纪 80 年代末,第一个TPC基准TPC-A发布,对事务处理时限、测试系统终端数量等提出明确要求,澄清了当时混乱的市场,为推动CPU的系统级性能测试提供了重要依据。

经过持续迭代升级,TPC已发展成为能够满足多种应用场景性能测试需求的基准测试簇,根据测试场景和测试事务的不同,可将 TPC性能基准测试分为三类:

联机在线事务处理系统(OLTP)测试,包括TPC-C,TPCE;决策支持和大数据(DS)测试,包括 TPC-H,TPC-DS;服务器虚拟化(VMS)测试,包括TPC-VMS. 其中,TPC-C性能基准测试通过模拟较复杂且具有代表意义的OLTP应用环境,来衡量联机事务处理系统性能与可伸缩性。TPC-E 则在 TPC-C 的基础上,对传统的 C/S 架构模拟环境进行了完善,从而实现对当时日益盛行的B/S架构系统的高效评价,为引导产业提升大规模并发处理能力提供了重要依据。

TPC-H提供了一套决策支持系统的性能基准测试依据,强调服务器在数据挖掘、分析处理方面的能力。TPC-DS 则补充了单用户响应时间、多用户吞吐量等测试,对测试基准的数据模型、业务模型和执行模式进行了完善。TPC-VMS的目标是模拟服务器虚拟化环境,并实现对 TPC-C,TPC-E,TPC-H,TPC-DS的综合测试,从而推动CPU围绕应用日益广泛的云计算模式不断提升性能。

二、其他性能基准测试

在 CPU 性能基准测试的不同发展时期,学术界和产业界也提出了一系列有关的性能基准测试方法,针对跨平台、内存共享、多线程等多种场景进行测试。

Geekbench 是近年来受关注较多的一种跨平台CPU 性能基准测试,其主要方式是通过构建多维评分系统,将单核、多核性能与模拟真实场景的工作负载分隔开。该性能基准测试适用于 Windows、Linux、macOS等多种操作系统下的测试。

Kozhirbayev 等人在利用Geekbench对单核和多核下的整形计算性能、浮点计算性能和存储性能的基准测试中,获得了很好的对比参考效果。Polvinen等人在实验过程中,采用Geek⁃bench快速、准确地度量了处理器在向量点乘、矩阵 LU分解等场景中的性能.

此外,Splash,PARSEC Benchmark,LINPACK Bench-mark,MiBench,NAS Parallel Benchmark,CPU-Z 等也常用于计算实验或实际应用中的性能基准测试,来展示和对比CPU的各项性能。

三、性能基准测试的对比分析

为直观地展示本文所述通用测试基准的测试重点,各类性能基准测试及相关工具的支持语言、编译程序、适配系统、支持的CPU架构及测试侧重点信息。

表1中各类工具支持语言、编译程序、适配系统、支持的 CPU 架构均具有一定的差异性。特别是基于不同的测试目标,各类工具的重点测试内容各异,不仅涉及运算能力、内存性能、内存带宽等重要指标,而且与联机业务处理、数据挖掘、并行计算等各类综合应用场景相关。

随着CPU性能测试维度的增加,CPU裸性能以及单一场景下的基准测试,难以全面反映 CPU 的综合性能,因此,多种基准测试工具的配合测试,已成为通用CPU性能基准测试行业共识。

在稳定性方面,选取常用的性能基准测试工具——SPEC CPU和UnixBench,通过对实际应用情况的分析和梳理,为通用CPU性能基准的深入研究提供参考。

测试工具 SPEC CPU 的重要参数包含缓存缺失率(cache-misses)、分支指令预测错误率(branch-misses)和地址块表缓存缺失率(dTLB-load-misses)等,相关指标越大,表明 CPU 的测试强度越高。SPEC CPU 测试工具的三个版本分别发布于 2000年、2006年和 2017年。从2000年至2017年的17年间,商业通用CPU的性能至少增长了 10 倍 . SPEC CPU2000 /2006/2017 三个版本演进过程中,工具开发人员希望通过加大数据集等手段,提高对通用 CPU 的测试压力,获取更准确的性能评测结果。

本文首先对当前国际主流的CPU基准测试现状进行了综述,并对各类测试基准和工具的功能、算法、应用场景等方面的迭代升级和最新成果进行了分析;然后对当前通用CPU性能指标和基准测试需求进行了梳理,并分析了通用CPU性能基准测试所面临的挑战。

目前,CPU性能基准测试工具和算法较早期已取得了较大的进步,满足的测试场景不断丰富,测试精度也有了明显提升,但在适用性、性能优化等方面依然有较大的提升空间。

作者:史惠康,王泽胜,张士宗,高 翔,赵有健


转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读

更多架构相关技术知识总结请参考“架构师技术全店资料打包汇总(全)(39本全)”相关电子书已经更新至39本,持续更新中。
1、下单“架构师技术全店资料打包汇总(全)”,包含服务器基础知识全解(终极版)pdf及ppt版本,价格仅收239元(原总价399元)。

2、随着电子书数量增加及内容更新,价格会随之增加,所以现在下单最划算,购买后续可享全店内容更新“免费”赠阅。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
算力技术未来发展路径概述(2023)俄乌战况14苹果首发3nm芯片,GPU性能暴涨前瞻产业研究院:ChatGPT开启AlGC产业生态新时代 新风口 新生态 新变革 新机遇(2023)#018 研究瓜氨酸血症的中国医生和医院 - 基于SCI论文大数据分析报告(2023)臭味相同的三剑客#010 研究自身免疫性垂体炎的中国医生和医院 - 基于SCI论文大数据分析报告(2023)#016 研究Castleman病的中国医生和医院 - 基于SCI论文大数据分析报告(2023)由一次SPEC Cloud基准测试引发的“一云多芯”之辨树莓派5来了!438元起售,CPU性能提高2-3倍一个没想到的人-白莲花编剧半夜三更吃饺子M2 Ultra性能测试,GPU性能仅有4080一半AI芯片第一极:GPU性能、技术全面分析GPU微架构、性能指标、场景、生态链及竞争格局(2023)2023 春季欧洲游 2. 9天环游瑞士所有基准测试都优于Llama 2 13B,最好的7B模型来了,免费用麦睿投资二季度市场综述(2023)36氪研究院:00后长音频消费趋势报告(2023)首销仅 32 元,硬件基准测试工具 3DMark 上架 Epic 商店【加勒比蓝/热带雨林/古堡/溶洞/荧光海】2023 波多黎各Puerto Rico环岛之旅主流国产GPU产品及规格概述(2023)AI芯片第二极:xPU性能、技术架构分析#023 研究先天性脊柱侧弯的中国医生和医院 - 基于SCI论文大数据分析报告(2023)复习一下关系图分布式PostgreSQL基准测试:Azure Cosmos DB、CockroachDB和YugabyteDB苹果A17pro单核比肩英特尔旗舰CPU!和AMD性能相差不到10%,网友:性能快接近M1了DPU硬件标准化思考与探索(2023)【美国风流才女春天传奇夏至父亲端午节5年现场舞台风格流派三部曲原创演唱会】励志春天跑步歌《阳光下奔跑》&《白色衣裙女孩》【金融行业】哪些地方中小行经营指标值得警惕?—2022年地方中小银行年报综述(一)俄乌战况22当你老了 冷明大型语言模型与知识图谱协同研究综述:两大技术优势互补麦睿投资第三季度市场综述(2023)Graphcore支持Byte MLPerf,为AI生产部署提供性能基准参考有你的笔记本吗?笔记本CPU性能释放天梯图 2023-0903GPU微架构及生态研究框架(2023)存储系统研究综述(收藏)英伟达GPU龙头稳固,国内逐步追赶(2023)研究框架:芯片光刻机(2023)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。