国产纯自研、100+行业实践,探秘速石核心调度器Fsched
本篇一共五个章节:
一、介绍一下主角——速石自研调度器Fsched
二、只要有个调度器,就够了吗?
三、全面对比:速石研发平台 VS LSF Suite
四、如果你想尝试AI——
五、不止半导体领域。。。。
介绍一下主角
速石自研调度器Fsched
01
我们的Fsched调度器到底厉害在哪?
Fsched性能指标
吞吐量:
1000 jobs/second
响应时间:
1 ms
集群规模:
单个Fsched集群能够支持的最大节点数:1000
单个Fsched集群能够支持的最大CPU核数:30000
02
代码级技术支持有什么不一样?
03
Slurm之上,我们还做了什么?
只要有个调度器
就够了吗?
答案自然是否定的。
为什么?
或许,我们可以换个角度来回答这个问题。
就像汽车出现之前,用户的期望永远是——1匹更快的马一样。
在当下芯片设计研发领域,我们如果把调度器类比马,那么汽车是什么呢?
我们给大家简单描绘一下:
一个站在整个芯片设计研发体系和架构视角来满足EDA行业用户性能、功能、体验的产品。
1. Ta是完整的一体化产品,功能紧密耦合,且经过层层实战考验;
2. Ta解决的是完整生命周期的芯片设计业务问题,调度器只是其中一个模块;
3. Ta具有对企业未来发展的弹性,能扩展至不同规模和更多业务路线,比如AI。
而这,正是我们与其他很多产品最大的区别之一。
我们的产品在设计之初就是面向EDA应用,服务芯片设计研发业务场景的。这也决定了我们解决问题的出发点永远是:是否满足研发业务需求,然后从上至下地解决问题。
01
一整套上中下层联动的芯片研发环境
我们提供的是一整套上中下层联动的芯片设计研发环境:
1. 连接上层EDA应用,对应用本身的运行提供支持和优化;
2. 连接底层资源,给用户提供更灵活,更高效使用资源的能力;
3. 结合EDA应用和底层资源的联动和适配,给出最佳实践经验。
02
功能面向实际业务场景设计和提供
我们的功能都是面向实际业务场景设计和提供的:
1. License调度优化,可帮助企业用户最大化提升License利用率,更好地规划License购买策略,控制整体使用成本;
2. 我们能多维度监控任务状态,提供基于EDA任务层的监控、告警、数据统计分析功能与服务,让团队管理者监控各个重要指标变化,从全局角度掌握项目的整体任务及资源情况,为未来项目合理规划、集群生命周期管理、成本优化提供支持;
3. 日常数据统计与运营分析管理,实现问题可追溯,可追踪,降低成本,提升整体项目管理效率。
03
交互方式不改变EDA用户使用习惯
我们的交互方式不改变EDA用户的使用习惯。原来怎么用,现在还怎么用。
速石研发平台
VS
LSF Suite
不过,它背后的LSF Suite大家就不一定熟悉了。
来来,我们盘一下,我们速石研发平台跟LSF Suite的区别是什么?
01
根本区别:设计理念不一样
02
性价比:速石研发平台TCO更低
下图是我们研发平台与LSF Suite的横向对比图,可以清楚地看到,两者的收费模式差别很大。
我们Fsched调度器是包含在平台费用里的,相关组件也都是随产品一起内置的,不单独收费。
而LSF Suite除了核心调度器按使用核数收费以外,所有功能组件都需要额外收费。
从总拥有成本来看,对用户来说,速石研发平台付出的成本更低,获得的东西更多。还有很多隐性成本没有列在表格里,比如对接调试时间成本,人工成本,售后支持成本等等。
总结一下,我们跟LSF Suite的五大主要区别:
如果你想尝试AI——
目前,AI在芯片设计领域的应用主要有两条路线:
路线一:AI+EDA工具
Synopsys、Cadence与Siemens等公司纷纷在其最新工具中使用了AI技术,覆盖先进数字与模拟芯片的设计、验证、测试和制造环节,让开发者在芯片开发的每一个阶段都可以采用借助AI的自主学习能力,提供芯片设计生产力。
当然,越来越多EDA工具也支持借助GPU进行运算加速。
路线二:AI算法模型训练
Google研究人员使用10,000个芯片布局图来训练他们的深度学习模型——PRIME,人工智能生成的芯片的设计时间不到六个小时。
而NVIDIA设计了另一种用于芯片设计的深度学习方法——PrefixRL模型,NVIDIA使用其RL工具设计的电路比人类使用当今EDA工具设计的电路小25%,但性能相似。
路线一需要支持全流程EDA工具的一整套研发环境,以及构建异构资源(CPU+GPU、本地+云上)的调度及管理平台的能力。
路线二需要的支持企业从ML/LLM模型构建、大规模训练到最终部署需求的MLOps模块。
我们都有。
另外,我们刚刚发布的一款行业知识库聊天应用Megrez,面向企业客户提供大语言模型的私有化部署能力,允许用户自定义行业知识库,实现领域知识的问答。
Megrez基于芯片设计领域提供的支持
不止半导体领域。。。。
在半导体以外的其他行业,如生命科学、汽车/智能制造,我们也表现不错:
汽车/智能制造
LS-DYNA求解效率深度测评 │ 六种规模,本地VS云端5种不同硬件配置
怎么把需要45天的突发性Fluent仿真计算缩短到4天之内?
从4天到1.75小时,如何让Bladed仿真效率提升55倍?
生命科学
王者带飞LeDock!开箱即用&一键定位分子库+全流程自动化,3.5小时完成20万分子对接
提速2920倍!用AutoDock Vina对接2800万个分子
关于fastone云平台在各种EDA应用上的表现,可以点击以下应用名称查看:
HSPICE │ OPC │ VCS │ Virtuoso │ Calibre
速石科技芯片设计五部曲,前三部先睹为快:
微信扫码关注该文公众号作者