如何“榨干”本地服务器or数据中心
很多企业已经有本地研发环境,但依然为一些问题而头疼——
本地资源利用率为什么这么低??
设计仿真业务卡顿,怎么搞?加机器?扩存储?集群化?
如何搭建一个研发集群?LSF、Slurm、OpenLava、SGE?没有经验?
EDA/CAE等工具无法使用?仿真Case异常退出?验证出现中断?
项目高峰期或冲刺期,怎么确保业务稳定可靠,不掉链子?
有成熟稳定大规模实践的国产自主可控研发平台吗?
上市成熟企业如何中长期规划研发平台的演进和持续性降本增效?
目录
1.先说FCP有啥用:四大典型适用场景
黑箱变白箱,提升资源利用率
可视化界面+自动化运维,赢麻了
应用与资源双管齐下,研发战斗力加成100%
业务目标稳定达成,中间不掉链子
3.选择适合你的FCP版本:Core核心版 vs Suite旗舰版
单机变集群,研发效率提升50%
FCP产品替代开源调度器,CAD精力节约40%+:普冉半导体
海内外多site研发协同与统一管理
混合云架构,无需动辄六位数投入
先说FCP有啥用
四大典型适用场景
FCP是面向创新驱动型用户的一站式企业级软件平台,能够快速构建企业本地研发环境,高效管理用户资源。FCP充分支持企业向混合云架构演进,统一管理多本地及多云的复杂研发环境,提升研发效率并降低总体拥有成本。
emmmmm,官方说明有点过于官方了。
场景一:黑箱变白箱,提升资源利用率
场景二:可视化界面+自动化运维,赢麻了
场景三:应用与资源双管齐下,研发战斗力加成100%
本地研发环境的集群模式能提高单人资源使用上限,而当本地资源不够用的时候,FCP还能开启混合云模式,自动调度云资源充分满足业务需求。
但是研发效率的症结可不止在资源层面——
FCP提供基于任务、资源或团队层面的灵活调度策略配置,最优化使用资源满足不同企业不同发展阶段的业务目标。对应用本身运行提供支持和优化,并结合应用和底层资源的联动和适配,给出最佳实践。
不同业务团队之间可以根据不同用户权限共享计算资源、存储资源、软件资源等,提高了整个团队的工作与协同效率。
场景四:业务目标稳定达成,中间不掉链子
资源利用率,运维效率,研发效率,统统上来了,最后一个要保证的,就是业务稳定性与可持续性了,尤其是项目高峰期或冲刺期。像我们在普冉案例里算的,停一天就是几百万,这谁扛得住?
我们FCP产品能支持整个研发全流程,同时,高可用的混合云架构保障平台自身稳定。我们能统一管理多本地及多云的复杂研发环境,且能随时拓展到云上,支持业务的扩展性和连续性,业务数据运营分析能为运营优化与决策提供数据支撑。专业的CSM服务能覆盖用户全生命周期,提供全天候专业服务与客户保障,确保用户业务目标的达成。
更长期来看,国产合规这个问题,不少企业已经开始早作打算了。
速石两大产品线:
FCP与FCC-E,啥关系?
我们的两大产品线FCC-E和FCP有什么关系呢?
用户应该怎么选?两者之间有冲突吗?
如果企业想轻资产快速起步,对未来发展不确定,对产品弹性要求高,我们首推FCC-E:即开即用的研发云平台,遍布全球的资源中心,满足全球化业务协同发展,能为企业提供一条研发的捷径。
在今年2月推出的FCC-E专有D区,则满足了用户对高性价比的稀缺大机型需求,可提供最大4T内存机器。
发展到一定阶段后,有本地环境的企业,业务逐渐增多,波峰波谷明显,可能涉及外包团队管理,数据备份或容灾,或者多地研发中心协同。这时候,就需要混合云架构了。
之前怎么用,之后还是怎么用。
选择适合你的FCP版本:
Core核心版 vs Suite旗舰版
帮助企业提升研发效率,保障业务的连续性与扩展性; 自动化构建标准本地环境,榨干本地算力,让运维更简单; 提供可视化的资源监控告警,信息透明,便于决策支持。
二者的区别
Core提供的是核心功能模块,构建环境、集群管理、自动化运维这些都包括在内,因此更适合需要快速搭建本地环境的小微企业; Suite涵盖Core的全部功能,并在这个基础上增加了六大高级能力加持,更适合用于大中型企业的复杂研发环境管理; FCP目前只有Suite支持将工作负载溢出至云端,也只有Suite能满足深度定制化需求。
FCP的落地实践
举4个栗子叭
单机变集群,研发效率提升50%
转成集群模式后,对研发工程师来说,一个任务可以拆分多机跑,多个任务可以同时跑,来了大任务也不用担心被一台机器的上限所限制。
而原本碎片化的资源在统一汇入资源池后,IT负责人可以直接在可视化界面上做集群管理,根据各组的情况调度分配资源,从根本解决资源碎片化和资源抢夺等问题。
从单机模式到集群模式,最直接的效果是:计算效率提升30%-50%。
单机转集群更多优点请戳:集群如何成为项目研发、IT和老板的最佳拍档?
FCP产品替代开源调度器,CAD精力节约40%+
在调度策略上,普冉能按照任务优先级、资源空闲状况、许可证使用等维度安排任务进程,也能实现不同团队间的资源分配,随时设置,随时修改。
更多详细内容可戳:【案例】普冉半导体逐步布局自主可控,渐次提升研发效率
海内外多site研发协同与统一管理
我们有一家全球化的IC Design用户,在上海、美国、印度等地都有研发团队,每个团队都是独立的,但又存在业务上的交叉,还有云上云下多个不同研发环境。
这种跨国多地研发中心的协同与统一管理,算是最复杂的那种了。
FCP能实现全球范围的统一身份认证,给不同的用户分别设定角色与访问权限,对项目的数据和计算资源等做统一的管理和隔离,提高运营效率与整体信息安全水平。
混合云架构,无需动辄六位数投入
在和一家数模混合芯片设计企业的交流过程中,对方表示自己的团队扩张速度很快,业务量大且没有规律,突发算力需求和多项目并行是常事了。
之前虽然超额配置了一批服务器,现在也不够用了,考虑到自身需要一定的现金流储备,而且机器买多了也没有地方放,因此不想继续投入大量资金采购。
精细化运营,给一些需要大内存的任务单独分区,避免内部的资源抢夺,进一步提升效率;
尽可能使用本地资源,如果有突发算力需求,或者到了业务高峰期,能使用云端弹性资源补足;
本地和云端统一管理,降低IT压力。
FCP的混合云架构,自带的Auto-Scale弹性伸缩功能,可以按照任务需求,动态开启和关闭云端资源,在资源灵活性和快速响应能力这一块拿捏得死死的。
我们提升了用户的资源利用率,混合云架构也完美解决了项目并行带来的短期算力缺口,无需动辄六位数的投入,需要多少用多少。
1000家企业
1000个CSM
1000家企业,可能有1000种不同需求。
大部分都可以用标准FCP产品来满足的。
但总有一些非标需求,需要深入企业自身的业务场景与使用现状,会涉及到一些定制化服务、专业分析评估、专家技术支持与行业经验的提炼输出。
我们的CSM(Customer Success Manager)服务,提供面向企业用户的全天候专业服务与客户保障,覆盖用户全生命周期使用场景。
CSM专业服务——单核时成本下降73%
提升用户研发效率,保障整体业务稳定性; 整个研发平台使用期间,单核时成本下降达73%。
我们大致把整个业务分为三个阶段:
阶段一:在业务的磨合阶段,平台刚刚上线,用户的使用习惯比较粗放。
阶段二:在中期优化阶段,GPU的使用量逐步增多,成本提升,不合理的资源使用带来的成本浪费也被放大。
阶段三:在持续优化的平稳期,蓝箭的业务稳定性和单核时成本均迈入了稳定向好的态势。
CSM持续提供主动巡检、定期数据分析、使用技巧赋能、安全加固规划、产品需求追踪落地等服务支撑,深耕细化,持续提升用户体验。
- END -
全球海量异构资源随心调用
可基于业务状态监控告警,提供运营优化分析报表
支持海内外多地协同研发与办公
行业专家团队全力保障业务落地
更多电子书
你也许想了解具体的落地场景:
从“地狱级开局”到全球首款液氧甲烷火箭,我们如何助力蓝箭冲破云霄
一站式研发云平台:
从“单打独斗”到“同舟共集”,集群如何成为项目研发、IT和老板的最佳拍档?
近期重大事件:
速石科技联合Altair打造一体化芯片综合研发平台,提升企业软硬件仿真效率
速石科技入驻粤港澳大湾区算力调度平台,参与建设数算用一体化发展新范式
速石科技成NEXT PARK产业合伙人,共同打造全球领先的新兴产业集群
微信扫码关注该文公众号作者