Redian新闻
>
精简代码实战:核心系统缩减80%代码

精简代码实战:核心系统缩减80%代码

公众号新闻

阿里妹导读


我们对精简代码做了一些创新尝试,在核心发券系统alsc-pc实践落地,取得不错的效果。希望能给大家带来一点参考价值。
精简代码是系统重构的一种手段,其目标在通过量化手段,辅助删减无效代码。通过减少无效代码来减轻系统的复杂度,提升系统的可读性、可运维性,从而减轻研发人员的理解、开发、运维的成本。

背景

软件系统会随着时间不断的成长,随着功能的添加和修改,代码数量不断的增加,函数之间的调用关系也越来越庞杂,最终导致代码复杂性增加、可读性下降,进而影响开发效率和软件质量。从某种角度来说,越是关键系统,承担的业务变化越频繁,其熵值增加的也就越快。因此,代码精简是一个重要的事情,体现在日常工作中,就是一个个小型的技改,很多时候,它们常驻to do list,目送其它需求一个个的发布。
“代码的阅读时间比写代码的时间多十倍以上。所以,让代码易于阅读至关重要。” --Robert C. Martin
1+6+N后,系统交割、数据独立运维,本地平台承接了几十个核心系统,千万行代码量级。这类系统特点是:演进多年,功能强大、逻辑复杂,保持了底层逻辑高度抽象、通用的同时,上层充分开放、灵活定制,以此支撑了多种形态的业务。团队接手后,需要快速的进入研发和运维状态。面对系统数量多、复杂度高,上手难度大的挑战,考虑到系统本身有很多代码,本地业务其实用不到。于是乎,代码精简成为一个重要且紧急的事情。
基于此,我们做了一些创新尝试,聚焦精简代码这个点,在核心发券系统alsc-pc实践落地,取得不错的效果。希望能给大家带来一点参考价值。

方案

这一章节主要围绕三个核心的难点展开:决策难、投入高、风险高,结合案例,给出实践方案。


1. 决策难

我们知道需要优化系统代码,但是怎么评估ROI是一个难题。减少系统10%的代码行,需要投入多少人力?减少20%的代码,能节省多少其他人阅读的时间,能提升多少的吞吐?以上问题,都在本文的射程范围之外(非常抱歉),需要根据实际的情况进行分析。以人力投入为例,其跟系统复杂度、变更频率、代码结构、历史负载、编程规范等均有关系,没有统一量化的标准,因此也就没有统一的方案。本文的意义在于,通过量化数据,给出定性的判断,辅助决策。
量化可以量化的部分:以生产流量来度量当前系统中,有效代码的占比(具体来说,是有效函数占比)。

如图所示,经过一个月的随机采样,采集到46万流量,以此来对系统代码进行染色,得到有效函数占比为~5.5%。
函数覆盖(有效函数) = 回放流量覆盖到的函数数量 / 系统的总函数数量
我们没有办法给出一个固定的门槛值:当一个系统的有效函数占比低于XX%时,就要开展代码精简专项。但是,我们不难判断,当该比例 <10%时,精简代码会取得不错的效果,是开展专项的良好时机。

Fowler、Bob大叔等人都在强调要重构、要优化系统代码。

但要是问他们:什么时候应该优化?

估计他们会答:任何时候。

问他们:优化能带来哪些好处?

估计会答:好处很多,自行体会。


2. 投入高

事中的部分,往往是最难的。正式进入删除代码的阶段,我们通过深入代码,从入口处逐层解读,分析每一个分支的业务含义,最终在脑中构建出一张函数调用的大网。大网以外,孤立的类、函数,很容易解决,IDE和静态代码扫描都能帮到我们。大网以内的部分,就需要结合业务场景进行人工的逻辑分析,并做出判断。
注意,在这里需要明确区分:精简代码和常规重构两个目标。精简代码,在走读过程中,需要时刻聚焦在:这个函数是不是必要的,能不能删除?而后者,聚焦在这个类、这个函数是否符合SOLID原则、是否符合命名规则,需不需要重写?
本文的方案依旧是,量化可以量化的部分:通过函数称重,以生产流量来量化每一个函数的重要程度。
函数权重 = 该函数被调用的次数 / 流量总数

如上图所示,左侧是类列表,右侧是选中的类下面的所有函数列表。右侧部分,每一行是一个函数,后面的数据就是其被调用的次数、函数的权重。
这部分数据,会帮助到开发同学,用以印证脑中的函数调用大网。在代码走读的过程中,实时的查看量化数据,形成快速的反馈机制,有助于理清思路、减轻脑负担,同时也能有效的防止分析遗漏。
IDE插件内部提示:

重点说明:由于流量是采样的数据,虽然通过随机、长时间采样,从统计上可以无限毕竟全量数据分布,但是对于核心系统来说,不能完全依赖统计分析。因此,精简代码的过程,需要以数据为辅,最终由人工来决策。
根据实践情况统计,以上的函数权重反馈机制,可以帮助开发同学有效减少30%-40%的代码走读成本。
20世纪初,福特公司有一台电机出了问题,导致整个车间生产停转,大批内部工人、专家反复查看都无法找到原因。后来,公司请来了斯坦门茨。斯坦门茨仔细检查了电机,然后用粉笔在电机外壳画了一条线,对工作人员说:“打开电机,在记号处把里面的线圈减少16圈。”人们照办了,令人惊异的是,故障竟然排除了!生产立刻恢复了!福特公司经理问斯坦门茨要多少酬金,斯坦门茨说:“不多,只需要1万美元。”1万美元?就只简简单单画了一条线!斯坦门茨看大家迷惑不解,转身开了个清单:画一条线,1美元;知道在哪儿画线,9999美元。
真正的难题不是培养斯坦门茨,而是技术化的解决“知道在哪儿画线”。


3. 风险高

毋庸置疑,删除代码是一件极其高危的操作,一不小心就会删在“大动脉”上。精简代码是一个典型的重构类项目,其质量保障的重点是确保:功能无损、性能无损、应急能力无损。对应的手段主要有:回归、灰度、压测、演练。
当然,以上手段需要根据实际情况进行选型和调整,以alsc-pc重构为例,经过综合考量,决策新建系统alsc-coupon(迁移alsc-pc的有效代码),并逐步完成上游流量的迁移。基于此,带来了一些新的挑战:
  • 天启用例不能直接使用,需要人工修复流量、mock子调用、mock配置等。而这部分的复杂度极高,导致ROI极低,我们最终放弃了天启回归方案。进一步,引发了回归覆盖的挑战。

  • 新系统,新的配置,需要专门验证。对于一个演进多年的系统,往往有大量的switch, diamond配置,如何高效的验证是一个难题。

  • 新建的部署结构,重点关注高可用风险,性能、限流、单元化等。

风险及应对策略
关键难点和风险
质量策略
开发迁移成本高!
alsc-pc代码量多(70+w行)、通过人工评估方式迁移成本极高,可能存在功能迁移遗漏风险。
通过 函数称重工具 辅助进行代码精简评估和函数能力评估。
测试成本高!
全量业务迁移,接口数量多,涉及全量券类活动,影响券生命周期全链路,评估不全会带来接口不可用、资源不可用的风险。
通过 全面的回归和校验能力 进行质量保障
  • 万象仿真;
  • 老服务天启用例、特征迁移适配(放弃);
  • kbt链路case比对工具&一键校验工具;
  • AJ覆盖率辅助回归场景补充;
新老配置一致性风险
一期迁移switch、不迁移diamond配置,二期diamond配置迁移至switch,可能会存在配置遗漏。
通过 配置一致性检测能力 进行新老服务switch、diamond配置保障,通过配置变更流水线保证变更的感知和新老同步。
资金安全风险
新服务监控、核对配置不完全,存在资损问题遗漏风险。
借助 VIP mock和异常注入的功能:
  • 强化异常场景和功能稳定性场景的测试覆盖,如灰度、缓存、消息、幂等、任务;
  • 资损场景重点分析并及时进行核对演练;
高可用风险
新服务的熔断限流、单元化、服务&db性能均可能出现风险问题。
通过 压测 进行性能和高可用配置合理性评估,重点关注单元化和容灾切流。

由于灰度、压测、演练等各个保障手段,有已经有大量的文章专门介绍,不再具体展开。
万象仿真是基于场景的E2E回归方案,场景背后是DB数据特征抽取;配置一致性检测,是一个繁锁和重复的过程,我们沉淀了镜铃平台;VIP已经是一个老朋友了,由于其能力在持续演进,跟文章中描述已经是面目全非了,计划“重构”文章中。
以上,希望对大家有所帮助。
"任何值得追求的目标都会涉及风险。成功的关键是学会管理风险,而不是回避它。"   --赫伯特·欧特尔

后记

颗粒度对齐一下:精简代码为什么全篇都在聊函数粒度,不是行粒度?
嗯,函数和代码行的关系,有点类似原子和内部粒子的关系。原子决定了物理性质,如质量、体积、温度、密度等。对应于函数决定了功能、性能。原子间建立连接组成各种分子和物理世界。对应于函数之间相互调用,组成了接口服务,支撑了业务。因此,函数是完整的功能原子,是人工分析极其合适的粒度。同时,原子中,删减质子,会改变原子本身,可能使金原子变成氢原子,在此基础上搭建的分子、物质都会坍塌。同理,精简函数内部的代码行,可能使函数、系统服务“坍塌”。
好吧,最主要的原因是,我们还没从技术上解决轻量级的代码行称重的难题。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
阿里回应收购菜鸟剩余股权;飞书团队精简比例不超20%;OpenAI公布Sora第一波试用反馈;知情人否认苹果与百度AI合作...均价不过百, 换季精简护肤, 这5个超实用!道远资本研报:核酸药物产业分析与展望70\'s Best Disco, Funk & R\'n\'B Hits Vol.1金融风控等场景的大模型应用,核心系统的国产化实践… 工银科技、平安壹钱包、华泰证券等确认出席 FCon绿色金融 | 产品碳足迹:核算方法学与背景数据库《阴阳鱼》连载第45章:时间如刀,空间如砧板,而你我都不过是鱼肉出国带一堆用不到!9招终极打包秘诀,1秒"精简行李"沃尔玛缩减自助结账系统给自己一杯茶的时间内部人士回应飞书精简规模,阿里撤回菜鸟上市,抖音商城版App上架,知情人士称苹果与百度未达成AI合作,这就是今天的其他大新闻!总领馆紧急提醒!中国公民防范冒用总领馆电话号码实施诈骗行为!早鸟报|飞书宣布精简规模;抖音电商推出抖音商城版APP;拼多多升级“新疆包邮”...重磅|加拿大两大移民项目惨被一刀切!英国宣布缩减移民福利!全球移民潮结束了?俄乌的影响:核威慑的局限性与走向战争的世界美股基本面 - 2024_03_18 * 晨报 * 摩根士丹利策略师Wilson:美债利率逼近重要技术位 将对美股构成考验。小催泪!澳洲民众心系Westfield受伤女婴,为其筹集善款近$70万,“希望以后无忧无虑的生活”​品牌故事|MIHOO小迷糊:在精简护肤的长期主义叙事里,强化用户信任关系免费试听|以求职为导向,核心技能+实战项目+真题实训全覆盖,轻松玩转二级市场!图书馆面临预算危机,每周运营时间缩减至五天,华人家长表达担忧小班+实战:学完这门课能直接进组?“非常遗憾,有部分同学不得不离开”!知名互联网企业决定精简团队,提供补偿和转岗机会,现有员工超5000人多地缩减今年供地计划,腾讯一季度净利大增54% | 财经日日评超670小时系统培训,2年积累100+小时实战实习,成为心理咨询师!丨最后3人华为云 AI Agent 实战:三步构建,七步优化,看智能体如何进入企业生产一周资讯|1688启动全面入淘;飞书宣布精简规模;抖音电商推出抖音商城版APP...普华永道:中国银行家调查报告(2023)精简版飞书发布全员信:适当精简规模,「感受到效率在变低」丨36氪独家突然裁员,涉及超5600人!理想汽车多部门人员优化!智驾团队缩减!Linux 系统性能优化:七个实战经验餐馆注意!这个费用要明码实价 不可悄悄加收 否则……历史性庭审登场!川普被告席打盹 500人陪审员池迅速缩减资管基础|以求职为导向,核心技能+实战项目+真题实训全覆盖,轻松玩转二级市场!熵泱——第四十六章股价跌去近92%,Ginkgo收到纽交所上市不合规通知背后:核心业务占比持续下滑、营收不及预期、兑现价值主张极其困难
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。