来看蚂蚁集团、亚马逊专家如何进行故障复盘和技术风险防控 | QCon
对于许多大型互联网公司来说,伴随着业务体量的扩大和复杂度提升,复杂系统的高网络密度和强耦合性往往会带来一些无法避免的故障和宕机风险。众所周知,系统架构体系越复杂,则潜在的问题和故障就越多,故障对于系统来说是一种常态。系统故障问题的产生也牵涉到诸多因素,如外部客观问题、技术失误、团队管理问题等。对于研发人员来说,如何不断提高系统的稳定性,建立起自身的技术风险防控体系,则尤为重要。
每一次故障从发生到发现,从修复到最后的复盘,可能需要经历很长的一个时期才能闭环。这些记录也被沉淀为宝贵的技术资源和业内经验。因此,在今年 11 月 25 日 -26 日将于上海举办的 QCon 全球软件开发大会策划了【稳定性建设】专题,借此机会邀请业内拥有真实事件经历和“修复”经验的一线专家来为大家进行事故现场回顾和复盘经验分享。目前,已经邀请了来自美团的金融服务平台研究员丁雪丰老师担任专题出品人,丁老师同时也是极客时间《玩转 Spring 全家桶》课程讲师,腾讯云最具价值专家。他也是活跃的技术图书作译者,已经出版了《Spring Boot 实战》、《RESTful WebService Cookbook 中文版》等 8 部图书,致力于推动优秀技术在国内的发展。
本专题已邀请到蚂蚁集团高级技术专家丁乾老师、亚马逊云科技资深技术专家兼安全团队主管黄帅老师进行演讲分享,精彩议题内容如下:
也许听完这些专家的事件剖析和系统稳定性经验,并不能让你快速解决自己系统当下的问题,但一定会给你带来不一样的思维视角和经验启发。系统故障的原因往往并不只有表面的浅层原因,如果深陷其中纠结不已,不如来和专家现场聊一聊,也许你会有不一样的收获。
除此以外,本次 QCon 上海站还策划了业务性能监控、以算法为核心的应用架构、复杂系统的 API 治理、LakeHouse 落地、金融科技、智能汽车、算法模型底层创新、产品设计的逻辑思考、走向元宇宙:交互技术与实时渲染、开发者工具与开发效率、前端职能化、多端一致性等专题。如果你目前的业务和技术出现了瓶颈,那最好的解惑方式无外乎和专家畅聊,欢迎你来 QCon 上海站现场与近百位一线专家分享交流。
点击底部【阅读原文】查看更多上线内容,大会门票 9 折优惠倒计时,现在下单立减 680 元,感兴趣的同学联系票务经理:+86 18514549229(同微信)。
微信扫码关注该文公众号作者