Redian新闻
>
外企互联网金融产品,如何搭建事故应变措施

外企互联网金融产品,如何搭建事故应变措施

公众号新闻

关注并将「人人都是产品经理」设为 ★ 星标

每天早上更新,与你一起成长

在工作过程中我们都会遇到不同的难点或者事故,那面对事故我们应该采取怎样的应对措施呢?或者应该怎样提前预防?一起来看看作者是如何分析的。


还记得某个请了事假的周五下午,处理完事情之后,我跟朋友北京城区内悠闲地吃个早午餐,没想到手机中的Teams突然响起,一看竟然是来自公司作战室的来电,心脏仿佛突然漏了一拍,只好放下手中的刀叉,接了起来……

对产品经理来说,处理事故是必修的课题,但如何「漂亮地处理事故」,则是需要不断与团队彼此磨合。有兴趣了解的朋友就一起往下看看吧!

什么是事故应变措施?

前阵子我看了一部被誉为人生必看的韩剧《浪漫医生金师傅》,剧中描写了许多医院急诊室的故事。

其实互联网服务的生产事故,就像在医院急诊室一样,得由一群经验老道,并且可以处理各式各样的医护人员进行第一步筛查,判断发生原因,然后再交由各科室的同仁进行详细处理。

因此,在产品服务面对用户之后,有一组非常重要又辛苦的互联网急诊室的守护者,就是SRE (Site Reliability Engineering)。

他们主要负责确保服务的稳定性,监控生产环境上的各种情况,一旦发生问题时,就要立刻召集相关人员排查、解决。

服务稳定性乍听之下可能不太起眼,但却至关重要。作为产品经理,为了能够提供更好的用户体验、保持市场竞争力,並追求更好的商业价值,我们总是不停地在「持续迭代」,而如何平稳、丝滑的调整,就依赖开发团队及SRE团队的合作。

互联网服务上,系统包含的范围非常广,业务应用服务、网路、数据库、云端服务或伺服器等等,每一个环节都有可能出现异常,问题真的千奇百怪。

小到用户不理解前端提示而误操作、网路波动影响接口调用失败、或是大到整体机房出现异常、流量被恶意拦截需要紧急抢救的…等等。

面对不同等级的故障,团队应该在事故的「处理时效」、「处理方式」、「通报范围」的不同维度达成共识。

为什么要搭建事故应变措施?

互联网金融服务相比于工具类的服务,服务的稳定性,在用户心智中很大程度与资金安全有所关联。试想看看,如果隔天就是房贷的缴款截止日了,但是金融服务突然不能用,身上也没有现金这多令人跳脚!

当有生产事故发生时,除了影响用户体验、公司收入、更甚者可能引发舆论而影响公司声誉。因此,在事故发生当下,除了排查问题、解决问题之外,与团队内部、外部合作方、外部用户、公关媒体的沟通,每一个环节都至关重要。

如何搭建事故应变措施?

1. 预想可能发生的事情

如同《浪漫医生金师傅》剧中,我们可以看到许多奇特的意外伤害而来到医院急诊室的病患,例如:连环车祸、滑雪受伤、误食农药、地震等各种天灾人祸皆有可能,而剧中的护理人员也会每天准备好急诊室常备用品,确保当有需求时,不会因为物品匮乏而延误抢救病患的最佳时间。

而反映在互联网服务上,我们不难找到许多有心者恶意利用漏洞,或是意外情况而导致的生产事故,团队可以预先想到可能发生的情况,也可以在经验中不断学习。

例如:系统流量超过可负荷的限额、流量被恶意拦截、依赖性系统突发异常、用户因不理解指引的误操作…等等。

2. 确定有哪些重要团队成员

如上述说的,在讨论生产事故处理机制时,我认为有这些角色的参与是非常重要的,每个角色可以从各自的角度提供专业建议与支持。

  • 产品经理

  • 架构师、开发、测试

  • 客户服务团队

  • 外部合作伙伴团队

  • 公关团队

  • 法务、合规团队

3. 建立团队成员对于事故等级的共识

你知道吗?在医院的急诊室中,并非先抵达的患者能够优先接受治疗,而是需要依照伤病的紧急程度进行优先级排序。

因此,团队成员的首要目标是拟定一套能够帮助判断「优先级」的指标架构,并且「达成共识」(当然内容可以依据业务发展而有所调整),毕竟当真的有P0、P1的紧急问题时,需要大家专心一致的解决。

这时候可不会希望因为彼此对标准理解不一致,降低了事故解决的效率。

1)建立指标:可以参考以下不同维度

  • 影响范围:评估事故对用户体验、业务运行、系统功能、或服务可用性的影响范围。

  • 持续时间:事故持续影响时间。

  • 重要性和紧急性:事故对业务运营的重要性和需要被紧急解决的程度。

  • 合规性要求:思考事件对相关合规性要求的影响,如违背合规法务要求,可能会导致更严重的故事等级。

  • 可用备份和恢复策略:考虑备份和恢复策略的可用性和有效性。

2)为每个指标及事故等级定义数值

通常我们会与团队成员对于不同事故等级共同讨论相关指标维度,并建议「可快速量化」数值。例如:影响交易金额、事故持续时间、或受影响用户数。

也需要针对不同等级的事故定义响应时间以及目标处理时间,例如:P0的事故需要一天内解决,P1事故可以两天内解决,以此类推。

3)为不同等级的事故,定义对应SOP(标准作业程序)

我们其实没有想像中的那么冷静。

还记得开头我提到的周六事件吧!我印象非常深刻,那天早上虽然是电话会议,但是我感觉许多人一进到电话里头就满脸「我是谁?我在哪?」的感觉。

每一次有新同事加入时,就要重新解释一遍问题、影响以及当前进度,然后想办法厘清原因、找到对应的处理方式。

SOP(标准作业程序)是一个非常好的工具,可以帮助团队在紧急的时候,有一个可以参考的依据。

「服务降级」也是一种常采用的方式,例如在大促活动的流量高峰时,仅维持重要的系统交互,避免过多的系统交互影响服务响应速度…等等。

4. 建立监测预警机制

监测与预警是预防、尽早掌握事故发生的重要工具。

例如:确保预先充值的云服务,会在额度快被用完之前会提供邮件或短信预警、定期监测主要核心流程是否有系统交互、流量请求(有时候没有系统请求是因为用户根本无法访问该页面),越早发现事故,也可以越快控制影响范围。

5. 事中优先解决问题,事后详细检讨

团队在事故发生的当下,仅需要专注于最快的速度解决问题。而在事故解决后,也需要十分详细地检讨原因。

每一次的生产事故对团队成员来说,都是极其宝贵的经验,而经验不仅需要时间积累,更需要被纪录与传承,避免重蹈覆辙,保持互联网的精神,小步快跑,在错误中学習。

结语

处理生产事故的时候,在时间与情绪的双重压力下,其实常常需要花费相当高的沟通成本。所以建立起团队的合作共识,持续地磨合出一些应变机制。我也时常跟同事分享一个正念思考的心态,「有生产问题,代表真的有用户在使用你的服务啊!」

作者:嗨!我是安娜

题图来自 Unsplash ,基于 CC0 协议


最近不少B端产品同学前来咨询,发现他们的问题很典型:

⭕ 想跳槽又感觉自己什么都不懂,才发现工作了两三年却没有沉淀下属于自己产品方法论;

⭕ 想转到其他行业却又害怕自己没有相关行业经验,无法通过面试;

👀 如果你也遇到以上问题,推荐你来《90天B端产品经理实战班》提升,多位10年+经验大厂实战导师在线直播,助助你搭建系统B端产品工作全流程,实现跳槽涨薪目标!

🔥 最新一起火热报名中,还有限量课程优惠~

👇 扫码立即咨询详情 👇

▼ 点击「阅读原文」了解更多详情

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
煜寒咨询:2023年中国养老金融产品调研白皮书三十五 表扬《糖豆人》《蛋仔派对》研究:UGC巨浪来临,如何搭上时代顺风车?普京慈祥地笑了!乌卫生部突染发布核事故应对指南...三十六 申请书工业互联网平台疯狂内卷?生成式AI在工业遇冷?一文看懂2023年中国工业互联网产业最新洞察搭建神经调控及介入式脑机接口两大平台型产品,哈佛博士如何拿到上亿元融资?一周回顾 | 潘功胜任央行党委书记 互金协会正研制互联网金融领域催收标准仅剩3席|九大行资管组ED带你从0到1,全面掌握二级市场运作、金融市场及金融产品,轻松斩获心仪Offer!地中海邮轮行之七一个产品的指标体系是如何搭建起来的君子如今不值錢六四、天安门—不能忘却的记忆恒大财富多次更改兑付方案,去年底定融产品未兑付本息340亿工信部重磅,5G工厂要来了!工业互联网处快速成长期,5G+工业互联网概念股名单出炉来真的?中使馆:乌卫生部发布核事故应对指南华为全联接大会首设互联网产业峰会,携手共拓产业互联网新蓝海网络直播间卖金融产品,你敢下单吗?有何风险?乌克兰卫生部发布核事故应对指南!中使馆再次提醒→直播预告 | 如何搭建“满足监管要求”的数据合规体系?经验分享:企业如何搭建好私域团队打造产业互联网高地 | 2023年琶洲产业互联网峰会圆满落幕美国知名侨领张素久:“侨”如何搭建中外民间友好之桥?|东西问车企不降价协议,猪企互不挖人公约……他们团结起来了?江苏银行:打造可持续金融产品服务体系,助力经济社会发展绿色化、低碳化耗时一年用户从 0 增长至 1400 万,背后仅三名工程师,这家社交巨头背后的技术栈是如何搭建的?【2023数智产业系列榜单】中国工业互联网领军企业榜发布!搭上工业互联网高速列车,加速推进转型升级早财经丨乌克兰卫生部发布核事故应对指南,中使馆提醒;淄博不少烧烤店贴出“转租”信息;企鹅FM发布下线公告12 维度能力画像、1+3 认证体系,东亚银行如何搭建数字人才体系未央播报 | 中国互金协会正研制互联网金融领域催收标准未央播报 | 互联网金融领域4项金融国家标准发布 中国银联增资至99.63亿元天涯不再是天涯,互联网也不再是互联网央企探路ESG,体系如何搭建?乌克兰卫生部发布核事故应对指南!一周回顾 | 互联网金融领域4项金融国家标准近日发布 1年期LPR下调10个基点
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。