滴滴“崩了”12小时 损失4亿成交额,竟有大V提前半个月预测到了
11月28日电,11月28日上午10:30左右,据记者在广州实测滴滴出行App后发现,目前滴滴出行包括网约车和共享单车等业务已经恢复正常,而此次全面的功能瘫痪持续了接近12小时,也是近年来滴滴出行瘫痪时间最长的一次故障。据滴滴出行此前公布的2023年第三季度财报显示,单季度中国出行业务总交易额为725亿元,日均单量达到3130万单,而以此次“崩了”的故障时长计算,估计将会让滴滴损失过千万的订单量和超4亿的交易额。(南方+)
滴滴出行App全面的功能瘫痪持续了接近12小时 图片来自网络
而在微博上,有个大V几乎是提前半个月就预测到了事故,只不过当时没有明确预测到会是滴滴。当时的预测是基于阿里云大事故。
图片看着不方便的话,可以看文字版:
作为一名互联网科技博主,这次谈谈本行。
昨天阿里云的大事故,圈内人猜测都是 IAM 之类的挂了,比如鉴权。一个是因为挂的太彻底了,几乎所有产品全挂,如果不是 IAM 那只能是网络了。但同时,恢复之后很多客户发现自己的业务也没啥事,运行很平稳,说明大概率不是网络问题,那也就只可能是 IAM 之类的系统挂了。
然后呢,这个事情大概率是个变更导致的故障,不会是系统自己出的问题。这个只要大概了解点儿技术都不难判断。
IAM 类的系统其实功能粗略可以分三块,一块是后台管理,一块是登录,一块是鉴权。
后台管理也就是你创建删除用户,修改用户权限的地方,这块如果提供了什么跨所有可用区同步的能力,那确实有可能一挂全挂。但这块挂了并不会影响别的服务,而且这块功能本身使用频率也很低,所以通常也不是啥大问题。
登录其实就是认证身份,生成 token 的过程,比如你要登阿里云的管理后台这块肯定是要过的,如果这块挂了你看着确实看着就是阿里云全挂了。但已经登录的用户应该是不受影响的,所以应该也不会一下全炸。同时对于正在运行的服务应该也没啥影响,只是有可能新启动的服务会受影响,因为有可能拿不到新 token 了。
鉴权其实就是各种服务拿着 token 去问是否合法,以及校验这个 token 权限的过程。这块是所有服务都强依赖的,一旦出了问题确实影响会很大。但鉴权这个东西,本质就是个读操作,并且从产品设计上,权限生效啥的本身就是异步的,所以冗余啊高可用啊之类的非常好做,并且不同区域之间肯定是隔离的,我不信阿里云连这种基本的东西都做不好,所以在运行过程中突然出现所有可用区全挂的故障几乎不可能。
所以综合下来看,大概率还是人为操作导致的严重故障。并且这个操作一定是违规的,大概率是跳过了一些灰度的流程直接推了全量。至于是误操作还是有意为之,这个咱就不清楚了,等着看阿里云自己的通告吧。
不过作为一名搞了十来年基础架构的背锅侠,我还是想再多说两句。
稳定性这个东西,说难也难,说不难也不难。难是因为确实没见过哪个公司系统不挂的,而且从理论上,就不存在完全不挂的系统。说不难,是因为没有哪次挂从技术和流程上看是无法避免的,所以只要投入精力去做去搞,稳定性提高并不是啥难事。
但提高稳定性这个事情本身,其实是件吃力不讨好的事情。举个简单的例子,年年花钱修河堤,如果没发大水,领导会质疑说你年年花这个钱干啥,从来没出过事。如果发了大水,领导会质疑说年年花这个钱干啥,不还是发大水了。
看明白没?搞稳定性和修河堤其实是一样的,都是防患于未然,做的越好越没有存在感,一旦出了事所有努力全白费,还得背锅。这种事情但凡想做好,一个是需要找一个耐得住寂寞且有责任心的人来负责,另一个就是管事的一把手必须真的懂这个事情的长期价值,愿意顶住压力给下面人空间去做,在绩效和评价上也做到公平公正。所以在任何公司搞基础架构,一旦公司换了一个搞业务的老板过来,那么你最好赶紧准备简历留条后路,大故障马上就要来了,别到时候背锅走人还不好找工作。。。
另外,最近经济不景气,各行各业都在降本增效,这个对于搞稳定性的的团队也是个巨大的打击。任何公司降本增效,第一肯定是先干掉烧钱的新业务,这个没啥说的。第二就是要对成本部门下刀,而这些搞基础架构、搞稳定性的团队,必然都是成本部门,很难不挨刀。朋友圈看到一个说法,降本砍业务部门,业务部门马上摆烂收入就要降,老板也怕。但砍成本部门,他们又不敢主动搞大故障来反击(违法的,这么搞真的会进去的),这些人工资又高,一砍下去成本降的立竿见影,然后所谓影响稳定性其实也是长期的,你砍完可能一年系统运行都很正常。所以越砍越上瘾,砍完还想砍,直到最后出了个大故障,才发现满地鸡毛没法收拾。。。
所以就现在这个大环境,我觉得其他竞争对手也别开心。阿里云遇到的问题,大家一个都不少。大环境这个样子,没有人能独善其身。更大的故障已经在路上了,就看谁家最倒霉吧,好日子还在后头呢
对此,小伙伴们你们怎么看?
更多互联网行业爆料,以及职场资讯,职业技能经验分享
关注我,给你好看
部分内容引用于网络,如有侵权,请联系删除。
【回复“健康指南”,Get《程序员健康指南》电子书】
【回复“1024”,Get 程序猿求职面试葵花宝典电子书】
微信扫码关注该文公众号作者