Redian新闻
>
滴滴P0级故障,又是降本增笑?

滴滴P0级故障,又是降本增笑?

公众号新闻

来源:数据STUDIO

2023 年 11 月 27 日晚间,滴滴因系统故障导致 App 服务异常,不显示定位且无法打车。11 月 27 日晚,滴滴出行进行了回复:非常抱歉,由于系统故障。

11 月 27 日深夜,上海、北京、广州等多地滴滴用户反馈,滴滴出行 App 无法使用,显示网络异常,地图无法加载,用户无法使用定位功能且无法打车。

“滴滴崩了”的话题随即登上微博热搜。热搜话题下不少用户发帖表达自己在使用滴滴 App 过程中遇到的“奇葩”问题。

有用户反馈虽然打到了车,但同时来了好几辆车,有的用户遇到来了三辆、有用户遇到来了四辆车,无法取消,无法联系客服。

从各平台上的反馈来看,此次滴滴平台在接单、定位、计费等环节上都出现了问题。

有网约车司机表示,昨晚 App 崩溃时刚好在接单,“从晚上 10 点 20 分开始什么都做不了,客服电话也进不了线。目前恢复了少部分功能,但不能正常使用,很多错单乱单,还出现了多位司机接同一单的现象。”

27 日深夜,滴滴出行对滴滴 App 服务出现异常进行了回复,滴滴出行称:非常抱歉,由于系统故障,今天晚间滴滴 App 服务出现异常,技术目前正陆续恢复中。由此给广大用户和司机师傅们造成不便,再次向大家致歉。

2023 年 11 月 28 日早间,滴滴出行消息称,网约车等服务已恢复,骑车等在陆续修复中。11 月 28 日,在滴滴发出公告的同时,记者在上海、深圳等地使用滴滴呼叫网约车,发现网约车功能并未恢复使用,网络加载异常,仍无法打车。11 月 28 日,滴滴向记者回应称,网约车服务已恢复,司机乘客权益陆续恢复补发。

11 月 29 日,滴滴再次发文致歉,称初步确定事故起因是底层系统软件发生故障

来源:https://weibo.com/2838754010/NuMAAaUEl

在滴滴官方发布这份公告之前,已经有资深 IT 技术人士分析:“从表现上看,打车、共享单车全挂,不同的业务板块之间应该是有隔离的,说明问题出在更加底层的基础设施。攻击者一般只能访问到应用层,基础设施访问不到。要么是被攻击者打穿,要么是自己系统操作不慎挂了。即便是前者,也算是一种系统缺陷,才会被打穿。”

360 安全专家认为,滴滴闪崩背后的技术原因可能有六种:

第一,系统更新升级过程中出现了编程错误、逻辑错误或未处理的异常情况:一般情况下,互联网厂商发布更新都会在晚上,与滴滴发生故障的时间也能对应,当然业务升级维护是放量更新,但现在滴滴全平台、全业务都故障了,说明肯定是他 “家里” 的问题。

第二,服务器故障:比如滴滴的核心机房,可能恒温恒湿环境出了问题,导致服务器过热、CPU 烧了,或者核心机房所在地发生了自然灾害如地震、洪水、海啸等,这种情况下,硬件需要重新更换,里面的服务软件也需要重新配置,恢复周期相对较长,但这个可能性比较小。

第三,第三方服务故障:滴滴的后台架构可能使用了第三方服务或者组件。如果第三方出了问题,也可能会影响滴滴的正常运行。但出于安全性考虑,滴滴可能不会将核心业务托管给第三方,不过这个可能性也较小。

第四,DDOS 攻击:黑客采用分布式拒绝服务的方式,抢占了大量的服务器资源,导致用户无法访问,但这个不太可能,因为 DDos 不会导致数据出错,而且滴滴从体量上来说,有足够的成本和能力去对抗。

第五,其他网络攻击:某些黑灰产团伙可能会通过拖库盗取数据,然后在暗网上售卖,在这个过程中不排除会有误操作,破坏了数据库。

第六,勒索病毒:网络攻击黑客对滴滴的底层数据、业务代码进行了加密。据披露现象,用户的账单和打车数据都算错了,存在一定可能是滴滴为了避免更大损失主动暂停了业务。近期勒索攻击事件屡屡发生,月初,某金融机构就是因为遭遇勒索病毒攻击造成了业务停摆。

不过也有网络安全公司专家认为,如果是来自外部的黑客攻击,公司一般会在第一时间进行声明。他猜测更集中于滴滴发生了内部重大业务调整,或有新业务接入原系统,但没有做好预案,导致关联业务或关联系统出现重大故障,这是大公司系统故障最常见的原因。

因此对于滴滴此次大规模的长时间故障,有行业人士认为,降本增效可能也是原因之一

该人士认为,互联网公司核心业务频繁宕机,且长时间宕机,是降本增效的附属品之一。系统投资少了,维护资源少了,程序员更换频繁了,BUG 就多

他举例称,一般在业务上行阶段都有冗余,为了迎接随时爆发的订单,上行阶段要维持负载的上限不能过大,比如平时 70%,这样遇到一个小爆发不用担心会出问题,足以应对小高峰;但是下行期的逻辑就不同了,负载很高的时候抗一抗就行了,虽然后面遇到小高峰可能会难受,但是随着时间的推移总体负载会下降。

其实类似故障情况在 2022 年 9 月 22 日也曾出现过。当日滴滴出行官方微博致歉称由于机房网络故障,导致滴滴部分服务受影响。

然而像今天这样大面积、长时间的故障,应该是滴滴史上少有的。以目前情况来看,大家还无法确认故障原因。有技术专家感慨于修复时间太长,表示“是时候废弃微服务了,别觉得自己水平多高,看看今天的滴滴吧。”

而更多人则认为这次故障跟“降本增效”有关。如平时为了迎接随时爆发的订单,设置了足够多的冗余,但现在可能没有给予足够的冗余量。根据相关资料显示,目前滴滴由滴滴云提供服务。滴滴云官网显示,滴滴出行的云计算服务基于滴滴出行的业务技术和经验积累,采用领先的云计算架构、高规格服务器集群搭建、高性能资源配置机制、精细化运营模式,致力于为开发者提供简单快捷、高效稳定、高性价比、安全可靠的 IT 基础设施云服务。在今年 2 月,滴滴云发布公告,由于产品线调整,滴滴云在 2023 年 3 月 31 日起将不再对外提供公有云服务。

对于互联网大厂研发和架构师常常提到的高可用性,此次事故让人不禁感叹,难道同城多活、异地多活只是PPT里的说辞吗?降本增效的所谓互联网方式,难道只是裁员留下一堆中层领导天天写PPT来维护系统吗?

降本增笑,开猿节流带来的后果是:
9月份,Boss直聘服务器崩了 11月初,阿里云服务器崩了
11月底,滴滴服务器崩了

下一位会是谁?

最后来看一下网传的消息,有同行说滴滴这次严重故障是升级 k8s 版本导致,当时 SRE 工程师定位了三个小时都没定位到问题。

从滴滴公开的技术分享来看,滴滴弹性云在上个月升级了 k8s 版本:从 k8s 1.12 升级到 1.20。(K8s 1.12 发布于 2018 年,K8s 1.20 发布于 2020 年。)

来源:滴滴弹性云基于 K8S 的调度实践

另外,滴滴还为所有用户派发了一张 “致歉补偿券”,无门槛使用,立减 10 元。

不过,有用户反馈补偿券领取失败,并且登上百度热搜,因此有用户质疑补偿券是限量的。

对此,滴滴客服回应称:补偿券不是限制数量的,目前领取人数较多,辛苦您后续重新尝试领取。


·················END·················

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
突发!GO火车全线停运!网络系统出故障,通勤者:大混乱还有一个小时!突发!上海起飞一航班飞行中出现故障,官方紧急通报→新加坡星展银行线上支付出故障,惊动了几家中国自媒体互联网大厂宕机事件大比拼!网友:开“猿”节流,降本增“笑”?美行科技,众源地图「助力」城市NOA降本增效|金球奖入围公示挪威阿尔塔(Alta),极光大教堂百沐生物:用BT+IT实现基因行业降本增效,业务覆盖三大核心板块降本增效还在继续,为什么超半数制造企业仍加大 IT 预算?我们能从阿里云史诗级故障中学到什么滴滴史上最严重服务故障,罪魁祸首是底层软件 or “降本增笑”?2024关键词:降本增效!忍笑一一难度不小「专题速递」边缘降本、智能语音降本、提高压缩率、极速高清实践2024 关键词:降本增效阿里赢了国内大模型打假第一案;联发科对内启动降本增效,加班费少60%阿里云突发严重故障,淘宝、闲鱼、阿里云盘、钉钉“崩”上热搜!历经 2.5 小时恢复《歌德堡变奏曲1364》晚点财经|富士康至少拿了相当于 1.3 万个足球场的用地;华尔街降本增效消费+AI圆桌 | AI赋能大消费全产业链,如何降本增效?阿里云史诗级故障原因曝光!网友评价也是绝了…Pico 大收缩,字节跳动开启新一轮降本增效上海医保系统突发故障,网友称“无法结算”!该系统1年维护费高达1300多万元!最新回应:暂未收到完全恢复的通知ChatGPT 出现严重故障,服务中断超一小时;苹果将被迫在欧洲开放第三方应用商店;中国平安辟谣收购碧桂园 | 极客早知道探寻西西里与马耳他的历史脚印(2)速自查!Westpac银行在线系统发生大规模故障,大批客户存款“一夜归零”从茅台到馒头,飞机餐也降本增效了?语雀,这波故障,放眼整个互联网也是炸裂般的存在。是时候基于云重新设计 Kafka 了!AutoMQ 如何实现 Kafka 十倍的降本增效探寻西西里与马耳他的历史脚印(1)激光雷达,角力「降本增效」字节2022年财报曝光!营收6220亿利润200亿美元,“降本增效”策略,已取得成效世界顶尖多模态大模型开源!又是零一万物,又是李开复单侧发动机出故障,飞机还能正常飞吗?亿咖通·安托拉系列计算平台,降本增效「典范」|年度好产品入围公示复盘 | 停服近 8 小时,重大故障,原因和处理过程来了!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。