阿里云深夜出现大规模宕机问题 官方表示将按协议赔偿
凌晨时阿里云华北区发生大规模宕机影响无数互联网企业,深更半夜不少开发和运维都被电话叫醒处理宕机。
不过本身这次宕机是阿里云导致的所以半夜运维也没法处理,各个公司都是等待阿里云处理完才能恢复服务。
当时有网友表示这次故障是服务器的磁盘出现问题,据阿里云最新发布的公告称故障原因是 IO HANG 导致。
阿里云目前是国内最大的公有云提供商,发生故障的华北区又是北京等互联网企业集中的区域因此影响巨大。
从故障开始到陆续恢复总共持续三个多小时,所幸故障发生在半夜相对来说给用户造成的影响要比白天小些。
阿里云表示将按服务协议进行赔偿:
目前阿里云官方公告称会根据向用户提供的SLA服务级别协议向受本次大规模故障的阿里云用户提供赔偿等。
按阿里云协议如果发生故障按级别为用户提供月服务费减免,最终换成阿里云服务器的代金券进行故障补偿。
当然对于互联网公司来说宕机三个多小时带来的损失很大,但补偿的代金券只能说算是安慰奖不能弥补损失。
多云支撑越来越被青睐:
对于互联网公司来说使用多个服务器进行宕机切换比较平常,这种情况可以应对某个服务器发生故障时恢复。
不过像阿里云这种整个可用区故障即便有同区容灾服务器也没什么用,并不能解决这种极端情况带来的影响。
所以在微博上也有很多开发和运维讨论多云支撑,使用不同公司的公有云搭建容灾备份提高服务整体稳定性。
但这种方案成本会高不少因此对于小型企业来说也是负担,具体也只能按照企业的实际情况进行区别对待了。