图片来自网络,如有侵权请联系删除
7月19日,全球发生了一场被称为“全球最严重的IT中断”的事件,导致商业、交通、医疗和全球通信基础设施陷入瘫痪。此次中断事件影响了航空公司、广播公司、医疗保健、紧急服务和公共交通应用程序等关键服务。
此次事件回顾与影响此次事件源于7月18日和19日发生的两起独立但可能相关的大型IT故障。首先是微软云计算平台Azure的中断,紧接着是网络安全公司CrowdStrike的软件更新缺陷。Falcon Sensor的缺陷更新在全球推广前未接受严格测试,导致Windows服务器和计算机出现严重故障。此次事件影响了约850万台Windows设备,导致全球多个系统瘫痪。影响范围包括:-航空公司停飞,机场被迫使用纸质机票和公告。-英国的天空新闻等广播公司暂时停播。-医疗保健、紧急服务和公共交通应用程序中断。-英国NHS预约系统和伦敦证券交易所受到影响。在爱尔兰,都柏林和科克机场、爱尔兰交通局和NCT测试中心也受到了影响。
官方声明与用户建议
周日,CrowdStrike 表示问题已被发现并隔离,并部署了修复程序。公司重申这不是网络攻击,建议客户查看公司的支持门户以获取最新的软件更新。CrowdStrike 表示:“我们了解情况的严重性,并对由此带来的不便和干扰深表歉意。”
此次中断不是网络攻击所致,但暴露了全球IT系统的脆弱性。
澳大利亚内政部长克莱尔·奥尼尔强调,此次中断没有对关键基础设施或政府服务造成影响,但恢复正常运营可能需要一段时间。她还提醒公众警惕潜在的诈骗行为。从19世纪中期的电报网络到20世纪60年代互联网的发展,安全性和可靠性一直是电信系统的核心。历史上的冗余和分散设计,如英国开发的“全红线”电报网络,确保了信息的安全传输。20世纪50年代到70年代,大学和军队工作人员设计了去中心化的全球信息共享网络,以应对核攻击等多故障点。这些经验教训告诉我们,冗余和分散是弹性和可靠系统的核心。尽管重大IT中断事件很少发生,但云计算的普及增加了风险和概率。为了确保未来因意外或故意造成的中断影响较小,需采取以下措施:-对第三方更新进行严格测试和认证。-在不同平台和云计算服务间实现多样化。-保留传统的备份措施。