Cloudflare 现在确实出现了大规模宕机 (outage)。
出了什么问题:
Cloudflare 官方确认他们正在修复一个问题,该问题影响了多个客户服务。 许多网站出现 “500 Internal Server Error” 的错误。 云服务恢复了一部分,Cloudflare 表示 “已经实施了修复”。 出问题的原因并非网络攻击,而是一个 “潜在 bug”(latent bug):Cloudflare 在一次常规配置变更后,相关服务开始崩溃。 Cloudflare 的 WARP (VPN 类服务) 在伦敦暂时被禁用后又重新启用了。
具体情况
影响范围非常广泛 这次宕机是全球性的 (global outage)。 受影响的平台包括很多知名网站和服务:X (原 Twitter)、ChatGPT、Spotify、Canva、部分交通网站 (如 NJ Transit) 等。 有用户报告出现 “500 Internal Server Error” 错误。 Cloudflare 的管理面板 (Dashboard) 和 API 也受影响。 原因 Cloudflare 官方表示,这次问题是因为 一个自动生成用于管理“威胁流量 (threat traffic)”的配置文件异常增长。这个文件的条目数量超过预期,导致其内部的流量处理软件崩溃。 Cloudflare 强调 没有发现恶意攻击的迹象。 在修复过程中,他们曾暂时禁用部分服务。例如,英国 (London) 的 WARP(Cloudflare 的 VPN /加速服务)一度被禁用,之后又重新启用了。 恢复情况 Cloudflare 表示他们已经部署了修复 (fix implemented),并认为大部分问题已经解决。 他们正在持续监测,以确保所有服务恢复正常。 虽然主要服务恢复,但仍有部分用户 可能无法访问 Cloudflare 仪表盘 (Dashboard)。 在恢复过程中,Access (接入) 和 WARP 服务的错误率恢复到事发前水平。 时序 Cloudflare 在大约 11:48 UTC 宣布进入 “内部服务降级 (internal service degradation)” 状态。 在 14:42 UTC 他们发布状态更新:A fix has been implemented … (已经部署修复) 外界观察到错误报告 (例如 500 错误)在一段时间后开始减少。 影响严重性 /意义 这次宕机再次暴露了互联网基础设施对 Cloudflare 这样的公司的依赖性:很多网站和服务在 Cloudflare 出问题时也一起崩。 对用户体验和企业运营都有实质影响:访问中断、服务无法使用等。 对 Cloudflare 本身也是重大打击:连它自己的 Dashboard 都受影响,说明问题很深入。
小结
根本问题:配置文件异常增长 → 核心流量处理系统崩溃。 没有攻击:Cloudflare 表示是内部 bug /系统问题,而非外部攻击。 恢复中:多数服务已经恢复,但仍在监控。 影响大:多个主流平台受波及。
