记录今天Couldflare崩溃

Cloudflare 现在确实出现了大规模宕机 (outage)。

出了什么问题：

Cloudflare 官方确认他们正在修复一个问题，该问题影响了多个客户服务。许多网站出现 “500 Internal Server Error” 的错误。云服务恢复了一部分，Cloudflare 表示 “已经实施了修复”。出问题的原因并非网络攻击，而是一个 “潜在 bug”（latent bug）：Cloudflare 在一次常规配置变更后，相关服务开始崩溃。 Cloudflare 的 WARP (VPN 类服务) 在伦敦暂时被禁用后又重新启用了。

具体情况

影响范围非常广泛这次宕机是全球性的 (global outage)。受影响的平台包括很多知名网站和服务：X (原 Twitter)、ChatGPT、Spotify、Canva、部分交通网站 (如 NJ Transit) 等。有用户报告出现 “500 Internal Server Error” 错误。 Cloudflare 的管理面板 (Dashboard) 和 API 也受影响。原因 Cloudflare 官方表示，这次问题是因为一个自动生成用于管理“威胁流量 (threat traffic)”的配置文件异常增长。这个文件的条目数量超过预期，导致其内部的流量处理软件崩溃。 Cloudflare 强调没有发现恶意攻击的迹象。在修复过程中，他们曾暂时禁用部分服务。例如，英国 (London) 的 WARP（Cloudflare 的 VPN /加速服务）一度被禁用，之后又重新启用了。恢复情况 Cloudflare 表示他们已经部署了修复 (fix implemented)，并认为大部分问题已经解决。他们正在持续监测，以确保所有服务恢复正常。虽然主要服务恢复，但仍有部分用户可能无法访问 Cloudflare 仪表盘 (Dashboard)。在恢复过程中，Access (接入) 和 WARP 服务的错误率恢复到事发前水平。时序 Cloudflare 在大约 11:48 UTC 宣布进入 “内部服务降级 (internal service degradation)” 状态。在 14:42 UTC 他们发布状态更新：A fix has been implemented … (已经部署修复) 外界观察到错误报告 (例如 500 错误)在一段时间后开始减少。影响严重性 /意义这次宕机再次暴露了互联网基础设施对 Cloudflare 这样的公司的依赖性：很多网站和服务在 Cloudflare 出问题时也一起崩。对用户体验和企业运营都有实质影响：访问中断、服务无法使用等。对 Cloudflare 本身也是重大打击：连它自己的 Dashboard 都受影响，说明问题很深入。

小结

根本问题：配置文件异常增长 → 核心流量处理系统崩溃。没有攻击：Cloudflare 表示是内部 bug /系统问题，而非外部攻击。恢复中：多数服务已经恢复，但仍在监控。影响大：多个主流平台受波及。

Share this:

Related