Entry № 1048
单点故障(SPOF)
单点故障(SPOF) 是什么?
单点故障(SPOF)某个组件单独发生故障即可导致整个系统停摆,破坏可用性、韧性与恢复目标。
单点故障是指其失效会使整个服务不可用的任何节点:主数据库、唯一的 DNS 服务商、单个云区域、单台硬件负载均衡器、未复制的加密密钥、或仅有一人持有的管理员权限。SPOF 违反 CIA 三元组中的可用性,并削弱 ISO 22301 业务连续性目标。工程师通过冗余(active-active 集群)、多区域部署、多 DNS 厂商、复制密钥、记录在案的运行手册、岗位继承计划以及借助混沌工程暴露隐藏 SPOF 来消除它们。检测剩余 SPOF 是灾难恢复与业务连续性演练的核心活动。
● 示例
- 01
2021 年 Fastly CDN 中断使大量依赖单一 CDN 的全球站点宕机。
- 02
On-call 排班只有一人也是一种组织级 SPOF。
● 常见问题
单点故障(SPOF) 是什么?
某个组件单独发生故障即可导致整个系统停摆,破坏可用性、韧性与恢复目标。 它属于网络安全的 合规与框架 分类。
单点故障(SPOF) 是什么意思?
某个组件单独发生故障即可导致整个系统停摆,破坏可用性、韧性与恢复目标。
单点故障(SPOF) 是如何工作的?
单点故障是指其失效会使整个服务不可用的任何节点:主数据库、唯一的 DNS 服务商、单个云区域、单台硬件负载均衡器、未复制的加密密钥、或仅有一人持有的管理员权限。SPOF 违反 CIA 三元组中的可用性,并削弱 ISO 22301 业务连续性目标。工程师通过冗余(active-active 集群)、多区域部署、多 DNS 厂商、复制密钥、记录在案的运行手册、岗位继承计划以及借助混沌工程暴露隐藏 SPOF 来消除它们。检测剩余 SPOF 是灾难恢复与业务连续性演练的核心活动。
如何防御 单点故障(SPOF)?
针对 单点故障(SPOF) 的防御通常结合技术控制与运营实践,详见上方完整定义。
单点故障(SPOF) 还有哪些其他名称?
常见的别称包括: SPOF。