什么叫容错性?

image.png

01 复制

复制是指在不同节点或地点创建多个数据或服务副本

例如 Cassandra 和 HBase 等分布式数据库会在多个节点上复制数据,以确保即使某些节点发生故障,数据也能可用。

02 冗余

冗余是指在发生故障时,有额外的组件或系统可以接替。

例如 RAID(独立磁盘冗余阵列)系统使用多个硬盘冗余存储数据,提供硬盘故障容错。

03 负载均衡

负载均衡将进入的网络流量分配给多个服务器,确保没有一个服务器成为故障点。

例如:使用 NGINX 或 HAProxy 等负载均衡在多个服务器之间分配网络流量,确保网络应用程序的高可用性。

04 故障切换机制

当主系统或组件出现故障时,故障切换机制会自动切换到备用系统或组件。

例如:AWS 等云服务将故障转移机制用于数据库(如 Amazon RDS Multi-AZ),以便在出现故障时切换到备用实例。

05 优雅降级

优雅降级可确保系统在功能降低的情况下继续运行,而不是在某些组件出现故障时完全失效。

例如:禁用非必要功能的网络应用程序,同时仍允许用户在部分系统故障时访问关键功能。

06 监控和警报

持续监控系统的健康状况和性能,并为任何异常或故障设置警报。