摘要
本发明涉及云计算和服务器托管技术技术领域,且公开了一种单机房故障恢复laas集群处理系统,包括:故障检测模块:负责实时监控集群中各节点的健康状态,分析系统日志和性能指标,快速识别潜在故障;故障评估模块:接收故障检测模块的输出,评估故障影响范围及严重程度,为故障恢复策略提供依据;资源调度模块:根据故障评估结果,动态调整资源分配,选择最佳健康节点进行服务迁移;服务迁移模块:负责将故障节点上的服务平滑迁移至健康节点,采用热迁移技术减少服务中断时间。本发明提出了一种单机房故障恢复laas集群处理系统,解决了现有技术中的集群处理系统单点故障风险高、故障检测响应延迟、资源调度不灵活、跨机房协同能力不足的问题。