近日,IDC在《关键业务平台以业务连续性助力“数字优先”战略》(Mission-Critical Platforms Deliver Continuity in the Shift to "Digital First" Strategies)报告中授予HPE Superdome Flex系列服务器AL4级别的可用性评价,并指出“HPE是AL4级市场的主要参与者”。
HPE Superdome Flex 系列服务器正是如此,基于RAS策略进行设计,可靠性(Reliability)、可用性(Availability)和可维护性(Serviceability)目标都得到了实现,具体行动步骤包括:
1. 通过检测和记录错误来确定出现的故障。
2. 对故障进行分析,防止其影响到更高 级别的IT堆栈,如操作系统、数据库、应用程序和数据等。
3. 修复故障来减少或避免停机。
此次IDC授予HPE Superdome Flex系列服务器AL4级评价,也充分肯定了其较高水准的RAS能力——称HPE Superdome Flex系列服务器是具有容错能力的平台,在任何情况下都能连续地运行,具有覆盖整个系统的硬件RAS和硬件冗余功能。
具体来看,HPE Superdome Flex的RAS功能体现在以下三方面:
使用RAS功能跨子系统进行错误检测
在较低的IT层级使用子系统RAS功能,来收集证据以检测错误、确定根本原因并找到错误之间的相关性。其中,内存RAS技术可增强内存可靠性并降低内存中断率。
Platform RAS提供自适应路由,能够在系统发生故障处或故障链路周围路由流量。HPE Superdome Flex服务器由英特尔®至强®可扩展处理器提供支持,具备了完整RAS功能,包括创新的错误检测和重试机制。
固件优先阻止错误影响操作系统和应用程序
内存、CPU或I/O通道中发生的错误将停留在固件级别。固件可以收集错误数据并进行诊断,即使在处理器未完全正常工作的情况下,诊断仍能正常进行,可针对系统内存、CPU、I/O和互连组件进行预测性故障分析
分析引擎对故障进行处理和纠正
分析引擎持续地对所有硬件进行故障分析。它可以预测故障,还能启动自动恢复功能,并将问题及时告知系统管理员和管理软件,进一步减少了人为错误的发生,并提高了系统的可用性。