• 凯发k8国际

    当前位置 > 凯发k8国际 > 服务 > 服务器 > KunTai R722服务器后置硬盘告警问题分析总结

    KunTai R722服务器后置硬盘告警问题分析总结

    发布时间:2025-12-29

    一 、现网描述

    1.1 环境描述

    设备型号:KunTai R722

    硬件配置

    主板型号:S920S00

    硬盘型号:NVME盘

    BMC芯片:1711版

     

    二、 故障描述

    2.1 故障现象

    客户现场共计有179台,40台有后置硬盘接入MEMBLAZE硬盘,其中有28台出现获取硬盘VPD信息失败告警。

    image.png 

     

    三、 问题分析

    3.1 排查思路

    1. 当前事件里有Disk44、Disk45获取VPD信息失败的告警,从5月20日至今未消除。

    image.png 

    2. 从sel日志中可以看到,4月4日曾上报过获取硬盘VPD信息失败的告警,在4月13日消除,之后又在5月20日再次出现告警。

    image.png 

    3. 查看硬盘信息,发现该硬盘为MEMBLAZE硬盘,型号为P5526DT0320T00

    image.pngimage.png 

    4. 查询该配置的服务器所兼容的NVME盘,发现MEMBLAZE硬盘不在兼容性里

    image.png 

    5. 当前设备BMC为1711芯片,BMC版本3.01.12.15,经客户反馈,现场已将BMC版本升级至3.01.12.29,问题仍然复现。查询BMC版本说明书,发现3.01.12.29版本能够支持两款MEMBLAZE硬盘,分别是D520和D920。

    image.png 

    6. 查看代码,发现客户当前所使用的这款硬盘并不在支持的两款硬盘里。

    image.png 

    7. 在客户环境上查询两块后置硬盘的属性值,查询结果表明,当前BMC无法获取到两块硬盘的数据。

    image.pngimage.png 

    8. 另外,从日志里可以看到,当前有告警的两块硬盘的温度无法正常获取,存在过温等较大风险。

    image.png 

    3.2 原因分析

    由于客户当前所使用的两块后置硬盘(Disk44、Disk45)不在兼容性列表内,导致BMC无法正常加载xml文件,从而影响对硬盘温度的调速策略;同时,BMC也无法正常获取到硬盘的属性值,从而产生硬盘告警。

     

    四、 问题解决

    4.1 解决办法

    客户当前所使用的两块后置硬盘(Disk44、Disk45)不在兼容性列表内,需要更换兼容的硬盘。

    4.2 分析总结

    考虑到该款硬盘不在兼容性列表内,影响风扇调速,存在过温等较大的风险,建议客户更换成在兼容性列表内的硬盘。若客户需要继续使用该款硬盘,建议向相关负责人提出测试需求进行解决。

    400-810-9119
    7天*24小时全天候接听客户的任何需求。是接入最快捷、响应最及时的全真人服务窗口,节假日无休;并为VIP客户设置专属坐席,让最分析您的服务代表时刻为您服务。
    除了常规技术问题的服务请求,客户对于服务有任何建议和意见,可顺利获得服务邮箱发送邮件,邮件将直达服务经理,为您给出满意的答复。
    官方微信
    • 凯发k8国际

    微信搜索【凯发k8国际】公众号,点击对话窗口发送信息,和凯发k8国际进行沟通,解决您随时想到的任何咨询。