一种异常定位方法、装置、设备及介质与流程

专利2025-10-20  8


本申请涉及数据处理,尤其涉及一种异常定位方法、装置、设备及介质。


背景技术:

1、在现代数据中心和信息技术(information technology,it)基础设施中,服务器的远程监控和管理是至关重要的,为了实现服务器的远程监控和管理,服务器通常配备有基板管理控制器(baseboard management controller,bmc),bmc用于使管理员远程监控服务器的状态,执行硬件诊断,甚至在某些情况下远程启动或重启服务器。

2、然而,在开发bmc系统、实现软件功能的过程中,开发人员更倾向于关注功能完整性的实现,而往往会忽视bmc系统对自身中央处理器(central processing unit,cpu)资源的消耗。但是,由于cpu资源是有限的,如果bmc系统的cpu占用率(cpu usage)过高,会导致系统性能下降,如:某个服务的响应过慢、超时等问题,甚至当cpu占用率和负载持续过高时,将导致整个系统挂死,引发服务器的远程管理功能失效。

3、为了避免这些问题,bmc系统开发人员需要在设计和实现软件功能时,将功能对于cpu资源的消耗纳入考虑范围。目前在发布的bmc系统正式版本中,获取bmc系统当前的cpu占用率,将该cpu占用率与预先设置的固定告警值进行比较,若超过告警值,则记录日志并发出告警,在发出告警后通过日志进行定位或复现问题。然而仅根据bmc系统的cpu占用率确定是否存在异常的方法,可能会存在无法准确定位到存在异常的具体位置的问题,导致定位不准确。


技术实现思路

1、本申请实施例提供了一种异常定位方法、装置、设备及介质,用以解决现有技术中异常定位不准确的问题。

2、第一方面,本申请实施例提供了一种异常定位方法,所述方法包括:

3、获取第一预设时间内待监测基板管理控制器bmc系统中各进程的第一cpu占用率;

4、识别所述待监测bmc系统中第一cpu占用率最高的前n个目标进程,获取所述待监测bmc系统对应的cpu占用率最高的前n个历史目标正常进程,将所述前n个目标进程中与所述前n个历史目标正常进程不同的目标进程确定为异常进程。

5、第二方面,本申请实施例还提供了一种异常定位装置,所述装置包括:

6、获取模块,用于获取第一预设时间内待监测基板管理控制器bmc系统中各进程的第一cpu占用率;

7、定位模块,用于识别所述待监测bmc系统中第一cpu占用率最高的前n个目标进程,获取所述待监测bmc系统对应的cpu占用率最高的前n个历史目标正常进程,将所述前n个目标进程中与所述前n个历史目标正常进程不同的目标进程确定为异常进程。

8、第三方面,本申请实施例还提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一项所述异常定位方法的步骤。

9、第四方面,本申请实施例还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述异常定位方法的步骤。

10、在本申请实施例中,获取第一预设时间内待监测基板管理控制器bmc系统中各进程的第一中央处理器cpu占用率;识别待监测bmc系统中第一cpu占用率最高的前n个目标进程,获取待监测bmc系统对应的cpu占用率最高的前n个历史目标正常进程,将前n个目标进程中与前n个历史目标正常进程不同的目标进程确定为异常进程。由于通过待监测bmc系统中各进程的cpu占用率,确定cpu占用率最高的前n个目标进程,将该前n个目标进程与历史目标正常进程进行对比确定异常进程,因此能够准确地定位到bmc系统中存在异常的进程,确保异常检测的准确性,同时方便研发人员及时快速的定位问题,减少在排查问题上的时间消耗。



技术特征:

1.一种异常定位方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述识别所述待监测bmc系统中第一cpu占用率最高的前n个目标进程,包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述初始基线的确定过程,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述策略模型,确定所述初始基线,包括:

6.根据权利要求3所述的方法,其特征在于,所述任一cpu占用率的获取过程,包括:

7.根据权利要求3所述的方法,其特征在于,所述根据每个第二cpu占用率中为预设占用率的数量,确定所述待监测bmc系统对应的bmc-zip指标值,包括:

8.一种异常定位装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7任一项所述的异常定位方法的步骤。

10.一种计算机存储介质,其特征在于,其存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行权利要求1-7任一项所述的异常定位方法的步骤。


技术总结
本申请实施例提供了一种异常定位方法、装置、设备及介质,用以解决现有技术中异常定位不准确的问题。在该方法中,获取第一预设时间内待监测基板管理控制器BMC系统中各进程的第一中央处理器CPU占用率;识别待监测BMC系统中第一CPU占用率最高的前N个目标进程,获取待监测BMC系统对应的CPU占用率最高的前N个历史目标正常进程,将前N个目标进程中与前N个历史目标正常进程不同的目标进程确定为异常进程,能够准确地定位到BMC系统中存在异常的进程,确保异常检测的准确性,同时方便研发人员及时快速的定位问题,减少在排查问题上的时间消耗。

技术研发人员:左渠,王宪臻,张昊,张国亮
受保护的技术使用者:宁畅信息技术(杭州)有限公司
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-17054.html

最新回复(0)