一种基于树模型的冰箱故障定位方法和系统与流程

专利2023-02-04  100



1.本发明涉及故障诊断技术领域,更具体的说是一种基于树模型的冰箱故障定位方法和系统。


背景技术:

2.现有的冰箱家电产品采用的是mcu进行控制,在家电工作的过程中mcu也会根据传感器反馈以及相关逻辑判定部分零部件是否出现故障,但这种判定的较为依赖故障传感器,并且传感器本身如果存在故障将会导致判定失效,而冰箱故障传感器本身布置较少,因此对应故障种类也较少,设备出现故障无法正常工作以后,用户找到售后详细排查后才能诊断维修。
3.目前,现有技术也对故障进行诊断的系统,如专利号:cn202011618015.6,专利名称为:《一种冰箱远程故障诊断系统及其诊断方法》,其公开了一种冰箱远程故障诊断系统及其诊断方法,涉及冰箱故障诊断技术领域。
4.其通过优化冰箱控制板及远程控制运行冰箱故障诊断规则,综合温度变化和电器件的功率变化,从而判断冰箱的具体故障原因,提高了判断的准确性,缩短冰箱维修时间,降低维修费用。其公开的技术方案中就涉及利用云端系统,但是该系统通过人为设定温度变化阈值以及功率变化阈值,现有的统计手段存在一定的局限性:

依赖经验,许多统计规律和计算方法依赖于专家的经验和人工处理,在准确性和效率上有所欠缺;

传统手段依赖人工,成本较高,对不同的场景适应性较差,效率较低。


技术实现要素:

5.本发明提供一种基于树模型的冰箱故障定位方法和系统,能够提高用户的使用体验并且降低冰箱成本提高检测效率的特点。以期解决背景技术中的问题。
6.为了实现上述目的,本发明采用以下技术方案:
7.一种基于树模型的冰箱故障定位方法,其包括,初步筛选,筛选出与冰箱故障有关的数据;数据处理,处理异常值,缺失值,并对其进行分类;特征工程,对特征进行处理;划分数据集,将数据分成训练集和验证集;模型训练,通过xgboost算法对训练集数据进行模型的训练;模型评估和优化,通过验证集数据对模型进行评估,并对xgboost中的各个特征进行分析,根据情况对模型进行优化。
8.本实施例还提供了一种基于树模型的冰箱故障定位系统,包含两个模块,特征提取模块和评估分析模块,特征提取模块包含:特征筛选,根据设备上报数据数值化,计算特征之间的自相关性,剔除自相关较大的特征,预处理,对数据进行异常值、缺失值、one-hot、标准化处理等,信息抽取,对于高纬度可进行pca抽取,特征解释,根据模型结果解释特征的重要程度,模型优化,根据结果对模型进行参数的优化,结构的优化。评估分析模块包括:模型建立,根据处理后的数据进行建模,模型训练,将数据分为tain/test进行训练,特征分析,根据结果对特征进行分析,确定特征重要性,模型评估,根据评估指标计算模型效果,是
否符合使用条件。
9.作为本发明所述基于树模型的冰箱故障定位方法和系统,其中:在对数据其进行分类时,根据冰箱售后的过往维修、保养记录以及使用冰箱各个温度传,湿度,压缩机状态,风机挡位,风门以及运行状态等传感器数据对选取的样本进行分类。
10.作为本发明所述基于树模型的冰箱故障定位方法和系统,其中:对特征进行处理包括去掉冗余特征,多项式组合特征,再使用方差选择法,使用主成分分析法等降维方法进一步减少特征
11.作为本发明所述基于树模型的冰箱故障定位方法和系统,其中:采用smote方法进行过采样处理。
12.作为本发明所述基于树模型的冰箱故障定位方法和系统,其中:使用f1-score对所述模型进行评估
13.本发明与现有技术相比具有的有益效果是:
14.能够实现对联网冰箱的故障检测,具有良好的鲁棒性和稳定性,并且能结合现有的评估体系和结论进行进一步的解释和优化,能够满足实用性和性能的要求。
附图说明
15.图1为基于树模型的冰箱故障定位方法和系统的解析框架图。
16.图2为基于树模型的冰箱故障定位方法和系统的图谱层次图。
具体实施方式
17.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
18.相反,本技术涵盖任何由权利要求定义的在本技术的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本技术有更好的了解,在下文对本技术的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本技术。
19.如图1-2所示,本系统通过对物联网冰箱上传的运行全状态数据进行存储,利用大数据云系统进行数据处理以及特征衍生再进行机器学习算法,形成云端的故障判定模型,对设备的运行数据进行运算后,对故障进行判定,对发现故障的设备向用户手机发送短信提示信息,用户检查发现后与售后客服联系确认维修订单,云端则无论是否用户确认都会将故障信息发送售后,以便售后提前准备待用户确认联系后进行上门维护。
20.为本发明提供了一种基于树模型的冰箱故障定位方法和系统,基于树模型的冰箱故障定位方法包括如下步骤:
21.1.初步筛选,筛选出与冰箱故障有关的数据;
22.2.数据处理,处理异常值缺失值,并对其进行分类;
23.3.特征工程,对特征进行处理;
24.4.划分数据集,将数据分成训练集和验证集;
25.5.模型训练,通过xgboost算法对训练集数据进行模型的训练;
26.6.模型评估和优化,通过验证集数据对模型进行评估,并对xgboost中的各个特征进行分析,根据情况对模型进行优化;
27.在步骤1中,首先把收集到的冰箱全状态数据中与售后维修数据没有关系的数据去掉,初步选出可能与故障有关的数据,这里可以结合制冷系统工程师的经验结论总结出来的已有结论。筛选的标准应该参考行业状况如设备特点,系统特点,以及传统冰箱故障分析中常用的分析如温度传,湿度,压缩机状态,风机挡位,风门以及运行状态等传感器数据以及售后故障标记数据等,参考以上因素,通过人标记的方式形成数据标签,同时也能在该步骤完成数据的脱敏等操作。
28.步骤2中,处理异常值缺失值,选取数据完整可靠的试验样机,同时根据这些样机的过往交实验记录,从数据中选取可信度较高,时效性较强的数据用来作为模型样本,同时依据样机的各项数据如压缩机故障,化霜传感器故障,风门故障等来增加负样本
29.在3步骤中,去掉冗余的特征,再使用常用的特征选择方法如方差选择法以及特征衍生,如(温度差t=|t1-t2|(设定温度与实际温度的绝对差)),然后使用主成分分析法等降维方法进一步减少特征。其中冗余的特征为能够由已有特征简单计算得出的特征。
30.在步骤4中,把数据分成训练集和验证集,同时采样时根据具体情况进行采样,采样处理,比如信用较差的公司一般占比例很少,这时一般需要对样本进行过采样或其他处理使得数据集分布更合理,模型效果更好。
31.在步骤5中,通过调试参数使得模型的准确率达到一个较高的水平,一般认为f1-score97%以上符合要求。
32.在步骤6中,使用模型评估方法对得到的模型进行评估,并对xgboost中的各个特征进行分析,如各个特征的重要程度,一般使用f1-score来对模型进行评估。
33.由于数据中的故障数据数量远远低于正常冰箱,因此得到的数据集负例,这就容易导致模型最终效果较差,因此需要在采样过程中运用一些方法来排除影响,如过采样方法smote方法等等来使得不平衡数据集更加合理便于学习。
34.xgboost是一种特殊的梯度提升决策树,是一种基于树结构的集成学习的方法。在模型训练中,xgboost的参数一般分为3类,第一种是通用的参数用来控制参数的基本功能如nthread用来进行多线程控制。第二类为booster参数,主要是控制训练时每一步的集成,比如tree booster和linear booster,xgboost的目标函数如下:
[0035][0036]
上式中gj表示所选叶子节点一阶导数,ω是叶节点的权重,hj为二阶导数,γ控制节点的个数防止过拟合,t是叶子节点的个数。该算法中用结构分作为树分裂的依据,越小说明特征分裂后的效果越好。
[0037]
结构分化简后如下:
[0038]
[0039]
在损失函数中,xgboost使用了泰勒公式,使用泰勒二阶展开做为目标函数的近似。通过不断的向回归树重添加树,通过结构分的多少来进行特征分裂长出新的树,用时用新的树去拟合上一次预测的残差,最后样本的特征会落到书中相应的节点上,每棵树的分数加起来就是某一个样本最终得到的预测值。
[0040]
叶节点在分裂的时候一般使用枚举全部树结构的贪心算法,当数据较大不能直接计算则可以使用近似算法,不同的算法应用在不同的场景能够适应场景的需求。
[0041]
xgboost算法训练具体为运用上一步得到的数据使用xgboost算法进行模型的构建和调参。可以用过python库中的xgboost库函数进行。在准确度达到要求后,使用评估指标对模型进行评估,并且通过分析各个特征的重要程度等方法与实际情况和现有结论进行比照,再对模型进行进一步的解释和改进。然后在模型达到预期的要求后将需要评估的冰箱运行状态数据的相关数据输入到得到的模型当中,得到一个比较具有参考价值和更为客观效率的故障概率
[0042]
本发明所述方法能够实现对冰箱故障的准确高效评估,具有良好的鲁棒性和稳定性,并且能结合现有的评估体系和结论进行进一步的解释和优化,能够满足实用性和性能的要求。结合人工智能方法推动冰箱故障评估售后管理的自动化,智能化,为冰箱等其他家电故障管理等各方面提供有效参考。
[0043]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种基于树模型的冰箱故障定位方法,其特征在于,包括:初步筛选,筛选出与冰箱故障有关的数据;数据处理,处理异常值缺失值,并对其进行分类;特征工程,对特征进行处理;划分数据集,将数据分成训练集和验证集;模型训练,通过xgboost算法对训练集数据进行模型的训练;模型评估和优化,通过验证集数据对模型进行评估,并对xgboost中的各个特征进行分析,针对模型结果对模型进行优化。2.根据权利要求1所述的一种基于树模型的冰箱故障定位方法,其特征在于,所述初步筛选,筛选出与冰箱故障有关的数据;包括:把收集到的冰箱全状态数据中与售后维修数据没有关系的数据去掉,初步选出与故障有关的数据,通过人标记的方式形成数据标签,同时在该步骤完成数据的脱敏操作。3.根据权利要求1所述的一种基于树模型的冰箱故障定位方法,其特征在于,所述数据处理,处理异常值缺失值,并对其进行分类;包括:处理异常值缺失值,选取数据完整可靠的试验样机,根据试验样机的过往实验记录,从数据中选取数据用来作为模型样本,同时依据试验样机的压缩机故障,化霜传感器故障,风门故障数据来增加负样本。4.根据权利要求1所述的一种基于树模型的冰箱故障定位方法,其特征在于,所述特征工程,对特征进行处理;包括:去掉冗余的特征,再使用常用的特征选择方法以及特征衍生,使用主成分分析法降维方法进一步减少特征;其中冗余的特征为能够由已有特征简单计算得出的特征。5.根据权利要求1所述的一种基于树模型的冰箱故障定位方法,其特征在于,所述模型训练,通过xgboost算法对训练集数据进行模型的训练;包括:在模型训练中,xgboost的参数一般分为3类,第一种是通用的参数用来控制参数的基本功能;第二类为booster参数,主要是控制训练时每一步的集成;xgboost的目标函数如下:上式中g
j
表示所选叶子节点一阶导数,ω是叶节点的权重,h
j
为二阶导数,γ控制节点的个数防止过拟合,t是叶子节点的个数;该算法中用结构分作为树分裂的依据,越小说明特征分裂后的效果越好。6.一种基于树模型的冰箱故障定位系统,其特征在于,用于实现权利要求1-5任一所述的方法,包括:特征提取模块和评估分析模块,特征提取模块包含:特征筛选,根据设备上报数据数值化,计算特征之间的自相关性,剔除自相关较大的特征,预处理,对数据进行异常值、缺失值、one-hot、标准化处理等,信息抽取,对于高纬度可进行pca抽取,特征解释,根据模型结果解释特征的重要程度,模型优化,根据结果对模型进行参数的优化,结构的优化。评估分析模块包括:模型建立,根据处理后的数据进行建模,模型训练,将数据分为tain/test进行训练,特征分析,根据结果对特征进行分析,确定特征重要性,模型评估,根据评估
指标计算模型效果,是否符合使用条件。

技术总结
本发明公开了一种基于树模型的冰箱故障定位方法和系统,包括:初步筛选,筛选出与冰箱故障有关的数据;数据处理,处理异常值缺失值,并对其进行分类;特征工程,对特征进行处理;划分数据集,将数据分成训练集和验证集;模型训练,通过Xgboost算法对训练集数据进行模型的训练;模型评估和优化,通过验证集数据对模型进行评估,并对xgboost中的各个特征进行分析,针对模型结果对模型进行优化。本发明所述方法能够实现对联网冰箱故障的准确高效评估,具有良好的鲁棒性和稳定性,并且能结合现有的评估体系和结论进行进一步的解释和优化,能够满足实用性和性能的要求。实用性和性能的要求。实用性和性能的要求。


技术研发人员:王辰 王强 任飞
受保护的技术使用者:四川虹美智能科技有限公司
技术研发日:2022.07.21
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-649.html

最新回复(0)