1.本发明涉及数据重构领域,具体而言,涉及一种用于数据的重构方法及系统。
背景技术:2.当数据发生损坏时,可以通过数据重构的方式,即由仍保存完整的元数据恢复出损坏数据,以保证数据的完整性和安全性。但是,目前数据重构技术无法直接针对将来自不同数据源的数据进行整合,前期需要大量时间和人工进行数据整理,导致工作效率较低。
技术实现要素:3.本发明的目的之一在于提供一种用于数据的重构方法,其能够整合不同数据源的数据,提高数据处理的工作效率。
4.本发明的目的之一在于提供一种用于数据的重构系统,其能够整合不同数据源的数据,提高数据处理的工作效率。
5.本发明的目的之一在于提供一种电子设备,其能够整合不同数据源的数据,提高数据处理的工作效率。
6.本发明的目的之一在于提供一种计算机存储介质,其能够整合不同数据源的数据,提高数据处理的工作效率。
7.本发明的实施例是这样实现的:
8.第一方面,本技术实施例提供一种用于数据的重构方法,其包括如下步骤:将采集的多组数据通过树状分层为多组片状数据;将任意两组片状数据中单个数据的上一层数据源依次进行比较;将比较结果相似的多个数据相匹配,并根据数据产生的时间添加时间标记;根据上述时间标记判断每组相匹配数据中各组相邻时间产生数据的差值是否超出预设范围,当超出时选择每组片状数据中的至少一个数据类型作为固定参考值,根据上述固定参考值的大小选择最相近的一组数据对该组数据进行数据重构。
9.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:若单个数据为最上层则直接利用本身数据进行比较。
10.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:按照每组数据的内存量从小到大依次进行上述数据重构。
11.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:当重构后的任意一项数据的上层数据源不完整时,依据上述固定参考值的大小选择最相近的一组数据对数据项的数据源进行填充。
12.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:将上层填充的数据源归类到对应匹配的一组数据中,若上层数据源填充后归类的一组数据的差值超出预设范围,则删除填充的内容。
13.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:上述数据重构包括当前组数据依据参考的一组数据的结构、格式和类型进行转换。
14.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:将分块后的多组数据根据上述时间标记进行排序。
15.第二方面,本技术实施例提供一种用于数据的重构系统,其包括:
16.数据分层模块:用于将采集的多组数据通过树状分层为多组片状数据;
17.数据比较模块:用于将任意两组片状数据中单个数据的上一层数据源依次进行比较;
18.匹配重构模块:用于将比较结果相似的多个数据相匹配,并根据数据产生的时间添加时间标记;根据上述时间标记判断每组相匹配数据中各组相邻时间产生数据的差值是否超出预设范围,当超出时选择每组片状数据中的至少一个数据类型作为固定参考值,根据上述固定参考值的大小选择最相近的一组数据对该组数据进行数据重构。
19.第三方面,本技术实施例提供一种电子设备,其包括:
20.存储器,用于存储一个或多个程序;
21.处理器;
22.当上述一个或多个程序被上述处理器执行时,实现如第一方面中任一项上述的方法。
23.第四方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一项上述的方法。
24.相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
25.针对第一方面~第四方面:本技术将采集的多组数据根据树状结构分层为多组片状数据,从而按照上下级关联关系将数据进行分组,并将不同组合关系的数据分隔开;通过将任意两组片状数据的上一层数据进比较,从而将每组片状数据中的单个数据相互关联匹配,便于后面对数据进行整合;利用匹配的数据添加时间标记,便于进一步利用数据产生时间进行比对;通过时间标记判断相匹配的每组匹配的数据之间的差值进行分析,从而将差值超出预设范围的数据进行数据重构;通过该组匹配数据所源于的片状数据设置选择至少一个数据类型作为固定参考值,选择片状数据中与当前组数据的固定参考值最相近的一组数据,从而对该组数据进行数据重构,从而减少数据整合后报错和乱码的情况。本技术能够将来自不同数据源的数据进行整合,减少前期数据整理所耗费的大量时间和人工,提高工作效率。
附图说明
26.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
27.图1为本发明实施例1用于数据的重构方法的流程示意图;
28.图2为本发明实施例1中上层数据源填充的流程示意图;
29.图3为本发明实施例1中上层数据源判断的流程示意图;
30.图4为本发明实施例2用于数据的重构系统的原理示意图;
31.图5为本发明实施例3电子设备的原理示意图。
具体实施方式
32.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
33.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
34.在本技术的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本技术中的具体含义。
35.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
36.实施例1
37.请参阅图1~图3,图1~图3所示为本技术实施例提供的用于数据的重构方法的示意图。用于数据的重构方法,其包括如下步骤:将采集的多组数据通过树状分层为多组片状数据;将任意两组片状数据中单个数据的上一层数据源依次进行比较;将比较结果相似的多个数据相匹配,并根据数据产生的时间添加时间标记;根据上述时间标记判断每组相匹配数据中各组相邻时间产生数据的差值是否超出预设范围,当超出时选择每组片状数据中的至少一个数据类型作为固定参考值,根据上述固定参考值的大小选择最相近的一组数据对该组数据进行数据重构。
38.详细的,采集的多组数据中包括多层级关系的多项数据,从而根据树状结构进行分层。详细的,片状数据中包括同一层级关系的多个数据项,利用两组片状数据的上一层数据源进行比较,从而将相似的数据项进行匹配整合,并利用时间维度进行标记区分。其中,若该数据不存在任何层级关系时,不用完成数据整合,此时删除该项数据。若片状数据中同一层级只包含一项数据项时,此时也不用完成数据整合,故删除该片状数据。匹配的数据可以通过时间进行排序并依次添加时间标记。通过时间标记获取每组匹配数据中相邻时间产生的各项数据的差值上是否超出预设范围,当超出预设范围时对该组匹配的多个数据进行数据重构。
39.每组相匹配的数据中至少包含两项数据,根据时间标记判断其中任意两个相邻产生的数据的差值是否超出预设阈值。其中两项数据可以为数字也可以通过文字表示不同等级,从而便于判断其差值。其中差值还可以根据两相邻数据项的预设函数计算得到。当超出预设范围时选择对应片状数据的一个或多个数据类型作为固定参考值,从而根据固定参考值选择当前片状数据中与当前一组数据相近的一组数据,用于对该组数据进行数据重构,以统一整合后的数据。选择片状数据中能够显著标识类型的数据项为固定参考值,从而进一步确定相关联的数据。其中,每组片状数据中包括多种数据类型。当一组片状数据中只包
含一种数据类型时,可以单独利用与其固定参考值最相近的一组其它片状数据进行数据重构,也可以直接将整组片状数据保留或删除。
40.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:若单个数据为最上层则直接利用本身数据进行比较。单个数据为层级关系的最上层时,此时没有上一层数据源,那么利用本身数据与其他片状数据直接进行比较。
41.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:按照每组数据的内存量从小到大依次进行上述数据重构。利用内存量设置数据重构的优先级,从而优先处理内存较小的数据,能够加快处理效率,减轻运载计算压力。
42.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:当重构后的任意一项数据的上层数据源不完整时,依据上述固定参考值的大小选择最相近的一组数据对数据项的数据源进行填充。
43.当数据重构后的多项数据项的上层数据源不完整时,依据固定参考值将最相近数据的数据源填充到该数据。其中,最相近的一组数据各项数据的数据源为多种时,选择与该项数据对应的一个数据项的数据源,可以根据数据项的具体类型确定是否相互对应。
44.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:将上层填充的数据源归类到对应匹配的一组数据中,若上层数据源填充后归类的一组数据的差值超出预设范围,则删除填充的内容。
45.将上层填充后的数据源再次归类到对应匹配的一组数据中,并利用相匹配同一组中的该数据源与相邻时间产生的数据项的差值判断是否超出预设范围,从而判断填充的数据源是否准确,并删除不合适的数据源。上述数据源删除后,可以换下一个数据源进行测试,其中数据源可以选择的范围依据固定参考值最相近的一组数据的上层数据源得到。
46.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:上述数据重构包括当前组数据依据参考的一组数据的结构、格式和类型进行转换。从而减少由于数据结构、格式和类型不一致造成的数据整合后无法查看的问题。
47.在本发明的一些实施例中,上述一种用于数据的重构方法还包括如下步骤:将分块后的多组数据根据上述时间标记进行排序。排序后能够便于列出的图表进行查看和查询,并且筛除重复和错误的内容。
48.实施例2
49.请参阅图4,图4为本技术实施例提供的用于数据的重构系统的原理图。用于数据的重构系统,其包括:数据分层模块:用于将采集的多组数据通过树状分层为多组片状数据;数据比较模块:用于将任意两组片状数据中单个数据的上一层数据源依次进行比较;匹配重构模块:用于将比较结果相似的多个数据相匹配,并根据数据产生的时间添加时间标记;根据上述时间标记判断每组相匹配数据中各组相邻时间产生数据的差值是否超出预设范围,当超出时选择每组片状数据中的至少一个数据类型作为固定参考值,根据上述固定参考值的大小选择最相近的一组数据对该组数据进行数据重构。
50.上述内容与实施例1的原理相同,在此不做重复描述。可以理解,图4所示的结构仅为示意,用于数据的重构系统还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
51.实施例3
52.请参阅图5,图5为本技术实施例提供的电子设备的一种示意性结构框图。电子设备包括存储器101、处理器102和通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,如本技术实施例2所提供的用于数据的重构系统对应的程序指令/模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
53.其中,存储器101可以是但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-only memory,prom),可擦除只读存储器(erasable programmable read-only memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。
54.处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
55.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
56.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
57.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
58.综上所述,本技术实施例提供的一种用于数据的重构方法及系统:
59.本技术将采集的多组数据根据树状结构分层为多组片状数据,从而按照上下级关联关系将数据进行分组,并将不同组合关系的数据分隔开;通过将任意两组片状数据的上
一层数据进比较,从而将每组片状数据中的单个数据相互关联匹配,便于后面对数据进行整合;利用匹配的数据添加时间标记,便于进一步利用数据产生时间进行比对;通过时间标记判断相匹配的每组匹配的数据之间的差值进行分析,从而将差值超出预设范围的数据进行数据重构;通过该组匹配数据所源于的片状数据设置选择至少一个数据类型作为固定参考值,选择片状数据中与当前组数据的固定参考值最相近的一组数据,从而对该组数据进行数据重构,从而减少数据整合后报错和乱码的情况。本技术能够将来自不同数据源的数据进行整合,减少前期数据整理所耗费的大量时间和人工,提高工作效率。
60.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
61.对于本领域技术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神或基本特征的情况下,能够以其它的具体形式实现本技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
技术特征:1.一种用于数据的重构方法,其特征在于,包括如下步骤:将采集的多组数据通过树状分层为多组片状数据;将任意两组片状数据中单个数据的上一层数据源依次进行比较;将比较结果相似的多个数据相匹配,并根据数据产生的时间添加时间标记;根据所述时间标记判断每组相匹配数据中各组相邻时间产生数据的差值是否超出预设范围,当超出时选择每组片状数据中的至少一个数据类型作为固定参考值,根据所述固定参考值的大小选择最相近的一组数据对该组数据进行数据重构。2.如权利要求1所述的一种用于数据的重构方法,其特征在于,还包括如下步骤:若单个数据为最上层则直接利用本身数据进行比较。3.如权利要求1所述的一种用于数据的重构方法,其特征在于,还包括如下步骤:按照每组数据的内存量从小到大依次进行所述数据重构。4.如权利要求3所述的一种用于数据的重构方法,其特征在于,还包括如下步骤:当重构后的任意一项数据的上层数据源不完整时,依据所述固定参考值的大小选择最相近的一组数据对数据项的数据源进行填充。5.如权利要求4所述的一种用于数据的重构方法,其特征在于,还包括如下步骤:将上层填充的数据源归类到对应匹配的一组数据中,若上层数据源填充后归类的一组数据的差值超出预设范围,则删除填充的内容。6.如权利要求1所述的一种用于数据的重构方法,其特征在于,还包括如下步骤:所述数据重构包括当前组数据依据参考的一组数据的结构、格式和类型进行转换。7.如权利要求1所述的一种用于数据的重构方法,其特征在于,还包括如下步骤:将分块后的多组数据根据所述时间标记进行排序。8.一种用于数据的重构系统,其特征在于,包括:数据分层模块:用于将采集的多组数据通过树状分层为多组片状数据;数据比较模块:用于将任意两组片状数据中单个数据的上一层数据源依次进行比较;匹配重构模块:用于将比较结果相似的多个数据相匹配,并根据数据产生的时间添加时间标记;根据所述时间标记判断每组相匹配数据中各组相邻时间产生数据的差值是否超出预设范围,当超出时选择每组片状数据中的至少一个数据类型作为固定参考值,根据所述固定参考值的大小选择最相近的一组数据对该组数据进行数据重构。9.一种电子设备,其特征在于,包括:存储器,用于存储一个或多个程序;处理器;当所述一个或多个程序被所述处理器执行时,实现如权利要求1-7中任一项所述的方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
技术总结本发明提出了一种用于数据的重构方法及系统,涉及数据重构领域。一种用于数据的重构方法,其包括如下步骤:将采集的多组数据通过树状分层为多组片状数据;将任意两组片状数据中单个数据的上一层数据源依次进行比较;将比较结果相似的多个数据相匹配,并根据数据产生的时间添加时间标记;根据上述时间标记判断每组相匹配数据中各组相邻时间产生数据的差值是否超出预设范围,当超出时选择每组片状数据中的至少一个数据类型作为固定参考值,根据上述固定参考值的大小选择最相近的一组数据对该组数据进行数据重构;能够整合不同数据源的数据,提高数据处理的工作效率。提高数据处理的工作效率。提高数据处理的工作效率。
技术研发人员:贺江涛
受保护的技术使用者:中软航科数据科技(珠海横琴)有限公司
技术研发日:2022.07.25
技术公布日:2022/11/1