一种表格型数据可视化的方法及装置与流程

专利2025-04-20  14


本公开涉及可视化领域,尤其涉及一种表格型数据可视化的方法及装置。


背景技术:

1、表格型数据在进行可视化的过程中,通常采用根据数据中字段的类型匹配可视化组件或者通过已有的数据集对模型进行训练生成可视化组件的模型的方式对表格型数据进行可视化;但通过数据中字段的类型匹配可视化组件的方式仅是针对数据类型的匹配,是针对一部分特定特征的匹配,没有考虑到表格型数据的多维度特征,通过对模型训练的方式需要由大量的真实表格作为训练数据集,并且每当训练数据集进行更新后,就需要再次对可视化组件进行训练,可视化组件适配的难度较高。


技术实现思路

1、本公开提供了一种表格型数据可视化的方法、装置、电子设备及存储介质,以至少解决现有技术中存在的以上技术问题。

2、根据本公开的第一方面,提供了一种表格型数据可视化的方法,所述方法包括:获取表格型数据,所述表格型数据的列数据包括数据字段和数据内容;根据所述数据字段和所述数据内容确定所述列数据属于不同数据类型的概率;根据所述列数据属于不同数据类型的概率,对所述表格型数据进行数据特征挖掘得到数据特征挖掘结果;基于所述列数据属于不同数据类型的概率和所述数据特征挖掘结果,将所述表格型数据与预设的可视化组件进行匹配,生成所述表格型数据的可视化图像。

3、在一可实施方式中,在确定所述列数据属于不同数据类型的概率之后,所述方法还包括:针对所述列数据属于不同数据类型的概率,对所述列数据进行数据聚合,得到所述列数据属于不同数据类型对应的数据聚合结果。

4、在一可实施方式中,所述根据所述数据字段和所述数据内容确定所述列数据属于不同数据类型的概率,包括:根据所述数据字段的字段内容确定所述列数据属于不同数据类型的第一概率;根据所述数据内容确定所述列数据属于不同数据类型的第二概率;获取所述数据字段和所述数据内容对应的第一权重函数;根据所述第一权重函数、所述第一概率和所述第二概率确定所述列数据属于不同数据类型的概率。

5、在一可实施方式中,所述对所述表格型数据进行数据特征挖掘得到数据特征挖掘结果,包括:基于所述列数据属于不同数据类型的概率,对所述表格型数据进行统计特征挖掘确定所述列数据的统计特征;基于所述列数据属于不同数据类型的概率,对所述表格型数据进行可视化特征挖掘确定所述列数据的可视化特征;获取所述统计特征和所述可视化特征对应的第二权重函数;根据所述第二权重函数、所述统计特征和所述可视化特征确定所述数据特征挖掘结果。

6、在一可实施方式中,所述针对所述列数据属于不同数据类型的概率,对所述列数据进行数据聚合,得到所述列数据属于不同数据类型对应的数据聚合结果,包括:根据所述列数据属于不同数据类型的概率,确定满足预设概率的数据类型;针对满足预设概率的每一类数据类型,通过不同的聚合方式对所述列数据的数据内容进行数据聚合得到对应聚合方式的子聚合结果;获取不同聚合方式对应的第三权重函数;基于所述第三权重函数和多个子聚合结果确定所述列数据属于不同数据类型对应的数据聚合结果。

7、根据本公开的第二方面,提供了一种表格型数据可视化的装置,所述装置包括:获取模块,用于获取表格型数据,所述表格型数据的列数据包括数据字段和数据内容;确定模块,用于根据所述数据字段和所述数据内容确定所述列数据属于不同数据类型的概率;挖掘模块,用于根据所述列数据属于不同数据类型的概率,对所述表格型数据进行数据特征挖掘得到数据特征挖掘结果;生成模块,用于基于所述列数据属于不同数据类型的概率和所述数据特征挖掘结果,将所述表格型数据与预设的可视化组件进行匹配,生成所述表格型数据的可视化图像。

8、在一可实施方式中,所述装置还包括:聚合模块,用于在确定所述列数据属于不同数据类型的概率之后,针对所述列数据属于不同数据类型的概率,对所述列数据进行数据聚合,得到所述列数据属于不同数据类型对应的数据聚合结果。

9、在一可实施方式中,所述确定模块,包括:第一确定子模块,用于根据所述数据字段的字段内容确定所述列数据属于不同数据类型的第一概率;所述第一确定子模块,还用于根据所述数据内容确定所述列数据属于不同数据类型的第二概率;第一获取子模块,用于获取所述数据字段和所述数据内容对应的第一权重函数;第二确定子模块,用于根据所述第一权重函数、所述第一概率和所述第二概率确定所述列数据属于不同数据类型的概率。

10、在一可实施方式中,所述挖掘模块,包括第三确定子模块,用于基于所述列数据属于不同数据类型的概率,对所述表格型数据进行统计特征挖掘确定所述列数据的统计特征;所述第三确定子模块,用于所述基于所述列数据属于不同数据类型的概率,对所述表格型数据进行可视化特征挖掘确定所述列数据的可视化特征;第二获取子模块,用于获取所述统计特征和所述可视化特征对应的第二权重函数;第四确定子模块,用于根据所述第二权重函数、所述统计特征和所述可视化特征确定所述数据特征挖掘结果。

11、在一可实施方式中,所述聚合模块,包括:第五确定子模块,用于根据所述列数据属于不同数据类型的概率,确定满足预设概率的数据类型;聚合子模块,用于针对满足预设概率的每一类数据类型,通过不同的聚合方式对所述列数据的数据内容进行数据聚合得到对应聚合方式的子聚合结果;第三获取子模块,用于获取不同聚合方式对应的第三权重函数;第六确定子模块,用于基于所述第三权重函数和多个子聚合结果确定所述列数据属于不同数据类型对应的数据聚合结果。

12、根据本公开的第三方面,提供了一种电子设备,包括:

13、至少一个处理器;以及

14、与所述至少一个处理器通信连接的存储器;其中,

15、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。

16、根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。

17、本公开的一种表格型数据可视化的方法、装置、电子设备及存储介质,首先获取表格型数据,该表格型数据的列数据包括数据字段和数据内容,根据数据字段和数据内容确定列数据属于不同数据类型的概率,再根据该概率对表格型数据进行数据特征挖掘得到数据特征挖掘结果,基于列数据属于不同数据类型的概率和数据特征挖掘结果,最后将表格型数据与预设的可视化组件进行匹配,生成表格型数据的可视化图像。应用本方法,通过确定列数据属于不同数据类型的概率、对数据的聚合、对数据特征的挖掘以及与可视化组件的匹配,利用了表格型数据的多维度特征,可以自动生成表格型数据全量的可视化视图,生成的供用户可选的可视化视图的数量更多,可视化效果更好,且不需要针对表格型数据专门设置对应的可视化组件。

18、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种表格型数据可视化的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在确定所述列数据属于不同数据类型的概率之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述数据字段和所述数据内容确定所述列数据属于不同数据类型的概率,包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述表格型数据进行数据特征挖掘得到数据特征挖掘结果,包括:

5.根据权利要求2所述的方法,其特征在于,所述针对所述列数据属于不同数据类型的概率,对所述列数据进行数据聚合,得到所述列数据属于不同数据类型对应的数据聚合结果,包括:

6.一种表格型数据可视化的装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述装置还包括:

8.根据权利要求6所述的装置,其特征在于,所述确定模块,包括:

9.一种电子设备,其特征在于,包括:

10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法。


技术总结
本公开提供了一种表格型数据可视化的方法及装置,所述方法包括:获取表格型数据,所述表格型数据的列数据包括数据字段和数据内容;根据所述数据字段和所述数据内容确定所述列数据属于不同数据类型的概率;根据所述列数据属于不同数据类型的概率,对所述表格型数据进行数据特征挖掘得到数据特征挖掘结果;基于所述列数据属于不同类型的概率和所述数据特征挖掘结果,将所述表格型数据与预设的可视化组件进行匹配,生成所述表格型数据的可视化图像。应用本方法,可以自动生成表格型数据全量的可视化视图,生成的供用户可选的可视化视图的数量更多,可视化效果更好,且不需要针对表格型数据专门设置对应的可视化组件。

技术研发人员:韩东明,贾帅,潘如晟,周昌炬
受保护的技术使用者:浙江同花顺智能科技有限公司
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-13331.html

最新回复(0)