支持语音交互的问答式数据可视分析方法、系统、终端

专利2023-03-28  102



1.本公开涉及信息检索技术领域,尤其涉及一种支持语音交互的问答式数据可视分析方法、系统、终端。


背景技术:

2.在大数据时代,数据的体量正在呈现爆炸式地增长趋势,数据每时每刻都被产生并存储在计算机介质中。只有通过对数据进行有效的分析,才能挖掘出数据中蕴含的价值和规律,从而更好地指导人们的生产和生活。数据可视化和可视分析作为解构复杂信息的有效手段之一,被誉为是大数据应用分析的“最后一公里”。
3.相关技术中,数据可视化和可视分析门槛高,需要用户掌握数据可视化和可视分析技能,即用户需要经过特定的培训,掌握必要的数据可视化查询语言;其次,交互模型效率低,需要用户在了解数据可视化和可视分析的交互模式后,通过交互地方式不断地重复“探索数据—操作系统/输入查询—分析结果—反馈迭代“的过程;另外,分析结果不精准,需要用户主动进行数据可视化和可视分析操作,不能智能地理解用户的数据可视化和可视分析意图,并且不能主动地根据用户的数据可视化和可视分析意图生成合适的数据可视化和可视分析结果。因此,数据可视化和可视分析的便利性不高。


技术实现要素:

4.本公开提供了一种支持语音交互的问答式数据可视分析方法、系统、终端和存储介质,主要目的在于提高数据可视化和可视分析的便利性。
5.根据本公开的一方面,提供了一种支持语音交互的问答式数据可视分析方法,包括:
6.获取目标查询意图信息;
7.对所述目标查询意图信息进行翻译,得到计算机查询语言信息;
8.生成与所述计算机查询语言信息对应的数据可视分析结果。
9.可选地,在本公开的一个实施例中,所述获取目标查询意图信息,包括:
10.确定数据可视分析数据集,并对所述数据可视分析数据集进行预处理,得到预处理后的数据可视分析数据集;
11.获取针对所述预处理后的数据可视分析数据集输入的查询意图信息;
12.对所述查询意图信息进行预处理,得到所述目标查询意图信息。
13.可选地,在本公开的一个实施例中,所述查询意图信息包括语言查询意图信息和点击查询意图信息,所述获取针对所述预处理后的数据可视分析数据集输入的查询意图信息,包括:
14.利用语音交互技术获取针对所述预处理后的数据可视分析数据集输入的语音查询意图信息;
15.或者,
16.利用计算机显示介质获取针对所述预处理后的数据可视分析数据集输入的点击查询意图信息。
17.可选地,在本公开的一个实施例中,对所述查询意图信息进行预处理的操作包括以下至少一种:
18.序列化;
19.分词;
20.向量化。
21.可选地,在本公开的一个实施例中,所述对所述目标查询意图信息进行翻译,得到计算机查询语言信息,包括:
22.将所述目标查询意图信息输入至编码模型,得到第一特征表示信息;
23.将所述第一特征表示信息输入至解码模型,得到目标字符集合;
24.根据所述目标字符集合,确定所述计算机查询语言信息。
25.可选地,在本公开的一个实施例中,所述将所述目标查询意图信息输入至编码模型,得到第一特征表示信息,包括:
26.将所述目标查询意图信息输入至编码模型,得到第二特征表示信息;
27.利用注意力机制对所述第二特征表示信息进行调整,得到第三特征表示信息;
28.根据所述第三特征表示信息,确定所述第一特征表示信息。
29.可选地,在本公开的一个实施例中,所述将所述第一特征表示信息输入至解码模型,得到目标字符集合,包括:
30.获取数据可视分析领域知识集合;
31.利用所述数据可视分析领域知识集合,指导所述解码模型对所述第一特征表示信息进行解码,得到所述目标字符集合。
32.可选地,在本公开的一个实施例中,在所述生成与所述计算机查询语言信息对应的数据可视分析结果之后,还包括:
33.获取针对所述数据可视分析结果输入的交互指令;
34.根据所述交互指令,利用计算机显示介质对所述数据可视分析结果进行展示。
35.根据本公开的另一方面,提供了一种支持语音交互的问答式数据可视分析系统,包括:
36.用户语音输入模块,用于获取目标查询意图信息;
37.用户语音查询理解与翻译模块,用于对所述目标查询意图信息进行翻译,得到计算机查询语言信息;
38.可视化智能生成模块,用于生成与所述计算机查询语言信息对应的数据可视分析结果。
39.可选地,在本公开的一个实施例中,所述用户语音输入模块包括数据集处理子模块、信息获取子模块和信息处理子模块,所述用户语音输入模块用于获取目标查询意图信息时:
40.所述数据集处理子模块,用于确定数据可视分析数据集,并对所述数据可视分析数据集进行预处理,得到预处理后的数据可视分析数据集;
41.所述信息获取子模块,用于获取针对所述预处理后的数据可视分析数据集输入的
查询意图信息;
42.所述信息处理子模块,用于对所述查询意图信息进行预处理,得到所述目标查询意图信息。
43.可选地,在本公开的一个实施例中,所述查询意图信息包括语言查询意图信息和点击查询意图信息,所述信息获取子模块,用于获取针对所述预处理后的数据可视分析数据集输入的查询意图信息时,具体用于:
44.利用语音交互技术获取针对所述预处理后的数据可视分析数据集输入的语音查询意图信息;
45.或者,
46.利用计算机显示介质获取针对所述预处理后的数据可视分析数据集输入的点击查询意图信息。
47.可选地,在本公开的一个实施例中,所述信息处理子模块,用于对所述查询意图信息进行预处理时,对所述查询意图信息进行预处理的操作包括以下至少一种:
48.序列化;
49.分词;
50.向量化。
51.可选地,在本公开的一个实施例中,所述用户语音查询理解与翻译模块包括信息编码子模块、信息解码子模块和信息确定子模块,所述用户语音查询理解与翻译模块用于对所述目标查询意图信息进行翻译,得到计算机查询语言信息时:
52.所述信息编码子模块,用于将所述目标查询意图信息输入至编码模型,得到第一特征表示信息;
53.所述信息解码子模块,用于将所述第一特征表示信息输入至解码模型,得到目标字符集合;
54.所述信息确定子模块,用于根据所述目标字符集合,确定所述计算机查询语言信息。
55.可选地,在本公开的一个实施例中,所述信息编码子模块,用于将所述目标查询意图信息输入至编码模型,得到第一特征表示信息时,具体用于:
56.将所述目标查询意图信息输入至编码模型,得到第二特征表示信息;
57.利用注意力机制对所述第二特征表示信息进行调整,得到第三特征表示信息;
58.根据所述第三特征表示信息,确定所述第一特征表示信息。
59.可选地,在本公开的一个实施例中,所述信息解码子模块,用于将所述第一特征表示信息输入至解码模型,得到目标字符集合时,具体用于:
60.获取数据可视分析领域知识集合;
61.利用所述数据可视分析领域知识集合,指导所述解码模型对所述第一特征表示信息进行解码,得到所述目标字符集合。
62.可选地,在本公开的一个实施例中,所述系统还包括指令获取模块和结果展示模块,用于在所述生成与所述计算机查询语言信息对应的数据可视分析结果之后:
63.所述指令获取模块,用于获取针对所述数据可视分析结果输入的交互指令;
64.所述结果展示模块,用于根据所述交互指令,利用计算机显示介质对所述数据可
视分析结果进行展示。
65.根据本公开的另一方面,提出了一种终端,包括:
66.至少一个处理器;以及
67.与所述至少一个处理器通信连接的存储器;其中,
68.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述一方面中任一项所述的方法。
69.根据本公开的另一方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行前述一方面中任一项所述的方法。
70.根据本公开的另一方面,提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现前述一方面中任一项所述的方法。
71.在本公开一个或多个实施例中,通过获取目标查询意图信息;对目标查询意图信息进行翻译,得到计算机查询语言信息;生成与计算机查询语言信息对应的数据可视分析结果。因此,通过将目标查询意图信息翻译为计算机查询语言信息,可以无需使用户掌握必要的数据可视化查询语言,可以降低数据可视化和可视分析的门槛。同时,通过生成与计算机查询语言信息对应的数据可视分析结果并反馈给用户,可以提高可视分析工作流的人机交互效率。另外,通过主动根据用户的数据可视化和可视分析意图获取目标查询意图信息,可以准确理解用户意图,从而可以提高数据可视分析结果获取的效率和准确性,进而可以提高数据可视化和可视分析的便利性。
72.本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
73.本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
74.图1示出本公开实施例提供的第一种支持语音交互的问答式数据可视分析方法的流程示意图;
75.图2示出本公开实施例提供的第二种支持语音交互的问答式数据可视分析方法的流程示意图;
76.图3示出本公开实施例提供的第一种支持语音交互的问答式数据可视分析系统的结构示意图;
77.图4示出本公开实施例提供的第二种支持语音交互的问答式数据可视分析系统的结构示意图;
78.图5示出本公开实施例提供的第三种支持语音交互的问答式数据可视分析系统的结构示意图;
79.图6示出本公开实施例提供的第四种支持语音交互的问答式数据可视分析系统的结构示意图;
80.图7是用来实现本技术实施例的支持语音交互的问答式数据可视分析方法的终端的框图。
具体实施方式
81.下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能理解为对本公开的限制。相反,本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
82.下面结合具体的实施例对本技术进行详细说明。
83.在第一个实施例中,如图1所示,图1示出本公开实施例提供的第一种支持语音交互的问答式数据可视分析方法的流程示意图,该方法可依赖于计算机程序实现,可运行于进行支持语音交互的问答式数据可视分析的装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。
84.其中,支持语音交互的问答式数据可视分析装置可以是具有支持语音交互的问答式数据可视分析功能的终端,该终端包括但不限于:可穿戴设备、手持设备、个人电脑、平板电脑、车载设备、智能手机、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中终端可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,pda)、第五代移动通信技术(5th generation mobile communication technology,5g)网络、第四代移动通信技术(the 4th generation mobile communication technology,4g)网络、第三代移动通信技术(3rd-generation,3g)网络或未来演进网络中的终端等。
85.具体的,该支持语音交互的问答式数据可视分析方法包括:
86.s101,获取目标查询意图信息;
87.根据一些实施例,目标查询意图信息指的是终端进行数据可视分析时接收到的信息。该目标查询意图信息并不特指某一固定信息。例如,当输入目标查询意图信息的用户发生变化时,该目标查询意图信息可以发生变化。当目标查询意图信息的内容发生变化时,该目标查询意图信息也可以发生变化。
88.易于理解的是,当终端进行支持语音交互的问答式数据可视分析时,终端可以获取目标查询意图信息。
89.s102,对目标查询意图信息进行翻译,得到计算机查询语言信息;
90.根据一些实施例,计算机查询语言信息指的是终端可以理解并处理的查询语音形成的信息。该计算机查询语言信息并不特指某一固定信息。例如,当目标查询意图信息发生变化时,该计算机查询语言信息可以发生变化。当计算机查询语言发生变化时,该计算机查询语言信息也可以发生变化。
91.易于理解的是,当终端获取目标查询意图信息时,终端可以对该目标查询意图信息进行翻译,得到计算机查询语言信息。
92.s103,生成与计算机查询语言信息对应的数据可视分析结果。
93.根据一些实施例,数据可视分析结果指的是终端根据计算机查询语言信息生成的数据可视化和可视分析结果。该数据可视分析结果并不特指某一固定结果。例如,当计算机查询语言信息发生变化时,该数据可视分析结果可以发生变化。当目标查询意图信息发生
变化时,该数据可视分析结果也可以发生变化。
94.易于理解的是,当终端得到计算机查询语言信息时,终端可以生成与该计算机查询语言信息对应的数据可视分析结果。
95.综上,本公开实施例提出的方法,通过获取目标查询意图信息;对目标查询意图信息进行翻译,得到计算机查询语言信息;生成与计算机查询语言信息对应的数据可视分析结果。因此,通过将目标查询意图信息翻译为计算机查询语言信息,可以无需使用户掌握必要的数据可视化查询语言,可以降低数据可视化和可视分析的门槛。同时,通过生成与计算机查询语言信息对应的数据可视分析结果并反馈给用户,可以提高可视分析工作流的人机交互效率。另外,通过主动根据用户的数据可视化和可视分析意图获取目标查询意图信息,可以准确理解用户意图,从而可以提高数据可视分析结果获取的效率和准确性,进而可以提高数据可视化和可视分析的便利性。
96.请参见图2,图2示出本公开实施例提供的第二种支持语音交互的问答式数据可视分析方法的流程示意图。
97.具体的,该支持语音交互的问答式数据可视分析方法包括:
98.s201,确定数据可视分析数据集,并对数据可视分析数据集进行预处理,得到预处理后的数据可视分析数据集;
99.根据一些实施例,数据可视分析数据集指的是终端进行数据可视分析时,获取到的用户指定用于数据可视分析的数据集。该数据可视分析数据集并不特指某一固定数据集。例如,当用户发生变化时,该数据可视分析数据集可以发生变化。当数据可视分析数据集的内容发生变化时,该数据可视分析数据集也可以发生变化。
100.在一些实施例中,当终端确定数据可视分析数据集时,终端可以将该数据可视分析数据集按照预定的数据格式和标准进行自动预处理和数据转换操作,得到预处理后的数据可视分析数据集,并进行存储。
101.在一些实施例中,终端可以利用计算机显示介质对存储的预处理后的数据可视分析数据集进行展示,以支持用户浏览和过滤该预处理后的数据可视分析数据集,以及支持用户进行其它必要的与系统交互的操作,例如,选择、转换和过滤等操作,对数据集进行查询。
102.易于理解的是,当终端进行支持语音交互的问答式数据可视分析时,终端可以确定数据可视分析数据集,并对该数据可视分析数据集进行预处理,得到预处理后的数据可视分析数据集。
103.s202,获取针对预处理后的数据可视分析数据集输入的查询意图信息;
104.根据一些实施例,查询意图信息指的是终端进行数据可视分析时用户输入的信息。该查询意图信息包括但不限于语言查询意图信息和点击查询意图信息等等。该查询意图信息并不特指某一固定信息。例如,当用户发生变化时,该查询意图信息可以发生变化。当查询意图信息的内容发生变化时,该查询意图信息也可以发生变化。
105.根据一些实施例,终端获取针对预处理后的数据可视分析数据集输入的查询意图信息时,获取查询意图信息的方式包括但不限于语音获取、点击获取等等。因此,可以提高数据可视化和可视分析的便利性。
106.在一些实施例中,当终端通过语音获取的方式获取查询意图信息时,终端可以利
用语音交互技术获取针对预处理后的数据可视分析数据集输入的语音查询意图信息。
107.在一些实施例中,语音交互技术指的是通过自然语音或机器合成语音同终端进行交互的技术。例如,当终端确定预处理后的数据可视分析数据集为航班数据集时,当终端检测到用户说出“展示航班延误情况”,终端可以利用语音交互技术获取到针对该航班数据集输入的语音查询意图信息。
108.在一些实施例中,当终端通过点击获取的方式获取查询意图信息时,终端可以利用计算机显示介质获取针对预处理后的数据可视分析数据集输入的点击查询意图信息。
109.例如,终端可以在计算机显示介质中展示与预处理后的数据可视分析数据集对应的可视化图表模板。进而,当终端检测到用户点击该可视化图表模板中的选择框时,终端可以获取针对预处理后的数据可视分析数据集输入的点击查询意图信息。
110.易于理解的是,当终端得到预处理后的数据可视分析数据集时,终端可以获取针对该预处理后的数据可视分析数据集输入的查询意图信息。
111.s203,对查询意图信息进行预处理,得到目标查询意图信息;
112.根据一些实施例,终端对查询意图信息进行预处理时,对查询意图信息进行预处理的操作包括但不限于序列化、分词、向量化等。
113.在一些实施例中,序列化指的是将用户指定的数据可视分析数据集的关键信息、用户语音查询和其它额外操作序列(例如用户指定的可视化图表模板)转化成一个序列。分词指的是将序列化后得到的序列通过某种策略切分成一系词(token)。
114.例如,当终端获取到用户输入的查询意图信息s、预处理后的数据可视分析数据集d和其它额外操作序列c时,终端可以将查询意图信息s序列化为序列ts={s1,s2,...,sj},将预处理后的数据可视分析数据集d序列化为序列td={d1,d2,...,dk},将其它额外操作序列c序列化为序列tc={c1,c2,...,ci}。进而,终端可以将这三个序列拼接为序列}。进而,终端可以将这三个序列拼接为序列即ta={x1,x2,...,xm},为一个长度m的向量。
115.在一些实施例中,当对语音查询意图信息进行向量化时,终端可以对序列ta中的每一个词进行嵌入(embedding)。具体的,该嵌入方式包括但不限于词嵌入(token embedding)、类型嵌入(type embedding)和位置嵌入(position embedding)等等。
116.在一些实施例中,当终端对序列t中的每一个词进行词嵌入、类型嵌入和位置嵌入时,终端可以对词嵌入进行对位相加,以得到目标嵌入向量也就是说,用户输入的查询意图信息s、预处理后的数据可视分析数据集d和其它额外操作序列c,最终会被处理为目标嵌入向量(目标查询意图信息)x=[x1,x2,...,xm]。
[0117]
易于理解的是,当终端获取到针对预处理后的数据可视分析数据集输入的查询意图信息时,终端可以对该查询意图信息进行预处理,得到目标查询意图信息。
[0118]
s204,将目标查询意图信息输入至编码模型,得到第一特征表示信息;
[0119]
根据一些实施例,编码模型指的是用于通过编码方案将人类可读的数据转换成机器存储数据(0、1数据形式),即将字符流转换为字节流的模型。该编码模型并不特指某一固定模型。例如,当编码方案发生变化时,该编码模型可以发生变化。该编码模型可以为编码器。
[0120]
在一些实施例中,第一特征表示信息终端利用编码模型对目标查询意图信息进行
编码后得到的信息。该第一特征表示信息并不特指某一固定信息。例如,当目标查询意图信息发生变化时,该第一特征表示信息可以发生变化。当编码模型发生变化时,该第一特征表示信息也可以发生变化。
[0121]
根据一些实施例,当终端将目标查询意图信息输入至编码模型,得到第一特征表示信息时,终端可以首先将目标查询意图信息输入至编码模型,得到第二特征表示信息。接着,利用注意力机制对第二特征表示信息进行调整,得到第三特征表示信息。最后,根据第三特征表示信息,确定第一特征表示信息。因此,可以显著的提高编码模型的学习效果和表达能力,进而,可以提高第一特征表示信息获取的准确性。
[0122]
在一些实施例中,当终端利用注意力机制对第二特征表示信息进行调整时,可以根据用户输入的各个部分的注意力权重,对第二特征表示信息进行调整,具体可以采用下式对第二特征表示信息进行调整:
[0123][0124]
其中,q,k,v分别是编码模型在计算注意力attention过程中的中间矩阵。e是本公开实施例提出的强制特殊注意力矩阵,用于当终端对目标查询意图信息进行翻译时,调整翻译过程中的查询语法之间的关系。t是第二特征表示信息。
[0125]
易于理解的是,当终端获取到目标查询意图信息时,终端可以将目标查询意图信息输入至编码模型,得到第一特征表示信息。
[0126]
s205,将第一特征表示信息输入至解码模型,得到目标字符集合;
[0127]
根据一些实施例,解码模型指的终端对第一特征表示信息进行解码时采用的模型。该解码模型并不特指某一固定模型。例如,当终端获取到针对解码模型的模型修改指令时,该解码模型可以发生变化。该解码模型例如可以为解码器。
[0128]
在一些实施例中,目标字符指的是可以被终端理解并进行处理的查询语言对应的字符。目标字符集合指的是由至少一个目标字符汇聚而成的集合。该目标字符集合并不特指某一固定集合。例如,当目标字符发生变化时,该目标字符集合可以发生变化。当第一特征表示信息发生变化时,该目标字符集合也可以发生变化。
[0129]
根据一些实施例,当终端将第一特征表示信息输入至解码模型,得到目标字符集合时,终端可以获取数据可视分析领域知识集合。接着,终端可以利用该数据可视分析领域知识集合,指导解码模型对第一特征表示信息进行解码,得到目标字符集合。因此,通过引入数据可视化和可视分析感知的解码工作策略,即引入数据可视化和可视分析的领域知识,可以指导解码模型更好地生成终端能理解并处理的、符合用户查询意图、符合可视化原则的可视化查询语言,可以提高解码质量。
[0130]
易于理解的是,当终端获取到第一特征表示信息时,终端可以将该第一特征表示信息输入至解码模型,得到目标字符集合。
[0131]
s206,根据目标字符集合,确定计算机查询语言信息;
[0132]
根据一些实施例,解码模型和编码模型可以位于同一个语音查询理解与翻译模型中。该语音查询理解与翻译模型并不特指某一固定模型。例如,该语音查询理解与翻译模型可以为改进的transformer模型。
[0133]
在一些实施例中,终端还可以利用基准数据集,对该语音查询理解与翻译模型进
行训练,控制该语音查询理解与翻译模型学习如何理解用户的语音查询意图。并基于此,将目标查询意图信息自动地翻译成终端可以处理的查询语言。因此,可以提高计算机查询语言信息获取的准确性。
[0134]
易于理解的是,当终端获取到目标字符集合时,终端可以根据该目标字符集合,确定计算机查询语言信息。
[0135]
s207,生成与计算机查询语言信息对应的数据可视分析结果;
[0136]
易于理解的是,当终端获取到计算机查询语言信息时,终端可以自动创建与计算机查询语言信息对应的数据可视分析结果,并将该数据可视分析结果通过计算机显示介质渲染呈现给用户。
[0137]
s208,获取针对数据可视分析结果输入的交互指令;
[0138]
根据一些实施例,交互指令指的是用户对数据可视分析结果进行交互操作时,发送给终端的指令。该交互指令并不特指某一固定指令。该交互指令包括但不限于缩放指令、下钻指令、上钻指令、区域选择指令、多图联动指令等等。
[0139]
易于理解的是,当终端通过计算机显示介质渲染呈现数据可视分析结果给用户时,用户可以基于该数据可视化结果,进行数据分析工作,即用户可以观察数据可视化结果,并对其进行数据的可视化分析,得出数据洞察。同时,用户还可以与该数据可视化结果进行交互,以令终端获取针对该数据可视分析结果输入的交互指令。因此可以方便用户探索数据可视分析结果,可以提高数据可视化和可视分析的便利性。
[0140]
s209,根据交互指令,利用计算机显示介质对数据可视分析结果进行展示。
[0141]
易于理解的是,当终端获取到针对数据可视分析结果输入的交互指令时,终端可以根据交互指令对应的展示方式,利用计算机显示介质对数据可视分析结果进行展示。
[0142]
综上,本公开实施例提出的方法,首先,确定数据可视分析数据集,并对数据可视分析数据集进行预处理,得到预处理后的数据可视分析数据集;获取针对预处理后的数据可视分析数据集输入的查询意图信息;对查询意图信息进行预处理,得到目标查询意图信息;因此可以通过语音交互的方式获取目标查询意图信息,可以支持用户以语音输入的方式输入查询意图信息,可以提高数据可视化和可视分析的便利性,同时,通过主动根据用户的数据可视化和可视分析意图获取目标查询意图信息,可以准确理解用户意图,从而可以提高数据可视分析结果获取的效率和准确性。其次,通过将目标查询意图信息输入至编码模型,得到第一特征表示信息;将第一特征表示信息输入至解码模型,得到目标字符集合;根据目标字符集合,确定计算机查询语言信息;生成与计算机查询语言信息对应的数据可视分析结果;因此,通过将目标查询意图信息翻译为计算机查询语言信息,可以无需使用户掌握必要的数据可视化查询语言,可以降低数据可视化和可视分析的门槛,可以提高数据可视化和可视分析的便利性。最后,通过获取针对数据可视分析结果输入的交互指令;根据交互指令,利用计算机显示介质对数据可视分析结果进行展示;因此通过生成与计算机查询语言信息对应的数据可视分析结果并反馈给用户,可以提高可视分析工作流的人机交互效率,提高数据可视化和可视分析的便利性。
[0143]
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0144]
下述为本公开系统实施例,可以用于执行本公开方法实施例。对于本公开系统实
施例中未披露的细节,请参照本公开方法实施例。
[0145]
请参见图3,其示出本公开实施例提供的第一种支持语音交互的问答式数据可视分析系统的结构示意图。该支持语音交互的问答式数据可视分析系统可以通过软件、硬件或者两者的结合实现成为系统的全部或一部分。该支持语音交互的问答式数据可视分析系统300包括用户语音输入模块301、用户语音查询理解与翻译模块302和可视化智能生成模块303,其中:
[0146]
用户语音输入模块301,用于获取目标查询意图信息;
[0147]
用户语音查询理解与翻译模块302,用于对目标查询意图信息进行翻译,得到计算机查询语言信息;
[0148]
可视化智能生成模块303,用于生成与计算机查询语言信息对应的数据可视分析结果。
[0149]
在本公开实施例中,图4示出本公开实施例提供的第二种支持语音交互的问答式数据可视分析系统的结构示意图。如图4所示,用户语音输入模块301包括数据集处理子模块311、信息获取子模块321和信息处理子模块331,用户语音输入模块301用于获取目标查询意图信息时:
[0150]
数据集处理子模块311,用于确定数据可视分析数据集,并对数据可视分析数据集进行预处理,得到预处理后的数据可视分析数据集;
[0151]
信息获取子模块321,用于获取针对预处理后的数据可视分析数据集输入的查询意图信息;
[0152]
信息处理子模块331,用于对查询意图信息进行预处理,得到目标查询意图信息。
[0153]
在本公开实施例中,查询意图信息包括语言查询意图信息和点击查询意图信息,信息获取子模块321,用于获取针对预处理后的数据可视分析数据集输入的查询意图信息时,具体用于:
[0154]
利用语音交互技术获取针对预处理后的数据可视分析数据集输入的语音查询意图信息;
[0155]
或者,
[0156]
利用计算机显示介质获取针对预处理后的数据可视分析数据集输入的点击查询意图信息。
[0157]
在本公开实施例中,信息处理子模块331,用于对查询意图信息进行预处理时,对查询意图信息进行预处理的操作包括以下至少一种:
[0158]
序列化;
[0159]
分词;
[0160]
向量化。
[0161]
在本公开实施例中,图5示出本公开实施例提供的第三种支持语音交互的问答式数据可视分析系统的结构示意图。如图5所示,用户语音查询理解与翻译模块302包括信息编码子模块312、信息解码子模块322和信息确定子模块332,用户语音查询理解与翻译模块302用于对目标查询意图信息进行翻译,得到计算机查询语言信息时:
[0162]
信息编码子模块312,用于将目标查询意图信息输入至编码模型,得到第一特征表示信息;
[0163]
信息解码子模块322,用于将第一特征表示信息输入至解码模型,得到目标字符集合;
[0164]
信息确定子模块332,用于根据目标字符集合,确定计算机查询语言信息。
[0165]
在本公开实施例中,信息编码子模块312,用于将目标查询意图信息输入至编码模型,得到第一特征表示信息时,具体用于:
[0166]
将目标查询意图信息输入至编码模型,得到第二特征表示信息;
[0167]
利用注意力机制对第二特征表示信息进行调整,得到第三特征表示信息;
[0168]
根据第三特征表示信息,确定第一特征表示信息。
[0169]
在本公开实施例中,信息解码子模块322,用于将第一特征表示信息输入至解码模型,得到目标字符集合时,具体用于:
[0170]
获取数据可视分析领域知识集合;
[0171]
利用数据可视分析领域知识集合,指导解码模型对第一特征表示信息进行解码,得到目标字符集合。
[0172]
在本公开实施例中,图6示出本公开实施例提供的第四种支持语音交互的问答式数据可视分析系统的结构示意图。如图6所示,系统300还包括指令获取模块304和结果展示模块305,用于在生成与计算机查询语言信息对应的数据可视分析结果之后:
[0173]
指令获取模块304,用于获取针对数据可视分析结果输入的交互指令;
[0174]
结果展示模块305,用于根据交互指令,利用计算机显示介质对数据可视分析结果进行展示。
[0175]
需要说明的是,上述实施例提供的支持语音交互的问答式数据可视分析系统在执行支持语音交互的问答式数据可视分析方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的支持语音交互的问答式数据可视分析系统与支持语音交互的问答式数据可视分析方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
[0176]
上述本公开实施例序号仅仅为了描述,不代表实施例的优劣。
[0177]
综上,本公开实施例提出的系统,通过用户语音输入模块获取目标查询意图信息;用户语音查询理解与翻译模块对目标查询意图信息进行翻译,得到计算机查询语言信息;可视化智能生成模块生成与计算机查询语言信息对应的数据可视分析结果。因此,通过将目标查询意图信息翻译为计算机查询语言信息,可以无需使用户掌握必要的数据可视化查询语言,可以降低数据可视化和可视分析的门槛。同时,通过生成与计算机查询语言信息对应的数据可视分析结果并反馈给用户,可以提高可视分析工作流的人机交互效率。另外,通过主动根据用户的数据可视化和可视分析意图获取目标查询意图信息,可以准确理解用户意图,从而可以提高数据可视分析结果获取的效率和准确性,进而可以提高数据可视化和可视分析的便利性。
[0178]
本公开的技术方案中,所涉及的用户个人信息的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
[0179]
图7示出了可以用来实施本公开的实施例的示例终端700的示意性框图。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的
和/或者要求的本公开的实现。
[0180]
如图7所示,终端700包括计算单元701,其可以根据存储在只读存储器(rom)702中的计算机程序或者从存储单元708加载到随机访问存储器(ram)703中的计算机程序,来执行各种适当的动作和处理。在ram 703中,还可存储终端700操作所需的各种程序和数据。计算单元701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
[0181]
终端700中的多个部件连接至i/o接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许终端700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0182]
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如支持语音交互的问答式数据可视分析方法。例如,在一些实施例中,支持语音交互的问答式数据可视分析方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由rom 702和/或通信单元709而被载入和/或安装到终端700上。当计算机程序加载到ram 703并由计算单元701执行时,可以执行上文描述的支持语音交互的问答式数据可视分析方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行支持语音交互的问答式数据可视分析方法。
[0183]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0184]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或终端上执行。
[0185]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计
算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0186]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0187]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据终端)、或者包括中间件部件的计算系统(例如,应用终端)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、互联网和区块链网络。
[0188]
计算机系统可以包括客户机和终端。客户机和终端一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户机-终端关系的计算机程序来产生客户机和终端的关系。终端可以是云终端,又称为云计算终端或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtual private server",或简称"vps")中,存在的管理难度大,业务扩展性弱的缺陷。终端也可以为分布式系统的终端,或者是结合了区块链的终端。
[0189]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0190]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

技术特征:
1.一种支持语音交互的问答式数据可视分析方法,其特征在于,包括:获取目标查询意图信息;对所述目标查询意图信息进行翻译,得到计算机查询语言信息;生成与所述计算机查询语言信息对应的数据可视分析结果。2.如权利要求1的方法,其特征在于,所述获取目标查询意图信息,包括:确定数据可视分析数据集,并对所述数据可视分析数据集进行预处理,得到预处理后的数据可视分析数据集;获取针对所述预处理后的数据可视分析数据集输入的查询意图信息;对所述查询意图信息进行预处理,得到所述目标查询意图信息。3.如权利要求2的方法,其特征在于,所述查询意图信息包括语言查询意图信息和点击查询意图信息,所述获取针对所述预处理后的数据可视分析数据集输入的查询意图信息,包括:利用语音交互技术获取针对所述预处理后的数据可视分析数据集输入的语音查询意图信息;或者,利用计算机显示介质获取针对所述预处理后的数据可视分析数据集输入的点击查询意图信息。4.如权利要求2的方法,其特征在于,对所述查询意图信息进行预处理的操作包括以下至少一种:序列化;分词;向量化。5.如权利要求1方法,其特征在于,所述对所述目标查询意图信息进行翻译,得到计算机查询语言信息,包括:将所述目标查询意图信息输入至编码模型,得到第一特征表示信息;将所述第一特征表示信息输入至解码模型,得到目标字符集合;根据所述目标字符集合,确定所述计算机查询语言信息。6.如权利要求5的方法,其特征在于,所述将所述目标查询意图信息输入至编码模型,得到第一特征表示信息,包括:将所述目标查询意图信息输入至编码模型,得到第二特征表示信息;利用注意力机制对所述第二特征表示信息进行调整,得到第三特征表示信息;根据所述第三特征表示信息,确定所述第一特征表示信息。7.如权利要求5的方法,其特征在于,所述将所述第一特征表示信息输入至解码模型,得到目标字符集合,包括:获取数据可视分析领域知识集合;利用所述数据可视分析领域知识集合,指导所述解码模型对所述第一特征表示信息进行解码,得到所述目标字符集合。8.如权利要求1的方法,其特征在于,在所述生成与所述计算机查询语言信息对应的数据可视分析结果之后,还包括:
获取针对所述数据可视分析结果输入的交互指令;根据所述交互指令,利用计算机显示介质对所述数据可视分析结果进行展示。9.一种支持语音交互的问答式数据可视分析系统,其特征在于,包括:用户语音输入模块,用于获取目标查询意图信息;用户语音查询理解与翻译模块,用于对所述目标查询意图信息进行翻译,得到计算机查询语言信息;可视化智能生成模块,用于生成与所述计算机查询语言信息对应的数据可视分析结果。10.一种终端,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行权利要求1-8中任一项的方法。

技术总结
本公开涉及信息检索技术领域,尤其涉及一种支持语音交互的问答式数据可视分析方法、系统、终端。其中,该支持语音交互的问答式数据可视分析方法包括:获取目标查询意图信息;对目标查询意图信息进行翻译,得到计算机查询语言信息;生成与计算机查询语言信息对应的数据可视分析结果。采用上述方案的本公开可以提高数据可视化和可视分析的便利性。据可视化和可视分析的便利性。据可视化和可视分析的便利性。


技术研发人员:李国良 骆昱宇
受保护的技术使用者:清华大学
技术研发日:2022.07.25
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-2077.html

最新回复(0)