本发明涉及信息技术应用,尤其涉及一种事件脉络生成方法、装置、设备及存储介质。
背景技术:
1、在信息时代的浪潮中,新闻媒体作为公众获取信息的重要窗口,其信息量呈爆炸式增长。然而,如何从这海量的新闻数据中迅速和准确地提取出事件脉络,成为了信息处理领域亟待解决的问题。
2、传统的事件分析方法,受限于人工操作的局限,不仅效率低下,而且容易受到主观因素的影响,难以适应信息时代的快速变化。近年来,随着机器学习和自然语言处理技术的飞速发展,新闻分析方法迎来了新的突破。利用文本挖掘技术提取关键信息,这些方法在一定程度上提高了事件分析的自动化水平。
3、然而,而现有的事件脉络自动化分析方法,在处理多维度的信息、复杂的事件关系和大规模数据集时显得捉襟见肘,且传统的事件脉络分析通常以文字列表的形式呈现结果,无法提供直观且准确的事件脉络信息。
技术实现思路
1、本发明提供了一种事件脉络生成方法、装置、设备及存储介质,以解决事件脉络生成效果较差且不直观的问题。
2、第一方面,本发明提供了一种事件脉络生成方法,包括:
3、获取待梳理事件数据,对所述待梳理事件数据进行聚类,以得到多个聚类簇,其中,所述聚类簇中包含多件待梳理事件的数据;
4、确定所述聚类簇中的关键词信息,并利用所述关键词信息和语义相似度算法确定权重信息,其中,所述关键词信息包括关键词和对应的关键词权重,所述权重信息包括事件特征词权重和事件关联关系权重;
5、利用所述权重信息生成事件子图,并利用所述事件子图输出事件脉络信息,其中,所述事件子图中包括所述事件特征词权重对应的节点和所述事件关联关系权重对应的节点边,所述事件脉络信息至少包括事件脉络树图。
6、第二方面,本发明提供了一种事件脉络生成装置,包括:
7、聚类簇生成模块,用于获取待梳理事件数据,对所述待梳理事件数据进行聚类,以得到多个聚类簇,其中,所述聚类簇中包含多件待梳理事件的数据;
8、权重信息确定模块,用于确定所述聚类簇中的关键词信息,并利用所述关键词信息和语义相似度算法确定权重信息,其中,所述关键词信息包括关键词和对应的关键词权重,所述权重信息包括事件特征词权重和事件关联关系权重;
9、事件脉络信息输出模块,用于利用所述权重信息生成事件子图,并利用所述事件子图输出事件脉络信息,其中,所述事件子图中包括所述事件特征词权重对应的节点和所述事件关联关系权重对应的节点边,所述事件脉络信息至少包括事件脉络树图。
10、第三方面,本发明提供了一种电子设备,该电子设备包括:
11、至少一个处理器;
12、以及与至少一个处理器通信连接的存储器;
13、其中,存储器存储有可被至少一个处理器执行的计算机程序,该计算机程序被至少一个处理器执行,以使至少一个处理器能够执行上述第一方面的事件脉络生成方法。
14、第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现上述第一方面的事件脉络生成方法。
15、本发明提供的事件脉络生成方案,获取待梳理事件数据,对所述待梳理事件数据进行聚类,以得到多个聚类簇,其中,所述聚类簇中包含多件待梳理事件的数据,确定所述聚类簇中的关键词信息,并利用所述关键词信息和语义相似度算法确定权重信息,其中,所述关键词信息包括关键词和对应的关键词权重,所述权重信息包括事件特征词权重和事件关联关系权重,利用所述权重信息生成事件子图,并利用所述事件子图输出事件脉络信息,其中,所述事件子图中包括所述事件特征词权重对应的节点和所述事件关联关系权重对应的节点边,所述事件脉络信息至少包括事件脉络树图。通过采用上述技术方案,对待梳理事件数据进行了准确聚类,并利用聚类簇中的关键词信息和语义相似度算法确定权重信息,以将各事件的关键词信息融入事件特征词权重和事件关联关系权重中,这样不仅增强了关联性分析的科学性,还提高了分析的精确度,准确地判断了新闻之间的关联性,再利用权重信息输出事件脉络树图,即可直观且准确的呈现了事件演化过程。
16、应当理解,本部分所描述的内容并非旨在标识本发明的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
1.一种事件脉络生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在所述对所述待梳理事件数据进行聚类,以得到多个聚类簇之前,包括:
3.根据权利要求2所述的方法,其特征在于,确定所述聚类簇中的关键词信息的方式包括:
4.根据权利要求1所述的方法,其特征在于,所述利用所述关键词信息和语义相似度算法确定权重信息,包括:
5.根据权利要求4所述的方法,其特征在于,所述利用所述相似度权重确定事件关联关系权重,包括:
6.根据权利要求1所述的方法,其特征在于,所述利用所述事件子图输出事件脉络信息,包括:
7.根据权利要求6所述的方法,其特征在于,所述事件脉络信息还包括事件脉络轴图和事件流图;在所述根据所述排序结果中目标子图节点的依赖概率生成事件脉络树图之后,还包括:
8.一种事件脉络生成装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的事件脉络生成方法。
