1.本发明涉及一种政务服务平台移动端的智能化搜索方法以及基于该搜索方法实现的搜索引擎系统,属于互联网技术领域。
背景技术:2.随着“互联网+”政务服务、数字政府等工作的深入推进,各级政府网站信息内容的快速增加与用户个性化需求之间的矛盾日益凸显。在这些途径中,始终避不开的一个问题就是搜索。与商业领域中搜索引擎日渐个性化、智能化相比,政府平台中的搜索功能普遍存在“搜不到、搜不全、搜不准、体验差”等问题,严重影响了政府平台甚至服务型政府建设的满意度。使用搜索引擎进行信息的查询是人们主动获取信息的重要手段。一般情况下,用户在搜索界面输入想要查询的内容,通过搜索引擎找到相关的信息,然后展示给用户,再由用户逐条翻阅,寻找需要的信息。
3.然而,目前这种搜索的方式还存在以下几个不足:
4.(1)在宽泛的范围和海量的内容中进行搜索会降低搜索的效率,增加用户等待的时间。而且将搜索结果直接呈现给用户时,常常是无用的信息非常多,需要用户花费一定时间去甄别,造成用户体验差、搜索精度低等问题。
5.(2)对于不同的用户,每个人的需求和情况是存在差异的。针对同一个词,一般的搜素引擎的搜索结果是相同的,这样的搜索不具有个性化,缺乏针对性。
6.(3)用户的搜索意图和搜索词可能不是匹配的,存在表达不清晰,甚至表达错误的情况,这会对搜索引擎造成误导,最后呈现的搜索结果也会让用户不满意。
7.(4)当用户的搜索意图非常明确时,搜索结果列表页中不会直接展示对应内容,用户需点击进入详情页后才可获取对应信息,没有做到“结果返回”中的智能化。
技术实现要素:8.本发明的目的是:使搜索引擎在政务服务移动端中实现“搜索门户化”、“搜索型门户”、“个性化搜索”、“情境化搜索”、“多媒体检索”等。
9.为了达到上述目的,本发明的一个技术方案是提供了一种政务服务移动端的智能化搜索方法,其特征在于,包括以下步骤:
10.步骤1:整合所有待搜索内容,将所有待搜索内容依据具体信息内容进行分类后划分为不同模块,每个模块对应同一类别的待搜索内容;
11.步骤2:获取用户输入的搜索词以及用户资料库;
12.步骤3:对用户输入的搜索词进行分词处理后获得搜索词分词,再进一步由搜索词分词衍生出与其相关的分词作为与当前搜索词分词相对应的衍生分词;
13.步骤4:将步骤3获得的搜索词分词以及衍生分词同步输入步骤1得到的各个模块中,在不同模块中进行并行搜索;
14.利用用户信息对各模块输出的搜索结果进行过滤,过滤掉不符合要求的搜索结
果,获得最终搜索结果;
15.在标准词库中查找与搜索词分词以及衍生分词相似的标准词,将标准词库反馈的标准词作为纠错词;若纠错词与搜索词分词一致,则不需要进行纠错,进入步骤5;若纠错词与搜索词分词不一致,将纠错词反馈给用户,由用户选择是否基于纠错词再次进行搜索,若用户选择基于纠错词再次进行搜索,则将纠错词作为搜索词分词后,重新执行步骤4获得新的最终搜索结果,否则,进入步骤5;
16.步骤5:将最终搜索结果与输出该最终搜索结果的模块相互捆绑;
17.步骤6:对于通过步骤5获得的与模块绑定的最终搜索结果,进行基于模块的排序以及模块内排序,并对最终搜索结果进行标记,其中:
18.进行基于模块的排序时,获得与当前用户相对应的各个模块的模块喜好权重,通过模块喜好权重表示用户对各个模块的感兴趣程度,基于模块喜好权重对步骤5获得的各个模块进行排序,进而实现对各个模块所对应的最终搜索结果的排序;
19.进行模块内排序时,对与同一个模块绑定的所有最终搜索结果进行排序;
20.对最终搜索结果进行标记时,在最终搜索结果上标记对应的显著性标签;
21.步骤7:将排序和标记后的最终搜索结果返回给用户。
22.优选地,步骤1中,所述用户资料包括用户唯一标识以及定位信息。
23.优选地,步骤3中,对信息资源进行重构后构建知识图谱,在知识图谱中,将各口语分词以及标准词分词作为节点,建立口语分词节点与标准词分词节点之间的关联关系;对用户输入的搜索词进行分词处理后,利用知识图谱获取其中的口语分词所对应的标准词,将标准词作为搜索词分词。
24.优选地,步骤6中,模块喜好权重通过带权离散函数计算得到,带权离散函数表示为:其中;ki表示第i个模块的模块内容的权重,动态变化,若当前用户查看或使用第i个模块的模块内容的频率越高,则ki越大,函数可表示为:其中xi为用户对于第i个模块的点击次数;ti表示第i个模块的时间衰减系数,若用户长时间没有使用第i个模块和其模块内容,说明用户对第i个模块的关注度在降低,时间衰减系数ti随着时间的流逝而降低,反之,时间衰减系数ti随着时间的流逝而增加。
25.优选地,步骤6中,基于用户收藏或预览过的内容获得所述显著性标签。
26.本发明的另一个技术方案是提供了一种基于上述的政务服务移动端的智能化搜索方法的搜索引擎系统,其特征在于,包括:
27.接收模块,用于接收搜索词和用户资料;接收模块将搜索词发送给分析模块;
28.分析模块,用于对搜索词进行分析,获得搜索词分词和衍生分词;
29.并行搜索模块,用于将搜索词分词和衍生分词同步输入多个模块进行并行搜索,获得搜索内容以及与搜索内容绑定的模块,绑定时,将搜索内容按模块进行存放,进入排序模块;
30.纠错模块,根据对搜索词分词和衍生分词的分析在标准词库中查询与搜索词相似度高的标准词作为纠错词;纠错模块调用排序模块,对所有纠错词进行排序后获得与搜索词相似度高的标准词;
31.排序模块,用于根据用户信息,依据模块对搜索内容进行排序,并对与同一模块绑定的不同搜索内容进行模块内排序,为排序后的搜索内容打上显著性标签;排序模块还用于对纠错模块获得的纠错词按照与搜索词的相似度从高到低进行排序;
32.发送模块,用于将排序后具有显著性标签的搜索内容发送给用户。
33.本发明通过结合用户兴趣、需求模型和动态场景,建立知识图谱,提高搜索的效率,提升用户逐条查阅的效率,并满足用户个性化的需求,极好地提升用户的搜索体验,提升服务型政府建设的满意度。
附图说明
34.图1是根据本发明一个实施例的搜索方法的流程图;
35.图2是根据本发明一个实施例的搜索引擎的结构示意图。
具体实施方式
36.下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本技术所附权利要求书所限定的范围。
37.在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
38.下面结合附图描述根据本发明实施例的搜索方法和搜索引擎。
39.图1是根据本发明一个实施例的搜索方法的流程图。如图1所示,根据本发明一个实施例的搜索方法包括以下步骤:
40.步骤s101:搜索引擎接收客户端发送的搜索请求。搜索请求包括了用户输入的搜索词以及用户资料。用户资料进一步包括了用户唯一标识以及定位信息。
41.在本发明的一个实施例中,客户端包括但不限于手机app以及小程序。搜索引擎具有搜索功能,可以借助已有的搜索引擎功能实现。搜索词是用户在客户端的搜索框中所输入的内容。用户资料包括但不限于用户唯一标识以及定位信息。用户唯一标识是用户注册时所使用的唯一身份标识。定位信息是通过客户端获取的用户当前所处位置的经纬度。根据搜索场景不同,用户资料可以进行拓展,但需要注意,所有与用户隐私相关的用户资料都需要在用户授权下使用。
42.步骤s102:对用户的搜索词进行分词分析的同时衍生出多种分词,从而获得搜索词分词以及对搜索词相对应的衍生分词,建立知识图谱。
43.在本发明的一个实施例中,对搜索词的分词分析包括但不限于文本短语分词、拼音分词、同义词分词、拼音首字母分词、停用词过滤。如“公积金贷款”,可以用文本短语分词为“公积金”和“贷款”,也可以用拼音分词为“gongjijindaikuan”,也可以用拼音首字母分词为“gjjdk”。又如“开心”可以用同义词分词为“快乐”等。又如口头语中的“领结婚证”,对应为政务服务事项中的“婚姻登记”及相关资源。从这些分词方式也可以看出,本发明实施例的搜索支持中文搜索、拼音搜索、拼音首字母搜索、同义词搜索等。
44.在本发明的一个实施例中,对信息资源进行重构后构建知识图谱,强大的知识图谱是实现政务搜索功能的关键。因为用户的表法方式可能是不准确的,通常是比较通俗的口语,例如:口语的“领结婚证”,对应为政务服务事项中的标准词“婚姻登记”及相关资源;口语中的“上户口”和“落户口”等,对应为政务服务事项标准词中的“户口初始登记”、“户口迁移”等及其相关资源。在知识图谱中,将各口语分词以及标准词分词作为节点,建立口语分词节点与标准词分词节点之间的关联关系,从而基于搜索词分词中的口语分词获得对应的标准词。
45.对搜索词库建立知识图谱。
46.步骤s103:根据搜索词分词和衍生分词按模块并行搜索,并使用用户资料对搜索结果进行过滤。
47.在本发明的一个实施例中,将待搜索内容进行分类后划分为不同模块,每个模块对应同一类别的待搜索内容。本发明对搜索内容进行模块化区分,区分以后信息将会大大减少。在本发明的一个实施例中,对于政务平台而言,可以依据不同的政务功能对待搜索内容进行分类后划分为不同的模块,则不同模块对应不同政务功能类别的待搜索内容,例如,可以将政务平台所能提供的不同政务功能按照模块分为“服务”模块、“办事”模块、“资讯”模块、“设施”模块以及“互动”模块等。每个模块对应的一个单独的索引,将数据分模块和索引存储。将步骤s102获得的搜索词分词和衍生分词并行地放入各个模块中,对这些模块进行并行搜索,提高搜索效率。例如,对于搜索词分词“公积金”,在“服务”模块中可以查询到“公积金查询”服务,在“办事”模块可以查询到“办理公积金异地转移”的事项,在“资讯”模块中可以查询到“公积金”相关的新闻,在“设施”模块中可以查询到“公积金网点”的位置,在“互动”模块中可以查询到“公积金”相关的问答。
48.随后,通过用户唯一标识,从用户信息中获取用户资料。根据用户资料,可以进一步对搜索结果过滤,过滤掉不符合要求的内容,获得最终的搜索结果。将最终的搜索结果与获得该搜索结果的模块相互捆绑。例如对于在“设施”模块中可以查询到“公积金网点”的位置,可以通过用户的定位信息,过滤掉所有“公积金网点”的位置中与当前用户距离较远的位置。
49.在这些模块中,有一个特殊的模块,定义为标准词库模块,专门用于对用户的搜索词进行纠错,纠错时,通过与搜索词对应的搜索词分词和衍生分词可以查到最相似的标准词,如“公基金”的衍生分词中有“gongjijin”,通过这个衍生分词可以找到标准词库中的“公积金”,而且两者在中文上仅一字之差,十分相似,这就是一种谐音纠错的方法。如果标准词库模块返回的纠错词与搜索词一致,则不需要进行纠错,进入步骤s104。如果不一致,则将纠错词反馈给用户,由用户选择是否基于纠错词再次进行搜索,还是依旧采用搜索词进行搜索,若用户选择基于纠错词再次进行搜索,则基于纠错词则再次进行搜索。
50.步骤s104:对于通过步骤s103获得的与模块绑定的最终搜索结果,在模块及模块内容上对最终搜索结果进行个性化排序,并标记内容。
51.在本发明的一个实施例中,通过用户唯一标识,从用户资料库中获取当前用户的各个模块的模块喜好权重。每个用户对各个模块的感兴趣程度是不一样的,这可以表现在用户平时搜索后对各个模块的点击频率,在本发明的一个实施例中,通过模块喜好权重表示用户对各个模块的感兴趣程度。在本发明的一个实施例中,模块喜好权重通过带权离散
函数计算得到,带权离散函数表示为:其中:ki表示第i个模块的模块内容的权重,动态变化,若当前用户查看或使用第i个模块的模块内容的频率越高,则ki越大,函数可表示为:其中xi为用户对于第i个模块的点击次数,模块中包含具有相似功能或者内容的服务和资讯,例如三金账单模块,其中包含着公积金查询,医疗保险查询,养老金查询等等子集服务;ti表示第i个模块的时间衰减系数,若用户长时间没有使用第i个模块和其模块内容,说明用户对第i个模块的关注度在降低,时间衰减系数ti随着时间的流逝而降低,反之,时间衰减系数ti随着时间的流逝而增加。
52.客户端在用户允许的情况下收集相关信息,基于带权离散函数统计后转化为模块喜好权重,存储到用户资料库。当对模块进行排序时,通过用户唯一标识查询当前用户对每个模块的模块喜好权重,从而对通过步骤s103获得的最终搜索结果所绑定的模块进行排序,进而实现对最终搜索结果的排序。排序后的模块方便用户快速找到感兴趣的内容,解决了用户在所有混杂的内容中逐条选择的问题。
53.在本发明的一个实施例中,还进行模块内容排序,模块内容排序指的是对与同一个模块绑定的所有最终搜索结果进行排序。例如对于与“设施”模块绑定的所有最终搜索结果,可以根据用户的定位信息以及与搜索词的相关性,对所搜索到的所有位置进行排序。其他没有利用到用户资料的内容,按照与搜索词的相关性进行排序。
54.除了排序,在本发明的一个实施例中,本步骤还将完成内容标记。为了更好的用户体验,用户资料库中会记录用户收藏或预览过的内容,通过这些内容获得对应的显著性标签后,在最终搜索结果上标记对应的显著性标签,通过这些显著性标签便于用户快速找到或滤过信息。
55.步骤105:将排序和标记后的最终搜索结果返回给客户端。
56.在本发明的一个实施例中,通过客户端的展示界面,将排序以及标记后的最终搜索结果提供至用户。
57.本发明实施例的搜索方法,通过对内容的模块化、模块化排序、对内容的显著性标记、使用个性化的用户资料、对搜索词的纠错等方式,提高了搜索效率和精准度,满足了用户对个性化、多样性的需求,提升了用户的搜索体验。
58.为了实现上述实施例,本发明还提出了一种搜索引擎。图2是根据本发明一个实施例的搜索引擎的结构示意图。如图2所示,根据本发明一个实施例的搜索引擎210,包括接收模块211、分析模块212、并行搜索模块213、纠错模块214、排序模块215和发送模块216。接下来对这些模块进行详细介绍:
59.在本发明的一个实施例中,接收模块211用于接收搜索词和用户资料。用户资料包括但不限于用户唯一标识、用户身份信息等。接收模块211将搜索词发送给分析模块212。
60.在本发明的一个实施例中,分析模块212用于对搜索词进行分析,获得搜索词分词和衍生分词。分析模块212所采用的分析方法包括但不限于文本短语分词、拼音分词、同义词分词、拼音首字母分词、停用词过滤。
61.在本发明的一个实施例中,并行搜索模块213用于将搜索词分词和衍生分词同步输入多个模块进行并行搜索,获得搜索内容以及与搜索内容绑定的模块,绑定时,将搜索内容按模块进行存放,进入排序模块215。
62.在本发明的一个实施例中,纠错模块214根据对搜索词分词和衍生分词的分析在标准词库240中查询与搜索词相似度最高的标准词作为纠错词。纠错模块214调用排序模块215,对所有纠错词进行排序后获得与搜索词相似度最高的标准词。
63.在本发明的一个实施例中,排序模块215根据用户资料库,依据模块对搜索内容进行排序,并对与同一模块绑定的不同搜索内容进行模块内排序,为排序后的搜索内容打上显著性标签。排序模块215还用于对纠错模块214获得的纠错词按照与搜索词的相似度从高到低进行排序。
64.在本发明的一个实施例中,发送模块216将排序后具有显著性标签的搜索内容发送给客户端220。
65.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
66.尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
技术特征:1.一种政务服务移动端的智能化搜索方法,其特征在于,包括以下步骤:步骤1:整合所有待搜索内容,将所有待搜索内容依据具体信息内容进行分类后划分为不同模块,每个模块对应同一类别的待搜索内容;步骤2:获取用户输入的搜索词以及用户资料库;步骤3:对用户输入的搜索词进行分词处理后获得搜索词分词,再进一步由搜索词分词衍生出与其相关的分词作为与当前搜索词分词相对应的衍生分词;步骤4:将步骤3获得的搜索词分词以及衍生分词同步输入步骤1得到的各个模块中,在不同模块中进行并行搜索;利用用户信息对各模块输出的搜索结果进行过滤,过滤掉不符合要求的搜索结果,获得最终搜索结果;在标准词库中查找与搜索词分词以及衍生分词相似的标准词,将标准词库反馈的标准词作为纠错词;若纠错词与搜索词分词一致,则不需要进行纠错,进入步骤5;若纠错词与搜索词分词不一致,将纠错词反馈给用户,由用户选择是否基于纠错词再次进行搜索,若用户选择基于纠错词再次进行搜索,则将纠错词作为搜索词分词后,重新执行步骤4获得新的最终搜索结果,否则,进入步骤5;步骤5:将最终搜索结果与输出该最终搜索结果的模块相互捆绑;步骤6:对于通过步骤5获得的与模块绑定的最终搜索结果,进行基于模块的排序以及模块内排序,并对最终搜索结果进行标记,其中:进行基于模块的排序时,获得与当前用户相对应的各个模块的模块喜好权重,通过模块喜好权重表示用户对各个模块的感兴趣程度,基于模块喜好权重对步骤5获得的各个模块进行排序,进而实现对各个模块所对应的最终搜索结果的排序;进行模块内排序时,对与同一个模块绑定的所有最终搜索结果进行排序;对最终搜索结果进行标记时,在最终搜索结果上标记对应的显著性标签;步骤7:将排序和标记后的最终搜索结果返回给用户。2.如权利要求1所述的一种政务服务移动端的智能化搜索方法,其特征在于,步骤1中,所述用户信息包括用户唯一标识以及定位信息。3.如权利要求1所述的一种政务服务移动端的智能化搜索方法,其特征在于,步骤3中,对信息资源进行重构后构建知识图谱,在知识图谱中,将各口语分词以及标准词分词作为节点,建立口语分词节点与标准词分词节点之间的关联关系;对用户输入的搜索词进行分词处理后,利用知识图谱获取其中的口语分词所对应的标准词,将标准词作为搜索词分词。4.如权利要求1所述的一种政务服务移动端的智能化搜索方法,其特征在于,步骤6中,模块喜好权重通过带权离散函数计算得到,带权离散函数表示为:其中;k
i
表示第i个模块的模块内容的权重,动态变化,若当前用户查看或使用第i个模块的模块内容的频率越高,则k
i
越大,函数可表示为:其中x
i
为用户对于第i个模块的点击次数,模块中包含具有相似功能或者内容的服务和资讯,例如三金账单模块,其中包含着公积金查询,医疗保险查询,养老金查询等等子集服务;t
i
表示第i个模块的时间衰减系数,若用户长时间没有使用第i个模块和其模块内容,说明用户对第i个模块的关注度在降低,时间衰减系数t
i
随着时间的流逝而降低,反之,时间衰减系数t
i
随着时间
的流逝而增加。5.如权利要求1所述的一种政务服务移动端的智能化搜索方法,其特征在于,步骤6中,基于用户收藏或预览过的内容获得所述显著性标签。6.一种基于权利要求1所述的政务服务移动端的智能化搜索方法的搜索引擎,其特征在于,包括:接收模块,用于接收搜索词和用户资料;接收模块将搜索词发送给分析模块;分析模块,用于对搜索词进行分析,获得搜索词分词和衍生分词;并行搜索模块,用于将搜索词分词和衍生分词同步输入多个模块进行并行搜索,获得搜索内容以及与搜索内容绑定的模块,绑定时,将搜索内容按模块进行存放,进入排序模块;纠错模块,根据对搜索词分词和衍生分词的分析在标准词库中查询与搜索词相似度高的标准词作为纠错词;纠错模块调用排序模块,对所有纠错词进行排序后获得与搜索词相似度高的标准词;排序模块,用于根据用户资料库,依据模块对搜索内容进行排序,并对与同一模块绑定的不同搜索内容进行模块内排序,为排序后的搜索内容打上显著性标签;排序模块还用于对纠错模块获得的纠错词按照与搜索词的相似度从高到低进行排序;发送模块,用于将排序后具有显著性标签的搜索内容发送给用户。
技术总结本发明的一个技术方案是提供了一种政务服务移动端的智能化搜索方法。本发明的另一个技术方案是提供了一种基于上述的政务服务移动端的智能化搜索方法的搜索引擎系统,其特征在于,包括接收模块;分析模块;并行搜索模块;纠错模块;排序模块;发送模块。本发明通过结合用户兴趣、需求模型和动态场景,建立知识图谱,提高搜索的效率,提升用户逐条查阅的效率,并满足用户个性化的需求,极好地提升用户的搜索体验,提升服务型政府建设的满意度。提升服务型政府建设的满意度。提升服务型政府建设的满意度。
技术研发人员:姚建平 吴敬伟 伍梦霞 王兆进 吴健
受保护的技术使用者:万达信息股份有限公司
技术研发日:2022.07.01
技术公布日:2022/11/1