一种全流程画像处理方法、系统、装置及存储介质与流程

专利2024-04-06  103



1.本技术涉及画像处理技术领域,尤其是一种全流程画像处理方法、系统、装置及存储介质。


背景技术:

2.随着人工智能、大数据领域的悄然兴起,围绕画像技术的相关研究也相继展开,并逐步成为众多学者关注的热点。近年来,随着检察信息化建设的深入推进,将画像知识应用于检察领域成为顺应发展的必然工作。
3.目前检察业务数据具有碎片化、分面低质、多源异构的特征,不能有效地发现和解决执法活动中遇到的问题,导致目前的检察画像处理技术无法有针对性地对检察业务提供完整清晰的画像服务,使得检察业务数据资源得不到充分利用,即目前检察业务的历史数据知识无法为检察办案提供帮助,可能会降低检察办案的效率以及降低案件分配的合理性。


技术实现要素:

4.本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
5.为此,本发明实施例的一个目的在于提供一种全流程画像处理方法、系统、装置及存储介质,以充分利用业务系统的原始数据提高检查办案的效率以及案件分配的合理性。
6.为了达到上述技术目的,本发明实施例所采取的技术方案包括:
7.第一方面,本发明实施例提供了一种全流程画像处理方法,所述片上网络包括多个路由节点,所述方法包括以下步骤:
8.获取业务系统中的原始数据,所述原始数据包括结构化数据和非结构化数据;
9.对所述原始数据进行预处理,获取事实数据信息;
10.根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成初步画像的绘制,所述初步画像包括案件初步画像以及检察官初步画像;
11.根据所述初步画像,采用预测算法和隐形知识化外技术得到预测标签;
12.根据所述预测标签进行分案和风险排查。
13.本发明实施例的一种全流程画像处理方法,通过获取业务系统中多维度的原始数据,并在预处理后得到事实数据信息,进而绘制案件初步画像和检察官初步画像,实现了对于业务数据的针对性的画像服务;并在初步画像的基础上采用预测算法和隐形知识化外技术进一步得到预测标签,从而利用预测标签实现了精准的分案和风险排查,实现了充分利用业务系统的原始数据来提高检查办案的效率以及案件分配的合理性。
14.另外,根据本发明上述实施例的一种全流程画像处理方法,还可以具有以下附加的技术特征:
15.进一步地,本发明实施例的一种全流程画像处理方法中,所述预处理包括数据清洗和文本挖掘;
16.所述对所述原始数据进行预处理,获取事实数据信息,包括:
17.对所述原始数据进行数据清洗;
18.采用分类和聚类算法对数据清洗后的所述原始数据进行文本挖掘,获取所述事实数据信息。
19.进一步地,在本发明的一个实施例中,所述根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成所述案件初步画像的绘制,包括:
20.对所述事实数据信息进行拆解分析,获取第一案件标签,所述第一案件标签包括案件信息、特定人员信息和预测信息;
21.根据所述第一案件标签绘制所述案件初步画像。
22.进一步地,在本发明的一个实施例中,所述根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成所述检察官初步画像的绘制,包括:
23.对所述事实数据信息进行拆解分析,获取第一检察官标签,所述第一检察官标签包括检察官基本信息、检察官办案信息和检察官辅助工具信息;
24.根据所述第一检察官标签绘制所述检察官初步画像。
25.进一步地,在本发明的一个实施例中,所述根据所述初步画像,采用预测算法和隐形知识化外技术得到预测标签,包括:
26.对所述初步画像进行特征提取,得到细粒度特征信息;
27.根据所述细粒度特征信息,采用预测算法和隐形知识化外技术得到预测标签。
28.进一步地,在本发明的一个实施例中,所述对所述初步画像进行特征提取,得到细粒度特征信息,包括:
29.采用共性特征提取技术对所述初步画像进行特征提取,得到粗粒度特征信息;
30.采用特征差异性分析技术对所述粗粒度特征信息进行去重和消歧,得到所述细粒度特征信息。
31.进一步地,在本发明的一个实施例中,所述预测标签包括第二案件标签和第二检察官标签,所述第二案件标签包括案件属性、特定人员属性和案件预测,所述第二检察官标签包括检察官属性、检察官办案能力和检察官辅助需求;
32.所述根据所述细粒度特征信息,采用预测算法和隐形知识化外技术得到预测标签,包括:
33.根据所述细粒度特征信息,采用预测算法和隐形知识化外技术将所述第一案件标签转化为所述第二案件标签;
34.根据所述细粒度特征信息,采用预测算法和隐形知识化外技术将所述第一检察官标签转化为所述第二检察官标签。
35.第二方面,本发明实施例提出了一种全流程画像处理系统,包括:
36.原始数据获取模块,用于获取业务系统中的原始数据,所述原始数据包括结构化数据和非结构化数据;
37.事实数据信息获取模块,用于对所述原始数据进行预处理,获取事实数据信息;
38.初步画像绘制模块,用于根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成初步画像的绘制,所述初步画像包括案件初步画像以及检察官初步画像;
39.预测标签生成模块,用于根据所述初步画像,采用预测算法和隐形知识化外技术
得到预测标签;
40.预测模块,用于根据所述预测标签进行分案和风险排查。
41.第三方面,本发明实施例提供了一种全流程画像处理装置,包括:
42.至少一个处理器;
43.至少一个存储器,用于存储至少一个程序;
44.当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现第一方面所述的一种全流程画像处理方法。
45.第四方面,本发明实施例提供了一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于实现第一方面所述的一种全流程画像处理方法。
46.本发明的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到:
47.本发明实施例通过获取业务系统中多维度的原始数据,并在预处理后得到事实数据信息,进而绘制案件初步画像和检察官初步画像,实现了对于业务数据的针对性的画像服务;并在初步画像的基础上采用预测算法和隐形知识化外技术进一步得到预测标签,从而利用预测标签实现了精准的分案和风险排查,实现了充分利用业务系统的原始数据来提高检查办案的效率以及案件分配的合理性。
附图说明
48.为了更清楚地说明本技术实施例或者现有技术中的技术方案,下面对本技术实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本技术的技术方案中的部分实施例,对于本领域的技术人员来说,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
49.图1为本发明一种全流程画像处理方法具体实施例的流程示意图;
50.图2为本发明一种全流程画像处理方法具体实施例的第一案件标签和第二案件标签示意图;
51.图3为本发明一种全流程画像处理方法具体实施例的第一检察官标签和第二检察官标签示意图;
52.图4为本发明一种全流程画像处理系统具体实施例的结构示意图;
53.图5为本发明一种全流程画像处理系统具体实施例的架构示意图;
54.图6为本发明一种全流程画像处理装置具体实施例的结构示意图。
具体实施方式
55.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能理解为对本技术的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
56.本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第
四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
57.在本发明中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
58.本发明提出了一种全流程画像处理方法和系统。本发明通过获取业务系统中多维度的原始数据,并在预处理后得到事实数据信息,进而绘制案件初步画像和检察官初步画像,实现了对于业务数据的针对性的画像服务;并在初步画像的基础上采用预测算法和隐形知识化外技术进一步得到预测标签,从而利用预测标签实现了精准的分案和风险排查,实现了充分利用业务系统的原始数据来提高检查办案的效率以及案件分配的合理性。
59.下面参照附图详细描述根据本发明实施例提出的一种全流程画像处理方法和系统,首先将参照附图描述根据本发明实施例提出的一种全流程画像处理方法。
60.参照图1,本发明实施例中提供一种全流程画像处理方法,本发明实施例中的一种全流程画像处理方法,可应用于终端中,也可应用于服务器中,还可以是运行于终端或服务器中的软件等。终端可以是平板电脑、笔记本电脑、台式计算机等,但并不局限于此。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。本发明实施例中的一种全流程画像处理方法主要包括以下步骤:
61.s101、获取业务系统中的原始数据;
62.其中,所述原始数据包括结构化数据和非结构化数据。
63.可以理解的是,全国检察机关通过统一业务应用系统(即所述业务系统)办理案件,通过互联网平台发布程序性信息、重要案件信息、公开法律文书,已形成庞大的信息数据,将国内外在画像领域所做的研究工作延伸到当前检察信息化工作中,与检察机关统一业务系统深度融合,将对辅助检察官办案起到明显的促进作用。
64.具体地,在本发明的实施例中,通过与统一业务应用系统、案件评查系统、队伍管理系统以及考勤系统等业务系统的实时对接,将分散在不同业务系统中的检察官办案程序性信息、实体性信息、卷宗材料、案件评查信息统一对接,无需人工导入和干预,不同数据资源紧密融合,实现了不同应用系统的整合,多维度展示检察官履职效能。
65.本发明实施例的结构化数据为案卡的结构化数据,非结构化数据为文书和卷宗的非结构化数据。
66.s102、对所述原始数据进行预处理,获取事实数据信息;
67.其中,所述预处理包括数据清洗和文本挖掘。
68.s102可以进一步划分为以下步骤s1021-s1022:
69.步骤s1021、对所述原始数据进行数据清洗;
70.具体地,对原始数据进行etl数据清洗,得到数据清洗后的原始数据。
71.步骤s1022、采用分类和聚类算法对数据清洗后的所述原始数据进行文本挖掘,获取所述事实数据信息。
72.具体地,通过对数据清洗后的所述原始数据进行文本挖掘,并根据分类算法对信息不全的案件信息进行预测,从而对案件和检察官进行预测分类,根据聚类算法分析挖掘储具有相同特征的群体进行受众细分,进而从原始数据中提取事实数据信息,包括特定人员属性信息、被害人属性信息和案件办理属性信息,本发明对此不作限定。
73.s103、根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成初步画像的绘制;
74.其中,所述初步画像包括案件初步画像以及检察官初步画像。
75.具体地,包括以下两个方面的初步画像绘制:
76.(1)根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成所述案件初步画像的绘制;
77.(2)根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成所述检察官初步画像的绘制。
78.参照图2,对于(1)中案件初步画像的绘制,本发明实施例中具体包括以下步骤:
79.a.对所述事实数据信息进行拆解分析,获取第一案件标签;
80.其中,所述第一案件标签包括案件信息、特定人员信息和预测信息。
81.具体地,在本发明的一个实施例中,案件信息包括案件名、受理时间、承办人信息、当事人信息等案件相关的信息,特定人员信息包括特定人员名称、性别、住所、年龄等,预测信息包括案件复杂度和案件风险等信息。
82.b.根据所述第一案件标签绘制所述案件初步画像。
83.参照图3,对于(2)中检察官初步画像的绘制,本发明实施例中具体包括以下步骤:
84.a.对所述事实数据信息进行拆解分析,获取第一检察官标签;
85.其中,所述第一检察官标签包括检察官基本信息、检察官办案信息和检察官辅助工具信息,每个第一检察官标签代表一种属性。
86.具体地,在本发明的一个实施例中,检察官基本信息包括检察官的性别、年龄、学历和单位等基本信息,检察官办案信息包括办案时长、案件类型、办案案由、办案数量、文书审批通过率、节点停留时间和节点退回频率,检察官辅助工具信息包括案卡回填使用量、类案推送使用量和知识库访问量。
87.c.根据所述第一检察官标签绘制所述检察官初步画像。
88.s104、根据所述初步画像,采用预测算法和隐形知识化外技术得到预测标签;
89.具体地,在本发明的实施例中,基于检察业务规则,从办案数量、办案质量、办案效率、办案效果四个维度,通过研究特征颗粒度分析、多属性简约算法技术、特征递进挖掘模型,分类汇总检察官个人发展信息指标,构建了科学完备的画像指标体系。在办案数量指标设置上,充分考虑案件之间的差异性,创新设计案件权重系数管理,兼顾常规案件、特殊案件类型,支持案件权重系数的机器自动测算和人工灵活设定,实现办案数量的合理评估。为确保指标数据提取的客观性和实时性,重点攻坚全流程画像系统与统一业务系统、案件质量评查系统、考勤系统和队伍管理等五大主要应用系统的数据并行接轨,实现考核指标与业务数据的智能抓取和实时衔接。同时,在画像系统内预留数据接口,更好的解决五个应用
系统升级改版后的业务管理数据引流问题。通过优化算法分析模型,该系统能自动抽取并形成全院、部门、个人三个层面的可视化检察业务和队伍成分数据图谱,为业务决策和队伍管理等提供全面科学的数据支撑。
90.s104可以进一步划分为以下步骤s1041-s1042:
91.步骤s1041、对所述初步画像进行特征提取,得到细粒度特征信息;
92.具体地,在本发明的实施例中,先采用共性特征提取技术对所述初步画像进行特征提取,得到粗粒度特征信息,再采用特征差异性分析技术对所述粗粒度特征信息进行去重和消歧,得到所述细粒度特征信息。
93.步骤s1042、根据所述细粒度特征信息,采用预测算法和隐形知识化外技术得到预测标签。
94.其中,所述预测标签包括第二案件标签和第二检察官标签,所述第二案件标签包括案件属性、特定人员属性和案件预测,所述第二检察官标签包括检察官属性、检察官办案能力和检察官辅助需求。
95.在本发明的实施例中,利用数据视角相对宏观和中观的优势,实现从“个案向类案、局部向整体、现象向本质”的深入分析,既能从数据层面捕捉检察业务的规律,又能通过对数据偏离、异常的监测,下钻、反查发现个案或检察官的办案问题以及监督线索,服务微观层面的具体办案。优质的数据融合可以开拓传统检察办案视野,提升类型化问题的发现和监管水平,创造出新的检察知识,进而转化为业务动能。在分析数据时,根据不同业务特点、分析重点、关联图谱、融合数据更有针对性地总结规律,找准发力点,切实助力“四大检察”全面协调充分发展。主要包括知识建模、关联图谱构建、图挖掘知识计算、关联图谱可视化展示等功能。
96.具体地,参照图2和图3,预测标签的生成包括以下两个方面:
97.根据所述细粒度特征信息,采用预测算法和隐形知识化外技术将所述第一案件标签转化为所述第二案件标签;
98.根据所述细粒度特征信息,采用预测算法和隐形知识化外技术将所述第一检察官标签转化为所述第二检察官标签。
99.其中,根据案件信息采用预测算法和隐形知识化外技术得到案件属性,根据特定人员信息采用预测算法和隐形知识化外技术得到特定人员属性,根据预测信息采用预测算法和隐形知识化外技术得到案件预测;根据检察官基本信息采用预测算法和隐形知识化外技术得到检察官属性,根据检察官办案信息采用预测算法和隐形知识化外技术得到检察官办案能力,根据检察官辅助工具信息采用预测算法和隐形知识化外技术得到检察官辅助需求。
100.s105、根据所述预测标签进行分案和风险排查。
101.具体地,首先根据预测标签对待分配的案件进行预测,得到预测结果,所述预测结果包括案件复杂度预测、办案时长预测和检察官办案能力预测,本发明对此不作限定;根据所述预测结果进行分案和风险排查。
102.根据步骤s101-s105所述可知,本发明实施例的一种全流程画像处理方法,通过获取业务系统中多维度的原始数据,并在预处理后得到事实数据信息,进而绘制案件初步画像和检察官初步画像,实现了对于业务数据的针对性的画像服务;并在初步画像的基础上
采用预测算法和隐形知识化外技术进一步得到预测标签,从而利用预测标签实现了精准的分案和风险排查,实现了充分利用业务系统的原始数据来提高检查办案的效率以及案件分配的合理性。
103.其次,参照附图描述根据本技术实施例提出的一种全流程画像处理系统。
104.图4是本技术一个实施例的一种全流程画像处理系统结构示意图。
105.所述系统具体包括:
106.原始数据获取模块401,用于获取业务系统中的原始数据,所述原始数据包括结构化数据和非结构化数据;
107.事实数据信息获取模块402,用于对所述原始数据进行预处理,获取事实数据信息;
108.初步画像绘制模块403,用于根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成初步画像的绘制,所述初步画像包括案件初步画像以及检察官初步画像;
109.预测标签生成模块404,用于根据所述初步画像,采用预测算法和隐形知识化外技术得到预测标签;
110.预测模块405,用于根据所述预测标签进行分案和风险排查。
111.图5为本发明实施例的一种全流程画像处理系统的架构示意图。本发明实施例的一种全流程画像处理系统基于检察官数据、案卡数据、业务系统数据、检察官及案件分析评估等数据,通过图挖掘深度学习、关联图谱、特征递进挖掘、特征粒度分析、多属性约简算法等模型训练以及研究人案结合的全流程画像构建方法,实现检察官、案件等多维度全流程的画像刻画,展示案件过程和检察官业务办理流程的全流程跟踪,并对案件全流程跟踪的结果加以技术评价。
112.可见,上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
113.参照图6,本技术实施例提供了一种全流程画像处理装置,包括:
114.至少一个处理器601;
115.至少一个存储器602,用于存储至少一个程序;
116.当所述至少一个程序被所述至少一个处理器601执行时,使得所述至少一个处理器601 实现步骤s101-s105所述的一种全流程画像处理方法。
117.同理,上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
118.在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本技术的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
119.此外,虽然在功能性模块的背景下描述了本技术,但应当理解的是,除非另有相反说明,功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本技术是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本技术。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本技术的范围,本技术的范围由所附权利要求书及其等同方案的全部范围来决定。
120.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干程序用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器 (ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
121.在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行程序的定序列表,可以具体实现在任何计算机可读介质中,以供程序执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从程序执行系统、装置或设备取程序并执行程序的系统)使用,或结合这些程序执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供程序执行系统、装置或设备或结合这些程序执行系统、装置或设备而使用的装置。
122.计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器 (rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
123.应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的程序执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
124.在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或
者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
125.尽管已经示出和描述了本技术的实施方式,本领域的普通技术人员可以理解:在不脱离本技术的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本技术的范围由权利要求及其等同物限定。
126.以上是对本技术的较佳实施进行了具体说明,但本技术并不限于所述实施例,熟悉本领域的技术人员在不违背本技术精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本技术权利要求所限定的范围内。

技术特征:
1.一种全流程画像处理方法,其特征在于,包括以下步骤:获取业务系统中的原始数据,所述原始数据包括结构化数据和非结构化数据;对所述原始数据进行预处理,获取事实数据信息;根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成初步画像的绘制,所述初步画像包括案件初步画像以及检察官初步画像;根据所述初步画像,采用预测算法和隐形知识化外技术得到预测标签;根据所述预测标签进行分案和风险排查。2.根据权利要求1所述的一种全流程画像处理方法,其特征在于,所述预处理包括数据清洗和文本挖掘;所述对所述原始数据进行预处理,获取事实数据信息,包括:对所述原始数据进行数据清洗;采用分类和聚类算法对数据清洗后的所述原始数据进行文本挖掘,获取所述事实数据信息。3.根据权利要求1所述的一种全流程画像处理方法,其特征在于,所述根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成所述案件初步画像的绘制,包括:对所述事实数据信息进行拆解分析,获取第一案件标签,所述第一案件标签包括案件信息、特定人员信息和预测信息;根据所述第一案件标签绘制所述案件初步画像。4.根据权利要求3所述的一种全流程画像处理方法,其特征在于,所述根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成所述检察官初步画像的绘制,包括:对所述事实数据信息进行拆解分析,获取第一检察官标签,所述第一检察官标签包括检察官基本信息、检察官办案信息和检察官辅助工具信息;根据所述第一检察官标签绘制所述检察官初步画像。5.根据权利要求4所述的一种全流程画像处理方法,其特征在于,所述根据所述初步画像,采用预测算法和隐形知识化外技术得到预测标签,包括:对所述初步画像进行特征提取,得到细粒度特征信息;根据所述细粒度特征信息,采用预测算法和隐形知识化外技术得到预测标签。6.根据权利要求5所述的一种全流程画像处理方法,其特征在于,所述对所述初步画像进行特征提取,得到细粒度特征信息,包括:采用共性特征提取技术对所述初步画像进行特征提取,得到粗粒度特征信息;采用特征差异性分析技术对所述粗粒度特征信息进行去重和消歧,得到所述细粒度特征信息。7.根据权利要求1所述的一种全流程画像处理方法,其特征在于,所述预测标签包括第二案件标签和第二检察官标签,所述第二案件标签包括案件属性、特定人员属性和案件预测,所述第二检察官标签包括检察官属性、检察官办案能力和检察官辅助需求;所述根据所述细粒度特征信息,采用预测算法和隐形知识化外技术得到预测标签,包括:根据所述细粒度特征信息,采用预测算法和隐形知识化外技术将所述第一案件标签转
化为所述第二案件标签;根据所述细粒度特征信息,采用预测算法和隐形知识化外技术将所述第一检察官标签转化为所述第二检察官标签。8.一种全流程画像处理系统,其特征在于,包括:原始数据获取模块,用于获取业务系统中的原始数据,所述原始数据包括结构化数据和非结构化数据;事实数据信息获取模块,用于对所述原始数据进行预处理,获取事实数据信息;初步画像绘制模块,用于根据所述事实数据信息,采用机器学习的方法进行标签建模与标识,完成初步画像的绘制,所述初步画像包括案件初步画像以及检察官初步画像;预测标签生成模块,用于根据所述初步画像,采用预测算法和隐形知识化外技术得到预测标签;预测模块,用于根据所述预测标签进行分案和风险排查。9.一种全流程画像处理装置,其特征在于,包括:至少一个处理器;至少一个存储器,用于存储至少一个程序;当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-7中任一项所述的一种全流程画像处理方法。10.一种存储介质,其中存储有处理器可执行的程序,其特征在于:所述处理器可执行的程序在由处理器执行时用于实现如权利要求1-7中任一项所述的一种全流程画像处理方法。

技术总结
本发明公开了一种全流程画像处理方法、系统、装置及存储介质。全流程画像处理方法通过获取业务系统中多维度的原始数据,并在预处理后得到事实数据信息,进而绘制案件初步画像和检察官初步画像,实现了对于业务数据的针对性的画像服务;并在初步画像的基础上采用预测算法和隐形知识化外技术进一步得到预测标签,从而利用预测标签实现了精准的分案和风险排查,实现了充分利用业务系统的原始数据来提高检查办案的效率以及案件分配的合理性。本发明可以广泛应用于画像处理技术领域。以广泛应用于画像处理技术领域。以广泛应用于画像处理技术领域。


技术研发人员:范丽艳 马海银 李岩川 盛慧 陈宝龙
受保护的技术使用者:北明软件有限公司
技术研发日:2022.05.13
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-7598.html

最新回复(0)