一种基于语义的大数据分析系统的制作方法

专利2024-08-07  48



1.本发明涉及大数据网络技术领域,具体为一种基于语义的大数据分析系 统。


背景技术:

2.随着互联网普及率的提高,电子商务产业和中小型商业产业均提供了线 上服务,利用语言处理应用技术给予用户客户提供相应的服务需要。信息资 源是企业最重要的资源之一,开发信息资源是企业信息化的出发点,又是企 业信息化的“归宿”。
3.大数据对中小型文化产业的内容创意、产品创作、营销传播、延伸服务 和终端制造等价值链环节都具有重要影响,它既可为文化企业带来直接盈利, 也可通过正反馈为企业创造难以模仿的竞争优势。大数据使文化产品的生产 和体验价值的创造日益走向社会化和大众化,使文化业态创新和业务模式创 新日益走向常态化和多样化,使企业对市场需求的理解洞察日益走向实时化 和精准化,使文化企业整个运作日益走向协作化和生态化。
4.现有的中小型企业大多还是封闭式管理,各方面产业链经营处于自我隐 私保护的状态,虽然中小型企业渐渐也在开启线上为主、虚实结合的商业模 式,但是在实行过程中、由于各个企业比较封闭保护商业隐私的同时,和无 法聚焦线上商业大数据渠道分析,因此也失去了跨界融合,对外合作进步的 机会,因此,为我们需要提出一种基于语义的大数据分析系统。


技术实现要素:

5.本发明提供了一种基于语义的大数据分析系统,具备数据的分布式采集、 存储和监控,进而为企业分析数据、聚焦商业渠道、提供给多方合作的机会 的有益效果,解决了上述背景技术中无法聚焦线上渠道以致丢失合作机会的 问题。
6.本发明提供如下技术方案:一种基于语义的大数据分析系统,包括数据 收集单元、数据识别单元、数据分析单元和数据可视化单元,所述数据收集 单元用于对大数据的存储和实时更新,所述数据识别单元用于对用户需要的 信息进行识别和初步过滤,所述数据分析单元用于对大数据信息的整合、分 类和关联分析数据,形成分析结果,提供分析需要的实时数据,所述数据可 视化单元用于对数据分析结果以用户能够识别的图形语音呈现出来;
7.该系统还包括信息处理单元、业务输出单元、业务匹配单元、业务处理 单元;所述信息处理单元用于对数据收集单元、数据识别单元、数据分析单 元和数据可视化单元的数据处理结果依次进行传送;所述业务输出单元用户 对所需业务信息进行输入、搜索和查找;所述业务匹配单元用于集合用户需 求信息和大数据处理信息进行匹配和调度,所述业务处理单元用于用户具体 业务的执行和展现。
8.作为本发明所述一种基于语义的大数据分析系统的一种可选方案,其中: 所述数据收集单元包括分布式采集单元、数据存储单元和数据监控单元;
9.所述分布式采集单元用于对不同采集站之间的数据进行采集;
10.所述数据存储单元用于对海量数量的数据进行分类储存;
11.所述数据监控单元用于对流动的数据进行监控,按实现设定的解惑原则 完成有效截取,然后对截获下的数据进行数据还原,最后对还原后的数据进 行分析并做出某种控制决定。
12.作为本发明所述一种基于语义的大数据分析系统的一种可选方案,其中: 所述数据识别单元包括文本纠错单元、情感倾向分析单元、评论观点抽取单 元;
13.所述文本纠错单元包括识别文本中错误的片段,进行错误提示并给出正 确的建议文本内容;
14.所述情感倾向分析单元用于包括主观信息的文本进行情感倾向型判断;
15.所述评论观点抽取单元用于自动分析评论关注点和评论观点,并输出评 论观点标签及评论观点极性。
16.作为本发明所述一种基于语义的大数据分析系统的一种可选方案,其中: 所述数据分析单元包括对话情绪识别单元、文章标签单元和文章分类单元和 新闻摘要单元;
17.所述对话情绪识别单元用于对话场景中识别对话双方文本被后续蕴含的 用户情绪结合上下文语境给出有针对性地参考回复话术;
18.所述文章标签单元用于对文章进行核心关键词缝隙,为新闻个性化催件、 相似文章聚合、文本内容而分析等提供技术支持;
19.所述文章分类单元用于对文章安装内容类型进行自动分类,支持娱乐、 体育、科技等26个主流内容类型,为文章聚类、文本内容分析等应用提供基 础技术支持;
20.所述新闻摘要单元基于深度语义分析模型,自动抽取新闻文本中的关键 信息并生成指定长度的新闻摘要。
21.作为本发明所述一种基于语义的大数据分析系统的一种可选方案,其中: 所述数据可视化单元包括结构化数据单元和非结构化数据单元;
22.所述结构化数据用于呈现固定格式和有限长度的数据;所述非结构化数 据用于无固定格式的数据的呈现。
23.作为本发明所述一种基于语义的大数据分析系统的一种可选方案,其中: 所述业务处理单元包括企业信息记录单元、营销数据收集单元、营销报告生 成单元和商业信息分析单元;
24.所述企业信息记录单元用于精准提取文本中的姓名、电话、地址信息, 通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化 信息;
25.所述营销数据收集单元用于精准营销提供数据搜集、分析和营销手段的 技术支持;
26.所述营销报告生成单元用于对用户生成概要性的营销摘要,支持定期自 动生成、报告和撰写;
27.所述商业信息分析单元用于对商业信息分析和竞争对手分析及商业营销 计划数据分析。
28.作为本发明所述一种基于语义的大数据分析系统的一种可选方案,其中: 所述业务处理单元还包括人才资源推荐单元和供应商资源推荐单元;
29.所述人才资源推荐单元用于对企业用户进行人力资源推荐和服务;
30.所述供应商资源推荐单元用于对企业用户进行相匹配的供应商进行匹配 和链接。
31.作为本发明所述一种基于语义的大数据分析系统的一种可选方案,其中: 所述非结构化数据单元包括可视图形单元和主体图单元;
32.所述可视图形单元用于图形、图像进行管理;所述主体图单元通过表达、 建模、表面、属性及动画的现实,对数据加以可视化解释。
33.作为本发明所述一种基于语义的大数据分析系统的一种可选方案,其中: 所述业务输出单元、业务匹配单元和业务处理单元运行时,当社交网络数据 采集和分析后,基于文档的分类和结果输入给业务输出单元的服务请求,服 务请求被分配至业务匹配单元中的服务人员进行交互,进一步处理进入到业 务处理单元,进而触发业务处理单元中的服务人员满足用户需求进行推荐和 搜索信息。
34.作为本发明所述一种基于语义的大数据分析系统的一种可选方案,其中: 所述业务输出单元包括自动匹配单元和人工相应单元,自动匹配单元用于将 用户所需要的信息匹配处理后自动回复用户,人工相应单元用于人工检索匹 配处理后进行人工回复客户。
35.本发明具备以下有益效果:
36.1、该一种基于语义的大数据分析系统,通过信息处理单元、业务匹配单 元、业务处理单元将企业所需要的信息、多方合作连接、进行执行,将信息 反馈给企业客户,实现从核心能力、业务组合以及产品线、可盈利方法等方 面进行分层次、多维度的商业模式创新,以实现企业的可持续发展。
37.2、该一种基于语义的大数据分析系统,通过分布式采集单元、数据存储 单元和数据监控单元,实现对数据的分布式采集、存储和监控,将数据进行 筛选,进而获得企业最有利也是搜索最直观相近的数据予以参考和支持。
38.3、该一种基于语义的大数据分析系统,在数据识别单元中,在企业客户 搜索引擎时起到精准性和其企业用户阅读体验,可帮助商家进行产品分析, 缺有效提高搜索的精度性。
39.4、该一种基于语义的大数据分析系统,通过数据分析单元中对话情绪识 别单元、文章标签单元和文章分类单元和新闻摘要单元的进行数据分析,通 过人性化的情绪分析,新闻摘要分析模型,方便快速形成摘要结果方便为企 业用户提供基础技术支持。
40.5、该一种基于语义的大数据分析系统,通过业务处理单元中的企业信息 记录单元、营销数据收集单元、营销报告生成单元和商业信息分析单元,对 企业信息、营销数据的分析和大数据信息的参考,自动为企业用户生成概要 性的营销摘要,进而为企业用户提供下一季的营销策划和参考,通过人才资 源推荐单元和供应商资源推荐单元,将与企业用户匹配的行业中的精英人才 资源和供应商资源进行匹配,供企业予以链接,减少企业得不到多渠道的信 息和无法聚焦线上商业合作的问题。
附图说明
41.图1为本发明基于语义的大数据分析系统的结构示意图。
42.图2为本发明业务处理单元结构示意图。
具体实施方式
43.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
44.实施例1
45.现有的中小型企业大多还是封闭式管理,各方面产业链经营处于自我隐 私保护的状态,虽然中小型企业渐渐也在开启线上为主、虚实结合的商业模 式,但是在实行过程中、由于各个企业比较封闭保护商业隐私的同时,和无 法聚焦线上商业大数据渠道分析,因此也失去了跨界融合,对外合作进步的 机会。
46.本发明提供以下方案,请参阅图1-2,一种基于语义的大数据分析系统, 包括数据收集单元、数据识别单元、数据分析单元和数据可视化单元,所述 数据收集单元用于对大数据的存储和实时更新,所述数据识别单元用于对用 户需要的信息进行识别和初步过滤,所述数据分析单元用于对大数据信息的 整合、分类和关联分析数据,形成分析结果,提供分析需要的实时数据,所 述数据可视化单元用于对数据分析结果以用户能够识别的图形语音呈现出来;
47.该系统还包括信息处理单元、业务输出单元、业务匹配单元、业务处理 单元;所述信息处理单元用于对数据收集单元、数据识别单元、数据分析单 元和数据可视化单元的数据处理结果依次进行传送;所述业务输出单元用户 对所需业务信息进行输入、搜索和查找;所述业务匹配单元用于集合用户需 求信息和大数据处理信息进行匹配和调度,所述业务处理单元用于用户具体 业务的执行和展现。
48.当前无论是企业还是政府,高校等单位面临的数据无法存储,无法计算 的状态,大数据,在于海量,单击无法快速处理,需要通过垂直扩展,水平 扩展即大数据的大内存高效能和大磁盘大集群等进行处理;
49.互联网持续增长信息资源蕴含了巨量的具有商业价值的信息,成为重要 的商业智能服务信息源头,但是,由于互联网数据量庞大、获取难度大、单 位价值相对低、几乎全是文本等非结构数据等难点,其价值并没有被业界充 分开发和利用;
50.在大数据时代,文化企业商业模式慢慢体现出上线为主、虚实结合的模 式,渠道大数据和顾客大数据为支撑的产业链经营与跨界融合的新机制,重 视以创造独特而丰富的体验价值为指向进而缝隙数据,提供线上的数据支持;
51.通过数据收集单元对大数据的存储和实时更新,通过数据识别单元对企 业用户需要的信息进行识别和初步过滤;进而通过数据分析单元对大数据信 息的整合、分类和关联,进而对企业的关联分析结果后,提供给企业相关的 数据支持,通过可视化单元将数据分析结果呈现;通过信息处理单元、业务 匹配单元、业务处理单元将企业所需要的信息、多方合作连接、进行执行, 将信息反馈给企业客户,实现从核心能力、业务组合以及产品线、可盈利方 法等方面进行分层次、多维度的商业模式创新,以实现企业的可持续发展;
52.不仅在企业保护隐私的同时,得以聚焦的精准化聚到分析,还方便与多 渠道客户产业链进行跨界融合,实现多方合作连接。
53.实施例2
54.本实施例是在实施例1的基础上做出的解释说明,具体的,请参阅图1-2, 所述数据收集单元包括分布式采集单元、数据存储单元和数据监控单元;
55.所述分布式采集单元用于对不同采集站之间的数据进行采集;
56.无论是大规模的系统还是中小规模的系统,分布式数据采集系统都能够 适应,因为可以通过选用适当数量的采集站来构建相应规模的系统。
57.由于采用了多个以单机片为核心的数据采集站,若某个数据采集站出现 故障,只会影响该单元数据,而不会对系统其他部分造成任何影响,也便于 故障查找和替换。由于分布式数据采集系统采用了多机并行工作模式,每一 个单片机仅完成数量有限的数据采集和处理任务,因此,它对硬件的要求不 高,可以用低档的硬件构建高性能的系统,这是微机型数据采集系统无法比 拟的优点。
58.所述数据存储单元用于对海量数量的数据进行分类储存;
59.所述数据监控单元用于对流动的数据进行监控,按实现设定的解惑原则 完成有效截取,然后对截获下的数据进行数据还原,最后对还原后的数据进 行分析并做出某种控制决定。
60.网络数据监控即对于网上流动的数据,首先按事先设定的截获原则完成 有效截取,然后对截获下的数据进行数据还原,最后对还原后的数据进行分 析并作出某种控制决定。网络监控需分三个阶段,先完成数据截获,然后是 数据的还原,最后才是进行控制。而网络监控的困难之处即如何完成第一, 第二阶段的工作。一旦从网络上捕获数据帧,它们被存在缓冲区中,可见, 数据捕获部分又可以分为硬件实现部分和软件实现部分,硬件部分就是相应 的计算机的网络接口设备,软件部分有许多的开放源码,例如libpcap以及 其在windows平台上的应用版本winpcap等。
61.通过分布式采集单元、数据存储单元和数据监控单元,实现对数据的分 布式采集、存储和监控,将数据进行筛选,进而获得企业最有利也是搜索最 直观相近的数据予以参考和支持。
62.实施例3
63.本实施例是在实施例1的基础上做出的解释说明,具体的,请参阅图1, 所述数据识别单元包括文本纠错单元、情感倾向分析单元、评论观点抽取单 元;
64.所述数据分析单元包括对话情绪识别单元、文章标签单元和文章分类单 元和新闻摘要单元;
65.所述文本纠错单元包括识别文本中错误的片段,进行错误提示并给出正 确的建议文本内容;支持短文本、长文本、语音识别结果等多种文本内容, 在搜索引擎、语音识别、内容审核有广泛应用,能显著提高各场景下语义的 准确性和用户阅读体验;
66.所述情感倾向分析单元用于包括主观信息的文本进行情感倾向型判断; 针对特定场景下带有主观描述的篇章文本,自动识别文本中的核心实体词, 并分别判断每个实体词对应的情感和对应置信度;支持用户使用适合自身应 用场景的情感极性标注语料,在通用模型基础上进行优化训练,满足专属场 景的更高准确率要求;
67.所述评论观点抽取单元用于自动分析评论关注点和评论观点,并输出评 论观点标签及评论观点极性;自动分析评论关注点和评论观点,并输出评论 观点标签及评论观点极性。目前支持13类产品用户评论的观点抽取,包括美 食、酒店、汽车、景点等,可帮助商家
进行产品分析,辅助用户进行消费决 策;在通用版效果基础之上,支持上传13个行业垂类的自定义评论词表,通 过自定义有效提高评论抽取的精度和召回,同时支持用户自定义评论的“归 一化标签”;
68.在数据识别单元中,在企业客户搜索引擎时起到精准性和其企业用户阅 读体验,可帮助商家进行产品分析,缺有效提高搜索的精度性。
69.实施例4
70.本实施例是在实施例1的基础上做出的解释说明,具体的,请参阅图1, 所述数据分析单元还包括对话情绪识别单元、文章标签单元和文章分类单元 和新闻摘要单元;
71.所述对话情绪识别单元用于对话场景中识别对话双方文本被后续蕴含的 用户情绪结合上下文语境给出有针对性地参考回复话术;
72.在对话场景中,识别对话双方文本背后蕴含的用户情绪,一级情绪分为 正向、中性、负向3种,正向情绪细分为:喜爱、愉快、感谢3种;负向情 绪细分为:抱怨、愤怒、厌恶、恐惧、悲伤5种,针对机器识别到的负向情 绪,结合上下文语境给出有针对性地参考回复话术,帮助应用方第一时间安 抚客户负向情绪;
73.所述文章标签单元用于对文章进行核心关键词缝隙,为新闻个性化催件、 相似文章聚合、文本内容而分析等提供技术支持;
74.技术领先识别准确,文章标签服务对文章的标题和内容进行深度分析, 输出能够反映文章关键信息的主题、话题、实体等多维度标签以及对应的标 签置信度;维度丰富应用广包含多维度信息,全面覆盖文章关键信息主题, 可广泛应用在文章聚合、个性化推荐、内容检索等场景中;
75.所述文章分类单元用于对文章安装内容类型进行自动分类,支持娱乐、 体育、科技等26个主流内容类型,为文章聚类、文本内容分析等应用提供基 础技术支持;
76.文章主题分类,文章分类服务对文章内容进行深度分析,输出文章的主 题一级分类、主题二级分类,如娱乐、社会、音乐、人文、科学、历史、军 事、体育、科技、教育等分类结果,相关置信度,可通过文章分类结果,给 出对应的一定置信相关度分值,如一般相关、非常相关、相关度较低。在个 性化推荐、文章聚合、文本内容分析等场景具有广泛应用价值;
77.所述新闻摘要单元基于深度语义分析模型,自动抽取新闻文本中的关键 信息并生成指定长度的新闻摘要。
78.可用于热点新闻聚合、新闻推荐、语音播报、app信息push等场景,全 面分析新闻语义,结合传统语义特征和深度学习模型,充分考虑短路分布和 篇章结构,准确计算新闻语句的重要性,对新闻内容进行全面的语义理解和 分析,自动抽取摘要文本,能根据需求灵活控制摘要长度,自动抽取关键信 息,形成摘要结果。可用于内容理解、内容分发、智能写作等多种应用;
79.通过数据分析单元中对话情绪识别单元、文章标签单元和文章分类单元 和新闻摘要单元的进行数据分析,通过人性化的情绪分析,新闻摘要分析模 型,方便快速形成摘要结果方便为企业用户提供基础技术支持。
80.实施例5
81.本实施例是在实施例1的基础上做出的解释说明,具体的,请参阅图1
‑ꢀ
图2,所述数据可视化单元包括结构化数据单元和非结构化数据单元;
82.所述结构化数据用于呈现固定格式和有限长度的数据;所述非结构化数 据用于无固定格式的数据的呈现。
83.现在非结构化的数据越来越多,就是不定长、无固定格式的数据,如: 视频,语音,网页,等;是一些xml或者html的格式的数据。获取大数据后, 用这些数据做:数据采集,数据存储,数据清洗,数据分析,数据可视化;
84.大数据的核心作用是数据价值化,简单地说就是大数据让数据产生各种
ꢀ“
价值”,这个数据价值化的过程就是大数据主要做主的事情,大数据可以 做得是记录一切,描述一切,预测一切,大数据技术的战略意义不在于掌握 庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
85.实施例6
86.本实施例是在实施例1的基础上做出的解释说明,具体的,请参阅图2, 所述业务处理单元包括企业信息记录单元、营销数据收集单元、营销报告生 成单元和商业信息分析单元;
87.所述企业信息记录单元用于精准提取文本中的姓名、电话、地址信息, 通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化 信息;
88.所述营销数据收集单元用于精准营销提供数据搜集、分析和营销手段的 技术支持;
89.所述营销报告生成单元用于对用户生成概要性的营销摘要,支持定期自 动生成、报告和撰写;
90.所述商业信息分析单元用于对商业信息分析和竞争对手分析及商业营销 计划数据分析。
91.通过业务处理单元中的企业信息记录单元、营销数据收集单元、营销报 告生成单元和商业信息分析单元,对企业信息、营销数据的分析和大数据信 息的参考,自动为企业用户生成概要性的营销摘要,进而为企业用户提供下 一季的营销策划和参考,便于企业用户进步。
92.实施例7
93.本实施例是在实施例1的基础上做出的解释说明,具体的,请参阅图2, 所述业务处理单元还包括人才资源推荐单元和供应商资源推荐单元;
94.所述人才资源推荐单元用于对企业用户进行人力资源推荐和服务;
95.所述供应商资源推荐单元用于对企业用户进行相匹配的供应商进行匹配 和链接。
96.当企业需要提高营销策略通过人才资源推荐单元和供应商资源推荐单元, 将与企业用户匹配的行业中的精英人才资源和供应商资源进行匹配,供企业 予以链接,减少企业得不到多渠道的信息和无法聚焦线上商业合作的问题的 时候,可能缺少相关人才资源和实际的多方供应商资源。
97.实施例8
98.本实施例是在实施例1的基础上做出的改进,具体的,请参阅图1,所述 非结构化数据单元包括可视图形单元和主体图单元;
99.所述可视图形单元用于图形、图像进行管理;所述主体图单元通过表达、 建模、表
面、属性及动画的现实,对数据加以可视化解释。
100.实施例9
101.本实施例是在实施例1的基础上做出的解释说明,具体的,所述业务输 出单元、业务匹配单元和业务处理单元运行时,当社交网络数据采集和分析 后,基于文档的分类和结果输入给业务输出单元的服务请求,服务请求被分 配至业务匹配单元中的服务人员进行交互,进一步处理进入到业务处理单元, 进而触发业务处理单元中的服务人员满足用户需求进行推荐和搜索信息。
102.实施例10
103.本实施例是在实施例1的基础上做出的解释说明,具体的,请参阅图1, 所述业务输出单元包括自动匹配单元和人工相应单元,自动匹配单元用于将 用户所需要的信息匹配处理后自动回复用户,人工相应单元用于人工检索匹 配处理后进行人工回复客户。
104.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来 将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示 这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、
ꢀ“
包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系 列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明 确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有 的要素。
105.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普 通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进 和润饰,这些改进和润饰也应视为本发明的保护范围。

技术特征:
1.一种基于语义的大数据分析系统,包括数据收集单元、数据识别单元、数据分析单元和数据可视化单元,其特征在于:所述数据收集单元用于对大数据的存储和实时更新,所述数据识别单元用于对用户需要的信息进行识别和初步过滤,所述数据分析单元用于对大数据信息的整合、分类和关联分析数据,形成分析结果,提供分析需要的实时数据,所述数据可视化单元用于对数据分析结果以用户能够识别的图形语音呈现出来;该系统还包括信息处理单元、业务输出单元、业务匹配单元、业务处理单元;所述信息处理单元用于对数据收集单元、数据识别单元、数据分析单元和数据可视化单元的数据处理结果依次进行传送;所述业务输出单元用户对所需业务信息进行输入、搜索和查找;所述业务匹配单元用于集合用户需求信息和大数据处理信息进行匹配和调度,所述业务处理单元用于用户具体业务的执行和展现。2.根据权利要求1所述的一种基于语义的大数据分析系统,其特征在于:所述数据收集单元包括分布式采集单元、数据存储单元和数据监控单元;所述分布式采集单元用于对不同采集站之间的数据进行采集;所述数据存储单元用于对海量数量的数据进行分类储存;所述数据监控单元用于对流动的数据进行监控,按实现设定的解惑原则完成有效截取,然后对截获下的数据进行数据还原,最后对还原后的数据进行分析并做出某种控制决定。3.根据权利要求1所述的一种基于语义的大数据分析系统,其特征在于:所述数据识别单元包括文本纠错单元、情感倾向分析单元、评论观点抽取单元;所述文本纠错单元包括识别文本中错误的片段,进行错误提示并给出正确的建议文本内容;所述情感倾向分析单元用于包括主观信息的文本进行情感倾向型判断;所述评论观点抽取单元用于自动分析评论关注点和评论观点,并输出评论观点标签及评论观点极性。4.根据权利要求1所述的一种基于语义的大数据分析系统,其特征在于:所述数据分析单元包括对话情绪识别单元、文章标签单元和文章分类单元和新闻摘要单元;所述对话情绪识别单元用于对话场景中识别对话双方文本被后续蕴含的用户情绪结合上下文语境给出有针对性地参考回复话术;所述文章标签单元用于对文章进行核心关键词缝隙,为新闻个性化催件、相似文章聚合、文本内容而分析等提供技术支持;所述文章分类单元用于对文章安装内容类型进行自动分类,支持娱乐、体育、科技等26个主流内容类型,为文章聚类、文本内容分析等应用提供基础技术支持;所述新闻摘要单元基于深度语义分析模型,自动抽取新闻文本中的关键信息并生成指定长度的新闻摘要。5.根据权利要求1所述的一种基于语义的大数据分析系统,其特征在于:所述数据可视化单元包括结构化数据单元和非结构化数据单元;所述结构化数据用于呈现固定格式和有限长度的数据;所述非结构化数据用于无固定格式的数据的呈现。6.根据权利要求1所述的一种基于语义的大数据分析系统,其特征在于:所述业务处理
单元包括企业信息记录单元、营销数据收集单元、营销报告生成单元和商业信息分析单元;所述企业信息记录单元用于精准提取文本中的姓名、电话、地址信息,通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化信息;所述营销数据收集单元用于精准营销提供数据搜集、分析和营销手段的技术支持;所述营销报告生成单元用于对用户生成概要性的营销摘要,支持定期自动生成、报告和撰写;所述商业信息分析单元用于对商业信息分析和竞争对手分析及商业营销计划数据分析。7.根据权利要求1所述的一种基于语义的大数据分析系统,其特征在于:所述业务处理单元还包括人才资源推荐单元和供应商资源推荐单元;所述人才资源推荐单元用于对企业用户进行人力资源推荐和服务;所述供应商资源推荐单元用于对企业用户进行相匹配的供应商进行匹配和链接。8.根据权利要求5所述的一种基于语义的大数据分析系统,其特征在于:所述非结构化数据单元包括可视图形单元和主体图单元;所述可视图形单元用于图形、图像进行管理;所述主体图单元通过表达、建模、表面、属性及动画的现实,对数据加以可视化解释。9.根据权利要求1所述的一种基于语义的大数据分析系统,其特征在于:所述业务输出单元、业务匹配单元和业务处理单元运行时,当社交网络数据采集和分析后,基于文档的分类和结果输入给业务输出单元的服务请求,服务请求被分配至业务匹配单元中的服务人员进行交互,进一步处理进入到业务处理单元,进而触发业务处理单元中的服务人员满足用户需求进行推荐和搜索信息。10.根据权利要求1所述的一种基于语义的大数据分析系统,其特征在于:所述业务输出单元包括自动匹配单元和人工相应单元,自动匹配单元用于将用户所需要的信息匹配处理后自动回复用户,人工相应单元用于人工检索匹配处理后进行人工回复客户。

技术总结
本发明涉及大数据网络技术领域,且公开了一种基于语义的大数据分析系统,包括数据收集单元、数据识别单元、数据分析单元和数据可视化单元,所述数据收集单元用于对大数据的存储和实时更新,所述数据识别单元用于对用户需要的信息进行识别和初步过滤,所述数据分析单元用于对大数据信息的整合、分类和关联分析数据,形成分析结果,提供分析需要的实时数据,所述数据可视化单元用于对数据分析结果以用户能够识别的图形语音呈现出来;该系统还包括信息处理单元、业务输出单元、业务匹配单元、业务处理单元。本发明具备数据的分布式采集、存储和监控,进而为企业分析数据、聚焦商业渠道、提供多方合作的机会的有益效果。供多方合作的机会的有益效果。供多方合作的机会的有益效果。


技术研发人员:杨懿 孟庆森 马祥帅 杨政伟 孟庆麟
受保护的技术使用者:徐州国云信息科技有限公司
技术研发日:2022.06.22
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-9235.html

最新回复(0)