本发明涉及信息智能生成领域,尤其涉及一种基于大语言模型的报告生成方法、设备及存储介质。
背景技术:
1、现有的智能数据分析平台,需要用户使用专业技能(如bi、数据库基础指令等)对数据库进行配置。如果用户使用可视化组件协助用户进行轻代码则耗时过长,对于用户来说虽然降低了专业技能的要求但提高了用户的时间成本。
2、数据报告是需要来自于各类平台统计的数据和图表分析制作,但是数据的处理上过于消耗时间则会导致报告的时效性过低缺乏灵活性。而为了追求数据报告的时效性掌握专业技能又导致学习门槛过高,对于数据报告制作的适用性产生障碍。因此,针对现有的数据报告生成方案无法同时满足时效性和低门槛要求的技术问题,需要一种新的技术来解决当前的问题。
技术实现思路
1、本发明的主要目的在于解决现有的数据报告生成方案无法同时满足时效性和低门槛要求的技术问题。
2、本发明第一方面提供了一种基于大语言模型的报告生成方法,包括步骤:
3、接收提问数据;
4、基于所述提问数据和预置sqlalchemy映射工具,查询预置starrocks数据库中的数据表,得到查询schema元信息,以及根据所述查询schema元信息,对预置提示词集进行查询组装处理,生成sql提示词;
5、将所述sql提示词传输至预置大语言模型中,接收所述大语言模型反馈的sql查询指令;
6、基于所述sql查询指令,对所述starrocks数据库进行数据查询处理,得到数值数据;
7、将所述数值数据和所述提问数据进行组合处理,生成解析提问词,以及将所述解析提问词传输至预置大语言模型中,接收所述大语言模型反馈的文字分析数据;
8、根据预置可视化算法,对所述数值数据进行图表绘制处理,得到图表数据;
9、将所述图表数据和所述文字分析数据进行整合处理,生成所述提问数据对应的分析报告数据。
10、可选的,在本发明第一方面的第一种实现方式中,所述根据预置可视化算法,对所述数值数据进行图表绘制处理,得到图表数据包括:
11、分析所述数值数据,得到所述数值数据对应的展示图表种类;
12、基于所述图表种类,对所述数值数据进行绘制处理,得到图表数据。
13、可选的,在本发明第一方面的第二种实现方式中,所述分析所述数值数据,得到所述数值数据对应的展示图表种类包括:
14、分析所述数值数据的数据维度,得到数据维度向量;
15、基于所述数据维度向量,得到所述数值数据对应的展示图表种类。
16、可选的,在本发明第一方面的第三种实现方式中,所述基于所述图表种类,对所述数值数据进行绘制处理,得到图表数据包括:
17、根据所述图表种类,利用pyecharts数据库对所述数值数据进行绘制处理,生成html文件;
18、利用selenium组件模拟打开所述html文件,生成模拟预览界面;
19、对所述模拟预览界面进行截图处理,生成截图数据,以及将所述截图数据上传至云端数据库,得到存储url地址;
20、将所述存储url地址确定为图表数据。
21、可选的,在本发明第一方面的第四种实现方式中,所述将所述截图数据上传至云端数据库,得到存储url地址包括:
22、将所述截图数据上传至oss数据库中,得到存储url地址。
23、可选的,在本发明第一方面的第五种实现方式中,所述根据所述图表种类,利用pyecharts数据库对所述数值数据进行绘制处理,生成html文件包括:
24、基于所述图表种类对应的数据结构,对所述数值数据进行封装处理,得到封装数据;
25、利用pyecharts数据库,对所述封装数据进行绘制处理,生成html文件。
26、可选的,在本发明第一方面的第六种实现方式中,在所述接收提问数据之后,在所述基于所述提问数据和预置sqlalchemy映射工具,查询预置starrocks数据库中的数据表,得到查询schema元信息之前,还包括:
27、分析出所述提问数据的提问领域,判断所述提问领域是否为预置有效领域;
28、当所述提问领域不为有效领域,则停止处理所述提问数据,并发送异常提问信息至所述提问数据对应的端口中;
29、当所述提问领域为有效领域,则标记所述提问数据为合格数据。
30、可选的,在本发明第一方面的第七种实现方式中,在所述将所述图表数据和所述文字分析数据进行整合处理,生成所述提问数据对应的分析报告数据之后,还包括:
31、将所述分析报告数据发送至所述提问数据对应的端口中。
32、本发明第二方面提供了一种基于大语言模型的报告生成设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于大语言模型的报告生成设备执行上述的基于大语言模型的报告生成方法。
33、本发明的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于大语言模型的报告生成方法。
34、在本发明实施例中,通过自然语言作为数据处理的初始语言,利用sqlalchemy映射工具操作数据库,并且使用大语言模型作为数据分析的工具,可以降低数据分析和处理的门槛,同时还能提高用户获取数据报告的时效性。用户无需专业技能,通过简单的提问便可以非常灵活快速的得到一份专业的可视化数据分析报告帮助用户更加及时准确的获取公司相关业务情况以及市场动态的了解,从而更加及时的做出相关决策,解决了现有的数据报告生成方案无法同时满足时效性和低门槛要求的技术问题。
1.一种基于大语言模型的报告生成方法,其特征在于,包括步骤:
2.根据权利要求1所述的基于大语言模型的报告生成方法,其特征在于,所述根据预置可视化算法,对所述数值数据进行图表绘制处理,得到图表数据包括:
3.根据权利要求2所述的基于大语言模型的报告生成方法,其特征在于,所述分析所述数值数据,得到所述数值数据对应的展示图表种类包括:
4.根据权利要求2所述的基于大语言模型的报告生成方法,其特征在于,所述基于所述图表种类,对所述数值数据进行绘制处理,得到图表数据包括:
5.根据权利要求4所述的基于大语言模型的报告生成方法,其特征在于,所述将所述截图数据上传至云端数据库,得到存储url地址包括:
6.根据权利要求4所述的基于大语言模型的报告生成方法,其特征在于,所述根据所述图表种类,利用pyecharts数据库对所述数值数据进行绘制处理,生成html文件包括:
7.根据权利要求1所述的基于大语言模型的报告生成方法,其特征在于,在所述接收提问数据之后,在所述基于所述提问数据和预置sqlalchemy映射工具,查询预置starrocks数据库中的数据表,得到查询schema元信息之前,还包括:
8.根据权利要求1所述的基于大语言模型的报告生成方法,其特征在于,在所述将所述图表数据和所述文字分析数据进行整合处理,生成所述提问数据对应的分析报告数据之后,还包括:
9.一种基于大语言模型的报告生成设备,其特征在于,所述基于大语言模型的报告生成设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述的基于大语言模型的报告生成方法。
