1.本公开涉及数据处理
技术领域:
:,具体涉及到一种智能在线绘图方法及系统。
背景技术:
::2.常用的绘图方式可以通过excel、非编程式如spss、tableau、origin等软件、以及编程式工具:如r语言、python、stata等。3.上述方式绘图方式复杂,绘图效率低,且上述方式要求绘图人员具备专业性,进而造成绘图难度大的问题。技术实现要素:4.本公开的主要目的在于提供一种智能在线绘图方法及系统。5.为了实现上述目的,根据本公开的第一方面,提供了一种智能在线绘图方法,包括:在获取到样本数据后进行结构化处理,将样本数据中对应不同字段的变量进行分类,得到属于不同类型的变量,其中,变量的字段在页面的待选区显示以实现通过字段调用变量;检测页面的检测区是否有被调用的变量所对应的字段输入;如果检测到有被输入,基于被调用的变量在页面的显示区域智能生成预设类型的图表。6.可选地,如果检测到有被输入之后,确定变量所对应的行维度、或列维度。7.可选地,当被调用的变量被更改,基于更改后的变量更改当前的图表。8.可选地,当页面的切换区检测到切换图表的类型的请求被触发后,将预设类型的图表切换至目标类型的图表。9.可选地,基于被调用变量在页面的显示区域智能生成预设类型的图表包括:基于被调用变量对应的字段的数量、被调用变量的类型、被调用变量对应的行维度、被调用变量对应的列维度、被调用变量的顺序、以及样本数据的总量,基于预设的图表推荐算法,智能生成预设类型的图表。10.可选地,建立图表推荐算法,包括:如果变量数据类型为定类类型,根据变量对应字段的数量确定图表类型;如果变量数据类型为定量类型,根据变量数据的数量、以及样本量,确定图表类型。11.根据本公开的第二方面,提供了一种智能在线绘图系统,包括:样本数据处理单元,被配置成在获取到样本数据后进行结构化处理,将样本数据中对应不同字段的变量进行分类,得到属于不同类型的变量,其中,变量的字段在页面的待选区显示以实现通过字段调用变量;调用单元,被配置成检测页面的检测区是否有被调用的变量所对应的字段输入;图表生成单元,被配置成如果检测到有被输入,基于被调用的变量在页面的显示区域智能生成预设类型的图表。12.可选地,如果检测到有被输入之后,确定变量所对应的行维度、或列维度。13.根据本公开的第三方面,提供了一种计算机可读存储介质,存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面任意一项实现方式所述的智能在线绘图方法。14.根据本公开的第四方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面任意一项实现方式所述的智能在线绘图方法。15.在本公开实施例智能在线绘图方法及系统中,包括:在获取到样本数据后进行结构化处理,将样本数据中对应不同字段的变量进行分类,得到属于不同类型的变量,其中,变量的字段在页面的待选区显示以实现通过字段调用变量;检测页面的检测区是否有被调用的变量所对应的字段输入;如果检测到有被输入,基于被调用的变量的类型,在页面的显示区域智能生成预设类型的图表。通过在线交互的方式智能化地生成推荐图表,简化了交互式绘图的过程,提高了绘图效率,降低了绘图难度。且能够生成符合样本数据的最优推荐图表,进而解决了相关技术中绘图方式复杂,绘图效率低一级绘图难度大的问题。附图说明16.为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。17.图1是根据本公开实施例的智能在线绘图方法流程图;18.图2是根据本公开实施例的电子设备的示意图。具体实施方式19.为了使本
技术领域:
:的人员更好地理解本公开方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。20.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。21.需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。22.根据本公开实施例,提供了一种智能在线绘图方法,本实施通过字段的更改智能推荐图表的类型,同时结合样本的多少缩小范围推荐可视化更高的图表,实现了最优图表的推荐。如图1所示,该方法包括如下的步骤101至步骤103:23.步骤101:在获取到样本数据后进行结构化处理,将样本数据中对应不同字段的变量进行分类,其中,变量的字段在页面的待选区显示以被调用。24.在本实施例中,样本数据的种类是多样的,可以获取用户输入的样本数据文件,而后自动地对样本数据中包含的字段进行识别,在识别后对样本数据进行结构化处理,包括自动确定各个变量的类型属于定类变量还是定量类型,离散型数据可被分为定类、连续的数据可被分为定量。变量的类型可以也可以通过自定义的方式进行设置。25.示例性地,性别数据可被分类为定类变量、身高数据属于定量类型、体重数据属于定量类型的变量。可以理解的是,也可以通过自定义方式(即手动的方式)对变量的类型进行划分。本实施例实现了将绘图数据进行单元化字段存储、并通过字段调用变量的目的,通过对绘图数据进行该过程标准化处理,使前端实现高复用性绘图。26.进一步地,可以预先设置待选区,。分类后的变量其可通过对应的字段显示在页面的待选区,当用户在待选区通过触发(触发方式可以是拖拽字段的方式)字段的方式,实现字段所对应的变量的调用,在待选区相同类型变量的字段可显示在同一区域。以青少年体能数据为例,“编号、性别、地区”等定类变量显示在待选区的第一子区域,“年龄、肺活量、舒张压”等定量变量显示在待选区的第二子区域,以方便按类型触发(可以是拖拽方式)所需字段。基于字段的形式实现绘图,能够简洁高效提升数据的运用能力,辅助用户透视数据,有利于用户探索数据。27.步骤102:检测页面的检测区是否有被调用的变量所对应的字段输入。28.在本实施例中,用户可以通过拖拽的方式从待选区拖拽不同类型变量对应的字段,如果检测到页面的检测区被输入了调用变量对应的字段,基于被调用变量执行相应的操作以生成推荐图表。29.本实施例以视觉输出为向导,绘图数据中变量对应的字段可交互式拖拽、位移、更新等。通过本实施例用户无需关注数据,只需关注变量便可以得到需要的分析结果。如:需要确定身高体重这两个之间有什么关系时,只需拖拽身高、体重这两个变量对应的字段,便自动会生成关系散点图,变量顺序也会影响关系散点图的样式。30.步骤103:如果检测到有被输入,基于被调用的变量在页面的显示区域智能生成预设类型的图表。31.在本实施例中,图标的类型可以包括多种,包括但是不限于柱状图、条形图、饼图、环图、南丁格尔玫瑰图、帕累拖图、矩形树图、雷达图、热力图、误差线图、小提琴图、直方图、散点图、p-p图、q-q图、箱线图、误差线图等。如果检测到有变量对应的字段输入,则基于被调用变量对应字段的数量、被调用变量的类型、被调用变量所属样本的样本总量、被调用变量的顺序、以及被调用变量所对应的行维度和列维度确定图表的类型,以及可根据变量的内容确定该类型图标所呈现的具体内容。可以理解的是,本实施例整体上生成的图表可以是两类,一类是在xy轴上点对点还原数据形态(比如散点图、折线图、条形图等基础图表),另一类对数据进行了算法处理(该算法是预设的),图形的结果是抽象或者降维后的结果,比如直方图,该类不是点对点的还原原始数据,而是采用了算法计算,得出是一个正态分布图。32.作为本实施例一种可选的实现方式,如果检测到有被输入之后,确定变量所对应的行维度、列维度。33.在本可选的实现方式中,检测区可以包括两种模式下的检测区,一种是智能识别模式下的检测区,在智能识别模式下,通过拖拽入被调用变量的字段,并在检测到字段被输入到检测区后,自动对变量的类型进行识别,并基于识别的类型自动确定对应行维度、或列维度哪一种。在手动模式下,可以分别将被调用变量的字段拖拽入行检测区、列检测区,并在检测到被输入到检测区后,将行检测区中字段指示的变量对应在行维度,将列检测区中字段指示的变量对应在列维度。34.在智能模识别模式下,通过输入的字段,确定字段指示的变量的类型,如果是定量类型则在行维度进行变量的显示;如果是定类类型则在列维度进行变量的显示。而在手动模式下,将拖入行检测区的字段对应的变量在行维度显示,将拖入列检测区的字段对应的变量在列维度显示。35.通过确定变量对应的行维度、和列维度,并基于变量的具体数据内容(如数值)可智能生成与变量匹配的最优展示图表。变量在行维度还是列维度会直接影响生成的推荐图表的类型,因此可通过行列维度的变换,变换生成的图表。36.作为本实施例一种可选的实现方式,当被调用的变量被更改,基于更改后的变量更改当前图表。37.在本可选的实现方式中,通过更改被调用变量,进而实时动态生成新的图表。更改方式包括但是不限于更改变量对应字段的数量(包括增大或者减少数量)、更改变量的类型(如,将定量类型调整为定类类型、或者将定类类型调整为定量类型)、更改变量所属样本的样本总量、更改被调用变量的顺序、更改变量所对应的行维度和列维度。在线数据修改可适用不同需求,减少用户反复上传与修改文件。38.示例性地,以不同变量类型和不同被调用变量对应字段的数量可生成不同类型的图表为例,如果用户拖入1个性别变量,可得到性别的样本柱状图、条形图、词云图等;如果用户拖入性别+身高2个变量,则会得到基于性别的折线图、箱线图等;如果拖入身高+体重2个不同于“性别+身高”的变量则会得到基于身高与体重的二维散点图等。39.示例性地,不同图表中变量顺序的调整会影响图表的内容,因此被调用变量的顺序调整,推荐的图表便可以被更改。以气泡图为例,气泡图需要三个定量分别为abc,默认a变量放x轴,b变量放y轴,c变量用来刻画气泡的大小,如果变量顺序被调整,则图表的效果以及标记的值与默认的不同。40.示例性地,不同的变量调整行维度和列维度后,推荐的图表也会更改,比如柱状图,其分类变量在x轴上,定量变量在y轴上;而条形图则是分类变量在y轴上刻画,定量变量在x轴上刻画。因此当调整行列顺序后,所推荐的图表也发生更改。更改样本总量推荐不同图表的方式在后文涉及。41.本可选的实现方式通过更改字段影响智能识图规则从而产生出不同的推荐图表;实现了前端在线修改数据更改绘图的方法。实现了非持久化数据绘图、以及轻量绘图,减少了功能冗余。42.作为本实施例一种可选的实现方式,当页面的切换区检测到切换图标的类型的请求被触发后,将预设类型的图表切换至目标类型的图表。43.在本可选的实现方式中,前端页面还可以设置有切换区,在切换区显示图表模板,该些图表模板可被触发(用户可通过点击方式触发),如,用户可通过点击选取一项图表的模板,在检测到模板被触发后实时将当前已经生成的图表按照选中图表的类型进行切换。44.作为本实施例一种可选的实现方式,基于被调用的变量在页面的显示区域智能生成预设类型的图表包括:基于被调用变量对应的字段的数量、被调用变量的类型、被调用变量对应的行维度、被调用变量对应的列维度、以及样本数据的总量,基于预设的图表推荐算法,智能生成预设类型的图表。45.作为本实施例一种可选的实现方式,方法还包括:建立图表推荐算法,包括:如果变量数据类型为定类类型,根据变量的数量确定图表类型;如果变量数据类型为定量类型,根据变量数据的数量、以及样本总量,确定图表类型。46.在本可选的实现方式中,基于本方式确定的图表类型可以是多种,而后可根据变量对应的行维度、列维度对确定的初始图表进行进一步确定,如分类变量在x轴上,定量变量在y轴上,则推荐柱状图;而分类变量在y轴上,定量变量在x轴上则推荐条形图。在确定图表的类型后,可以根据变量的具体内容进行预设类型的图表的绘制。47.进一步地,在智能绘图时,当智能绘图的系统启动后智能识别行列,即自动地将定类变量作为列处理,将定量变量作为行处理,且当变量只有一个时自动补充顺序为一个列,当有多个定量时(不含定类),自动将第一个定量作为列,当一个定类时自动做频数算法。48.被调用变量对应字段的数量、被调用变量类型的不同可以确定不同的图表。示例性地,以1个定类为例,首先可默认进行频数分析,进而可以生成柱状图、条形图、饼图、环图、南丁格尔玫瑰图,此处还可以在此基础上增加词云图等。可以理解的是,对于至少有两个变量的图表,如条形图或者柱状图,如果只有1个定类,则还可以增加索引变量辅助完成柱状图或者条形图的绘图。49.被调用变量对应字段的数量、被调用变量类型、样本总量的不同,可以确定不同的图表。示例性地,以1个定量为例,如果样本量属于1-3,则可以生成柱状图、饼图、环图、折线图、面积图;如果样本量属于3-10,则可以生成柱状图、饼图、环图、折线图、面积图、玫瑰图、雷达图、箱线图等;如果样本量属于11-72,则可以生成柱状图、折线图、面积图、玫瑰图、箱线图等;如果样本量大于76,则可以生成折线图、散点图、直方图、p-p图、q-q图、箱线图等。在确定图表类型后,可以基于不同的图标生成算法生成预设类型的图表。50.变量的不同类型、不同的数量、不同的样本总量可以基于上述思路确定图表的推荐类型。示例性地,如果有2-3个定类变量,算法会关联处理为列联交叉表、跟分类汇总的桑基图进行推荐。如果是3个定量,假设样本超过100,推荐气泡图,因为气泡图要求xyz三维,如果是2个定量,样本超过100,推荐为散点图(二维),如果样本只有10个以内,还是这2个定量,可以生成折线图、诸如此类。本可选的实现方式,针对样本数据,可自动划分当前数据样本范围,根据样本梯度自动推荐合适类型的统计图表。样本阶梯推荐图表可满足不同样本数据的作图要求,保证系统永远处在给用户最佳的输出方案上。51.也即本实施例基于不同的变量类型、被调用变量对应字段的数量、样本量的多少、以及行列推荐不同类型的图表,进而将图表相关联的预设的算法智能生成推荐的图表。可以理解的是,当生成的推荐图表不符合需求,用户可以通过自定义上述切换区的模板更换所推荐生成的图表。本可选的实现方式,根据当前变量的类型、变量的多少、样本的多少、行列情况进行算法关联,根据智能生成规则输出相应的推荐图表,实现了始终面向用户输出当前因素最优的推荐图表。52.进一步地,本实施例在生成图表过程中,还可以基于被调用变量对应的字段、样本量的多少根据预设的算法自动进行坐标轴命名、以及自动开启数据缩放,提高了图表可视化程度。53.本实施例实现了基于交互的在线智能绘图方法,通过极简的页面交互,以拖变量便可得到最优呈现图表。同时增减变量、更换变量顺序、更换变量行列、更换变量属性的每一步操作均会输出当前最佳的统计图表,整个过程是一个持续动态的探索过程。54.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。55.根据本公开实施例,还提供了一种智能在线绘图系统,该系统包括:在获取到样本数据后进行结构化处理,将样本数据中对应不同字段的变量进行分类,得到属于不同类型的变量,其中,变量的字段在页面的待选区显示以实现通过字段调用变量;检测页面的检测区是否有被调用的变量所对应的字段输入;如果检测到有被输入,基于被调用变量在页面的显示区域智能生成预设类型的图表。56.作为本实施例一种可选的实现方式,如果检测到有被输入之后,确定变量所对应的行维度、或列维度。57.作为本实施例一种可选的实现方式,当被调用的变量被更改,基于更改后的变量更改当前的图表。58.作为本实施例一种可选的实现方式,装置还包括切换单元,被配置成当页面的切换区检测到切换图表的类型的请求被触发后,将预设类型的图表切换至目标类型的图表。59.作为本实施例一种可选的实现方式,基于被调用变量在页面的显示区域智能生成预设类型的图表包括:基于被调用变量对应的字段的数量、被调用变量的类型、被调用变量对应的行维度、被调用变量对应的列维度、被调用变量的顺序、以及样本数据的总量,基于预设的图表推荐算法,智能生成预设类型的图表。60.作为本实施例一种可选的实现方式,装置还包括:建立图表推荐算法,包括:如果变量数据类型为定类类型,根据变量数据的数量确定图表类型;如果变量数据类型为定量类型,根据变量数据的数量、以及样本量,确定图表类型。61.本实施例实现了基于交互的在线智能绘图方法,通过极简的页面交互,以拖变量便可得到最优呈现图表。同时增减变量、更换变量顺序、更换变量行列、更换变量属性的每一步操作均会输出当前最佳的统计图表,整个过程是一个持续动态的探索过程。62.本公开实施例提供了一种电子设备,如图2所示,该电子设备包括一个或多个处理器21以及存储器22,图2中以一个处理器21为例。63.该控制器还可以包括:输入装置23和输出装置24。64.处理器21、存储器22、输入装置23和输出装置24可以通过总线或者其他方式连接,图2中以通过总线连接为例。65.处理器21可以为中央处理器(centralprocessingunit,cpu)。处理器21还可以为其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。66.存储器22作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本公开实施例中的控制方法对应的程序指令/模块。处理器21通过运行存储在存储器22中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的智能在线绘图方法。67.存储器22可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据服务器操作的处理装置的使用所创建的数据等。此外,存储器22可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器22可选包括相对于处理器21远程设置的存储器,这些远程存储器可以通过网络连接至网络连接装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。68.输入装置23可接收输入的数字或字符信息,以及产生与服务器的处理装置的用户设置以及功能控制有关的键信号输入。输出装置24可包括显示屏等显示设备。69.一个或者多个模块存储在存储器22中,当被一个或者多个处理器21执行时,执行如图1所示的方法。70.本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各电机控制方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)、随机存储记忆体(randomaccessmemory,ram)、快闪存储器(flashmemory)、硬盘(harddiskdrive,缩写:hdd)或固态硬盘(solid-statedrive,ssd)等;存储介质还可以包括上述种类的存储器的组合。71.虽然结合附图描述了本公开的实施方式,但是本领域技术人员可以在不脱离本公开的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。当前第1页12当前第1页12
技术特征:1.一种智能在线绘图方法,其特征在于,包括:在获取到样本数据后进行结构化处理,将样本数据中对应不同字段的变量进行分类,得到属于不同类型的变量,其中,变量的字段在页面的待选区显示以实现通过字段调用变量;检测页面的检测区是否有被调用的变量所对应的字段输入;如果检测到有被输入,基于被调用的变量在页面的显示区域智能生成预设类型的图表。2.根据权利要求1所述的智能绘图方法,其特征在于,如果检测到有被输入之后,确定变量所对应的行维度、或列维度。3.根据权利要求1所述的智能绘图方法,其特征在于,当被调用的变量被更改,基于更改后的变量更改当前的图表。4.根据权利要求1所述的智能绘图方法,其特征在于,方法还包括:当页面的切换区检测到切换图表的类型的请求被触发后,将预设类型的图表切换至目标类型的图表。5.根据权利要求2所述的智能绘图方法,其特征在于,基于被调用变量在页面的显示区域智能生成预设类型的图表包括:基于被调用变量对应的字段的数量、被调用变量的类型、被调用变量对应的行维度、被调用变量对应的列维度、被调用变量的顺序、以及样本数据的总量,基于预设的图表推荐算法,智能生成预设类型的图表。6.根据权利要求5所述的智能绘图方法,其特征在于,方法还包括:建立图表推荐算法,包括:如果变量数据类型为定类类型,根据变量对应字段的数量确定图表类型;如果变量数据类型为定量类型,根据变量数据的数量、以及样本量,确定图表类型。7.一种智能在线绘图系统,其特征在于,包括:样本数据处理单元,被配置成在获取到样本数据后进行结构化处理,将样本数据中对应不同字段的变量进行分类,得到属于不同类型的变量,其中,变量的字段在页面的待选区显示以实现通过字段调用变量;调用单元,被配置成检测页面的检测区是否有被调用的变量所对应的字段输入;图表生成单元,被配置成如果检测到有被输入,基于被调用的变量在页面的显示区域智能生成预设类型的图表。8.根据权利要求7所述的智能在线绘图系统,其特征在于,如果检测到有被输入之后,确定变量所对应的行维度、或列维度。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-6任意一项所述的智能在线绘图方法。10.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-6任意一项所述的智能在线绘图方法。
技术总结本公开实施例公开了一种智能在线绘图方法及系统,方法包括:在获取到样本数据后进行结构化处理,将样本数据中对应不同字段的变量进行分类,得到属于不同类型的变量,其中,变量的字段在页面的待选区显示以实现通过字段调用变量;检测页面的检测区是否有被调用的变量所对应的字段输入;如果检测到有被输入,基于被调用的变量在页面的显示区域智能生成预设类型的图表。通过在线交互的方式智能化地生成推荐图表,简化了交互式绘图的过程,提高了绘图效率,降低了绘图难度。且能够生成符合样本数据的最优推荐图表,进而解决了相关技术中绘图方式复杂,绘图效率低一级绘图难度大的问题。题。题。
技术研发人员:敬金山 汪建豪 李欢 方浩澄 郁军海 张超鑫
受保护的技术使用者:上海众言网络科技有限公司
技术研发日:2022.07.25
技术公布日:2022/11/1