1.本发明涉及基因检测技术领域,具体而言,涉及一种基因数据的解压方法、系统、电子设备及计算机存储介质。
背景技术:2.基因检测是通过血液、其他体液或细胞对dna进行检测的技术,是取被检测者外周静脉血或其他组织细胞,扩增其基因信息后,通过特定设备对被检测者细胞中的dna分子信息作检测,分析它所含有的基因类型和基因缺陷及其表达功能是否正常的一种方法,从而使人们能了解自己的基因信息,明确病因或预知身体患某种疾病的风险。
3.为了提高基因数据的传输效率,现有技术中的基因数据可经过数据压缩处理的,基因检测机构的分析人员需要对经过压缩的基因数据进行解压缩之后再进行使用。然而,对基因数据进行压缩处理虽然提高了基因数据的传输效率,但在基因数据的解压缩及使用方面存在较多安全隐患。通过压缩包加密虽然可以在一定程度上提升数据使用的安全性,但是解压密码容易在使用过程中遭到泄露,而且基因分析人员需要事先记忆或手动获取解压密码,基因数据的使用效率较低。
4.经过上述分析可以得知,现有的基因数据解压技术无法在数据安全和使用便利性上达到平衡,难以满足基因数据分析人员的实际需要。
技术实现要素:5.为了至少解决上述背景技术中存在的技术问题,本发明提供了一种基因数据的解压方法、系统、电子设备及计算机存储介质。
6.本发明的第一方面提供了一种基因数据的解压方法,包括如下步骤:
7.响应于对基因数据压缩包的解压请求,获取请求人员的第一权限数据;
8.根据所述第一权限数据确定所述请求人员的第二权限数据;
9.根据所述第一权限数据、所述第二权限数据确定解压方案;
10.根据所述解压方案对基因数据压缩包进行解压,以使所述请求人员获得所述基因数据。
11.进一步地,所述获取请求人员的第一权限数据,包括:
12.接收所述请求人员手动输入的身份数据,或者,接收所述请求人员通过扫描设备输入的身份数据;
13.根据所述身份数据和第一关联关系获取岗位属性数据,将所述岗位属性数据作为所述第一权限数据。
14.进一步地,所述根据所述第一权限数据确定所述请求人员的第二权限数据,包括:
15.根据所述第一权限数据与第二关联关系确定关联场所数据、关联设备数据;
16.将所述关联场所数据和/或所述关联设备数据作为所述第二权限数据。
17.进一步地,所述根据所述第一权限数据、所述第二权限数据确定解压方案,包括:
18.获取所述基因数据压缩包的基因数据属性数据;
19.将所述基因数据属性数据与所述第一权限数据和/或所述第二权限数据输入分析模型,所述分析模型输出第一匹配度值;
20.若所述第一匹配度值大于或等于第一阈值,则根据所述第一权限数据和/或所述第二权限数据确定所述基因数据压缩包中匹配的目标基因数据;
21.将所述目标基因数据设置为可解压状态,以得出解压方案。
22.进一步地,所述方法还包括对所述分析模型进行训练的步骤:
23.获取历史解压数据以构建训练数据集,所述历史解压数据包括历史基因数据属性数据、历史第一权限数据、历史第二权限数据;
24.将所述训练数据集输入所述分析模型以进行训练,其中,训练过程中采用如下损失函数:
[0025][0026]
式中,f
loss
为损失函数,f0为基础损失函数,λ为训练数据集中历史基因数据属性数据与所述历史第一权限数据和所述历史第二权限数据的人工标注的数据量;m为训练数据集中历史基因数据属性数据与所述历史第一权限数据的人工标注的数据量;n为训练数据集中历史基因数据属性数据与所述历史第二权限数据的人工标注的数据量;ωi为训练数据集中历史基因数据属性数据与历史第一权限数据和历史第二权限数据的人工标注的置信度系数,0《ωi《1,j为该人工标注的数量。
[0027]
进一步地,若所述第一匹配度值小于第一阈值,则:
[0028]
获取请求人员的第三权限数据,所述第三权限数据为历史数据中与所述第一匹配度值小于所述第一阈值且确定了所述解压方案的所述解压请求对应的历史基因数据属性数据;
[0029]
计算所述基因数据属性数据与所述历史基因数据属性数据的第二匹配度值;
[0030]
若所述第二匹配度值大于或等于第二阈值,则使用修正系数对所述第一匹配度值进行修正,并再次判断修正后的所述第一匹配度值是否大于或等于所述第一阈值:
[0031]
若是,则根据所述第一权限数据和/或所述第二权限数据确定所述基因数据压缩包中匹配的所述目标基因数据;将所述目标基因数据设置为可解压状态,以得出解压方案;
[0032]
若否,则输出解压失败的提示信息,和/或,输出请求解压权限授权的提示信息,并根据与所述请求解压权限授权的反馈信息决定是否生成解压方案。
[0033]
进一步地,所述修正系数通过如下方式确定:
[0034]
计算所述第二匹配度值大于或等于第二阈值的若干所述历史基因数据属性数据之间的第三匹配度值,计算所有所述第三匹配度值的稳定性值,根据所述稳定性值确定所述修正系数,其中,所述修正系数与所述稳定性值正相关。
[0035]
本发明的第二方面提供了一种基因数据的解压系统,包括获取模块、处理模块、存储模块;所述处理模块与所述获取模块、所述存储模块连接;
[0036]
所述存储模块,用于存储可执行的计算机程序代码;
[0037]
所述获取模块,用于获取历史日志数据、实时日志数据并传输给所述处理模块;
[0038]
所述处理模块,用于通过调用所述存储模块中的所述可执行的计算机程序代码,
执行如前任一项所述的方法。
[0039]
本发明的第三方面提供了一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,执行如前任一项所述的方法。
[0040]
本发明的第四方面提供了一种计算机存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上任一项所述的方法。
[0041]
本发明的方案,响应于对基因数据压缩包的解压请求,获取请求人员的第一权限数据;根据所述第一权限数据确定所述请求人员的第二权限数据;根据所述第一权限数据、所述第二权限数据确定解压方案;根据所述解压方案对基因数据压缩包进行解压,以使所述请求人员获得所述基因数据。本发明的方案无需请求人员记忆或手动获取解压密码,能够基于与请求人员相关的权限数据自动确定合理的解压方案并执行,极大地提高了基因数据的使用效率及数据安全性。
附图说明
[0042]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0043]
图1是本发明实施例公开的一种基因数据的解压方法的流程示意图;
[0044]
图2是本发明实施例公开的一种基因数据的解压系统的结构示意图;
[0045]
图3是本发明实施例公开一种电子设备的结构示意图。
具体实施方式
[0046]
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0047]
在本技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术。在本技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
[0048]
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0049]
应当理解,尽管在本技术实施例中可能采用术语第一、第二、第三等来描述
……
,但这些
……
不应限于这些术语。这些术语仅用来将
……
区分开。例如,在不脱离本技术实施例范围的情况下,第一
……
也可以被称为第二
……
,类似地,第二
……
也可以被称为第一
……
。
[0050]
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如
果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
[0051]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
[0052]
下面结合附图详细说明本发明的优选实施例。
[0053]
实施例一
[0054]
请参阅图1,图1是本发明实施例公开的一种基因数据的解压方法的流程示意图。如图1所示,本发明实施例的一种基因数据的解压方法,包括如下步骤:
[0055]
响应于对基因数据压缩包的解压请求,获取请求人员的第一权限数据;
[0056]
根据所述第一权限数据确定所述请求人员的第二权限数据;
[0057]
根据所述第一权限数据、所述第二权限数据确定解压方案;
[0058]
根据所述解压方案对基因数据压缩包进行解压,以使所述请求人员获得所述基因数据。
[0059]
在本发明实施例中,针对背景技术中提到的上述技术问题,本发明设计了在接收到基因数据分析人员对基因数据压缩包的解压请求之后,依次获取请求人员的第一权限数据、第二权限数据,根据第一权限数据、第二权限数据确定出合理的解压方案,进而使得基因数据分析人员可以获取到解压后的基因数据。于是,本发明的方案无需请求人员记忆或手动获取解压密码,能够基于与请求人员相关的权限数据自动确定合理的解压方案并执行,极大地提高了基因数据的使用效率及数据安全性。
[0060]
需要进行说明的是,本发明的方案可以实施于基因数据分析人员所使用的终端设备上,也可以实施于与所述终端设备连接的服务器上。其中,终端设备包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台等,还可以是各类移动属性设备,例如手机、平板电脑、可穿戴设备、虚拟现实/增强现实设备等;以及,服务器包括但不限于独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。以及,终端设备与服务器之间可以通过任何合适的网络协议进行通信,包括在本技术提交日尚未开发出的网络协议。网络协议例如可以包括tcp/ip协议、udp/ip协议、http协议、https协议等。当然,网络协议例如还可以包括在上述协议之上使用的rpc协议(remote procedure call protocol,远程过程调用协议)、rest协议(representational state transfer,表述性状态转移协议)等。
[0061]
进一步地,所述获取请求人员的第一权限数据,包括:
[0062]
接收所述请求人员手动输入的身份数据,或者,接收所述请求人员通过扫描设备输入的身份数据;
[0063]
根据所述身份数据和第一关联关系获取岗位属性数据,将所述岗位属性数据作为
所述第一权限数据。
[0064]
在本发明实施例中,请求人员在对基因数据压缩包进行解压操作时,系统可以获得解压请求,此时可输出提示请求人员输入身份数据的信息,接着,请求人员可以通过手动输入或者扫描设备向系统输入身份数据,而身份数据与岗位属性数据预设有第一关联关系,通过匹配计算即可确定出与输入的身份数据对应的岗位属性数据,将其作为第一权限数据。其中,岗位属性数据包括行政人员、管理人员、技术人员等,行政人员明显不具有基因数据的访问权限,部分管理人员和技术人员则具有针对特定基因数据的访问权限。
[0065]
需要进行说明的是,手动输入包括但不限于按键输入、触屏输入、语音输入等,而扫描设备既可以为接触式的读卡设备(例如rfid读卡器、nfc读卡器等)、指纹扫描器,也可以包括非接触式的虹膜扫描器、人脸识别器等。
[0066]
进一步地,所述根据所述第一权限数据确定所述请求人员的第二权限数据,包括:
[0067]
根据所述第一权限数据与第二关联关系确定关联场所数据、关联设备数据;
[0068]
将所述关联场所数据和/或所述关联设备数据作为所述第二权限数据。
[0069]
在本发明实施例中,如前所述,管理人员和技术人员虽然具有的是针对特定基因数据的访问权限,此时仍需要进一步分析管理人员和技术人员对当前待解压的基因数据压缩包权限;同时,基因分析包括不同的项目类别,而不同的项目类别又与不同的场所(检测实验室类别)、设备具有第二关联关系。于是,本发明利用第一权限数据(即岗位属性数据)和第二关联关系确定出与对应岗位关联的场所数据、设备数据,进而得出第二权限数据,从而综合利用第一权限数据、第二权限数据来分析请求人员对当前待解压的基因数据压缩包的解压权限,使得解压权限分析结果更为准确。
[0070]
需要进行说明的是,第一关联关系和第二关联关系可以是由相关人员根据实际的人员情况而预先设定的。
[0071]
进一步地,所述根据所述第一权限数据、所述第二权限数据确定解压方案,包括:
[0072]
获取所述基因数据压缩包的基因数据属性数据;
[0073]
将所述基因数据属性数据与所述第一权限数据和/或所述第二权限数据输入分析模型,所述分析模型输出第一匹配度值;
[0074]
若所述第一匹配度值大于或等于第一阈值,则根据所述第一权限数据和/或所述第二权限数据确定所述基因数据压缩包中匹配的目标基因数据;
[0075]
将所述目标基因数据设置为可解压状态,以得出解压方案。
[0076]
在本发明实施例中,基因数据压缩包中除了包括原始的各类型基因数据以外,还可以包括无权限或低权限要求访问的说明数据,说明数据包括基因检测项目,以及压缩包中所包括的基因数据的类型及种类的说明,其实际上可以构成压缩包中基因数据的目录。继而,将基因数据属性数据与第一权限数据和/或第二权限数据输入到经过训练的分析模型,分析模型即可输出请求人员对于解压基因数据压缩包的权限匹配度值,并在具有解压权限时,可以将基因数据压缩包中部分基因数据设置为可解压状态,此时即可将可解压状态的基因数据进行解压,以供请求人员查看使用。
[0077]
于是,本发明的方案可以根据请求人员与基因数据压缩包中基因数据的权限匹配度值来确定请求人员是否具有解压权限,相比于现有技术来说,避免了用户记忆或手动获取解压密码的繁琐、低效,提升了基因数据分析人员对基因数据的使用效率。而且,在确定
了基因数据的解压权限之后,本发明的方案还能够进一步确定出基因数据中的哪些数据是有用的、必须的,并仅对这些数据解压给请求人员,从而确保了基因数据的安全性。
[0078]
其中,基因数据压缩包可以包括多个人员的基因检测数据,可以将第一匹配度值大于或等于第一阈值的所有基因检测数据设置为潜在可解压状态,在此基础上,还可以再基于第一权限数据和/或第二权限数据进行二次匹配计算,从而确定出针对于当前请求人员的最终的目标基因数据。当然,对于一些敏感客户的基因检测数据,还可以设置特别的权限,本发明对此不作具体限定。
[0079]
需要进行说明的是,分析模型由深度学习算法构建,例如卷积神经网络算法(cnn)、受限玻尔兹曼机(rbm)、自动编码器(ae)、循环神经网络(rnn)等,本发明对此可不做限定。
[0080]
进一步地,所述方法还包括对所述分析模型进行训练的步骤:
[0081]
获取历史解压数据以构建训练数据集,所述历史解压数据包括历史基因数据属性数据、历史第一权限数据、历史第二权限数据;
[0082]
将所述训练数据集输入所述分析模型以进行训练,其中,训练过程中采用如下损失函数:
[0083][0084]
式中,f
loss
为损失函数,f0为基础损失函数,λ为训练数据集中历史基因数据属性数据与所述历史第一权限数据和所述历史第二权限数据的人工标注的数据量;m为训练数据集中历史基因数据属性数据与所述历史第一权限数据的人工标注的数据量;n为训练数据集中历史基因数据属性数据与所述历史第二权限数据的人工标注的数据量;ωi为训练数据集中历史基因数据属性数据与历史第一权限数据和历史第二权限数据的人工标注的置信度系数,0《ωi《1,j为该人工标注的数量。
[0085]
在本发明实施例中,由于本发明的训练数据集中的数据是将历史基因数据属性数据与历史第一权限数据和/或历史第二权限数据分别进行人工标注得出,也即,本发明使用了三类数据来训练分析模型;同时,三类数据中历史基因数据属性数据与历史第一权限数据和历史第二权限数据所组成的训练数据具有更高的可信度,其更能反映工作人员与基因数据压缩包的基因数据的权限匹配情况。针对上述情况,本发明设计了上述损失函数,除了使用基础损失函数以外,还设置了调节部分,即使用历史基因数据属性数据与历史第一权限数据和历史第二权限数据所共同组成的训练数据的数据量和对应的置信度系数来对损失函数进行调节,使得分析模块建立起基因数据属性数据与权限数据之间更为准确的函数关系。另外,由于调节部分本身数值很小,所以,其并不会影响分析模型对其它两种单一情况的函数关系建立的准确性。
[0086]
需要进行说明的是,置信度系数ωi可以基于基因数据属性数据与各类型权限数据之间的关联关系或组合置信关系所涉及的经验值来确定,本发明对此可不作限定。以及,基础损失函数f0可以采用下述损失函数中的至少一种:
[0087]
1)
[0088]
式中,n为训练数据集中的训练数据的数量,yi为实际的分析模型的输出值,y
′i为
预测的分析模型的输出值。
[0089]
2)
[0090]
式中,n为训练数据集中的训练数据的数量,yi为实际的分析模型输出值,y
′i为预测的分析模型输出值。
[0091]
进一步地,若所述第一匹配度值小于第一阈值,则:
[0092]
获取请求人员的第三权限数据,所述第三权限数据为历史数据中与所述第一匹配度值小于所述第一阈值且确定了所述解压方案的所述解压请求对应的历史基因数据属性数据;
[0093]
计算所述基因数据属性数据与所述历史基因数据属性数据的第二匹配度值;
[0094]
若所述第二匹配度值大于或等于第二阈值,则使用修正系数对所述第一匹配度值进行修正,并再次判断修正后的所述第一匹配度值是否大于或等于所述第一阈值:
[0095]
若是,则根据所述第一权限数据和/或所述第二权限数据确定所述基因数据压缩包中匹配的所述目标基因数据;将所述目标基因数据设置为可解压状态,以得出解压方案;
[0096]
若否,则输出解压失败的提示信息,和/或,输出请求解压权限授权的提示信息,并根据与所述请求解压权限授权的反馈信息决定是否生成解压方案。
[0097]
在本发明实施例中,虽然请求人员的解压请求是合理的,但多种客观情况会导致第一匹配度值小于第一阈值。例如,该请求人员所在的基因数据分析单位/公司某些设备不齐全(需要与其它公司合作进行基因数据分析),或者新增基因检测项目所对应的设备尚未到厂或投入使用,导致请求人员的第二关联关系中并不存在与基因数据压缩包对应的关联设备数据,也即导致第一匹配度值小于第一阈值。
[0098]
有鉴于此,本发明进一步获取请求人员的第三权限数据,第三权限数据是虽然第一匹配度值小于第一阈值但最终成功实现了解压的历史数据所对应的历史基因数据属性数据,然后再将本次的基因数据属性数据与历史基因数据属性数据进行匹配度分析,如果匹配度分析成功,则说明该请求人员虽然客观上未关联与待解压的基因数据压缩包所必需的关联场所数据、关联设备数据,但这是由于前述原因导致的,其实际是具有解压权限的。于是,经过本发明的上述对第一匹配度值的修正,即可使得该请求人员成功实现解压,即便经过修正之后的第一匹配度值仍然无法满足要求,也可以通过提示请求人员向更高权限的管理人员发出请求解压权限授权来实现解压,当然,该情况的记录数据也会被作为历史数据以用于后续的修正。
[0099]
另外,采用下式计算所述基因数据属性数据与所述历史基因数据属性数据的第二匹配度值:
[0100]
sj=α0s0+α1s1+
…
+αnsn[0101]
式中,sj为所述基因数据属性数据与第j个所述历史基因数据属性数据的第二匹配度值;sn为所述基因数据属性数据的第n个特征参数与第j个所述历史基因数据属性数据的第n个特征参数的匹配度值;αn为权重系数,α0+α1+
…
+αn=1。
[0102]
需要进行说明的是,特征参数并非是所涉及的属性数据中的原始数据,而是经过归一化处理之后的数据。举例来说,可将基因数据属性数据分为两个部分,即基因检测项目名称部分、基因数据部分,其中,基因检测项目名称部分可不进行归一化处理,直接计算相似度即可;而基因数据部分,则可以从原始数据中提取出数据量(客户数量、数据总的字符
量等),基因数据属性,基因数据的性别属性,与基因数据对应的关联场所数据及关联设备数据的匹配状态等,以上数据能够反映出与基因检测项目名称的从属关联关系,以及请求人员所在公司/单位对应于对应基因检测项目名称的设备配备情况。通过上述归一化处理之后,即可直接计算基因数据属性数据与各历史基因数据属性数据的第二匹配度值。
[0103]
另外,关于权重系数,可以先根据基因检测项目名称部分来确定α0,即若基因检测项目名称部分的相似度高于第一设定值,则可确定α0为第一高值,而若低于第二设定值,则可确定α0为第二低值,其它情况默认设置为第三中值。接着,再基于基因数据部分所对应的上述各归一化后的参数与基因检测项目名称部分的关联紧密度来依序确定出α
1-αn的值,具体确定方式不再赘述。
[0104]
需要进行说明的是,其中所涉及的相似度可通过欧氏距离、曼哈顿距离、汉明距离等算法计算得出,本发明对此不作具体限定。
[0105]
进一步地,修正系数通过如下方式确定:
[0106]
计算所述第二匹配度值大于或等于第二阈值的若干所述历史基因数据属性数据之间的第三匹配度值,计算所有所述第三匹配度值的稳定性值,根据所述稳定性值确定所述修正系数,其中,所述修正系数与所述稳定性值正相关。
[0107]
在本发明实施例中,匹配成功的历史基因数据属性数据存在多个时,可以计算这些历史基因数据属性数据两两之间的第三匹配度值,再对所有第三匹配度值进行稳定性分析(例如均值、方差、标准差及其各种改进方式等),稳定性越高则说明当前的基因检测项目比较常规,该请求人员的解压权限的合理性越高,相对应的,设置修正系数越高,从而提高第一匹配度值大于或等于第一阈值的可能性;反之,则说明当前的基因检测项目并非常规项目,该请求人员本次的解压请求的合理性越低,相对应的,设置修正系数越低,以避免错误的解压权限判定。
[0108]
需要进行说明的是,第一匹配度值和第三匹配度值可以采用与第二匹配度值相同的计算方式,也可以采用比第二匹配度值更为简单的现有技术中的匹配度计算方式,本发明对此可不做限定。
[0109]
实施例二
[0110]
请参阅图2,图2是本发明实施例公开的一种基因数据的解压系统的结构示意图。如图2所示,本发明实施例的一种基因数据的解压系统,包括获取模块(101)、处理模块(102)、存储模块(103);所述处理模块(102)与所述获取模块(101)、所述存储模块(103)连接;
[0111]
所述存储模块(103),用于存储可执行的计算机程序代码;
[0112]
所述获取模块(101),用于请求人员的权限数据,并传输给所述处理模块(102);
[0113]
所述处理模块(102),用于通过调用所述存储模块(103)中的所述可执行的计算机程序代码,执行如前任一项所述的方法。
[0114]
该实施例中的一种基因数据的解压系统的具体功能参照上述实施例一,由于本实施例中的系统采用了上述实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
[0115]
实施例三
[0116]
请参阅图3,图3是本发明实施例公开的一种电子设备,包括:存储有可执行程序代
码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,执行如实施例一所述的方法。
[0117]
实施例四
[0118]
本发明实施例还公开了一种计算机存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如实施例一所述的方法。
[0119]
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是,但不限于,电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。
[0120]
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、系统或者器件使用或者与其结合使用的程序。
[0121]
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括、但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0122]
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0123]
注意,上述仅为本发明的较佳实施例及所运用的技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明的构思的情况下,还可以包括更多其他等效实施例,均属于本发明的保护范畴。
技术特征:1.一种基因数据的解压方法,其特征在于,包括如下步骤:响应于对基因数据压缩包的解压请求,获取请求人员的第一权限数据;根据所述第一权限数据确定所述请求人员的第二权限数据;根据所述第一权限数据、所述第二权限数据确定解压方案;根据所述解压方案对基因数据压缩包进行解压,以使所述请求人员获得所述基因数据。2.根据权利要求1所述的一种基因数据的解压方法,其特征在于:所述获取请求人员的第一权限数据,包括:接收所述请求人员手动输入的身份数据,或者,接收所述请求人员通过扫描设备输入的身份数据;根据所述身份数据和第一关联关系获取岗位属性数据,将所述岗位属性数据作为所述第一权限数据。3.根据权利要求1或2所述的一种基因数据的解压方法,其特征在于:所述根据所述第一权限数据确定所述请求人员的第二权限数据,包括:根据所述第一权限数据与第二关联关系确定关联场所数据、关联设备数据;将所述关联场所数据和/或所述关联设备数据作为所述第二权限数据。4.根据权利要求3所述的一种基因数据的解压方法,其特征在于:所述根据所述第一权限数据、所述第二权限数据确定解压方案,包括:获取所述基因数据压缩包的基因数据属性数据;将所述基因数据属性数据与所述第一权限数据和/或所述第二权限数据输入分析模型,所述分析模型输出第一匹配度值;若所述第一匹配度值大于或等于第一阈值,则根据所述第一权限数据和/或所述第二权限数据确定所述基因数据压缩包中匹配的目标基因数据;将所述目标基因数据设置为可解压状态,以得出解压方案。5.根据权利要求4所述的一种基因数据的解压方法,其特征在于:所述方法还包括对所述分析模型进行训练的步骤:获取历史解压数据以构建训练数据集,所述历史解压数据包括历史基因数据属性数据、历史第一权限数据、历史第二权限数据;将所述训练数据集输入所述分析模型以进行训练,其中,训练过程中采用如下损失函数:式中,f
loss
为损失函数,f0为基础损失函数,λ为训练数据集中历史基因数据属性数据与所述历史第一权限数据和所述历史第二权限数据的人工标注的数据量;m为训练数据集中历史基因数据属性数据与所述历史第一权限数据的人工标注的数据量;n为训练数据集中历史基因数据属性数据与所述历史第二权限数据的人工标注的数据量;ω
i
为训练数据集中历史基因数据属性数据与历史第一权限数据和历史第二权限数据的人工标注的置信度系数,0<ω
i
<1,j为该人工标注的数量。6.根据权利要求4或5所述的一种基因数据的解压方法,其特征在于:若所述第一匹配
度值小于第一阈值,则:获取请求人员的第三权限数据,所述第三权限数据为历史数据中与所述第一匹配度值小于所述第一阈值且确定了所述解压方案的所述解压请求对应的历史基因数据属性数据;计算所述基因数据属性数据与所述历史基因数据属性数据的第二匹配度值;若所述第二匹配度值大于或等于第二阈值,则使用修正系数对所述第一匹配度值进行修正,并再次判断修正后的所述第一匹配度值是否大于或等于所述第一阈值:若是,则根据所述第一权限数据和/或所述第二权限数据确定所述基因数据压缩包中匹配的所述目标基因数据;将所述目标基因数据设置为可解压状态,以得出解压方案;若否,则输出解压失败的提示信息,和/或,输出请求解压权限授权的提示信息,并根据与所述请求解压权限授权的反馈信息决定是否生成解压方案。7.根据权利要求6所述的一种基因数据的解压方法,其特征在于:所述修正系数通过如下方式确定:计算所述第二匹配度值大于或等于第二阈值的若干所述历史基因数据属性数据之间的第三匹配度值,计算所有所述第三匹配度值的稳定性值,根据所述稳定性值确定所述修正系数,其中,所述修正系数与所述稳定性值正相关。8.一种基因数据的解压系统,包括获取模块、处理模块、存储模块;所述处理模块与所述获取模块、所述存储模块连接;所述存储模块,用于存储可执行的计算机程序代码;所述获取模块,用于获取历史日志数据、实时日志数据并传输给所述处理模块;其特征在于:所述处理模块,用于通过调用所述存储模块中的所述可执行的计算机程序代码,执行如权利要求1-7任一项所述的方法。9.一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;其特征在于:所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7任一项所述的方法。10.一种计算机存储介质,该存储介质上存储有计算机程序,其特征在于:该计算机程序被处理器运行时执行如权利要求1-7任一项所述的方法。
技术总结本发明提供了一种基因数据的解压方法及系统;其中,所述方法包括:响应于对基因数据压缩包的解压请求,获取请求人员的第一权限数据;根据所述第一权限数据确定所述请求人员的第二权限数据;根据所述第一权限数据、所述第二权限数据确定解压方案;根据所述解压方案对基因数据压缩包进行解压,以使所述请求人员获得所述基因数据。本发明的方案无需请求人员记忆或手动获取解压密码,能够基于与请求人员相关的权限数据自动确定合理的解压方案并执行,极大地提高了基因数据的使用效率及数据安全性。性。性。
技术研发人员:刘晓明 石传煜 王冠
受保护的技术使用者:蔓之研(上海)生物科技有限公司
技术研发日:2022.05.18
技术公布日:2022/11/1