所属的技术人员能够理解,本发明提供的基于多元非线性回归模型预测ssd最佳电压轴的方法各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。在储存实现碳排放检测的电能采集设备的元器件比对方法的非暂态计算机可读存储介质中,可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。
背景技术:
1、ssd,是solid state drive的简称,固态硬盘。
2、pe,是program and erase的简称,表示一次数据的写入和擦除过程。
3、ret,是retention的简称,表示数据存储在ssd中之后存放的时间。
4、ssd采用闪存颗粒作为核心组件,闪存颗粒类型主要包括slc、mlc、tlc、qlc和plc五种。作为市场上最常见的闪存颗粒类型的tlc,是trinal-level cell的简称,是三层式存储,每单元可存储3bit信息。tlc在读取数据时由7个电压轴来确定存储单元存储的具体数据,但随着擦写pe和存放时间ret的变化,存储单元的电子发生变化,出厂设定的默认电压轴不再是区分存储单元数据的最佳电压轴,造成读取数据错误,如果错误数超过一定值,则无法通过校验算法还原数据,造成数据永久丢失,因此需要重新确定新的最佳电压轴保证读取数据的准确。
5、目前确定ssd最佳电压轴的方式主要有穷举法和frt方式。例如穷举法可对每个电压轴vthn设立32个间隔,每间隔2mv尝试(vthn+2mv)……(vthn+32mv)以及(vthn-2mv)……(vthn-32mv)这32个不同电压,直到找到最合适的电压轴,此种方式显然工作量比较大,浪费资源,不可取。而frt方式通过表格对数据中不同pe和ret的历史规律进行展示并记录最佳电压轴,一定程度上避免了穷举的资源浪费,但仍然需要人工识别规律,并且数据跨度大,工作量仍然较大。
6、因此,针对上述缺陷,提供一种基于多元非线性回归模型预测ssd最佳电压轴的方法、系统、设备及介质,是非常有必要的。
技术实现思路
1、针对穷举方式确定ssd的最佳电压轴显然工作量比较大,浪费资源,不可取。而frt方式通过表格对数据中不同pe和ret的历史规律进行展示并记录最佳电压轴,一定程度上避免了穷举的资源浪费,但仍然需要人工识别规律,并且数据跨度大,工作量仍然较大的缺陷,本发明提供一种基于多元非线性回归模型预测ssd最佳电压轴的方法、系统、设备及介质,以解决上述技术问题。第一方面,本发明提供一种基于多元非线性回归模型预测ssd最佳电压轴的方法,包括如下步骤:
2、s1.启动ssd硬盘测试,使用不同电压轴采集不同pe值、不同ret值下的数据读取错误数;
3、s2.对采集数据进行清洗、化简及数据归一化,生成数据样本;
4、s3.基于数据样本确定模型特征,并根据确定的模型特征构建多元非线性回归模型,并导入数据样本进行拟合,得到ssd电压轴预测模型及预测ssd电压轴;s4.使用评估函数对预测的ssd电压轴进行评估,并在评估通过后,将预测的ssd电压轴作为最佳电压轴进行输出。
5、进一步地,步骤s1具体步骤如下:
6、s11.通过nand flash测试软件对ssd硬盘进行测试;
7、s12.将不同pe值以及不同pet值进行组合作为不同测试条件;
8、s13.将7个电压轴按照设定方式进行穷举并组合作为不同读取电压;
9、s14.生成随机数,将随机数按照各测试条件写入ssd硬盘进行存放后使用各读取电压进行读取,识别每个测试条件下各读取电压的读取错误数,并将读取错误数、对应测试条件中pe值、pet值以及读取电压作为采集数据进行记录。进一步地,步骤s12具体步骤如下:
10、s121.预先设定n个的数据一次写入个数pe值,并将各pe值按大小顺序排列生成pe序列;
11、s122.预先设定m个数据存放时间pet值,并将各pet值按大小顺序排列生成pet序列;
12、s123.将不同pe序列与不同pet序列进行组合得到n*m个测试条件组合;步骤s13具体步骤如下:
13、s131.获取7个电压轴的默认阈值电压,对每个电压轴基于默认阈值电压按照设定步长δv和数量p进行穷举,得到每个电压轴的设定数量的扩展电压序列;s132.从7个扩展电压序列中分别选取扩展电压进行组合得到p7个读取电压的组合。
14、进一步地,步骤s14具体步骤如下:
15、s141.按照预先设定的数据量生成随机数;
16、s142.在nand flash测试软件选择一个测试条件组合;
17、s143.确定选择的测试条件组合的pe值作为测试pe值以及选择的测试条件组合的pet值作为测试pet值;
18、s144.按照测试pe值将随机数写入ssd硬盘并按照测试pet值保存,并记录写入数据为原数据;
19、s145.在nand flash测试软件选择一个读取电压的组合作为测试读取电压;
20、s146.使用测试读取电压进行数据读取,比较读取数据与原数据的读取错误数并作为采集数据进行记录;
21、s147.判断p7个读取电压的组合是否选择完毕;
22、若是,进入步骤s148;
23、若否,选择下一个读取电压的组合,返回步骤s146;
24、s148.判断n*m个测试条件组合是否选择完毕;
25、若是,进入步骤s2;
26、若否,选择下一个测试条件组合,返回步骤s143。
27、进一步地,步骤s2具体步骤如下:
28、s21.在nand flash测试软件对采集数据进行处理,计算均值,使用均值计算标准差;
29、s22.根据预先设定的阈值系数和标准差的乘积确定阈值;
30、s23.遍历采集数据,将与标准差的偏差超过确定的阈值的异常数据,并去除异常数据;
31、s24.对去除异常数据后的采集数据中属于ssd硬盘每一页的读取错误数进行统计,再将属于ssd硬盘的每一存储块的各页的读取错误数进行统计,将读取错误数最大的页作为存储块的读取错误数,完成采集数据化简;
32、s25.将化简的采集数据中的读取错误数与对应测试条件中pe值、pet值及读取电压进行归一化处理,消除不同量纲的影响,将归一化后采集数据作为数据样本。
33、进一步地,步骤s3具体步骤如下:
34、s31.对数据样本进行分析确定作为模型特征的多项式阶数;
35、s32.使用确定的多项式阶数创建多项式特征转化器,将采集数据的测试条件中pe值及pet值作为输入变量,将每个电压轴的扩展电压范围作为偏移量,将读取电压组合中每个电压轴分别作为输出变量,构建7个多项式;
36、s33.创建线性回归函数,并使用管道将7个多项式分别与线性回归函数得到7个多元非线性回归模型;
37、s34.导入数据样本对7个多元非线性回归模型分别进行拟合,得到7个多元非线性回归模型的各项系数,得到7个ssd电压轴预测模型;
38、s35.使用确定的pe值及pet值的测试条件进行ssd硬盘测试,向ssd硬盘写入数据,并将确定的pe值及pet值分别输入7个ssd电压轴预测模型中进行预测,得到7个预测的电压轴,并将7个预测的电压轴进行组合作为预测的读取电压。
39、进一步地,步骤s4具体步骤如下:
40、s41.使用穷举法获取7个实际修正的电压轴,使用评估函数对每个预测电压轴与对应实际修正的电压轴进行评估;
41、s42.使用评估通过的7个预测的电压轴进行组合作为预测的读取电压;
42、s43.使用预测的读取电压进行ssd硬盘中数据读取,并将读取数据与原写入数据进行比对,识别第一读取错误数;
43、s44.使用穷举法的7个时间修正的电压轴进行组合作为实际的读取电压;
44、s45.使用实际的读取电压进行ssd硬盘中数据读取,并将读取数据与原写入数据进行比对,识别第二读取错误数;
45、s46.若第一读取错误数与第二读取错误数的偏差小于设定阈值时,将7个预测的电压轴作为最佳电压轴进行输出。
46、第二方面,本发明提供基于多元非线性回归模型预测ssd最佳电压轴的系统,包括:
47、ssd硬盘测试模块,用于启动ssd硬盘测试,使用不同电压轴采集不同pe、不同ret下的数据读取错误数;
48、数据处理模块,用于对采集数据进行清洗、化简及数据归一化,生成数据样本;模型构建及ssd电压轴预测模块,用于基于数据样本确定模型特征,并根据确定的模型特征构建多元非线性回归模型,并导入数据样本进行拟合,得到ssd电压轴预测模型及预测ssd电压轴;
49、最佳电压轴输出模块,用于使用评估函数对预测的ssd电压轴进行评估,并在评估通过后,将预测的ssd电压轴作为最佳电压轴进行输出。
50、进一步地,ssd硬盘测试模块包括:
51、测试启动单元,用于通过nand flash测试软件对ssd硬盘进行测试;
52、测试条件组合单元,用于将不同pe值以及不同pet值进行组合作为不同测试条件;
53、读取电压组合单元,用于将7个电压轴按照设定方式进行穷举并组合作为不同读取电压;
54、采集数据记录单元,用于生成随机数,将随机数按照各测试条件写入ssd硬盘进行存放后使用各读取电压进行读取,识别每个测试条件下各读取电压的读取错误数,并将读取错误数、对应测试条件中pe值、pet值以及读取电压作为采集数据进行记录。
55、进一步地,数据处理模块包括:
56、采集数据特征计算单元,用于在nand flash测试软件对采集数据进行处理,计算均值,使用均值计算标准差;
57、阈值确定单元,用于根据预先设定的阈值系数和标准差的乘积确定阈值;
58、异常数据去除单元,用于遍历采集数据,将与标准差的偏差超过确定的阈值的异常数据,并去除异常数据;
59、数据化简单元,用于对去除异常数据后的采集数据中属于ssd硬盘每一页的读取错误数进行统计,再将属于ssd硬盘的每一存储块的各页的读取错误数进行统计,将读取错误数最大的页作为存储块的读取错误数,完成采集数据化简;数据归一化处理单元,用于将化简的采集数据中的读取错误数与对应测试条件中pe值、pet值及读取电压进行归一化处理,消除不同量纲的影响,将归一化后采集数据作为数据样本。
60、进一步地,模型构建及ssd电压轴预测模块包括:
61、多项式阶数确定单元,用于对数据样本进行分析确定作为模型特征的多项式阶数;
62、多项式构建单元,用于使用确定的多项式阶数创建多项式特征转化器,将采集数据的测试条件中pe值及pet值作为输入变量,将每个电压轴的扩展电压范围作为偏移量,将读取电压组合中每个电压轴分别作为输出变量,构建7个多项式;
63、多元非线性回归模型拼接单元,用于创建线性回归函数,并使用管道将7个多项式分别与线性回归函数得到7个多元非线性回归模型;
64、模型拟合单元,用于导入数据样本对7个多元非线性回归模型分别进行拟合,得到7个多元非线性回归模型的各项系数,得到7个ssd电压轴预测模型;电压轴预测单元,用于使用确定的pe值及pet值的测试条件进行ssd硬盘测试,向ssd硬盘写入数据,并将确定的pe值及pet值分别输入7个ssd电压轴预测模型中进行预测,得到7个预测的电压轴,并将7个预测的电压轴进行组合作为预测的读取电压。
65、进一步地,最佳电压轴输出模块包括:
66、预测的电压轴评估单元,用于使用穷举法获取7个实际修正的电压轴,使用评估函数对每个预测电压轴与对应实际修正的电压轴进行评估;
67、预测的读取电压组合单元,用于使用评估通过的7个预测的电压轴进行组合作为预测的读取电压;
68、第一读取错误数识别单元,用于使用预测的读取电压进行ssd硬盘中数据读取,并将读取数据与原写入数据进行比对,识别第一读取错误数;
69、实际的读取电压组合单元,用于使用穷举法的7个时间修正的电压轴进行组合作为实际的读取电压;
70、第二读取错误数识别单元,用于使用实际的读取电压进行ssd硬盘中数据读取,并将读取数据与原写入数据进行比对,识别第二读取错误数;
71、最佳电压轴输出单元,用于若第一读取错误数与第二读取错误数的偏差小于设定阈值时,将7个预测的电压轴作为最佳电压轴进行输出。
72、第三方面,本发明提供一种电子设备,包括处理器和存储器;
73、其中,该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,使得电子设备执行第一方面所述的方法。
74、第四方面,本发明提供了一种存储介质,
75、所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。
76、本发明的有益效果在于:
77、本发明提供的基于多元非线性回归模型预测ssd最佳电压轴的方法、系统、设备及介质,通过将ssd硬盘测试与多元非线性回归模型结合实现ssd最佳电压轴的预测,避免了通过穷举尝试来获取最佳电压轴,提升了最佳电压轴确定效率。
78、此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
79、由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
1.一种基于多元非线性回归模型预测ssd最佳电压轴的方法,其特征在于,包括如下步骤:
2.如权利要求1所述的基于多元非线性回归模型预测ssd最佳电压轴的方法,其特征在于,步骤s1具体步骤如下:
3.如权利要求2所述的基于多元非线性回归模型预测ssd最佳电压轴的方法,其特征在于,步骤s12具体步骤如下:
4.如权利要求3所述的基于多元非线性回归模型预测ssd最佳电压轴的方法,其特征在于,步骤s14具体步骤如下:
5.如权利要求2所述的基于多元非线性回归模型预测ssd最佳电压轴的方法,其特征在于,步骤s2具体步骤如下:
6.如权利要求5所述的基于多元非线性回归模型预测ssd最佳电压轴的方法,其特征在于,步骤s3具体步骤如下:
7.如权利要求6所述的基于多元非线性回归模型预测ssd最佳电压轴的方法,其特征在于,步骤s4具体步骤如下:
8.一种基于多元非线性回归模型预测ssd最佳电压轴的系统,其特征在于,包括:
9.一种电子设备,其特征在于,包括处理器和存储器;
10.一种存储介质,其特征在于,