数据处理装置、数据处理方法和数据处理程序与流程

专利2024-05-12  87

1.本技术涉及数据处理装置、数据处理方法和数据处理程序。
背景技术
::2.近年来,随着互联网的发展和能够连接到互联网的装置的普及,装置中的各种数据由提供互联网服务的公司、开发和知道装置的公司等收集,并且用于服务改进、产品开发等。这些数据中的有用数据之一是关于使用该装置的个人用户的数据。存在关于个人用户的多种数据,诸如装置的使用方法和经由装置的互联网上的服务的使用状态。3.虽然这种关于个人用户的数据具有高利用价值,但是存在由于数据泄露、数据处理方法等侵犯用户的隐私的问题。因此,称为差分隐私的技术用于防止侵犯隐私(专利文献1)。4.差分隐私是使得可以在防止识别作为数据的核心的用户等的同时通过向收集的数据添加噪声来使用数据本身的技术。对“一些数据属于特定用户”的假设不能给出特定等级或更高的统计置信度。由于数学安全性甚至针对任意背景知识的攻击被给予,因此差分隐私具有定量地评估对隐私的影响的特征。即使在没有用户的同意的情况下收集数据的情况下,差分隐私的使用也允许防止侵犯用户隐私。差分隐私包括输出型差分隐私和本地型差分隐私。5.输出型差分隐私从装置收集原始数据并在云中构建的数据库中管理该数据。当访问数据库并且利用数据时,数据的用户添加噪声并且展现数据,从而保护用户的隐私。因为提供云服务的业务运营商管理原始数据,所以存在关于由收集的原始数据引起的用户的心理障碍、当数据泄露时业务运营商的业务风险等的担忧。6.本地型差分隐私是由用户具有的装置添加噪声并且在云中收集匿名化数据的方法。当利用数据时,可以从云获得去除了噪声的统计值。由于以匿名化的状态收集数据,用户的心理障碍低,并且商业运营者在数据泄露时的商业风险也小。7.引用列表8.专利文献9.专利文献1:rappor:randomizedaggregatableprivacy-preservingordinalresponse技术实现要素:10.本发明要解决的问题11.由于此类差分隐私在存在大量要收集的数据时更精确,因此通常假定存在大量要收集的数据。然而,根据数据的类型,可能不能收集大量的数据,并且对于这样的数据,存在不能适当地使用差分隐私的问题。12.鉴于这些点做出本技术,并且目的是提供数据处理装置、数据处理方法以及数据处理程序,该数据处理装置、数据处理方法以及数据处理程序即使在少量数据的情况下也可以通过将噪声加入数据中并且增加数据量来减小统计结果的误差。13.问题的解决方案14.为了解决上述问题,第一技术是一种数据处理装置,包括:噪声分布预测单元,被配置为预测通过在外部的噪声添加装置中将噪声添加到原始数据所产生的噪声添加数据中的噪声分布;以及增强处理单元,被配置为基于噪声分布的预测结果对噪声添加数据执行增强处理。15.此外,第二种技术是一种数据处理方法,包括:预测通过在外部的噪声添加装置中将噪声添加到原始数据所产生的噪声添加数据中的噪声的分布;以及基于噪声分布的预测结果对噪声添加数据执行增强处理。16.此外,第三技术是一种用于使计算机执行数据处理方法的数据处理程序,数据处理方法包括:预测通过在外部的噪声添加装置中将噪声添加到原始数据所产生的噪声添加数据中的噪声的分布;以及基于噪声分布的预测结果对噪声添加数据执行增强处理。附图说明17.[图1]是用于描述差分隐私的概况的示图。[0018][图2]是示出了样本大小、字典大小、以及误差之间的关系的一组曲线图。[0019][图3]图3a至图3e是示出数据分布与误差之间的关系的一组曲线图,并且图3f是示出数据分布的相对误差的曲线图。[0020][图4]是示出了数据分布与隐私指数之间的关系的曲线图。[0021][图5]为示出变化系数与相对误差之间的关系的曲线图。[0022][图6]是样本大小和噪声的说明图。[0023][图7]是示出数据处理系统10的配置的框图。[0024][图8]是示出使用初级网格覆盖日本的整个区域的状态的示图。[0025][图9]是示出终端装置100的配置的框图。[0026][图10]是示出噪声添加装置200的配置的框图。[0027][图11]是使用区域网格作为实例的低阶数据和高阶数据的说明图。[0028][图12]是使用区域网格作为实例对低阶数据和高阶数据添加噪声的说明图。[0029][图13]是示出服务器装置300的配置的框图。[0030][图14]是示出数据处理装置400的配置的框图。[0031][图15]是每个区域网格(数据类型)的计数值(样本大小)的说明图。[0032][图16]是示出噪声添加装置200中的处理的流程图。[0033][图17]是示出数据处理装置400中的处理的流程图。[0034][图18]是数据扩展处理的说明图。[0035][图19]是数据扩展处理的说明图。[0036][图20]是示出了噪声分布预测结果的曲线图。[0037][图21]是示出增强处理的流程图。[0038][图22]是通过增强处理添加噪声的计数值(样本大小)的说明图。[0039][图23]是示出了原始数据与增强数据之间的比较的曲线图。[0040][图24]图24a是原始数据和噪声添加数据的比较图,图24b是具有变化的噪声和具有均匀分布的噪声的比较图,图24c是原始数据和增强数据的比较图。具体实施方式[0041]下面将参考附图描述本技术的实施方式。注意,将按照以下顺序进行描述。[0042]《1.差分隐私的描述》[0043]《2.实施例》[0044][2-1.数据处理系统10的配置][0045][2-2.区域网格的描述][0046][2-3.终端装置100和噪声添加装置200的配置][0047][2-4.服务器装置300和数据处理装置400的配置][0048][2-5.噪声添加装置200中的处理][0049][2-6.数据处理装置400中的处理][0050]《3.变形例》[0051]《1.差分隐私的描述》[0052]首先,在描述本技术的实施方式之前,将描述在本技术中使用的差分隐私。差分隐私是使得可以通过向收集的数据添加噪声来在防止识别作为数据的核心的用户等的同时使用数据本身的技术。本技术使用用户具有的装置(对应于实施例的终端装置100)添加噪声的本地型差分隐私,并且通过云(对应于实施例的服务器装置300)收集匿名化数据。[0053]如图1的示意图所示,本地型差分隐私包括其中装置对数据进行编码以生成比特串v1的编码技术、根据比特串v1中的随机变量生成噪声添加数据v1’的噪声添加技术、收集噪声添加数据的聚合技术、从聚合数据中去除噪声的噪声去除技术(聚合技术和噪声去除技术经常同时执行,并且有时被统称为解码技术)、以及根据分析使用情况执行可视化处理的数据分析技术。[0054]在本技术中,当使用差分隐私时,“样本大小”、“字典大小”、以及“隐私指数”被用作主要参数。[0055]样本大小指示云收集的数据的总数。样本大小可以定义为“具有装置的用户的数量x从每个装置传输至云的数据的数量”。[0056]字典大小指示字典中包括的数据类型的总数。字典是针对指示数据分类的每个数据类型收集的数据集,并且对应于权利要求中的数据集。[0057]字典大小由数据类型的数量确定。例如,由于iso5218中定义了四种性别类别:男性、女性、未知和不可应用,数据类型的数目为4,此时字典大小=4。此外,例如,在智能电话等中使用象形图进行字符输入的情况下,象形图的数目当前约为2600,数据类型的数目约为2600,并且在这种情况下,字典大小=约2600。此外,在关于全球定位系统(gps)的位置信息被映射到1km2的区域网格的情况下,网格的数量将为约380000,因此数据类型的数量为约380000,并且字典大小=约380000。[0058]隐私指数指示差分隐私中的隐私保护的程度。随着隐私指数的值减小,隐私保护的程度增加并且添加到数据的噪声量增加。同时,随着隐私指数的值增加,隐私保护的程度降低并且添加到数据的噪声量减少。[0059]根据要处理的数据的敏感度,将隐私指数的值确定为预定值。例如,在将噪声添加到用于智能电话等中的字符输入的象形图以进行匿名化的情况下,将隐私指数设置为4,在处理诸如脉搏的保健信息的情况下,将隐私指数设置为2等。应注意,隐私指数的这些特定值仅是实例,并且本技术不限于这些值。[0060]图2是示出在隐私指数具有预定值的情况下样本大小、字典大小、以及误差之间的关系的一组图表。误差是没有添加噪声的数据的测量值(以下称为正确回答值)和通过差分隐私噪声添加数据的测量值(以下称为具有噪声的测量值)之间的差。在图2的曲线图中,在排列的两个条形图中,右侧示出未噪声添加的数据的测量值(正确回答值),并且左侧示出通过差分隐私噪声添加数据的测量值(具有噪声的测量值)。[0061]在图2中,上部图a至e中的字典大小是10,中间图f至j中的字典大小是100,并且下部图k至p中的字典大小是1000。[0062]垂直排列的曲线图a、f和k的样本大小是10000。此外,垂直排列的曲线图b、g和l的样本大小是100000。此外,垂直排列的图c、h和m的样本大小是一百万。此外,垂直排列的曲线图d、i和n的样本大小是一千万。此外,垂直排列的曲线图e、j和p的样本大小是1亿。要注意的是,所有图的隐私指数相同。[0063]在每个曲线图的右上方示出的值是在曲线图中的正确回答值与具有噪声的测量值之间的误差。[0064]从图2的曲线图中可以看出,在比较具有相同样本大小的曲线图时,可以看出,随着字典大小减小,误差减小。而且,在比较具有相同字典大小的图时,可以看出,随着样本大小增加,误差减小。在差分隐私中,随着正确回答值与具有噪声的测量值之间的误差减小,能够在保护数据隐私的同时获取更可靠的数据,这是优选的。[0065]图3a至图3e是示出正确回答值与具有噪声的测量值之间的误差与数据分布之间的关系的曲线图组,并且图3f是示出每个分布中的相对误差的曲线图。在图3a至图3e的每个图中,样本大小相同,字典大小相同,并且隐私指数相同。如从图3f中可以看出,即使样本大小、字典大小、以及隐私指数相同,相对误差也根据数据分布而不同。[0066]图4是示出了图3a至图3e中所示的每种类型的数据分布与隐私指数的值之间的关系的曲线图。如从图4可以看出,即使分布不同,随着隐私指数减少,添加至数据的噪声量增加,并且误差也增加。同时,随着隐私指数增加,添加到数据的噪声量减少,并且误差也减少。[0067]从样本大小、字典大小和隐私指数之间的这种关系可见,样本大小、字典大小和隐私指数之间存在以下折衷关系。[0068]在字典大小恒定并且隐私指数恒定的情况下,误差随着样本大小减小而增大。[0069]此外,在字典大小小的情况下,即使样本大小小,误差也小。同时,在字典大小较大的情况下,即使样本大小较大,误差也较大。[0070]此外,在样本大小恒定并且字典大小恒定的情况下,随着隐私指数减小,误差增大,并且随着隐私指数增大,误差减小。因此,为了增加隐私强度和可靠性,有必要增加样本大小。[0071]在本地型差分隐私中,作为正确答案值的统计结果与具有噪声的测量值之间的差的误差被用作评估指数。因此,在样本大小相同并且字典大小相同的情况下,即使噪声量和灵敏度增加,良好的本地型差分隐私的误差也不改变。此外,在字典大小相同并且隐私指数相同的情况下,即使样本大小减小,良好的本地型差分隐私的误差也不改变。这是因为,通常,为了增加样本大小,需要获得大量测量值(数据),这是昂贵的。[0072]注意,当实际操作使用差分隐私的系统时,不能获得没有添加噪声的正确回答值,从而不能计算误差。因此,在本技术中,可靠性而不是误差被定义为差分隐私的有效性的指数。[0073]针对构成字典的每个数据类型评估多次数据的总计结果的变化。为了在不同的数据类型之间进行比较,变化系数被用作可靠性。变化系数是用于相对评估测量值(数据)和变化之间的关系相对于平均值的指数,并且可以从下面的公式1获得。[0074][公式1][0075]变化系数=标准偏差/平均值[0076]图5是示出在垂直轴上绘制的变化系数和变化系数的相对误差和相对误差的相对误差与在等级轴上绘制的数据类型(从1开始的序列号)之间的关系的图表。如图5所示,从具有噪声的测量值计算的变化系数与相对误差具有相关性。因此,变化系数可以用作差分隐私的有效性的指数。因此,变化系数用作可靠性作为差分隐私的有效性的指数。由于具有低变化系数的误差很少,因此可靠性高。同时,由于存在具有高变化系数的许多误差,可靠性低。[0077]为了减少应用具有小样本大小的差分隐私的结果与不应用差分隐私的结果之间的误差,字典大小需要小。[0078]此外,为了减少应用具有小样本大小的差分隐私的结果与不应用差分隐私的结果之间的误差,使用用于增加数据的数据增强技术。通过将噪声添加划分至装置和云,并且执行多次噪声添加,可以增加数据量,但是简单的方法不能改善由装置添加的噪声的变化引起的误差。[0079]将参照图6描述这一点。在图6a至图6h的所有图中,等级轴是字典大小,并且垂直轴是样本大小。在原始数据的样本大小如图6a所示较大的情况下,如图6b所示,具有均匀分布的噪声在装置中通过差分隐私而被添加。然后,在云中总计数据的情况下,如图6c所示,数据增加均匀噪声的量。然后,如图6d所示,在通过去除噪声获得原始数据的情况下,由于假设噪声是均匀的来去除噪声,所以原始数据与具有由差分隐私添加的噪声的数据之间的误差小。[0080]同时,在原始数据的样本大小为小的情况下,如图6e所示,在装置中通过差分隐私添加不具有均匀分布并且具有变化的噪声。然后,在数据在云中总计的情况下,如图6g所示,由于数据被添加具有不均匀分布的噪声,因此数据的分布也变化。然而,因为在云中假设噪声是均匀的,噪声被去除,所以没有噪声的数据与具有通过差分隐私添加的噪声的数据之间的误差增加,如图6h所示。在样本大小为小的情况下,这种非均匀分布的噪声引起误差。[0081]因此,在本技术中,执行增强处理以通过使用数据层级结构来在云中预测由装置引起的噪声分布的变化,在云中校正噪声变化,并添加噪声并增加数据,使得噪声分布变得均匀。数据层级结构和增强处理的细节将稍后描述。[0082]《2.实施例》[0083][2-1.数据处理系统10的配置][0084]接下来,将描述使用上述差分隐私的数据处理系统10的配置。在该实施方式中,将通过在使用区域网格的数据收集中使用差分隐私的示例来描述本技术。本实施例将位置信息从终端装置100发送到服务器装置300,从而在服务器装置300中收集指示终端装置100存在于特定区域网格中的数据,并且确定终端装置100的分布,即,拥有终端装置100的用户的分布。[0085]如图7所示,数据处理系统10包括多个终端装置100和服务器装置300。多个终端装置100和服务器装置300经由诸如互联网的网络1000彼此连接。注意,为了便于描述和附图,列出了七个终端装置100,但是可以存在连接到服务器装置300的七个或更多个终端装置100。[0086]服务器装置300是例如由制造终端装置100等的制造商操作的装置,用于从终端装置100收集数据并且通过使用差分隐私获得统计结果。服务器装置300对应于上述差分隐私中的云。[0087]终端装置100是至少具有位置信息获取功能和通信功能的智能电话等。终端装置100周期性地或在预定的定时向服务器装置300发送包括终端装置100的位置信息的日志。[0088][2-2.区域网格的描述][0089]这里,将描述用于确定使用特定终端装置100的用户的分布的区域网格。区域网格是基于纬度/经度将区域分成近似相同大小的网格的网格,用于统计。用于标识每个网格的代码是区域网格代码。[0090]区域网格根据网格的大小被分类为初级网格、次级网格和三级网格。初级网格是一片1/200000地形图的部分作为一个单元部分。纬度差为40分,经度差为1度,一边的长度约为80km。次级网格是在经纬度方向上将次级网格等分为8个部分而形成的区域,对应1张1/25000地形图的一部分。纬度差为5分,经度差为7分30秒,一边的长度约为10km。三级网格是通过将次级网格在纬度和经度方向上分割成10个相等的部分而形成的区域。纬度差为30秒,经度差为45秒,一边长约1km。[0091]通过从多个终端装置100的每一个收集位置信息,可以确定终端装置100的用户在日本的整个区域中的分布。区域网格的数量被定义为构成字典的数据类型,数据类型的数量被定义为字典大小。[0092]图8是示出使用初级网格覆盖日本的整个区域的状态的示图。重叠在日本地图上的每个矩形是初级网格。由于初级网格可用176个网格覆盖日本的整个区域,因此在仅使用初级网格的情况下,构成字典的数据类型的数量是176,并且字典大小是176。如果日本的整个区域都覆盖有初级网格,那么遥远的岛屿、无人区、山区等将包括在网格中,这是浪费的。[0093]由于次级网格可以用4862个网格覆盖日本的整个区域,因此在仅使用次级网格的情况下,构成字典的数据类型的数量是4862,并且字典大小是4862。以类似于初级网格的方式,遥远的岛屿、无人区、山区等被包括在次级网格的网格中,这是浪费的。[0094]由于三级网格可用387286个网格覆盖日本的整个区域,因此在仅使用三级网格的情况下,构成字典的数据类型的数量是387286,并且字典大小是387286。[0095]此外,由于初级网格、次级网格和三级网格的具体值根据关于要参考的互联网上的网格的信息而变化,因此本技术不以任何方式受到上述网格的具体数量的限制。[0096][2-3.终端装置100和噪声添加装置200的结构][0097]接下来,将参考图9描述终端装置100的配置。终端装置100包括控制单元101、通信单元102、存储单元103、位置信息获取单元104、显示单元105、输入单元106和噪声添加装置200。噪声添加装置200对应于权利要求中的外部的噪声添加装置。另外,虽然与服务器装置300连接的终端装置100很多,但是为了便于说明和附图,仅示出一个终端装置100的细节。[0098]控制单元101包括中央处理单元(cpu)、随机存取存储器(ram)、只读存储器(rom)等。rom存储由cpu读取和操作的程序等。ram用作cpu的工作存储器。cpu通过根据存储在rom中的程序执行各种处理并发布命令来控制整个终端装置100。[0099]通信单元102是根据预定通信标准与服务器装置300和互联网通信的通信模块。通信方法包括诸如无线保真(wi-fi)的无线局域网(lan)、第四代移动通信系统(4g)、第五代移动通信系统(5g)、宽带、蓝牙(注册商标)等。[0100]存储单元103是例如包括硬盘驱动器(hdd)、半导体存储器、固态驱动器(ssd)等的存储介质,并且除了诸如图像数据、视频数据、音频数据和文本数据的内容数据之外,还存储诸如应用和程序的数据。[0101]位置信息获取单元104是用于获得关于终端装置100的位置信息的全球定位系统(gps)模块。在本实施例中,将位置信息获取单元104取得的表示终端装置100的当前位置的位置信息转换为低阶数据,作为原始数据。低阶数据对应于权利要求中的原始数据。[0102]显示单元105是用于显示诸如图像和视频的内容、用户界面等的显示装置。显示装置的实例包括液晶显示器(lcd)、等离子体显示面板(pdp)、有机电致发光(el)面板等。[0103]输入单元106是用于用户输入指令到终端装置100的各种输入装置。输入单元106包括按钮、与显示单元105集成的触摸屏等。如果对输入单元106进行输入,则根据该输入的控制信号被生成并被输出到控制单元101和噪声添加装置200。[0104]噪声添加装置200是通过终端装置100执行程序而配置的处理装置。程序可以安装在终端装置100中,或者可以通过下载、存储介质等分发并且由用户亲自安装。注意,噪声添加装置200不必仅由程序实现,而是可以通过具有功能的硬件组合专用装置、电路等来实现。[0105]如图10所示,噪声添加装置200包括字典存储单元201、低阶数据转换单元202、高阶数据转换单元203、低阶编码单元204、高阶编码单元205以及日志生成单元206。噪声添加装置200是用于通过差分隐私将噪声添加到要传输到服务器装置300的数据处理装置400的数据的装置。[0106]字典存储单元201是使存储单元103存储从服务器装置300发送的字典的存储处理单元。要存储的字典是由数据处理装置400的字典生成单元401生成的字典。因此,噪声添加装置200和数据处理装置400所拥有的字典是共同的。在本实施例中,对应于低阶数据的区域网格为数据类型,根据该数据类型配置字典。因此,如图11所示,可以说字典表示包括收集数据的多个区域网格(数据类型)的整个域。在其中收集数据的整个域中的低等级的区域网格是字典大小。[0107]低阶数据转换部202将位置信息获取单元104取得的位置信息转换为作为原始数据的低阶数据。如图11的a所示,低阶数据被配置为比特串,其中,0和1表示由位置信息表示的位置存在于预定域中的区域网格中的何处。构成低阶数据的区域网格的等级是低等级。此比特值被称为真值以区别于噪声。[0108]比特值“1”被分配给包括由位置信息指示的位置的区域网格,即,终端装置100存在于其中的区域网格。比特值“0”被分配给其中不存在终端装置100的区域网格。因此,比特值“1”指示在区域网格中存在作为终端装置100的拥有者的一个用户。[0109]预先确定的预定域中的多个区域网格是构成字典的数据类型。此外,在预定时间内从多个终端装置100到服务器装置300的数据(日志)传输的总数量是每个区域网格的计数值(样本大小)。传输总次数由数据处理装置400进行总计。[0110]高阶数据转换部203从低阶数据(其是数据的层级结构中的低等级的数据)生成高阶数据(其是高等级的数据)。[0111]数据的层级结构包括低等级的低阶数据和从低阶数据生成的高等级的高阶数据。低阶数据是将位置信息变换为比特串数据而得到的原始数据,高阶数据是由低阶数据生成的比特串数据。本技术通过使用数据层级结构来预测由终端装置100的噪声添加装置200添加的噪声的分布,因此不能仅利用作为原始数据的低阶数据来预测噪声分布。因此,为了形成数据层级结构,需要从低阶数据生成高阶数据。[0112]在本实施例中,如图11的a所示,首先,特定大小的区域网格(例如,三级网格)是低等级。然后,包括低等级的区域网格并且具有比低等级的区域网格更大的网格大小的高区域网格(初级网格或次级网格)是高等级。注意,次级网格可以是低等级,而初级网格可以是高级别。[0113]图11的b中所示的四个网格m1、m2、m3和m4是对应于高阶数据的高等级。此外,图11的a中所示的16个网格是对应于低阶数据的低等级。[0114]m1-1、m1-2、m1-3和m1-4是包括在高等级的网格m1中的低等级的网格。此外,m2-1、m2-2、m2-3和m2-4是包括在高等级的网格m2中的低等级的网格。此外,m3-1、m3-2、m3-3和m3-4是包括在高等级的网格m3中的低等级的网格。此外,m4-1、m4-2、m4-3和m4-4是包括在高等级的网格m4中的低等级的网格。[0115]在低等级的多个区域网格中,在包括位置信息所指示的位置的区域网格中由低阶数据转换单元202设置比特值“1”。此外,在不包括由位置信息指示的位置的区域网格中由低阶数据转换单元202设置比特值“0”。这样,位置信息被转换成作为低阶数据的比特串。[0116]然后,高阶数据转换单元203通过在包括低等级的区域网格的高等级的区域网格中反映低等级的每个区域网格的比特值,生成作为高阶数据的比特串。[0117]例如,如图11的a中所示的,在低等级的区域网格m4-3包括由位置信息表示的位置的情况下,在区域网格m4-3中设置比特值“1”。然后,这意味着高等级的区域网格m4也包括位置信息所指示的该位置。因此,如图11的b所示,比特值“1”也设置在高等级的区域网格m4中。[0118]如图11的a所示,在低等级的区域网格m3-1、m3-2、m3-3和m3-4不包括由位置信息表示的位置的情况下,在这四个区域网格中设置比特值“0”。然后,如图11的b所示,这意味着高等级的区域网格m3也不包括由位置信息表示的位置,并且也在高等级的区域网格m3中设置比特值“0”。这在高等级的区域网格m1和m2中也是类似的。由此,能够从低等级的低阶数据生成高等级的高阶数据。[0119]返回到噪声添加装置200的说明。低阶编码单元204对作为低阶数据要发送到服务器装置300的比特串执行编码处理和噪声添加处理,以产生低阶噪声添加数据。根据隐私指数和概率分布确定要添加的噪声量。因此,在添加噪声之前,未知将添加什么噪声分布。[0120]例如,如果噪声被添加到图11的a中所示的低阶数据,则结果如图12的a所示。指示位置信息所指示的位置存在于区域网格内的比特值“1”被添加为多个区域网格中的噪声。因此,比特值“1”的数量增加。在图12的a中,为了在真实值与噪声之间进行区分,将(n)加入作为噪声的比特值“1”。[0121]高阶编码单元205对作为高阶数据要发送到服务器装置300的比特串执行编码处理和噪声添加处理,以产生高阶噪声添加数据。根据隐私指数和概率分布确定要添加的噪声量。因此,在添加噪声之前,未知将添加什么噪声分布。[0122]例如,如果噪声被添加到图11发热b中所示的高阶数据,则结果如图12的b中所示。指示位置信息所指示的位置存在于区域网格内的比特值“1”作为噪声被添加到区域网格中。因此,比特值“1”的数量增加。在图12的b中,为了在真实值与噪声之间进行区分,将(n)加入作为噪声的比特值“1”以及加入噪声。注意,由于通过不同的处理将噪声添加到低阶数据和高阶数据,所以不总是将噪声添加到包括其中将噪声添加到低阶数据的低等级的区域网格的高等级的区域网格。[0123]低阶数据(其是原始数据)对应的所有区域网格的数量与字典大小相对应。[0124]日志生成单元206生成待向服务器装置300发送的日志,该日志包括高阶噪声添加数据和低阶噪声添加数据。日志包括作为报头信息的时间戳、作为用于差分隐私的参数信息的上隐私指数和下隐私指数、高阶比特深度、低阶比特深度、关于终端装置100的标识信息(id)等。生成的日志通过通信单元102的通信经由网络1000被发送到服务器装置300。注意,如果被终端装置100和服务器装置300预先共享,则诸如隐私指数和标识信息的不改变的信息不需要被包括在日志中。[0125]终端装置100和噪声添加装置200如上所述配置。[0126][2-4.服务器装置300和数据处理装置400的配置][0127]接下来,将参考图13描述服务器装置300的配置。服务器装置300包括控制单元301、通信单元302、存储单元303和数据处理装置400。[0128]控制单元301包括cpu、ram、rom等。cpu通过根据存储在rom中的程序执行各种处理并发布命令来控制整个服务器装置300。[0129]通信单元302是根据预定通信标准与终端装置100和互联网通信的通信模块。通信方法包括诸如wi-fi、4g、5g的无线lan、宽带、蓝牙(注册商标)等。[0130]存储单元303是例如包括hdd、半导体存储器、ssd等的存储介质,并且存储从终端装置100发送的应用、程序、日志、数据等。[0131]数据处理装置400是通过执行程序的服务器装置300配置的处理单元。程序可以安装在服务器装置300中,或者可以通过下载、存储介质等分发并且由用户亲自安装。注意,数据处理装置400不必仅通过程序来实现,而是可以通过具有该功能的硬件通过组合专用装置、电路等来实现。[0132]如图14所示,数据处理装置400包括字典生成单元401、字典存储单元402、低阶解码单元403、高阶解码单元404、数据扩展单元405、噪声分布预测单元406、增强处理单元407、解码单元408以及统计分析单元409。[0133]字典生成单元401生成字典作为数据集。在本实施例中,对应于低阶数据的区域网格为数据类型,根据该数据类型配置字典。因此,如图11所示,可以说字典表示包括收集数据的多个区域网格(数据类型)的整个域。在其中收集数据的整个域中的低等级的区域网格是字典大小。[0134]字典生成单元401生成的字典数据由字典存储单元402存储在存储单元303中,并传输至终端装置100并且还由终端装置100中的字典存储单元201存储。[0135]字典存储单元402是将字典生成单元401生成的字典存储在存储单元303中的存储处理单元。[0136]低阶解码单元403对来自服务器装置300所接收的多个日志的低阶噪声添加数据进行聚合,并对该低阶噪声添加数据进行解码处理和噪声去除处理,获得低阶数据。低阶解码单元403对应于权利要求中的去噪单元。[0137]高阶解码单元404对来自服务器装置300接收的多个日志的高阶噪声添加数据进行聚合,并对低阶噪声添加数据进行解码处理和噪声去除处理,得到高阶数据。去除噪声的低阶数据被提供给噪声分布预测单元406。[0138]向数据扩展单元405提供高阶噪声添加数据。数据扩展单元405进行如下处理:对于噪声分布预测单元406的噪声分布预测处理,根据低阶数据的比特长度对高阶数据进行扩展。将经过扩展处理的高阶噪声添加数据提供给噪声分布预测单元406。[0139]向噪声分布预测单元406提供扩展的高阶噪声添加数据和低阶噪声添加数据。噪声分布预测单元406通过使用高阶噪声添加数据和低阶噪声添加数据来预测低阶噪声添加数据中的噪声分布。噪声分布预测结果被提供给增强处理单元407。由于数据处理装置400接收已经由噪声添加装置200添加了噪声的数据,因此需要预测噪声分布,以便确定由噪声添加装置200添加了哪种类型的噪声。[0140]增强处理单元407进一步基于预测的噪声分布将噪声添加到低阶噪声添加数据,使得噪声分布变得更加均匀,以产生增强数据。通过在该增强处理中添加噪声,可以增加数据量并且可以增加样本大小。[0141]解码单元408对通过对从多个终端装置100中的每个发送的数据应用增强处理而产生的多个增强数据进行聚合,对多个增强数据执行噪声去除处理,并产生多个原始数据(低阶数据)。解码单元408对应于权利要求中的去噪单元。[0142]由于低阶数据是没有噪声添加数据,因此可以基于从多个终端装置100发送的日志聚集的低阶数据,获得收集数据的域(字典)中的每个数据类型(低等级的区域网格)的计数值(样本大小)。计数值是对于低等级的每个区域网格,位置信息在区域网格中被发送到服务器装置300的次数。这使得能够确定拥有终端装置100的用户在其中收集数据(字典)的域中存在于哪里和多少用户作为统计结果。[0143]例如,如图15所示,计数值是在预定时间内针对低等级的每个区域网格从区域网格内发送位置信息的次数。位置信息的发送次数是样本大小,并且每个区域网格中的发送次数是每个数据类型的样本大小。这不是来自一个终端装置100的发送次数,而是来自连接到服务器装置300并向服务器装置300发送数据的所有终端装置100的发送总数。[0144]此外,还可以从多个增强数据中获得计数值。稍后将描述从增强数据获得的计数值。[0145]统计分析单元409创建热图以使统计分析结果、可靠性等可视化。应注意,统计分析单元409不是本技术中所需的配置。[0146]服务器装置300和数据处理装置400如上所述配置。[0147][2-5.噪声添加装置200中的处理][0148]接下来,参照图16的流程图,描述在噪声添加装置200中的处理。首先,在步骤s11中,确定要发送至数据处理装置400的数据。该发送数据是由终端装置100的位置信息获取单元104取得的终端装置100的位置信息。通过数据确定的数据发送的定时可以由终端装置100的用户确定,或者可以通过预定算法等自动确定。[0149]接着,在步骤s12中,低阶数据转换部202从发送数据生成作为原始数据的低阶数据。低阶数据被配置为包括如上所述在每个区域网格中设置的比特值的比特串,并且0和1指示位置信息从在预先确定的预定范围内的区域网格中的何处被发送。[0150]接着,在步骤s13中,高阶数据转换部203从低阶数据生成高阶数据。如上所述,高阶数据被配置为包括在每个区域网格中设置的比特值的比特串,并且0和1指示在预先确定的预定范围内的区域网格中存在用户的终端装置100的位置。高阶数据在包括低等级的区域网格的高等级的区域网格中反映低等级的比特值,高等级的区域网格包括具有比低等级的区域网格的网格大小大的网格大小的高区域网格。[0151]本技术通过使用数据的层级结构来预测由终端装置100的数据处理装置400添加的噪声分布。因此,为了构建数据的层级结构,需要将原始数据设置为低阶数据并且从低阶数据生成高阶数据。[0152]接着,在步骤s14中,低阶编码单元204对低阶数据进行编码处理和噪声添加处理,以生成低阶噪声添加数据。此外,在步骤s15中,高阶编码单元205对高阶数据执行编码处理和噪声添加处理,以产生高阶噪声添加数据。注意,为了便于描述,描述了步骤s12和步骤s13、以及步骤s14和步骤s15,但是可以同时执行步骤s12和步骤s13和步骤s14和步骤s15。[0153]接着,在步骤s16中,日志生成单元206生成向数据处理装置400发送的包含高阶噪声添加数据和低阶噪声添加数据的日志。[0154]然后,在步骤s17中,经由终端装置100的通信单元102将日志发送到服务器装置300。注意,当将日志发送到服务器装置300时,将发送所需的对于终端装置100唯一的报头信息添加到日志。[0155]终端装置100定期或在预定定时执行该处理。[0156][2-6.数据处理装置400中的处理][0157]接下来,将参考图17的流程图描述在数据处理装置400中的处理。首先,在步骤s21中,接收从与服务器装置300连接的所有终端装置100发送的日志。[0158]接着,在步骤s22中,低阶解码单元403从日志中提取并聚集低阶噪声添加数据。此外,在步骤s23中,高阶解码单元404从日志中提取并聚集高阶噪声添加数据。[0159]接着,在步骤s24中,低阶解码单元403对低阶噪声添加数据进行解码处理和噪声去除处理,获得低阶数据。并且,在步骤s25中,高阶解码单元404对高阶噪声添加数据进行解码处理和噪声去除处理,得到高阶数据。[0160]接着,在步骤s26中,数据扩展单元405扩展高阶数据以匹配低阶数据的比特长度。[0161]接下来,在步骤s27中,噪声分布预测单元406根据高阶数据和低阶数据来预测由装置添加的噪声分布。[0162]这里,将参考图12所示的低阶噪声添加数据和高阶噪声添加数据来描述步骤26中的数据扩展和步骤s27中的噪声分布预测。噪声分布预测是使用数据的层级结构、高阶噪声添加数据和低阶噪声添加数据来执行的。[0163]图18的a是图12所示的低阶噪声添加数据与高阶噪声添加数据之间的比特串的对应表。然后,如果通过数据扩展单元405扩展高阶噪声添加数据的比特串以匹配低阶噪声添加数据的比特长度,则获得图18的b。扩展是将与高阶噪声添加数据的比特值相同的比特值与低阶噪声添加数据的比特串的位数匹配,如图18的b所示。[0164]在低等级的一个区域网格和包括该一个区域网格的高等级的区域网格两者中设置比特的情况下,确定比特值可能是真值。同时,在仅在低等级的一个区域网格和包括该一个区域网格的高等级的区域网格中设置比特的情况下,确定比特值可能是噪声。[0165]例如,由于低等级的区域网格m4-3的比特值是1,并且包括区域网格m4-3的上等级的区域网格m4的比特值也是1,因此可以预测m4-3的比特值具有是真值的高概率。这在低等级的区域网格m1-1和高等级的区域网格m1中也类似。[0166]同时,低等级的区域网格m2-2的比特值是1,并且包括区域网格m2-2的上等级的区域网格m2的比特值是0。以这种方式,可以预测其中高等级的比特值与低等级的比特值不一致的低等级的区域网格m2-2的比特值不可能是真实值(噪声的概率高)。这在低等级的区域网格m2-3和高等级的区域网格m2中是类似的,并且在低等级的区域网格m3-4和高等级的区域网格m3中是类似的。[0167]这样,在低等级附加了比特值1的所有区域网格中,确认比特值为真值的概率是高还是低。具有作为真值的高概率的比特值乘以指示作为真值的概率高的真值概率值。同时,具有作为真值的低概率的比特值乘以指示作为真值的概率低的真值概率值。然后,在图19中示出了低阶噪声添加数据的比特值1是真值的概率值。[0168]为真值的概率值取0至1.0的值,在1.0的情况下,为真值的概率为100%,并且在0的情况下,为真值的概率为0%。例如,表示真值概率高的真值概率值为0.8,表示真值概率低的真值概率值为0.2。指示作为真值的概率高的真值概率值被设置为0.8而不是1.0,因为在高等级和低等级的比特值都是1的情况下,不区分比特值是真值还是噪声。要注意的是,这个真值概率值仅仅是一个实例,并且本技术不限于这个值。[0169]这样,可以获得作为低阶噪声添加数据的比特串是真值或噪声的概率。然后,基于该真值概率,可以获得图20中所示的字典的噪声分布预测。图20是示出构成字典的每个数据类型的噪声分布预测结果的曲线图,字典的大小绘制在水平轴上并且噪声的量绘制在垂直轴上。[0170]该处理返回图17的流程图的描述。接下来,在步骤s28中,增强处理单元407基于计算出的噪声分布预测来对低阶噪声添加数据进行增强处理,并进一步将噪声添加到低阶噪声添加数据,使得噪声分布变得均匀。[0171]此处,将参考图21的流程图描述增强处理。[0172]首先,在步骤s41中,从字典中选择对其执行增强处理的一个区域网格(数据类型)。[0173]接下来,在步骤s42中,在所选择的区域网格中进一步添加噪声,并且生成噪声添加数据。接下来,在步骤s43中,计算噪声添加数据的变化系数(cv)。[0174]接下来,在步骤s44中,针对与计算变化系数的区域网格相同的区域网格,将在步骤s43中计算的变化系数与在先前处理中计算的变化系数进行比较,以确定变化系数是否已经改进。在此,“变化系数已经改进”意味着变化系数的值已经减小。减小的变化系数意味着噪声变化已经减小。因此,为了消除噪声的变化,并且通过进一步将噪声添加到噪声添加数据来使噪声均匀,优选地,变化系数较小。[0175]另外,在步骤s43中计算出的变化系数为第一变化系数的情况下,也可以与预先设定的默认的变化系数进行比较,也可以不进行比较处理而进入步骤s45。[0176]在变化系数已经改善的情况下,处理进行至步骤s45(步骤s44中的是)。接下来,在步骤s45中,采用通过在步骤s42中添加噪声而产生的噪声添加数据作为增强数据。[0177]然后,在步骤s46中,将在步骤s42中计算的变化系数更新为与下一处理的新的变化系数进行比较的变化系数。[0178]然后,在步骤s47中,确定样本大小是否已达到预定数量。在样本大小达到预定数量的情况下,随着增强处理成功,处理结束(步骤s47中的是)。[0179]同时,在样本大小未达到预定数量的情况下(步骤s47中的否),处理进行至步骤s41,并且重复步骤s41至s47。[0180]返回到步骤s44。在步骤s44中,将在步骤s43中计算的变化系数与在先前处理中计算的变化系数进行比较。在变化系数已劣化(未改善)的情况下,处理进行至步骤s48(步骤s44中的否)。在此,变差的变化系数意味着变化系数的值增加。变化系数增大意味着噪声变化增大。[0181]随后,在步骤s48中,判断针对一个变化系数判断变化系数劣化的次数是否达到了预定次数。在判定为变化系数恶化的次数未达到预定次数的情况下,处理进入步骤s42(步骤s48中的否)。[0182]然后,在步骤s42中,对在步骤s41中选择的数据新添加噪声,针对在步骤s43中新添加了噪声的噪声添加数据,计算变化系数。然后,在变化系数优于先前处理的变化系数的情况下,处理进行至步骤s45(步骤s44中的是),在变化系数已经劣化的情况下,处理进行至步骤s48(步骤s44中的否)。[0183]在变化系数已经劣化的情况下,重复步骤s42至s45和步骤s48,直到确定变化系数已经劣化的次数达到预定次数。[0184]在步骤s48中确定变化系数已经劣化的次数达到预定次数的情况下,处理进行至步骤s47(步骤s48中的是)。在这种情况下,处理进行至步骤s47,并且在样本大小未达到预定值的情况下,对另一字典执行处理。[0185]如上所述,执行增强处理。通过增强处理,仅向变化系数改进的区域网格(数据类型)添加附加噪声。因此,可以通过仅向需要增加具有噪声的数据的区域网格添加噪声来使噪声分布均匀。[0186]该处理返回图17的流程图的描述。接下来,在步骤s29中,解码单元410聚集从接收自多个终端装置100的日志产生的增强数据,并将增强数据提供给解码单元408。[0187]接下来,在步骤s30中,解码单元408对增强数据执行解码处理和噪声去除处理,并且获取数据被发送的次数作为构成字典的每个区域网格(数据类型)中的计数值(样本大小)。[0188]通过增强处理,例如,在低等级的区域网格中的数据如图15中所示的情况下,通过在噪声添加装置200中的噪声添加和在数据处理装置400中的增强,噪声被添加使得噪声分布如图22中所示是均匀的。在图22中,噪声分布是均匀的,并且将平均值300的噪声进一步添加到图15的低阶噪声添加数据中。[0189]如图23的曲线图所示,在通过增强处理添加噪声而产生的噪声添加数据中,可通过添加的噪声获得大于原始数据的计数值(样本大小)。[0190]然后,通过从构成字典的所有数据类型(区域网格)中均匀地减去300的噪声,可以通过返回到原始数据的状态来获得正确的统计。[0191]通过如上所述的本技术执行处理。即使在作为差分隐私而添加的噪声由于小的样本大小而不均匀分布并且不同的情况下,本技术也能够预测噪声的变化并且添加噪声使得分布变得均匀。通过噪声添加,可以伪方式增加数据量(样本大小)。通过差分隐私,在字典大小相同的情况下,误差随着样本大小增加而减小。因此,通过添加噪声并且增加数据量(增加样本大小),即使使用少量的数据,也可以减少统计结果中的误差,并且可以提高差分隐私的精度。[0192]此外,在本技术中,代替一次将噪声添加到数据,一次在装置侧(噪声添加装置200)添加噪声,并且进一步在云侧(数据处理装置400)添加噪声,以便校正所添加噪声的变化。因此,能够最终生成噪声分布的变化少的噪声添加数据,在添加噪声前后,能够以误差少的噪声增加数据。[0193]图24是示出通过增强处理减小误差的说明图。图24的a是示出原始数据和噪声添加数据之间进行比较的示图,字典大小绘制在水平轴上,计数值绘制在垂直轴上。图24的b是示出由噪声添加装置200添加的噪声的分布和理想均匀噪声分布的示图,在水平轴上绘制字典大小并且在垂直轴上绘制噪声量。图24的c是示出了原始数据与增强数据之间的比较的示图,其中,字典大小绘制在水平轴上并且计数值绘制在垂直轴上。[0194]如图24的b所示,由于由噪声添加装置200添加的噪声的分布不均匀,所以如图24的a所示,在原始数据和噪声添加数据之间产生大的误差。相反,如图24的c所示,通过增强处理添加均匀分布的噪声,原始数据和增强数据之间的误差减小。[0195]《3.变形例》[0196]以上具体描述了本技术的实施方式,但是本技术不限于上述实施方式,并且可以基于本技术的技术构思进行各种修改。[0197]该实施例已经描述了终端装置100是智能电话,但是除了智能电话之外,终端装置100可以是任何事物、个人计算机、平板终端、相机、可穿戴装置、智能扬声器、游戏机、服务器装置300、启用互联网的宠物/类人机器人、各种传感器装置、各种物联网(iot)装置,只要该装置可以向外部发送信息即可。[0198]在实施方式中,使用区域网格,但是本技术不限于区域网格。可以被视为统计数据的任何事物都可以被应用,例如,由用户在终端装置100中的字符输入中使用的象形图的使用频率、在终端装置100中运行的应用的使用频率、本地温度的测量值等。[0199]在本实施例中,通过使用在区域网格中设置的比特值,从低阶数据生成高阶数据。然而,在低阶数据是gps纬度/经度信息的情况下,通过删除该纬度/经度信息的值的最后多个位,能够生成作为高阶数据的纬度/经度信息。[0200]此外,在低阶数据是用于智能电话等中的字符输入的所有类型的象形图的情况下,可以通过例如通过诸如人、动物、标记和食物的高级概念对象形图的类型进行分类来生成高阶数据。此外,在数据是诸如温度的数字数据的情况下,低阶数据可以是包括小数点(37.1、38.2等)右侧的数位的值,并且高阶数据可以是整数值(37、38等)。此外,在数据是年龄的情况下,也可以将低阶数据设置为包括末位(35岁、47岁等)的年龄,并且将高阶数据设置为不包括末位的年龄组(30多岁、40多岁等)。[0201]在本实施例中,数据的层级结构具有两个等级,但是数据可以具有三个或更多个等级的层级结构。[0202]本技术还可具有以下配置。[0203](1)[0204]一种数据处理装置,包括:[0205]噪声分布预测单元,被配置为预测在外部的噪声添加装置中通过将噪声添加到原始数据而产生的噪声添加数据中的噪声的分布;以及[0206]增强处理单元,被配置为基于所述噪声分布的预测结果对所述噪声添加数据执行增强处理。[0207](2)[0208]根据(1)所述的数据处理装置,其中在噪声添加装置中,将噪声添加至作为原始数据的较低等级的较低阶数据和作为比较低等级更高等级的数据的较高阶数据中的每一个。[0209](3)[0210]根据(2)所述的数据处理装置,其中在外部装置中从较低阶数据生成较高阶数据。[0211](4)[0212]根据(1)至(3)中任一项所述的数据处理装置,其中在所述噪声添加装置中将噪声添加到所述高阶数据中的高阶噪声添加数据和将噪声添加到所述低阶数据中的低阶噪声添加数据包括比特串。[0213](5)[0214]根据(1)至(4)中任一项所述的数据处理装置,其中所述噪声分布预测单元通过比较所述高阶噪声添加数据与所述低阶噪声添加数据,并且确定构成所述低阶噪声添加数据的比特串的比特是否是所述噪声,来预测所述低阶噪声添加数据中的噪声分布。[0215](6)[0216]根据(5)所述的数据处理装置,进一步包括数据扩展单元,被配置为对所述高阶噪声添加数据执行扩展处理,以将所述高阶噪声添加数据与所述低阶噪声添加数据进行比较。[0217](7)[0218]根据(6)所述的数据处理装置,其中该数据扩展单元扩展该高阶噪声添加数据的比特串,以使该高阶噪声添加数据的比特串的位数与该低阶噪声添加数据的比特串的位数一致。[0219](8)[0220]根据(1)至(7)中任一项所述的数据处理装置,其中增强处理单元将噪声添加至被噪声添加数据以增加数据量。[0221](9)[0222]根据(8)所述的数据处理装置,其中增强处理单元将噪声添加至被噪声添加数据,以便减小指示噪声分布的变化的变化系数。[0223](10)[0224]根据(9)所述的数据处理装置,进一步包括噪声去除单元,被配置为去除由增强处理单元添加到原始数据的噪声。[0225](11)[0226]一种数据处理方法,包括:[0227]预测在外部的噪声添加装置中将噪声添加到原始数据而产生的噪声添加数据中的噪声的分布;以及[0228]基于所述噪声分布的预测结果对所述噪声添加数据进行增强处理。[0229](12)[0230]一种用于使计算机执行数据处理方法的数据处理程序,所述数据处理方法包括:[0231]预测在外部的噪声添加装置中将噪声添加到原始数据而产生的噪声添加数据中的噪声的分布;以及[0232]基于所述噪声分布的预测结果对所述噪声添加数据进行增强处理。[0233]附图标记列表[0234]200噪声添加装置[0235]405数据扩展单元[0236]406噪声分布预测单元[0237]407增强处理单元[0238]400数据处理装置。当前第1页12当前第1页12
技术特征:
1.一种数据处理装置,包括:噪声分布预测单元,被配置为预测通过在外部的噪声添加装置中将噪声添加到原始数据所产生的噪声添加数据中的噪声分布;以及增强处理单元,被配置为基于所述噪声分布的预测结果对所述噪声添加数据执行增强处理。2.根据权利要求1所述的数据处理装置,其中在所述噪声添加装置中,将所述噪声分别添加到高阶数据和低等级的低阶数据中,其中,所述低等级的低阶数据是所述原始数据,所述高阶数据是比所述低等级高的等级的数据。3.根据权利要求2所述的数据处理装置,其中在所述外部装置中,从所述低阶数据生成所述高阶数据。4.根据权利要求1所述的数据处理装置,其中在所述噪声添加装置中,噪声添加到高阶数据中的高阶噪声添加数据和噪声添加到低阶数据中的低阶噪声添加数据包括比特串。5.根据权利要求1所述的数据处理装置,其中所述噪声分布预测单元通过对高阶噪声添加数据与低阶噪声添加数据进行比较并且判定构成所述低阶噪声添加数据的比特串的比特是否为所述噪声,预测所述低阶噪声添加数据中的噪声分布。6.根据权利要求5所述的数据处理装置,进一步包括:数据扩展单元,被配置为对所述高阶噪声添加数据进行扩展处理,以比较所述高阶噪声添加数据与所述低阶噪声添加数据。7.根据权利要求6所述的数据处理装置,其中所述数据扩展单元对所述高阶噪声添加数据的比特串进行扩展,使所述高阶噪声添加数据的比特串的位数与所述低阶噪声添加数据的比特串的位数一致。8.根据权利要求1所述的数据处理装置,其中所述增强处理单元将所述噪声添加到所述噪声添加数据以增加数据量。9.根据权利要求8所述的数据处理装置,其中所述增强处理单元将所述噪声添加到所述噪声添加数据,以减小指示所述噪声分布的变化的变化系数。10.根据权利要求9所述的数据处理装置,进一步包括:去噪单元,被配置为去除由所述增强处理单元添加到所述原始数据的所述噪声。11.一种数据处理方法,包括:预测通过在外部的噪声添加装置中将噪声添加到原始数据所产生的噪声添加数据中的噪声的分布;以及基于所述噪声分布的预测结果对所述噪声添加数据执行增强处理。12.一种用于使计算机执行数据处理方法的数据处理程序,所述数据处理方法包括:预测通过在外部的噪声添加装置中将噪声添加到原始数据所产生的噪声添加数据中的噪声的分布;以及基于所述噪声分布的预测结果对所述噪声添加数据执行增强处理。

技术总结
提供了一种数据处理装置,包括:噪声分布预测单元,预测在外部的噪声添加装置中通过将噪声添加到原始数据而产生的噪声添加数据中的噪声的分布;以及增强处理单元,基于噪声分布的预测结果对噪声添加数据执行增强处理。布的预测结果对噪声添加数据执行增强处理。布的预测结果对噪声添加数据执行增强处理。


技术研发人员:梅田哲士 丸山信也
受保护的技术使用者:索尼集团公司
技术研发日:2021.03.17
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-8099.html

最新回复(0)