图像生成方法、装置、存储介质及电子装置与流程

专利2024-11-09 85

1.本技术涉及智慧家庭技术领域，具体而言，涉及一种图像生成方法、装置、存储介质及电子装置。

背景技术：

2.目前，随着社会的科技水平不断的飞速发展，图像处理领域内的数字图像处理技术的进步也越来越大，例如，已经能够使用红外图像动态仿真软件将将对象在各个角度下的温度场和温度反射率等参数组织为浮点格式的dds(direct draw surface，直接绘画表面)纹理，并根据这些环绕对象不同角度的二维纹理与三维模型顶点之间的坐标映射关系实现纹理映射，以生成目标图像。但是这种根据采集到的对象的红外数据生成的目标图像，仅仅能够反映出对象的外表，并不能反馈出对象的心理状态。
3.因此，相关技术中，存在如何生成与用户的心理状态对应的图片的问题。
4.针对相关技术中，如何生成与用户的心理状态对应的图片的问题，尚未提出有效的解决方案。

技术实现要素：

5.本技术实施例提供了一种图像生成方法、装置、存储介质及电子装置，以至少解决相关技术中，如何生成与用户的心理状态对应的图片的问题。
6.根据本技术实施例的一个实施例，提供了一种图像生成方法，包括：向智能设备发送预设文本；解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像。
7.在一个示例性实施例中，根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像，包括：对所述语音数据的关键词进行特征识别，得到所述关键词对应的词语类别；获取为所述词语类别预先设置的图像模板，以及所述语音特征信息对应的图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板生成目标图像。
8.在一个示例性实施例中，获取所述语音特征信息对应的图像特征调节值，包括：获取所述语音特征信息中的语音音量，并在所述语音音量大于第一预设值，且小于第二预设值的情况下，将所述语音音量和所述第一预设值的第一差值确定为所述图像特征调整值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调整值调整所述图像模板中的初始图像的大小，得到所述目标图像。
9.在一个示例性实施例中，获取所述语音特征信息对应的图像特征调节值，包括：获取所述语音特征信息中的语音抖动频率，并在确定所述语音抖动频率大于第三预设值的情况下，将所述语音抖动频率与所述第三预设值的第二差值确定为所述图像特征调节值；根
据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调节值调整所述图像模板中的初始图像的轮廓线条宽度，得到所述目标图像。
10.在一个示例性实施例中，获取所述语音特征信息对应的图像特征调节值，包括：获取预设时间段内的所述语音特征信息的语速，并在确定所述语速大于第四预设值的情况下，将所述语速与所述第四预设值的第三差值确定为所述图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调节值调整所述图像模板中的初始图像的轮廓线条倾斜角度，得到所述目标图像。
11.在一个示例性实施例中，根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像，包括：从所述语音特征信息中获取不同的音调值的数量；在所述不同的音调值的数量大于第五预设值的情况下，将所述图像模板中的初始图像的色相类型确定为第一色系，得到所述目标图像。
12.在一个示例性实施例中，所述方法还包括：获取所述第一语音特征信息对应的多个语音特征维度，所述多个语音特征维度至少包括以下之一：语音音量维度、语音抖动频率维度、语速维度；获取所述第一语音特征信息在所述多个语音特征维度下的多个心理压力值；从所述多个心理压力值中确定出异常压力值；在所述异常压力值的数量大于第六预设值的情况下，向所述第一对象发送提示信息，以提示所述第一对象存在所述异常压力值。
13.根据本技术实施例的另一个实施例，还提供了一种图像生成装置，包括：发送模块，用于向智能设备发送预设文本；解析模块，用于解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；确定模块，用于根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像。
14.根据本技术实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述图像生成方法。
15.根据本技术实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述的图像生成方法。
16.在本技术实施例中，向智能设备发送预设文本；解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的第一图像；采用上述技术方案，解决了如何生成与用户的心理状态对应的图片的问题。
附图说明
17.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。
18.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而
言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
19.图1是本技术实施例的一种图像生成方法的硬件环境示意图；
20.图2是根据本技术实施例的图像生成方法的流程图；
21.图3是根据本技术实施例的图像生成方法的示意图；
22.图4是根据本技术实施例的一种图像生成装置的结构框图(一)；
23.图5是根据本技术实施例的一种图像生成装置的结构框图(二)。
具体实施方式
24.为了使本技术领域的人员更好地理解本技术方案，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分的实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本技术保护的范围。
25.需要说明的是，本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
26.根据本技术实施例的一个方面，提供了一种图像生成方法。该图像生成方法广泛应用于智慧家庭(smart home)、智能家居、智能家用设备生态、智慧住宅(intelligencehouse)生态等全屋智能数字化控制应用场景。可选地，在本实施例中，上述图像生成方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示，服务器104通过网络与终端设备102进行连接，可用于为终端或终端上安装的客户端提供服务(如应用服务等)，可在服务器上或独立于服务器设置数据库，用于为服务器104提供数据存储服务，可在服务器上或独立于服务器配置云计算和/或边缘计算服务，用于为服务器104提供数据运算服务。
27.上述网络可以包括但不限于以下至少之一：有线网络，无线网络。上述有线网络可以包括但不限于以下至少之一：广域网，城域网，局域网，上述无线网络可以包括但不限于以下至少之一：wifi(wireless fidelity，无线保真)，蓝牙。终端设备102可以并不限定于为pc、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
28.在本实施例中提供了一种图像生成方法，应用于上述计算机终端，图2是根据本技术实施例的图像生成方法的流程图，该流程包括下步骤：
29.步骤s202，向智能设备发送预设文本；
30.步骤s204，解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；
31.需要说明的是，上述语音特征信息可以包括但不限于语音音量、语速、语音抖动频率、语音音色、语音音调等，本技术对此不作限制。
32.步骤s206，根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像。
33.其中，上述与关键词对应的图像模板可以是预先设置好的，可以是实时生成的。例如，对于实时生成的图像模板，可以根据表示名词的关键词生成的景物，即图像模板。也可以根据表示形容词的关键词生成景物之间的位置关系。
34.需要说明的是，上述图像模板可以是仅有黑白底色的模板，也可以包括彩色的模板，本技术对此不作限制。
35.通过上述步骤，向智能设备发送预设文本；解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像，解决了相关技术中，如何生成与用户的心理状态对应的图片的问题。
36.在一个示例性实施例中，为了更好的理解上述步骤s206如何根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像，可以通过以下方案说明：对所述语音数据的关键词进行特征识别，得到所述关键词对应的词语类别；获取为所述词语类别预先设置的图像模板，以及所述语音特征信息对应的图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板生成目标图像。
37.需要说明的是，上述词语类别可以包括名词、动词、形容词、数次、量词、代词、副词、介词、连词、助词、叹词、拟声词等，但不限于此。并且，不同的词语类别对应不同的图像处理方式，例如，名词可以直接生成是名词对应的景物，而对于连词、副词、助词等没有实际含义的词语可以用于调节景物之间的位置等。
38.在一个示例性实施例中，进一步提出了多种获取所述语音特征信息对应的图像特征调节值，以及根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像的方案，具体包括：
39.方案1、获取所述语音特征信息对应的图像特征调节值，包括：获取所述语音特征信息中的语音音量，并在所述语音音量大于第一预设值，且小于第二预设值的情况下，将所述语音音量和所述第一预设值的第一差值确定为所述图像特征调整值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调整值调整所述图像模板中的初始图像的大小，得到所述目标图像。
40.通过上述实施例不仅能够根据用户的语音音量调节图像的大小，还实现了根据语音音量生成目标图像的方案，即可以根据用户在不同的心理状态下的发生变化的语音音量生成与用户的心理状态相对应的目标图像。
41.方案2、获取所述语音特征信息对应的图像特征调节值，包括：获取所述语音特征信息中的语音抖动频率，并在确定所述语音抖动频率大于第三预设值的情况下，将所述语
音抖动频率与所述第三预设值的第二差值确定为所述图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调节值调整所述图像模板中的初始图像的轮廓线条宽度，得到所述目标图像。
42.可以理解的是，本实施例中，还可以根据一段时间内的语音抖动频率的剧烈程度调节图像模板中的初始图像的轮廓线条宽度。
43.进一步的，上述根据所述语音抖动频率与所述第三预设值的第二差值调整所述图像模板中的初始图像的轮廓线条宽度，得到目标图像的过程可以包括：根据所述第二差值对应的线条宽度调整比例对所述初始图像的轮廓线条宽度进行调整，得到目标图像。
44.在确定所述语音抖动频率小于第三预设值的情况下，则直接使用上述第三预设值对应的轮廓线条宽度作为初始图像的轮廓线条宽度，得到目标图像。
45.通过上述实施例实现了根据语音抖动频率调整图像模板中的初始图像的轮廓线条宽度的方案，即，可以根据用户在不同的心理状态下的语音抖动频率生成与用户的心理状态相对应的目标图像。
46.方案3、获取所述语音特征信息对应的图像特征调节值，包括：获取预设时间段内的所述语音特征信息的语速，并在确定所述语速大于第四预设值的情况下，将所述语速与所述第四预设值的第三差值确定为所述图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调节值调整所述图像模板中的初始图像的轮廓线条倾斜角度，得到所述目标图像。
47.需要说明的是，上述初始图像的轮廓线条倾斜角度可以理解为相对于图像模板的任一条中垂线的夹角角度，在初始图像为山峰的情况下，山峰的轮廓线条倾斜角度可以理解为山峰的峰尖相比于山峰中垂线的倾斜角度。
48.进一步的，上述根据所述语速与所述第四预设值的第三差值调整所述轮廓线条倾斜角度，得到目标图像的过程可以包括：根据所述第三差值对应的线条倾斜角度调整比例对所述轮廓线条倾斜角度进行调整，得到目标图像。
49.在确定所述语速小于第四预设值的情况下，则使用上述第四预设值对应的线条倾斜角度作为初始图像的轮廓线条倾斜角度。
50.通过上述实施例实现了根据语速调整图像模板中的初始图像的轮廓线条倾斜角度的方案，即，可以根据用户在不同的心理状态下的语速生成与用户的心理状态相对应的目标图像。
51.在一个示例性实施例中，进一步提出了一种根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像的技术方案，具体包括：从所述语音特征信息中获取不同的音调值的数量；在所述不同的音调值的数量大于第五预设值的情况下，将所述图像模板中的初始图像的色相类型确定为第一色系，得到所述目标图像。
52.可以理解的是，上述第一色系可以为暖色色系，例如，红色、橙色、黄色等。
53.可选的，在一个实施例中，在所述不同的音调值的数量小于第五预设值的情况下，将所述图像模板的色相类型确定为第二色系。上述第二色系可以为冷色色系，例如，蓝色、绿色等。
54.在一个示例性实施例中，所述方法还包括：获取所述第一语音特征信息对应的多个语音特征维度，所述多个语音特征维度至少包括以下之一：语音音量维度、语音抖动频率
维度、语速维度；获取所述第一语音特征信息在所述多个语音特征维度下的多个心理压力值；从所述多个心理压力值中确定出异常压力值；在所述异常压力值的数量大于第六预设值的情况下，向所述第一对象发送提示信息，以提示所述第一对象存在所述异常压力值。
55.其中，上述第六预设值例如可以为0，如果确定上述异常压力值的数量为1，则可以确定第一对象在某一特征维度下出现异常压力值。
56.进一步的，上述在异常压力值的数量大于第六预设值的情况下，向所述第一对象发送提示信息还可以包括：分别获取上述多个心理压力值的第一数量，和异常压力值的第二数量，如果确定第二数量和第一数量的比值大于预设阈值，则确定向所述第一对象发送提示信息，以提示所述第一对象存在所述异常压力值，还可以提示第一对象采取减压措施；其中，第二数量和第一数量的比值大小表示所述第一对象存在异常压力的程度高低，与所述减压措施的减压程度成正比关系。
57.在其他实施例中，还提出了以下方案，具体包括：分别确定所述第一语音特征信息在所述语音音量维度下的语音音量，所述第一语音特征信息在所述语音抖动维度下的语音抖动频率，所述第一语音特征信息在所述语音速度维度下的语音速度；并确定出所述语音音量维度下的第一维度阈值，所述第一语音特征信息在所述语音抖动维度下的第二维度阈值，所述第一语音特征信息在所述语音速度维度下的第三维度阈值；在所述语音音量超过所述第一维度阈值，确定所述第一语音特征信息在语音音量维度下出现异常压力值，或者所述语音抖动频率超过所述第二维度阈值，确定所述第一语音特征信息在语音抖动维度下出现异常压力值，或者所述语音速度超过所述第三维度阈值的情况下，确定所述第一语音特征信息在语音速度维度下出现异常压力值。
58.本实施例中的方法可以在用户最熟悉、最放松的家庭场景使用，通过情绪识别+图画创作的方式，对用户的心理健康度进行打分和呈现。
59.为了更好的理解上述图像生成方法的过程，以下再结合可选实施例对上述图像生成的实现方法流程进行说明，但不用于限定本技术实施例的技术方案。
60.在本实施例中提供了一种图像生成方法，图3是根据本技术实施例的图像生成方法的示意图，如图3所示，具体如下步骤：
61.步骤s301：用户通过语音或点击的方式打开内嵌在智能屏的“情绪绘画”程序。
62.步骤s302：屏幕上展示出一段描述景物或画面的文字。例如：百日依山尽，黄河入海流。
63.步骤s303：用户对着屏幕用最放松的声音、声调一句一句地朗读这段文字。
64.步骤s304：解析用户朗读的文字。从中匹配出可以绘画的实体词和描述性的形容词，例如：白、日、山。并从用户语音中提取音量大小(相当于上述语音音量)、音波抖动(相当于上述语音抖动频率)、语速等声学信号特征。
65.步骤s305：从用户朗读的语音中解析用户情绪。
66.如下表1所示，用户情绪可以简单分为积极、消极2大类，每个大类包括若干情绪小类，每个情绪小类对应n种不同的情绪程度，1表示最轻，n表示最重。
67.表1
[0068][0069][0070]
步骤s306：根据步骤s304解析出的实体词和描述性的词语、声学信号特征、步骤s305解析出的用户情绪，进行绘画创作。图画中的景物通过实体词生成，景物之间的位置关系通过描述性的词语生成，景物轮廓的大小与用户语音音量对应(声音越大景物越大)、景物轮廓线顺滑度与用户音波抖动程度对应(用户声音越抖，轮廓线也越抖越细)、景物轮廓线圆润度与用户语速对应(用户语速越快，山越陡峭)。
[0071]
积极情绪使用暖色进行填充，消极情绪使用冷色进行填充。每种情绪小类对应不同的色彩明亮度，n种情绪程度对应n种饱和度。
[0072]
步骤s307：根据绘画结果对用户的心理健康度进行打分。
[0073]
步骤s308：若用户得分低于健康阈值，则及时通知用户本人和家人，并提供情绪缓解方法。
[0074]
通过上述实施例，提出一种将语音情绪、声学信号特征、绘画相结合的测评心理健康程度的方法，具体的：可以将声学信号特征用于生成绘画轮廓线，以颜色区分情绪类别，还可以用颜色饱和度区分情绪程度，并且用户可以在自己家中，实现足不出户就进行心理健康测评，不需要特意找专业的心理咨询医生，在使用上，用户只需要与智慧屏设备交互就可以完成测评，保护了用户的个人隐私。并且，本方法以娱乐有趣的方式和熟悉的家庭环境可以让用户身心更加放松，得到更准确的测评结果。
[0075]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储
介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本技术各个实施例的方法。
[0076]
图4是根据本技术实施例的一种图像生成装置的结构框图(一)。如图4所示，包括：
[0077]
发送模块42，用于向智能设备发送预设文本；
[0078]
解析模块44，用于解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；
[0079]
需要说明的是，上述语音特征信息可以包括但不限于语音音量、语速、语音抖动频率、语音音色、语音音调等，本技术对此不作限制。
[0080]
确定模块46，用于根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像。
[0081]
其中，上述与关键词对应的图像模板可以是预先设置好的，可以是实时生成的。例如，对于实时生成的图像模板，可以根据表示名词的关键词生成的景物，即图像模板。也可以根据表示形容词的关键词生成景物之间的位置关系。
[0082]
需要说明的是，上述图像模板可以是仅有黑白底色的模板，也可以包括彩色的模板，本技术对此不作限制。
[0083]
通过上述装置，通过向智能设备发送预设文本；解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像，解决了相关技术中，如何生成与用户的心理状态对应的图片的问题。
[0084]
可选的，在一个示例性实施例中，上述确定模块46，还用于对所述语音数据的关键词进行特征识别，得到所述关键词对应的词语类别；获取为所述词语类别预先设置的图像模板，以及所述语音特征信息对应的图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板生成目标图像。
[0085]
需要说明的是，上述词语类别可以包括名词、动词、形容词、数次、量词、代词、副词、介词、连词、助词、叹词、拟声词等，但不限于此。并且，不同的词语类别对应不同的图像处理方式，例如，名词可以直接生成是名词对应的景物，而对于连词、副词、助词等没有实际含义的词语可以用于调节景物之间的位置等。
[0086]
可选的，在一个示例性实施例中，上述确定模块46，还用于获取所述语音特征信息对应的图像特征调节值，包括：获取所述语音特征信息中的语音音量，并在所述语音音量大于第一预设值，且小于第二预设值的情况下，将所述语音音量和所述第一预设值的第一差值确定为所述图像特征调整值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调整值调整所述图像模板中的初始图像的大小，得到所述目标图像。
[0087]
通过上述实施例不仅能够根据用户的语音音量调节图像的大小，还实现了根据语音音量生成目标图像的方案，即可以根据用户在不同的心理状态下的发生变化的语音音量生成与用户的心理状态相对应的目标图像。
[0088]
可选的，在一个示例性实施例中，上述确定模块46，还用于获取所述语音特征信息
中的语音抖动频率，并在确定所述语音抖动频率大于第三预设值的情况下，将所述语音抖动频率与所述第三预设值的第二差值确定为所述图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调节值调整所述图像模板中的初始图像的轮廓线条宽度，得到所述目标图像。
[0089]
可以理解的是，本实施例中，还可以根据一段时间内的语音抖动频率的剧烈程度调节图像模板中的初始图像的轮廓线条宽度。
[0090]
进一步的，上述根据所述语音抖动频率与所述第三预设值的第二差值调整所述图像模板中的初始图像的轮廓线条宽度，得到目标图像的过程可以包括：根据所述第二差值对应的线条宽度调整比例对所述初始图像的轮廓线条宽度进行调整，得到目标图像。
[0091]
在确定所述语音抖动频率小于第三预设值的情况下，则直接使用上述第三预设值对应的轮廓线条宽度作为初始图像的轮廓线条宽度，得到目标图像。
[0092]
通过上述实施例实现了根据语音抖动频率调整图像模板中的初始图像的轮廓线条宽度的方案，即，可以根据用户在不同的心理状态下的语音抖动频率生成与用户的心理状态相对应的目标图像。
[0093]
可选的，在一个示例性实施例中，上述确定模块46，还用于获取预设时间段内的所述语音特征信息的语速，并在确定所述语速大于第四预设值的情况下，将所述语速与所述第四预设值的第三差值确定为所述图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调节值调整所述图像模板中的初始图像的轮廓线条倾斜角度，得到所述目标图像。
[0094]
需要说明的是，上述初始图像的轮廓线条倾斜角度可以理解为相对于图像模板的任一条中垂线的夹角角度，在初始图像为山峰的情况下，山峰的轮廓线条倾斜角度可以理解为山峰的峰尖相比于山峰中垂线的倾斜角度。
[0095]
进一步的，上述根据所述语速与所述第四预设值的第三差值调整所述轮廓线条倾斜角度，得到目标图像的过程可以包括：根据所述第三差值对应的线条倾斜角度调整比例对所述轮廓线条倾斜角度进行调整，得到目标图像。
[0096]
在确定所述语速小于第四预设值的情况下，则使用上述第四预设值对应的线条倾斜角度作为初始图像的轮廓线条倾斜角度。
[0097]
通过上述实施例实现了根据语速调整图像模板中的初始图像的轮廓线条倾斜角度的方案，即，可以根据用户在不同的心理状态下的语速生成与用户的心理状态相对应的目标图像。
[0098]
可选的，在一个示例性实施例中，上述确定模块46，还用于从所述语音特征信息中获取不同的音调值的数量；在所述不同的音调值的数量大于第五预设值的情况下，将所述图像模板中的初始图像的色相类型确定为第一色系，得到所述目标图像。
[0099]
可以理解的是，上述第一色系可以为暖色色系，例如，红色、橙色、黄色等。
[0100]
可选的，在一个实施例中，在所述不同的音调值的数量小于第五预设值的情况下，将所述图像模板的色相类型确定为第二色系。上述第二色系可以为冷色色系，例如，蓝色、绿色等。
[0101]
进一步的，在一个示例性实施例中，可以结合图5对上述图像生成装置进行说明，图5是根据本技术实施例的一种图像生成装置的结构框图二)。
[0102]
如图5所示，上述图像生成装置还包括：获取模块52，用于获取所述第一语音特征信息对应的多个语音特征维度，所述多个语音特征维度至少包括以下之一：语音音量维度、语音抖动频率维度、语速维度；获取所述第一语音特征信息在所述多个语音特征维度下的多个心理压力值；从所述多个心理压力值中确定出异常压力值；在所述异常压力值的数量大于第六预设值的情况下，向所述第一对象发送提示信息，以提示所述第一对象存在所述异常压力值。
[0103]
其中，上述第六预设值例如可以为0，如果确定上述异常压力值的数量为1，则可以确定第一对象在某一特征维度下出现异常压力值。
[0104]
进一步的，上述在异常压力值的数量大于第六预设值的情况下，向所述第一对象发送提示信息还可以包括：分别获取上述多个心理压力值的第一数量，和异常压力值的第二数量，如果确定第二数量和第一数量的比值大于预设阈值，则确定向所述第一对象发送提示信息，以提示所述第一对象存在所述异常压力值，还可以提示第一对象采取减压措施；其中，第二数量和第一数量的比值大小表示所述第一对象存在异常压力的程度高低，与所述减压措施的减压程度成正比关系。
[0105]
在其他实施例中，还提出了以下方案，具体包括：分别确定所述第一语音特征信息在所述语音音量维度下的语音音量，所述第一语音特征信息在所述语音抖动维度下的语音抖动频率，所述第一语音特征信息在所述语音速度维度下的语音速度；并确定出所述语音音量维度下的第一维度阈值，所述第一语音特征信息在所述语音抖动维度下的第二维度阈值，所述第一语音特征信息在所述语音速度维度下的第三维度阈值；在所述语音音量超过所述第一维度阈值，确定所述第一语音特征信息在语音音量维度下出现异常压力值，或者所述语音抖动频率超过所述第二维度阈值，确定所述第一语音特征信息在语音抖动维度下出现异常压力值，或者所述语音速度超过所述第三维度阈值的情况下，确定所述第一语音特征信息在语音速度维度下出现异常压力值。
[0106]
本实施例中的方法可以在用户最熟悉、最放松的家庭场景使用，通过情绪识别+图画创作的方式，对用户的心理健康度进行打分和呈现。
[0107]
本技术的实施例还提供了一种存储介质，该存储介质包括存储的程序，其中，上述程序运行时执行上述任一项的方法。
[0108]
可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：
[0109]
s1，向智能设备发送预设文本；
[0110]
s2，解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；
[0111]
s3，根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像。
[0112]
本技术的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
[0113]
可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备
和上述处理器连接，该输入输出设备和上述处理器连接。
[0114]
可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：
[0115]
s1，向智能设备发送预设文本；
[0116]
s2，解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；
[0117]
s3，根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像。
[0118]
可选地，在本实施例中，上述存储介质可以包括但不限于：u盘、只读存储器(read-only memory，简称为rom)、随机存取存储器(random access memory，简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0119]
可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。
[0120]
显然，本领域的技术人员应该明白，上述的本技术的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本技术不限制于任何特定的硬件和软件结合。
[0121]
以上所述仅是本技术的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本技术原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本技术的保护范围。

技术特征：
1.一种图像生成方法，其特征在于，包括：向智能设备发送预设文本；解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像。2.根据权利要求1所述的图像生成方法，其特征在于，根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像，包括：对所述语音数据的关键词进行特征识别，得到所述关键词对应的词语类别；获取为所述词语类别预先设置的图像模板，以及所述语音特征信息对应的图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像。3.根据权利要求2所述的图像生成方法，其特征在于，获取所述语音特征信息对应的图像特征调节值，包括：获取所述语音特征信息中的语音音量，并在所述语音音量大于第一预设值，且小于第二预设值的情况下，将所述语音音量和所述第一预设值的第一差值确定为所述图像特征调整值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调整值调整所述图像模板中的初始图像的大小，得到所述目标图像。4.根据权利要求2所述的图像生成方法，其特征在于，获取所述语音特征信息对应的图像特征调节值，包括：获取所述语音特征信息中的语音抖动频率，并在确定所述语音抖动频率大于第三预设值的情况下，将所述语音抖动频率与所述第三预设值的第二差值确定为所述图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调节值调整所述图像模板中的初始图像的轮廓线条宽度，得到所述目标图像。5.根据权利要求2所述的图像生成方法，其特征在于，获取所述语音特征信息对应的图像特征调节值，包括：获取预设时间段内的所述语音特征信息的语速，并在确定所述语速大于第四预设值的情况下，将所述语速与所述第四预设值的第三差值确定为所述图像特征调节值；根据所述图像特征调节值和为所述词语类别预先设置的图像模板，生成目标图像，包括：根据所述图像特征调节值调整所述图像模板中的初始图像的轮廓线条倾斜角度，得到所述目标图像。6.根据权利要求1-5任一项所述的图像生成方法，其特征在于，根据所述语音特征信息
和所述关键词对应的图像模板生成所述第一对象对应的目标图像，包括：从所述语音特征信息中获取不同的音调值的数量；在所述不同的音调值的数量大于第五预设值的情况下，将所述图像模板中的初始图像的色相类型确定为第一色系，得到所述目标图像。7.根据权利要求1-6任一项所述的图像生成方法，其特征在于，所述方法还包括：获取所述第一语音特征信息对应的多个语音特征维度，所述多个语音特征维度至少包括以下之一：语音音量维度、语音抖动频率维度、语速维度；获取所述第一语音特征信息在所述多个语音特征维度下的多个心理压力值；从所述多个心理压力值中确定出异常压力值；在所述异常压力值的数量大于第六预设值的情况下，向所述第一对象发送提示信息，以提示所述第一对象存在所述异常压力值。8.一种图像生成装置，其特征在于，包括：发送模块，用于向智能设备发送预设文本；解析模块，用于解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；确定模块，用于根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像。9.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行上述权利要求1至7任一项中所述的方法。10.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。

技术总结
本申请公开了一种图像生成方法、装置、存储介质及电子装置，涉及智慧家庭技术领域，该图像生成方法包括：向智能设备发送预设文本；解析所述智能设备上传的语音数据，得到所述语音数据的关键词和所述语音数据对应的语音特征信息，所述语音数据为第一对象阅读所述预设文本时产生的语音数据；根据所述语音特征信息和所述关键词对应的图像模板生成所述第一对象对应的目标图像，采用上述技术方案，解决了如何生成与用户的心理状态对应的图片的问题。如何生成与用户的心理状态对应的图片的问题。如何生成与用户的心理状态对应的图片的问题。

技术研发人员：邓邱伟魏玉琼王凯栾天祥王迪张丽
受保护的技术使用者：青岛海尔智能家电科技有限公司海尔智家股份有限公司
技术研发日：2022.06.29
技术公布日：2022/11/1

转载请注明原文地址: https://tieba.8miu.com/read-10185.html

专利

最新回复(0)