一种翻译机及翻译方法与流程

专利2023-02-05 226

1.本发明属于翻译技术领域，具体涉及一种翻译机及翻译方法。

背景技术：

2.翻译是人们日常中经常使用到的场景，在日常生活中主要是采用人员进行现场翻译，在一些特殊的场景也支持采用电子设备进行翻译。但目前所有电子设备涉及翻译都是语种之间的翻译，例如：中文翻译成英文，英文翻译成中文。由于只能进行语种之间的翻译，导致目前翻译机的翻译性能比较差。

技术实现要素：

3.本发明提供一种翻译机及翻译方法，能够解决翻译机的翻译性能比较差的问题。
4.本发明提供一种翻译机，包括：
5.第一采集单元，用于采集幼儿的第一音频数据；
6.第一识别单元，用于识别所述第一音频数据中的第一关键音频特征，所述第一关键音频特征为能够准确识别出文本内容的音频特征，且所述第一音频数据存在无法识别出文本内容的音频特征；
7.第二识别单元，用于将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，以及识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句；
8.第一翻译单元，用于将所述第一目标语句作为所述第一音频数据的第一翻译文本内容；
9.播放单元，用于播放所述第一翻译文本内容对应的第二音频数据。
10.本发明还提供一种翻译方法，包括：
11.采集幼儿的第一音频数据；
12.识别所述第一音频数据中的第一关键音频特征，所述第一关键音频特征为能够准确识别出文本内容的音频特征，且所述第一音频数据存在无法识别出文本内容的音频特征；
13.将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，以及识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句；
14.将所述第一目标语句作为所述第一音频数据的第一翻译文本内容；
15.播放第一翻译文本内容对应的第二音频数据。
16.本发明还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明提供的翻译方法中的步骤。
17.本发明实施例中，翻译机包括：第一采集单元，用于采集幼儿的第一音频数据；第一识别单元，用于识别所述第一音频数据中的第一关键音频特征，所述第一关键音频特征
为能够准确识别出文本内容的音频特征，且所述第一音频数据存在无法识别出文本内容的音频特征；第二识别单元，用于将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句；第一翻译单元，用于将所述第一目标语句作为所述第一音频数据的第一翻译文本内容；播放单元，用于播放所述第一翻译文本内容对应的第二音频数据。本发明实施例中翻译机可以对幼儿的音频数据进行翻译，从而可以提高翻译机的翻译性能。
附图说明
18.图1是本发明实施例提供的一种翻译机的结构示意图；
19.图2是本发明实施例提供的一种翻译机的结构示意图；
20.图3是本发明实施例提供的一种翻译机的结构示意图；
21.图4是本发明实施例提供的一种翻译机的结构示意图；
22.图5是本发明实施例提供的一种翻译机的结构示意图；
23.图6是本发明实施例提供的一种翻译方法的流程示意图。
具体实施方式
24.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本技术保护的范围。
25.图1是本发明实施例提供的一种翻译机的结构图，如图1所示包括：
26.第一采集单元101，用于采集幼儿的第一音频数据；
27.第一识别单元102，用于识别所述第一音频数据中的第一关键音频特征，所述第一关键音频特征为能够准确识别出文本内容的音频特征，且所述第一音频数据存在无法识别出文本内容的音频特征；
28.第二识别单元103，用于将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，以及识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句；
29.第一翻译单元104，用于将所述第一目标语句作为所述第一音频数据的第一翻译文本内容；
30.播放单元105，用于播放所述第一翻译文本内容对应的第二音频数据。
31.上述第一音频数据可以是幼儿在讲述书本故事时说出的音频数据，例如：某一幼儿在家里阅读了一种书籍，在去另一个地方，如回老家时，想将阅读的书籍的内容讲述给老家人听，但由于幼儿说话的音频不是很准确，或者语速过快，导致老家人可能听不清楚，这样通过本发明提供的翻译机就可以将幼儿的音频进行翻译。
32.上述第一关键音频特征，可以是上述第一音频数据中能够准确识别出具体文本内容的音频特征，该音频特征也是其他人能够听清楚的音频特征，这样通过该音频特征对应的文本内容就可以识别出该幼儿讲述的具体是哪个书籍的内容，从而可以将无法识别出文本内容的音频特征进行翻译。以使得其他人员能够听清楚该幼儿讲述的具体内容。
33.上述书籍库可以是在为上述幼儿单独建立的数据库，例如：幼儿在家里阅读时，及时记录幼儿阅读的书籍，并建立上述数据库，这样可以准确、快速的查询幼儿讲述的书籍。
34.本发明实施例中，可以实现针对幼儿的音频数据进行翻译，且是同语种的翻译，这样可以提高翻译机的翻译性能，还由于翻译出幼儿讲述的内容，可以避免因为别人听不懂幼儿讲述的内容，导致幼儿哭泣的可能，以提高幼儿阅读的积极性，以避免因幼儿讲述的内容别人无法听清楚，导致幼儿失去阅读积极性的问题。
35.本发明实施例中，上述翻译机可以是手持式翻译机，也可以是佩戴式翻译机。
36.在一种实施方式中，如图2所示，所述翻译机还包括：
37.第二采集单元106，用于采集所述幼儿的第三音频数据，所述第三音频数据为与所述第一音频数据连续，且存在停顿间隔的音频数据；
38.第三识别单元107，用于识别所述第三音频数据中的第二关键音频特征，所述第二关键音频特征为能够准确识别出文本内容的音频特征，且所述第二音频数据存在无法识别出文本内容的音频特征；
39.所述第二识别单元103具体用于将所述第一关键音频特征转化为第一关键文本内容，以及将所述第二关键音频特征转化为第二关键文本内容，并基于所述第一关键文本内容和所述第二关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容和所述第二关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句，以及所述目标幼儿书籍中与所述第二关键文本内容匹配的第二目标语句，所述第一目标语句和所述第二目标语句在所述目标幼儿书籍中为连续的语句；
40.所述第一翻译单元104具体用于将所述第一目标语句作为所述第一音频数据的第一翻译文本内容，将所述第二目标语句作为所述第三音频数据的第二翻译文本内容；
41.所述播放单元102还用于播放所述第二翻译文本内容对应的第四音频数据。
42.上述停顿间隔表示幼儿讲述的不同句子之间的停顿。
43.上述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句为，目标幼儿书籍中包括所述第一关键文本内容的第一目标语句。
44.上述目标幼儿书籍中与所述第二关键文本内容匹配的第一目标语句为，目标幼儿书籍中包括所述第二关键文本内容的第一目标语句。
45.这样通过两个目标语句这连续语句，可以准确地确定第一翻译文本内容和第二翻译文本内容，因为，可以避免两个语句与幼儿讲述的音频匹配，但却不连续的可能，进而可以提高翻译的准确性。
46.在一种实施方式，如图3所示，所述翻译机还包括：
47.检测单元108，用于检测当前环境是否满足幼儿音频翻译条件，其中，所述幼儿音频翻译条件包括：
48.当前位置不属于预先记录的所述幼儿的常驻位置；
49.当前环境包括预先记录的所述幼儿的关联家人之外的人员；
50.所述第一采集单元101具体用于在所述当前环境满足所述幼儿音频翻译条件的时，采集幼儿的第一音频数据。
51.上述预先记录的常驻位置可以是幼儿的家里，如果是幼儿家里就不需要翻译，因为，在家里给父母讲述时，由于父母是有陪伴幼儿阅读书籍的，因此，即便幼儿讲述的不是
很清楚，父母也可以基于对幼儿已阅读的书籍听懂幼儿讲述的具体是什么内容，因此，在该常驻位置不需要翻译。而在常驻位置之外，可能是幼儿讲述给其他人听，例如：老家的爷爷奶奶或者其他人，这些人员并不知道幼儿阅读过哪些书籍，另外，对幼儿的讲话方式也不清楚，因此，幼儿讲述的书籍内容，对于这些人员来说可能会存在听不清楚的可能，进而需要翻译。
52.上述幼儿的关联家人之外的人员为，与幼儿接触比较少的人员，这些人员并不知道幼儿阅读过哪些书籍，另外，对幼儿的讲话方式也不清楚，因此，幼儿讲述的书籍内容，对于这些人员来说可能会存在听不清楚的可能，进而需要翻译。
53.该实施方式中，可以实现只在特定场景下才进行翻译，从而可以节约翻译的功耗、
54.在一种实施方式中，如图4所示，所述翻译机还包括：
55.收集单元109，用于采集幼儿的图像信息，识别所述图像信息是否表示所述幼儿在阅读书籍，在所述图像信息表示所述幼儿在阅读书籍时，从所述图像信息中提取书籍特征信息或者书籍名称，并基于所述书籍特征信息或者书籍名称在网络中查找所述幼儿当前正在阅读的阅读书籍，并获取该阅读书籍对应的电子书籍，将所述电子书籍存储到所述书籍库中。
56.上述收集单元可以是在幼儿阅读书籍的过程中，自动采集幼儿当前阅读的书籍，这样通过提取的特征信息或者书籍名称在网络查找幼儿当前阅读的书籍，并将该书籍的内容记录到书籍库，从而在翻译时可以准确翻译出幼儿的音频数据。
57.在一种实施方式中，所述收集单元还用于收集所述幼儿在所述阅读书籍过程中音频数据集，以及所述音频数据集中每个音频数据在所述阅读书籍中对应的书籍图像，并建立音频数据与书籍图像之间的映射关系，并在所述书籍库中存储所述映射关系，其中，每个音频数据在所述阅读书籍中对应的书籍图像为在所述幼儿输出音频数据时所述图像信息显示的所述阅读书籍的当前图像；
58.所述第二识别单元103具体用于：
59.将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的候选语句，以及提取所述目标幼儿书籍中包括所述候选语句的书籍页面图像；以及，将所述书籍页面图像与目标书籍图像进行匹配，当所述书籍页面图像与所述目标书籍图像匹配时，将所述候选语句作为所述第一目标语句；其中，所述目标书籍图像为基于在所述音频数据集中查找与所述第一音频数据匹配的历史音频数据，并基于所述映射关系提取的与所述历史音频数据存在映射关系的书籍图像。
60.上述第一音频数据匹配的历史音频数据可以是，在翻译时幼儿讲述的音频数据与该幼儿在阅读书籍时讲述的音频数据是相同或者相似的，即讲述的是同一个文本内容。
61.该实施方式可以建立幼儿在阅读书籍时的音频数据与书籍图像的映射关系，这样在翻译时，可以将查找的目标幼儿书籍中的候选语句，以及在目标书籍中对应的图像内容，再将该图像内容与预先记录的书籍图像内容进行匹配，当匹配时表示候选文句的图像内容与幼儿在阅读时讲述的音频内容的书籍图像是相同的，因此，可以确定候选语句为上述第一目标语句，进而可以提高翻译的准确性。
62.在一种实施方式中，如图5所示，所述翻译机还包括：
63.第三采集单元110，用于采集所述幼儿的第五音频数据，所述第五音频数据包括在所述第一音频数据之前的m条音频数据，以及还包括在所述第一音频数据之后的n个音频数据，m和n为正整数；
64.第四识别单元111，用于识别所述第五音频数据和所述第一音频数据的语速，并将所述语速与预设语速阈值进行比较；
65.第二翻译单元112，用于提取所述m条音频数据的m个关键音频特征，并将所述m个关键音频特征转化为m个关键文本内容，并基于所述m个关键文本内容，并识别所述目标幼儿书籍中与所述m个关键文本内容匹配的m个目标语句，将所述m个目标语句作为所述m条音频数据的翻译文本内容；以及，在所述语速达到预设语速阈值时，在所述目标幼儿书籍中识别与所述第一目标语句连续的n个目标语句，并将所述n个目标语句作为所述n条音频数据的翻译文本内容；
66.所述播放单元105还用于播放所述m条音频数据的翻译文本内容对应的音频数据，以及，播放所述n条音频数据的翻译文本内容对应的音频数据。
67.上述语速达到预设语速阈值可以理解为，幼儿讲述的书籍内容比较快，而讲述的比较快往往表示幼儿对书籍的内容特别熟悉，也就是说，幼儿当前讲述的书籍内容是准确的，只是幼儿由于发音不标准，导致一些人可能无法听清楚。
68.该实施例中，可以实现在语速达到预设语速阈值时，对于后面一些语句不需要逐句，因为，由于幼儿讲述的比较快，讲述的内容是准确的，这样可以直接基于翻译出的前面的语句可以查到在后面音频数据在书籍中的语句，进而可以节约翻译计算量，也可以提高翻译效率。
69.该实施方式中，当语速未达到预设语速阈值时针对上述n个音频数据可以进行逐句翻译。
70.本发明实施例中，翻译机包括：第一采集单元，用于采集幼儿的第一音频数据；第一识别单元，用于识别所述第一音频数据中的第一关键音频特征，所述第一关键音频特征为能够准确识别出文本内容的音频特征，且所述第一音频数据存在无法识别出文本内容的音频特征；第二识别单元，用于将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句；第一翻译单元，用于将所述第一目标语句作为所述第一音频数据的第一翻译文本内容；播放单元，用于播放所述第一翻译文本内容对应的第二音频数据。本发明实施例中翻译机可以对幼儿的音频数据进行翻译，从而可以提高翻译机的翻译性能。
71.图6是本发明实施例提供的一种翻译方法的流程图，如图6所示，包括：
72.601、采集幼儿的第一音频数据；
73.602、识别所述第一音频数据中的第一关键音频特征，所述第一关键音频特征为能够准确识别出文本内容的音频特征，且所述第一音频数据存在无法识别出文本内容的音频特征；
74.603、将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，以及识
别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句；
75.604、将所述第一目标语句作为所述第一音频数据的第一翻译文本内容；
76.605、播放第一翻译文本内容对应的第二音频数据。
77.可选的，所述方法还包括：
78.采集所述幼儿的第三音频数据，所述第三音频数据为与所述第一音频数据连续，且存在停顿间隔的音频数据；
79.识别所述第三音频数据中的第二关键音频特征，所述第二关键音频特征为能够准确识别出文本内容的音频特征，且所述第二音频数据存在无法识别出文本内容的音频特征；
80.所述将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句，包括：
81.将所述第一关键音频特征转化为第一关键文本内容，以及将所述第二关键音频特征转化为第二关键文本内容，并基于所述第一关键文本内容和所述第二关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容和所述第二关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句，以及所述目标幼儿书籍中与所述第二关键文本内容匹配的第二目标语句，所述第一目标语句和所述第二目标语句在所述目标幼儿书籍中为连续的语句；
82.所述将所述第一目标语句作为所述第一音频数据的第一翻译文本内容，包括：
83.将所述第一目标语句作为所述第一音频数据的第一翻译文本内容，将所述第二目标语句作为所述第三音频数据的第二翻译文本内容。
84.可选的，所述方法还包括：
85.检测当前环境是否满足幼儿音频翻译条件，其中，所述幼儿音频翻译条件包括：
86.当前位置不属于预先记录的所述幼儿的常驻位置；
87.当前环境包括预先记录的所述幼儿的关联家人之外的人员；
88.所述采集幼儿的第一音频数据，包括：
89.在所述当前环境满足所述幼儿音频翻译条件的时，采集幼儿的第一音频数据。
90.可选的，所述方法还包括：
91.采集幼儿的图像信息，识别所述图像信息是否表示所述幼儿在阅读书籍，在所述图像信息表示所述幼儿在阅读书籍时，从所述图像信息中提取书籍特征信息或者书籍名称，并基于所述书籍特征信息或者书籍名称在网络中查找所述幼儿当前正在阅读的阅读书籍，并获取该阅读书籍对应的电子书籍，将所述电子书籍存储到所述书籍库中。
92.可选的，所述方法还包括：
93.收集所述幼儿在所述阅读书籍过程中音频数据集，以及所述音频数据集中每个音频数据在所述阅读书籍中对应的书籍图像，并建立音频数据与书籍图像之间的映射关系，并在所述书籍库中存储所述映射关系，其中，每个音频数据在所述阅读书籍中对应的书籍图像为在所述幼儿输出音频数据时所述图像信息显示的所述阅读书籍的当前图像；
94.所述将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，并识别
所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句，包括：
95.将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的候选语句，以及提取所述目标幼儿书籍中包括所述候选语句的书籍页面图像；以及，将所述书籍页面图像与目标书籍图像进行匹配，当所述书籍页面图像与所述目标书籍图像匹配时，将所述候选语句作为所述第一目标语句；其中，所述目标书籍图像为基于在所述音频数据集中查找与所述第一音频数据匹配的历史音频数据，并基于所述映射关系提取的与所述历史音频数据存在映射关系的书籍图像。
96.可选的，所述方法还包括：
97.采集所述幼儿的第五音频数据，所述第五音频数据包括在所述第一音频数据之前的m条音频数据，以及还包括在所述第一音频数据之后的n个音频数据，m和n为正整数；
98.识别所述第五音频数据和所述第一音频数据的语速，并将所述语速与预设语速阈值进行比较；
99.提取所述m条音频数据的m个关键音频特征，并将所述m个关键音频特征转化为m个关键文本内容，并基于所述m个关键文本内容，并识别所述目标幼儿书籍中与所述m个关键文本内容匹配的m个目标语句，将所述m个目标语句作为所述m条音频数据的翻译文本内容；以及，在所述语速达到预设语速阈值时，在所述目标幼儿书籍中识别与所述第一目标语句连续的n个目标语句，并将所述n个目标语句作为所述n条音频数据的翻译文本内容；
100.所述播放所述第一翻译文本内容对应的第二音频数据，包括：
101.播放所述m条音频数据的翻译文本内容对应的音频数据，以及，播放所述n条音频数据的翻译文本内容对应的音频数据。
102.本发明还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明提供的翻译方法中的步骤。
103.需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。
104.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本技术各个实施例所述的方法。
105.上面结合附图对本技术的实施例进行了描述，但是本技术并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本技术的启示下，在不脱离本技术宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本技术的保护之内。

技术特征：
1.一种翻译机，其特征在于，包括：第一采集单元，用于采集幼儿的第一音频数据；第一识别单元，用于识别所述第一音频数据中的第一关键音频特征，所述第一关键音频特征为能够准确识别出文本内容的音频特征，且所述第一音频数据存在无法识别出文本内容的音频特征；第二识别单元，用于将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，以及识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句；第一翻译单元，用于将所述第一目标语句作为所述第一音频数据的第一翻译文本内容；播放单元，用于播放所述第一翻译文本内容对应的第二音频数据。2.根据权利要求1所述的翻译机，其特征在于，所述翻译机还包括：第二采集单元，用于采集所述幼儿的第三音频数据，所述第三音频数据为与所述第一音频数据连续，且存在停顿间隔的音频数据；第三识别单元，用于识别所述第三音频数据中的第二关键音频特征，所述第二关键音频特征为能够准确识别出文本内容的音频特征，且所述第二音频数据存在无法识别出文本内容的音频特征；所述第二识别单元具体用于将所述第一关键音频特征转化为第一关键文本内容，以及将所述第二关键音频特征转化为第二关键文本内容，并基于所述第一关键文本内容和所述第二关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容和所述第二关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句，以及所述目标幼儿书籍中与所述第二关键文本内容匹配的第二目标语句，所述第一目标语句和所述第二目标语句在所述目标幼儿书籍中为连续的语句；所述第一翻译单元具体用于将所述第一目标语句作为所述第一音频数据的第一翻译文本内容，将所述第二目标语句作为所述第三音频数据的第二翻译文本内容；所述播放单元还用于播放所述第二翻译文本内容对应的第四音频数据。3.根据权利要求1所述的翻译机，其特征在于，所述翻译机还包括：检测单元，用于检测当前环境是否满足幼儿音频翻译条件，其中，所述幼儿音频翻译条件包括：当前位置不属于预先记录的所述幼儿的常驻位置；当前环境包括预先记录的所述幼儿的关联家人之外的人员；所述第一采集单元具体用于在所述当前环境满足所述幼儿音频翻译条件的时，采集幼儿的第一音频数据。4.根据权利要求1所述的翻译机，其特征在于，所述翻译机还包括：收集单元，用于采集幼儿的图像信息，识别所述图像信息是否表示所述幼儿在阅读书籍，在所述图像信息表示所述幼儿在阅读书籍时，从所述图像信息中提取书籍特征信息或者书籍名称，并基于所述书籍特征信息或者书籍名称在网络中查找所述幼儿当前正在阅读的阅读书籍，并获取该阅读书籍对应的电子书籍，将所述电子书籍存储到所述书籍库中。5.根据权利要求4所述的翻译机，其特征在于，所述收集单元还用于收集所述幼儿在所
述阅读书籍过程中音频数据集，以及所述音频数据集中每个音频数据在所述阅读书籍中对应的书籍图像，并建立音频数据与书籍图像之间的映射关系，并在所述书籍库中存储所述映射关系，其中，每个音频数据在所述阅读书籍中对应的书籍图像为在所述幼儿输出音频数据时所述图像信息显示的所述阅读书籍的当前图像；所述第二识别单元具体用于：将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的候选语句，以及提取所述目标幼儿书籍中包括所述候选语句的书籍页面图像；以及，将所述书籍页面图像与目标书籍图像进行匹配，当所述书籍页面图像与所述目标书籍图像匹配时，将所述候选语句作为所述第一目标语句；其中，所述目标书籍图像为基于在所述音频数据集中查找与所述第一音频数据匹配的历史音频数据，并基于所述映射关系提取的与所述历史音频数据存在映射关系的书籍图像。6.根据权利要求1至4中任一项所述的翻译机，其特征在于，所述翻译机还包括：第三采集单元，用于采集所述幼儿的第五音频数据，所述第五音频数据包括在所述第一音频数据之前的m条音频数据，以及还包括在所述第一音频数据之后的n个音频数据，m和n为正整数；第四识别单元，用于识别所述第五音频数据和所述第一音频数据的语速，并将所述语速与预设语速阈值进行比较；第二翻译单元，用于提取所述m条音频数据的m个关键音频特征，并将所述m个关键音频特征转化为m个关键文本内容，并基于所述m个关键文本内容，并识别所述目标幼儿书籍中与所述m个关键文本内容匹配的m个目标语句，将所述m个目标语句作为所述m条音频数据的翻译文本内容；以及，在所述语速达到预设语速阈值时，在所述目标幼儿书籍中识别与所述第一目标语句连续的n个目标语句，并将所述n个目标语句作为所述n条音频数据的翻译文本内容；所述播放单元还用于播放所述m条音频数据的翻译文本内容对应的音频数据，以及，播放所述n条音频数据的翻译文本内容对应的音频数据。7.一种翻译方法，其特征在于，包括：采集幼儿的第一音频数据；识别所述第一音频数据中的第一关键音频特征，所述第一关键音频特征为能够准确识别出文本内容的音频特征，且所述第一音频数据存在无法识别出文本内容的音频特征；将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，以及识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句；将所述第一目标语句作为所述第一音频数据的第一翻译文本内容；播放第一翻译文本内容对应的第二音频数据。8.根据权利要求7所述的方法，其特征在于，所述方法还包括：采集所述幼儿的第三音频数据，所述第三音频数据为与所述第一音频数据连续，且存在停顿间隔的音频数据；识别所述第三音频数据中的第二关键音频特征，所述第二关键音频特征为能够准确识
别出文本内容的音频特征，且所述第二音频数据存在无法识别出文本内容的音频特征；所述将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句，包括：将所述第一关键音频特征转化为第一关键文本内容，以及将所述第二关键音频特征转化为第二关键文本内容，并基于所述第一关键文本内容和所述第二关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容和所述第二关键文本内容的目标幼儿书籍，并识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句，以及所述目标幼儿书籍中与所述第二关键文本内容匹配的第二目标语句，所述第一目标语句和所述第二目标语句在所述目标幼儿书籍中为连续的语句；所述将所述第一目标语句作为所述第一音频数据的第一翻译文本内容，包括：将所述第一目标语句作为所述第一音频数据的第一翻译文本内容，将所述第二目标语句作为所述第三音频数据的第二翻译文本内容。9.根据权利要求7所述的方法，其特征在于，所述方法还包括：检测当前环境是否满足幼儿音频翻译条件，其中，所述幼儿音频翻译条件包括：当前位置不属于预先记录的所述幼儿的常驻位置；当前环境包括预先记录的所述幼儿的关联家人之外的人员；所述采集幼儿的第一音频数据，包括：在所述当前环境满足所述幼儿音频翻译条件的时，采集幼儿的第一音频数据。10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求7至9中任一项所述的翻译方法中的步骤。

技术总结
本发明公开了一种翻译机及翻译方法，该翻译机包括：第一采集单元，用于采集幼儿的第一音频数据；第一识别单元，用于识别所述第一音频数据中的第一关键音频特征；第二识别单元，用于将所述第一关键音频特征转化为第一关键文本内容，并基于所述第一关键文本内容，在预先获取的书籍库中查找包括所述第一关键文本内容的目标幼儿书籍，以及识别所述目标幼儿书籍中与所述第一关键文本内容匹配的第一目标语句；第一翻译单元，用于将所述第一目标语句作为所述第一音频数据的第一翻译文本内容；播放单元，用于播放所述第一翻译文本内容对应的第二音频数据。本发明可以提高翻译机的翻译性能。能。能。

技术研发人员：漆雨郭胜荣
受保护的技术使用者：深圳市东象设计有限公司
技术研发日：2022.07.26
技术公布日：2022/11/1

转载请注明原文地址: https://tieba.8miu.com/read-688.html

专利

最新回复(0)