AI控制装置、与AI控制装置连接的服务器装置以及AI控制方法与流程

专利2023-11-04  88


ai控制装置、与ai控制装置连接的服务器装置以及ai控制方法
技术领域
1.本公开涉及一种ai控制装置、与ai控制装置连接的服务器装置以及ai控制方法。


背景技术:

2.以往,已知有使用生产装置周围的声音信息进行异常检测的学习完毕模型构建装置和异常检测装置(参照专利文献1)。在专利文献1中,学习完毕模型构建装置获取声音数据,该声音数据包括位于生产装置附近的操作人员的声音,并获取与生产线相关的异常度作为标签,将声音数据与标签的组合作为学习数据进行监督学习,由此构建关于异常度的学习完毕模型。异常检测装置使用构建的学习完毕模型和判定数据,来对判定数据的异常度进行判定。
3.现有技术文献
4.专利文献
5.专利文献1:日本专利第6527187号说明书
6.为了构建学习完毕模型而得到足够的学习数据对于用户来说负担很重,另外很难提高从学习完毕模型得到的输出的准确性。


技术实现要素:

7.本公开的目的在于提供一种能够在学习完毕模型的生成过程中减轻用户的负担,并且能够使用学习完毕模型来实现任意的事件检测单元的ai控制装置、与ai控制装置连接的服务器装置和ai控制方法。
8.根据本公开的一个观点,ai控制装置能够与服务器装置连接,该服务器装置从多个用户识别各个用户并接收输入数据,并针对每个用户基于输入数据生成学习完毕模型,该ai控制装置具备:第一控制部;以及第一通信部,其与服务器装置连接。第一控制部获取输入数据,将能够识别ai控制装置的用户的识别信息与该获取的输入数据相关联,并经由第一通信部发送到服务器装置。第一控制部执行学习完毕模型,该学习完毕模型是使用所发送的获取的输入数据,通过服务器装置与其他用户的学习完毕模型分开生成的,且该学习完毕模型学习获取的输入数据的特征,以从未知的输入数据中检测具有该特征的输入数据。
9.根据本公开的其他观点,服务器装置能够与多个用户使用的多个ai控制装置连接,其具备:第二控制部;第二通信部,其与多个ai控制装置连接;以及第二存储部。第二控制部从多个用户的ai控制装置经由第二通信部接收与各用户的识别信息相关联的输入数据,将该接收的输入数据存储于第二存储部,使用接收的输入数据,针对每个用户,学习接收的输入数据的特征,以生成从未知的输入数据中检测具有该特征的输入数据的学习完毕模型。第二控制部针对每个用户使生成的学习完毕模型存储于第二存储部。
10.根据本公开的又一观点,ai控制方法使用能够与多个ai控制装置连接的服务器装
置,其包括:从多个用户的ai控制装置接收与各用户的识别信息相关联的输入数据;将该接收的输入数据存储于存储部;使用接收的输入数据,针对每个用户,学习接收的输入数据的特征;生成从未知的输入数据中检测具有该特征的输入数据的学习完毕模型;以及针对每个用户使生成的学习完毕模型存储于存储部。
11.根据本公开所提供的ai控制装置、与ai控制装置连接的服务器装置和ai控制方法,能够在学习完毕模型的生成过程中减轻用户的负担,并且能够使用学习完毕模型来实现任意的事件检测单元。
附图说明
12.图1示出了实施方式1所提供的系统的整体结构。
13.图2示出了实施方式1所提供的ai控制装置的结构。
14.图3示出了实施方式1所提供的服务器装置的结构。
15.图4a示出了在服务器装置中管理的用户管理表的一个示例。
16.图4b示出了在服务器装置中管理的收费表的一个示例。
17.图5是示出了ai控制装置的用于机器学习的动作的流程图。
18.图6是示出了服务器装置的机器学习动作的流程图。
19.图7示出了用于用户输入标签的显示界面的一个示例。
20.图8a示出了表示关联信息的显示界面的一个示例。
21.图8b示出了用于计算标签名的关联度的基准信息的例子。
22.图9示出了表示收费信息的显示界面的一个示例。
23.图10是示出了ai控制装置的异常检测的动作的流程图。
24.图11a示出了其他实施方式所提供的ai控制装置所参照的麦克风的位置信息的例子。
25.图11b示出了其他实施方式所提供的ai控制装置所参照的扬声器的位置信息的例子。
26.图11c示出了其他实施方式所提供的ai控制装置所参照的监视相机的位置信息的例子。
具体实施方式
27.1.实施方式1
28.包括图1所示的ai控制装置10和服务器装置30的系统1可以以适合每个用户的方式生成对任意事件(异常声音等)作出反应的传感器。经由用户使用的ai控制装置10,收集输入数据,并发送到服务器装置30,该输入数据以代表用户想要作出反应的事件、例如尖叫声、门的开闭等异常声音的关键词作为标签。服务器装置30是机器学习服务器,基于针对每个用户接收的输入数据,针对每个用户生成并管理学习完毕模型。ai控制装置10基于该学习完毕模型,作为对包括事件发生时的未知声音的声音作出反应的传感器发挥作用。其结果,各用户都可以生成适合自己的传感器。
29.如图1所示,ai控制装置10是各用户usera、userb

使用的装置。ai控制装置10与包括设置在办公室、工厂、商业设施、公共设施等设施内的广播装置20、监视相机40的设备
机器连接。此外,一个ai控制装置10可以连接多个设备机器,也可以对每个设备机器连接ai控制装置10。另外,ai控制装置10也可以作为设备机器中的控制装置而被搭载。
30.如后所述,各设备机器具备:触点输入端子,其从ai控制装置10接收信号;以及继电器电路,其根据从触点输入端子接收到的信号使设备机器工作。
31.广播装置20至少包括触点输入端子、保存广播声音的保存部以及扬声器。广播装置20根据从触点输入端子接收到的信号,从扬声器输出由保存部保存的广播声音并进行扩音。
32.监视相机40至少包括触点输入端子和录像部。监视相机40根据从触点输入端子接收到的信号,对拍摄到的影像进行录像。
33.以下,对本实施方式所提供的包括ai控制装置10和服务器装置30的系统1的结构及其动作进行说明。
34.此外,在以下的说明中,以输入数据是用户将尖叫声作为关键词进行标注的声音数据,生成对作为异常检测的尖叫声进行检测的传感器的情况为例。
35.1-1.结构
36.1-1-1.ai控制装置10
37.如图2所示,ai控制装置10(ai控制装置的一个示例)具备控制部11、ram12、rom14、存储部13、显示部15、操作部16、通信部17、麦克风18和触点输出部19。
38.控制部11(第一控制部的一个示例)例如由ai芯片构成,包括能够进行高速处理的cpu、gpu、fpga等处理器。控制部11将存储于rom14、存储部13的计算机程序读出至ram12并执行,从而执行ai控制装置10的各功能。控制部11特别执行由服务器装置30生成的学习完毕模型的程序,来执行输入数据获取部111、标记部112、异常检测部113和设备机器工作指令部114的功能。
39.麦克风18(输入部的一个示例)是内置于ai控制装置10的内置麦克风或经由xlr连接器等外部输入端子与ai控制装置10连接的至少1个外部麦克风(省略图示)。麦克风18用于获取后述的服务器23的机器学习所使用的输入数据(声音数据)用的声音、以及后述的异常检测动作用的声音。麦克风18也可以是经由各不相同的外部输入端子而连接的多个外部麦克风。在ai控制装置10与多个设备机器连接的情况下,也可以与多个设备机器相关联地具备多个外部麦克风18。例如,在多个设备机器分别设置于不同的区域的情况下,各外部麦克风18可以经由外部输入端子与ai控制装置10连接,使得不同的外部麦克风18与设备机器一起分别配置在这些区域。
40.输入数据获取部111获取由用户输入的声音数据。声音数据包括用户判断为“尖叫声”的多个样本声音。声音数据例如经由麦克风18输入。例如,经由麦克风18重复输入样本声音,通过后述的标记部112赋予相同的标签,从而获取带标签的声音数据。此外,声音数据也可以从预先获取并存储于存储部13的声音文件中获取。另外,经由麦克风18收集到的样本声音也可以暂时存储于存储部13,用户对所存储的样本声音一并赋予相同的标签。
41.标记部112对由输入数据获取部111获取的声音数据赋予标签。标签的赋予根据使用了后述的显示界面的用户的输入来执行。被赋予了标签的声音数据(以下,称为带标签的声音数据或者带标签的输入数据)经由通信部17被发送到服务器装置30。
42.异常检测部113获取从麦克风18拾取到的声音,并基于由服务器装置30生成的学
习完毕模型来判定异常。
43.在判定为异常的情况下,设备机器工作指令部114生成用于使连接有ai控制装置10的设备机器(广播装置20、监视相机40等)工作的信号。所生成的信号经由触点输出部19被发送到设备机器。在设备机器中,通过接收信号,设备机器的继电器电路的触点接通,设备机器工作。例如,在判定为从麦克风18获取的声音为“尖叫声”的情况下,接通设备机器,并且如果是广播装置20则输出广播声音(警告声音),如果是监视相机40则开始对影像进行录像。
44.在ai控制装置10与不同区域的多个设备机器连接的情况下,设备机器工作指令部114从与获取了被判定为异常的声音的麦克风18接近的设备机器(与麦克风18对应地设置于相同区域的设备机器)连接的输出端子发送信号,使设备机器工作。
45.存储部13由半导体存储器、hdd等构成。存储部13具有存储ai控制装置10的识别信息的识别信息存储部131。如后所述,存储部13还具有存储学习完毕模型的学习完毕模型存储部132(存储部的一个示例),该学习完毕模型包括通过机器学习生成并更新的程序和参数。此外,学习完毕模型也可以仅存储在服务器装置30中,并暂时存储在ai控制装置10中。在该情况下,学习完毕模型存储部132也可以包括在控制部11的一部分中。另外,存储部13的一部分或全部也可以作为其他存储装置而具备。
46.显示部15例如由液晶显示器或有机el显示器构成。显示部15也可以包括触摸面板。显示部15也可以是能够与ai控制装置10连接的分体的显示器。
47.操作部16例如具备键盘、鼠标、触摸面板等,用户按照显示部15所显示的画面进行输入操作。
48.通信部17(第一通信部的一个示例)是用于与网络连接的接口,例如是无线通信用的天线或可以通过有线连接的网卡。通信部17经由lan、wan等内部网络和互联网与服务器装置30连接。
49.触点输出部19(外部接口的一个示例)具有与广播装置20、监视相机40等设备机器连接的输出端子,发送设备机器工作指令部114生成的信号。触点输出部19具有多个输出端子,ai控制装置10也可以针对每个输出端子分别与不同区域的多个广播装置20、多个监视相机40连接。
50.1-1-2.服务器装置30
51.服务器装置30经由互联网与多个用户所使用的ai控制装置10连接。服务器装置30由管理设备机器的经营者和提供使用了机器学习的服务的经营者管理。
52.如图3所示,服务器装置30(服务器装置的一个示例)具备控制部31、ram32、rom34、存储部33和通信部37。
53.控制部31(第二控制部的一个示例)例如由ai芯片构成,包括能够进行高速处理的cpu、gpu等处理器。控制部31通过将存储于rom34、存储部33的计算机程序读出至ram32并执行,从而执行服务器装置30的各功能。控制部31特别执行输入数据管理部311和学习部312的功能。
54.输入数据管理部311将从各用户的ai控制装置10获取的输入数据即声音数据存储于存储部33。此时,输入数据管理部311根据从各用户的ai控制装置10发送的用户识别信息、带标签的声音数据和可否使用信息,生成或更新后述的用户管理表。输入数据管理部
311还根据来自ai控制装置10的请求,参照后述的用户管理表,将收费信息发送到ai控制装置10。
55.输入数据管理部311基于从各用户的ai控制装置10获取的带标签的声音数据,生成并更新用于判定标签名之间的类似性的基准信息。基准信息是按照规定的基准与标签名的概念相关联的信息。规定的基准例如是,是否为一个标签名的概念(下位概念)继承另一个的标签名的概念(上位概念)的关系、标签名的概念彼此是否为同义词、近义词等的基准。输入数据管理部311例如生成由图8b所示的分层结构表示的基准信息,并将其存储于存储部33。输入数据管理部311在从用户的ai控制装置10获取了带标签的声音数据时,例如在标注了新的标签名的情况下,更新该基准信息。
56.输入数据管理部311根据来自用户的ai控制装置10的请求生成关联度信息。关联度信息包括相对于作为目标的带标签的声音数据具有较高关联度的带标签的声音数据及其关联度。输入数据管理部311参照上述的基准信息,计算关联度。例如,如图8a和图8b所示,对于标注了“女性的尖叫声”这样的标签名的声音数据,标注了同义词的“女性的尖叫声”(或者女性的叫声等)这样的标签名的声音数据的关联度被计算为100%。另外,例如对于标注了“女性的尖叫声”这样的标签名的声音数据,标注了“尖叫声”这样的标签名的声音数据的关联度被计算为80%。另一方面,例如对于标注了“门开闭”这样的标签名的声音数据,标注了“尖叫声”这样的标签名的声音数据的关联度被计算为0%。输入数据管理部311从输入数据存储部334读出这样计算出的关联度较高的(例如,60%以上)声音数据,生成包括关联度在内的用于向有请求的ai控制装置10发送的关联度信息。
57.学习部312根据来自ai控制装置10的请求,基于所获取的声音数据进行机器学习,构建每个用户的学习完毕模型。具体而言,构建学习完毕模型,该学习完毕模型自主学习所获取的声音数据的特征,并针对未知声音的输入,检测具有该特征的声音。
58.机器学习例如使用执行监督学习的分类的回归算法来进行,或者使用深度学习的神经网络来进行。机器学习执行所谓的监督学习。带标签的声音数据作为正确数据被用于机器学习。此外,机器学习中也可以使用预先准备的非正确数据(例如,关于标注“尖叫声”的声音数据,为非“尖叫声”的声音数据)。
59.服务器装置30也可以使用现有的ai平台、机器学习引擎、其他机器学习服务,使用带标签的声音数据对现有的学习完毕模型进行训练,执行机器学习。
60.存储部33(第二存储部或存储部的一个示例)由半导体存储器、hdd等构成。存储部33包括用户管理表存储部331、收费表存储部332、针对每个用户存储的学习完毕模型存储部333、和按照标签存储有声音数据的输入数据存储部334。此外,存储部33的一部分或全部也可以作为包括数据库的其他存储装置而具备。
61.用户管理表存储部331存储如图4a所示的用户管理表331a。用户管理表331a将用户的识别信息、标签、与该标签对应的声音数据的识别信息、可否使用信息相关联地进行存储。可否使用信息表示是否允许其他用户使用该声音数据。此外,可否使用信息也可以仅允许或不允许特定的用户。例如,也可以设为能够确定竞争公司而设定不允许其使用。
62.收费表存储部332存储图4b所示的收费表332a。收费表332a是用于计算ai控制装置10通过服务器装置30生成学习完毕模型时的使用费用,并对ai控制装置10的用户收费的表。例如,收费表332a是表示用于生成学习完毕模型的单价的信息。例如,收费表332a包括:
标注一个标签并使用了带标签的声音数据的机器学习的基本使用费用(在图4b的例子中为100日元);在机器学习时使用其他用户的带标签的声音数据的情况下的追加费用(在图4b的例子中为50日元);以及在带标签的声音数据的可否使用信息为“允许”(肯定性的可否使用信息)时的追加费用(在图4b的例子中为-50日元,即50日元的折扣)。
63.学习完毕模型存储部333针对每个用户存储由学习部312生成的学习完毕模型。
64.输入数据存储部334按照标签存储声音数据。从各用户获取的带标签的声音数据由输入数据管理部311按照标签进行分类,并存储于输入数据存储部334。此外,声音数据的按照标签的分类也可以根据上述的基准信息进行。例如,在标签名为“尖叫声”的情况下,如图8b所示,也可以分类为在上位概念即“尖叫声”的声音数据中,包括被赋予了下位概念即“女性的尖叫声”、“室外的尖叫声”、“室内的尖叫声”的标签名的声音数据。
65.通信部37(第二通信部的一个示例)是用于与网络连接的接口,例如是无线通信用的天线或可以通过有线连接的网卡。通信部37经由lan、wan等内部网络和互联网与多个用户的ai控制装置10连接。
66.1-2.动作
67.参照图5至图10,对ai控制装置10(图2)和服务器装置30的动作进行说明。
68.1-2-1.ai控制装置10的用于机器学习的动作
69.图5示出了用于执行图2所示的ai控制装置10的机器学习的动作。ai控制装置10接受针对输入数据即声音数据的标签的输入(s101)。此时,显示部15显示图7所示的显示界面15a。显示界面15a(标签输入界面的一个示例)包括用于输入标签的界面和用于输入数据的可否使用信息的界面。可否使用信息表示允许/不允许其他用户使用该声音数据。ai控制装置10的用户经由操作部16输入针对目标声音数据的标签。例如,输入关键词“女性的尖叫声”这样的标签。此外,标签的输入可以由用户直接输入,也可以通过显示预先设定的标签的列表来由用户选择。
70.通过输入数据获取部111获取声音数据(s102),通过标记部112,对声音数据赋予在步骤s101中接受的标签(s103)。
71.控制部11将与用户的识别信息相关联的带标签的声音数据与数据的可否使用信息一起经由通信部17发送到服务器装置30(s104)。
72.从服务器装置30接收上述的关联度信息,并显示于显示部15(s105)。例如,显示部15显示图8a所示的显示界面15b。显示界面15b显示其他用户的各声音数据相对于该声音数据的关联度(%)、各声音数据的标签名以及样本数。通过经由该显示界面15b选择输入其他用户的声音数据,该用户向服务器装置30发送表示使用其他用户的声音数据的意思的请求。
73.此外,作为关联度信息显示的其他用户的声音数据仅限于该其他用户在可否使用信息中允许的数据。
74.如果接受使用其他用户的声音数据的输入(s106的是),则控制部11经由通信部17将所选择的其他用户的数据的使用请求发送到服务器装置30(s107)。
75.从服务器装置30接收收费信息,并显示于显示部15(s108)。
76.在使用由其他用户收集到的声音数据的情况下(s106的是),显示部15显示图9所示那样的显示界面15c。显示界面15c除了显示使用服务器装置30的本次的机器学习的费用
(机器学习使用费用)之外,还显示所请求的其他用户的声音数据的使用费用。
77.在完全不使用其他用户的声音数据的情况下(s106的否),即在图8a的显示界面15b中选择了“全部不使用,开始机器学习”的情况下,显示部15仅将机器学习使用费用作为收费信息显示于显示部15。
78.该用户经由显示界面15c,输入是否同意所提示的收费信息。当输入了同意时,控制部11对服务器装置30请求开始机器学习(s109)。
79.在步骤s106中,在完全不使用其他用户的声音数据的情况下(s106的否),显示部15也可以不显示收费信息。
80.步骤s101~s103的顺序不限于上述顺序。也可以在获取声音数据之后,接受标签输入,执行标记。
81.1-2-2.服务器装置30的机器学习的动作
82.图6示出了服务器装置30的动作。控制部31的输入数据管理部311获取从ai控制装置10接收到的声音数据和数据的可否使用信息(s111)。输入数据管理部311判定接收到的用户的识别信息(s112),将接收到的被标注的声音数据按照每个标签分类并存储于输入数据存储部334,并且更新图4a所示的用户管理表331a(s113)。
83.输入数据管理部311生成上述的关联度信息,并发送到与该用户的识别信息对应的ai控制装置10(s114)。此时,输入数据管理部311还参照其他用户的声音数据的可否使用信息,不生成不可使用的其他用户的声音数据的关联度信息,并将其排除在外。
84.关联度信息的生成如下面这样执行。输入数据管理部311将来自用户的带标签的声音数据的标签(以下,称为目标标签)与在输入数据存储部334中分类并存储的多个声音数据的标签(其他标签)进行比较。输入数据管理部311基于图8b所示的基准,针对目标标签,计算其他标签与目标标签的关联度(%)。输入数据管理部311确定被赋予了其他标签中关联度为规定值以上(例如,60%以上)的标签的声音数据。输入数据管理部311从输入数据存储部334提取标签的关联度为规定值以上的声音数据,生成包括该声音数据和计算出的关联度的关联度信息,并发送到ai控制装置10。
85.在从参照了关联度信息的ai控制装置10接收到其他用户的声音数据的使用请求的情况下(s115的是),从输入数据存储部334获取该其他用户的声音数据(s116)。
86.输入数据管理部311生成收费信息,并将其发送到ai控制装置10(s117)。在步骤s117中,输入数据管理部311根据在步骤s111中获取的可否使用信息是“可使用”还是“不可使用”,以及根据步骤s115中的使用请求的有无,参照收费表332a计算收费金额,生成表示该金额的收费信息。参照图4b所示的收费表322a,以生成基于标注有一个标签(在本实施方式的例子中为“尖叫声”)的声音数据的学习完毕模型的基本费用100日元为基础,在步骤s111中获取的可否使用信息为“可使用”的情况下,打折50日元,在步骤s115中接收到使用请求(s115的是)的情况下,追加50日元,计算收费金额。
87.通过学习部312执行机器学习(s118)。在不使用其他用户的声音数据的情况下(s115的否),仅基于从该用户获取的声音数据来执行机器学习。由此,构建了一个学习完毕模型,该学习完毕模型学习从该用户获取的声音数据的特征,并检测具有该特征的未知声音。在使用其他用户的声音数据的情况下(s115的是),除了从该用户获取的声音数据之外,还基于所指定的其他用户的声音数据,执行机器学习。由此,构建了一个学习完毕模型,该
学习完毕模型学习从该用户获取的声音数据和所指定的其他用户的声音数据的特征,并检测具有该特征的未知声音。
88.当机器学习结束时(s119的是),将所生成的学习完毕模型与该用户的识别信息对应地存储于学习完毕模型存储部333(s120)。
89.所生成的学习完毕模型被发送到对应的用户的ai控制装置10,并存储于存储部13的学习完毕模型存储部132。将学习完毕模型从服务器装置30发送到ai控制装置10既可以响应于机器学习的结束而自动地进行,也可以根据来自ai控制装置10的请求来进行。
90.1-2-3.ai控制装置10的异常检测动作
91.ai控制装置10使用由服务器23生成的学习完毕模型来进行异常检测。图10示出了ai控制装置10的异常检测的动作。ai控制装置10接收来自麦克风18的声音(s121)。
92.ai控制装置10的控制部11的异常检测部113读出并执行学习完毕模型存储部132中存储的学习完毕模型,基于上述的学习完毕模型判定接收到的声音是否异常(s122)。即,通过学习完毕模型检测具有学习到的特征的声音,来判定发生了异常(存在异常)。这意味着检测与原本用户在图5的步骤s101~s103中标注的标签(在本实施方式中为“尖叫声”)对应的声音来判定异常。在本实施方式中,在检测到与尖叫声对应的声音的情况下,判定为存在异常(s123的是)。设备机器工作指令部114根据存在异常的判定,经由触点输出部19发送信号(s124)。如上所述,在连接有多个麦克风18的情况下,设备机器工作指令部114经由触点输出部19向与接收到判定为异常的声音的麦克风18对应的广播装置20、监视相机40发送信号(s124)。
93.通过设备机器工作指令部114,使所指定的设备机器工作(s125)。例如,将该设备机器接通,并且如果是广播装置20,则输出警告声音,如果是监视相机40,则开始对影像进行录像。
94.ai控制装置10也可以具有执行用于机器学习的动作(图5的步骤s101~s109)的模式(机器学习模式)和执行异常检测动作(图10的步骤s121~s125)的模式(异常检测模式),并切换这些模式来执行各自的动作。麦克风18在机器学习模式中,为了获取带标签的声音数据而发挥作用,在异常检测模式中,为了获取用于异常判定的未知声音而发挥作用。ai控制装置10也可以构成为,在学习完毕模型存储部132中没有存储学习完毕模型时,以机器学习模式进行动作,根据在学习完毕模型存储部132中存储有学习完毕模型,自动地切换为异常检测模式。
95.1-3.特征等
96.上述实施方式1所提供的ai控制装置10获取输入数据(例如,声音数据),将输入数据与能够识别ai控制装置10的用户的识别信息相关联地发送至服务器装置30。ai控制装置10执行学习完毕模型,从而检测规定的事件(例如尖叫声)的发生,该学习完毕模型是通过服务器装置30、与其他用户的学习完毕模型分开生成的,且该学习完毕模型学习输入数据的特征并从未知的输入数据中检测具有该特征的输入数据。因此,能够在学习完毕模型的生成过程中减轻用户的负担,并且能够使用学习完毕模型来实现任意的事件检测单元。
97.上述实施方式1所提供的ai控制装置10使显示部15显示用于接受标签的输入的显示界面15a,根据标签的输入对输入数据标注标签。因此,用户能够简单地对输入数据执行标注。
98.上述实施方式1所提供的ai控制装置10使显示部15显示关联度信息,该关联度信息表示由服务器装置30计算出的、带标签的输入数据与其他用户的带标签的输入数据的关联度。因此,用户可以选择性地使用其他用户的并且关联度高的输入数据,不需要用户自己收集大量的样本声音来制作带标签的声音数据。因此,能够在学习完毕模型的生成过程中进一步减轻用户的负担,并且能够提高学习完毕模型的准确性。
99.上述实施方式1所提供的服务器装置30从多个用户的ai控制装置10接收与各用户的识别信息相关联的输入数据,将接收到的输入数据存储于存储部33,使用该输入数据,针对每个用户,学习输入数据的特征,以生成从未知的输入数据中检测具有该特征的输入数据的学习完毕模型,使生成的学习完毕模型按照标签存储于存储部33。因此,能够在多个用户间共享输入数据,在学习完毕模型的生成过程中能够进一步减轻用户的负担,并且能够提高学习完毕模型的准确性。
100.上述实施方式1所提供的服务器装置30将各用户的输入数据的可否使用信息存储于存储部33并进行管理。因此,限制了其他用户使用用户的输入数据,从而保护了输入数据。
101.上述实施方式1所提供的ai控制装置10和服务器装置30基于由服务器装置30管理的上述可否使用信息和收费信息,向用户提示用户使用机器学习时的费用。收费根据用户是否允许使用自己的输入数据,或者根据其他用户的输入数据的使用量而不同。因此,用户被鼓励允许使用自己的输入数据、使用其他用户的输入数据,可以促进各用户的机器学习中的输入数据的使用。
102.上述实施方式1所提供的ai控制装置10基于使用了学习完毕模型的异常检测,使所连接的广播装置20、监视相机40工作。因此,ai控制装置10能够采用通用的结构,并且能够实现对用户来说便利性高的装置。
103.1-4.变形例
104.在上述例子中,在发送来自ai控制装置10的输入数据时执行机器学习,但也可以在等待来自用户的输入之后进行是否执行机器学习。例如,也可以是,用户多次输入输入数据,在得到某种程度的数据量时执行机器学习。
105.在上述例子中,在ai控制装置10判定为异常的情况下,使设备机器工作,但并不限定于此。例如,ai控制装置10也可以向设施的管理者、警备室进行通报。
106.ai控制装置10也可以为即使没有自己的输入数据,仅使用其他用户的数据。例如,在对图7所示的显示界面15a进行标签的输入操作后(图5的s101),ai控制装置10向服务器装置30发送其他用户的数据的使用请求(图5的s107)。在显示部15中显示该用户输入的标签与其他用户的带标签的输入数据的关联度信息和收费信息(图5的s105和s108)。当用户根据关联度信息选择其他用户的带标签的输入数据并同意收费时,向服务器装置30发送机器学习请求(图5的s109)。服务器装置30针对该用户,基于所指定的其他用户的输入数据来执行机器学习。
107.在上述例子中,数据的可否使用信息可以与带标签的输入数据一起发送到服务器装置30,但也可以另外发送。另外,用户也可以经由输入操作,随时变更数据的可否使用信息。
108.2.其他实施方式
109.如上所述,作为在本技术中公开的技术的例示,对各实施方式进行了说明。然而,本公开中的技术不限于此,也可以应用于进行了适当的变更、置换、添加、省略等的实施例。另外,也可以将上述实施方式中说明的各构成要素组合而作为新的实施方式。
110.(1)在实施方式1中,ai控制装置10通过经由触点输出部19的触点输出使设备机器工作,但并不限于此。ai控制装置10也可以经由通信部17使设备机器工作。
111.在该情况下,各设备机器具有网络连接部,该网络连接部具有ip地址。图1所示的ai控制装置10的控制部11的设备机器工作指令部114在判定为异常的情况下,生成用于使设备机器工作的信号,并经由通信部17发送到设备机器的ip地址,与实施方式1同样地使设备机器工作。进一步地,如上所述,在不同的区域中设置多个设备机器(广播装置20、监视相机40)和与它们对应的多个麦克风18的情况下,可以使麦克风18也进行ip化并经由通信部17连接。在这样的结构的情况下,可以构成为预先登记各麦克风18的位置信息和设备机器的位置信息,使获取了被判定为异常的声音的麦克风18附近的设备机器工作。ai控制装置10(存储部13)或与ai控制装置10连接的管理计算机(省略图示)保存将各麦克风18的识别信息(ip地址)与设施内的设置有各麦克风18的位置信息相关联的麦克风信息(图11a)、将各设备机器的识别信息(ip地址)以及与设施内的设置有设备机器的位置信息相关联的设备机器信息(图11b、图11c)。在检测到异常的情况下,设备机器工作指令部114参照图11a所示的信息,确定获取了被判定为异常的声音的麦克风18的位置信息。设备机器工作指令部114还根据图11b所示的扬声器的位置信息、图11c所示的监视相机的位置信息,确定接近该麦克风18的设备机器,向该设备机器发送信号,与实施方式1同样地工作。例如,在设施内设置有多个广播装置20的情况下,ai控制装置10参照图11b所示的位置信息,指定检测到被判定为“尖叫声”的声音的麦克风18附近的一个或多个广播装置20的ip地址,发送信号,将该广播装置20接通,并输出警告声音。
112.(2)在实施方式1中,输入数据以声音数据为例,但并不限于此。例如,输入数据也可以是图像数据。在该情况下,ai控制装置10可以具备获取图像的相机来代替麦克风18。另外,也可以使用从监视相机40获取的图像数据。在图像数据中,将以用户期望的标签、例如“可疑的动作”、“人们互相争斗的动作”、“人跌倒的状态”等关键词为标签的图像数据作为输入数据,执行机器学习,学习图像数据的特征,以生成从未知的图像(影像)中检测具有该特征的图像的学习完毕模型。另外,在从图像数据中检测到异常的情况下,与实施方式1同样地,开始设备机器的接通、其他工作(例如,开始广播装置20的接通、警告声音的输出、或者监视相机40的图像的录像等)。
113.(3)在实施方式1和上述例子中,服务器装置30的输入数据管理部311根据用户的输入数据的标签名之间的类似度计算关联度,但并不限于此。除了标签名之间的类似度以外或者代替标签名之间的相似度,也可以计算输入数据本身的类似度。例如,在输入数据是声音数据的情况下,可以根据频率的高低、振幅的大小等声音数据的特征参数的数值的接近度来计算。在输入数据是图像数据的情况下,可以计算图像中的动作模式、姿势模式的类似度作为关联度。
114.进一步地,关联度也可以考虑用户间的业态的类似度、使用ai控制装置10的设施的类型的类似度等来计算。
115.(4)在实施方式1和上述例子中,服务器装置30也可以在存储部33中预先存储从用
户以外获取的数据集(例如,由ai平台、提供机器学习服务的公司提供的数据集),并允许有请求的用户使用该数据集。
116.(5)在实施方式1和上述例子中,ai控制装置10通过用户输入标签而对输入数据赋予标签,但并不限于此。服务器装置30也可以从ai控制装置10获取未被标注的输入数据,自动解析输入数据,并赋予标签。
117.(6)在实施方式1和上述例子中,ai控制装置10具备用于机器学习的功能和异常检测功能这两者,但并不限于此。用户也可以不通过ai控制装置10而是通过其他的计算机终端对输入数据进行标注,并发送到服务器装置30,执行机器学习。ai控制装置10也可以从服务器装置30获取学习完毕模型,进行异常检测动作。
118.(7)在本说明书中,异常检测并不限于伴随危险的事件的检测,还可以包括用户期望检测的所有状态、动作、即规定的事件的检测。
119.(8)ai控制装置10和服务器装置30的控制部11、31也可以包括由设计为实现规定的功能的专用的电子电路构成的处理器。另外,控制部11、31也可以通过dsp、fpga、asic等各种处理器来实现。处理器也可以由一个或多个处理器构成。
120.(9)图5、图6和图10所示的流程图的处理的执行顺序不一定限于上述实施方式的记载,在不脱离发明的主旨的范围内,可以调换执行顺序或者并行地执行。进一步地,在一个步骤中包括多个处理的情况下,该一个步骤中包括的多个处理除了由一个装置执行以外,还可以由多个装置分担执行。
121.(10)由ai控制装置10和/或服务器装置30执行的机器学习方法和异常检测方法、执行该方法的计算机程序、以及记录有该计算机程序的计算机可读记录介质包括在本公开的范围内。计算机程序可以经由电气通信线路、无线或有线通信线路、以互联网为代表的网络等获取。
122.(11)本公开的ai控制装置10和/或服务器装置30的一部分或全部,可以采用经由网络由多个装置分担、共同处理一个功能的云计算的结构。在本说明书中,装置包括表示多个构成要素(装置、模块(部件)等)的集合的情况,无论所有的构成要素是否位于同一框体中。另外,全部或一部分的构成要素可以设置在设施以外的场所。
123.符号说明
124.1:系统;10:ai控制装置;11:控制部;12:ram;13:存储部;14:rom;15:显示部;15a~15c:显示界面;16:操作部;17:通信部;18:麦克风;20:广播装置;30:服务器装置;31:控制部;32:ram;33:存储部;34:rom;37:通信部;40:监视相机;111:输入数据获取部;112:标记部;113:异常检测部;114:设备机器工作指令部;131:识别信息存储部;132:学习完毕模型存储部;311:输入数据管理部;312:学习部;331:用户管理表存储部;331a:用户管理表;332:收费表存储部;332a:收费表;333:学习完毕模型存储部;334:输入数据存储部。

技术特征:
1.一种ai控制装置,其能够与服务器装置连接,该服务器装置从多个用户识别各个用户并接收输入数据,并针对每个用户基于输入数据生成学习完毕模型,所述ai控制装置具备:第一控制部;以及第一通信部,其与所述服务器装置连接,所述第一控制部,获取输入数据,将能够识别所述ai控制装置的用户的识别信息与所述获取的输入数据相关联,并经由所述第一通信部发送到所述服务器装置,执行学习完毕模型,该学习完毕模型是使用所发送的所述获取的输入数据,通过所述服务器装置与其他用户的学习完毕模型分开生成的,且该学习完毕模型学习所述获取的输入数据的特征,以从未知的输入数据中检测具有所述特征的输入数据。2.根据权利要求1所述的ai控制装置,其还具备:标签输入界面,其从用户接受标签的输入,所述第一控制部对所述获取的输入数据标注经由所述标签输入界面输入的标签,生成带标签的输入数据,并将该带标签的输入数据发送到所述服务器装置,所述学习完毕模型是通过所述服务器装置使用所述带标签的输入数据生成的学习完毕模型。3.根据权利要求1所述的ai控制装置,其还具备:标签输入界面,其从用户接受标签的输入,所述第一控制部对所述获取的输入数据标注经由所述标签输入界面输入的标签,生成带标签的输入数据,并将该带标签的输入数据发送到所述服务器装置,所述学习完毕模型是通过所述服务器装置,使用接收到的所述带标签的输入数据、和标注有与该标签的关联度为规定值以上的类似标签并且从保存在所述服务器装置中的其他用户接收到的输入数据而生成的学习模型。4.根据权利要求1所述的ai控制装置,其还具备:输入部,其接受输入数据的输入,所述第一控制部,在通过所述服务器装置生成所述学习完毕模型之前,将经由所述输入部输入的所述获取的输入数据发送至所述服务器装置,在通过所述服务器装置生成所述学习完毕模型之后,对经由所述输入部输入的所述未知的输入数据执行所述学习完毕模型,并对具有所述特征的输入数据进行检测。5.根据权利要求1所述的ai控制装置,其中,所述ai控制装置选择性地以第一模式或第二模式进行动作,其还具备:输入部,其接受输入数据的输入,所述第一控制部,在所述第一模式下动作时,将经由所述输入部输入的所述获取的输入数据发送到所述服务器装置,在所述第二模式下动作时,对经由所述输入部输入的所述未知的输入数据执行所述学习完毕模型,并对具有所述特征的输入数据进行检测。
6.根据权利要求2或3所述的ai控制装置,其中,所述获取的输入数据是声音数据,所述标签是表示声音的关键词,所述学习完毕模型是学习所述声音数据的特征并从未知的声音中检测具有所述特征的声音的学习完毕模型。7.根据权利要求4或5所述的ai控制装置,其中,所述输入数据和所述未知的输入数据是声音数据,所述输入部是接受所述声音数据的输入的麦克风。8.根据权利要求1所述的ai控制装置,其中,所述第一控制部包括处理器和存储学习完毕模型的存储部,在将所述获取的输入数据发送至所述服务器装置之后,经由所述第一通信部从所述服务器装置接收所述学习完毕模型并存储于所述存储部,所述处理器执行存储于所述存储部的学习完毕模型。9.根据权利要求1所述的ai控制装置,其还具备:外部接口,其用于向根据信号的接收而工作的外部的设备机器发送信号,所述第一控制部,在执行所述学习完毕模型而检测出具有所述特征的输入数据时,经由所述外部接口发送所述信号,从而使所述外部的设备机器工作。10.一种服务器装置,其能够与多个用户使用的多个ai控制装置连接,其具备:第二控制部;第二通信部,其与所述多个ai控制装置连接;以及第二存储部,所述第二控制部,从所述多个用户的ai控制装置经由所述第二通信部接收与各所述用户的识别信息相关联的输入数据,将所述接收的输入数据存储于所述第二存储部,使用所述接收的输入数据,针对所述每个用户,学习所述接收的输入数据的特征,以生成从未知的输入数据中检测具有所述特征的输入数据的学习完毕模型,针对所述每个用户使生成的学习完毕模型存储于所述第二存储部。11.根据权利要求10所述的服务器装置,其中,所述接收的输入数据是标注有由该接收的输入数据的发送者即用户输入的标签的带标签的输入数据,所述第二控制部,响应于从第一用户接收到所述带标签的输入数据,使用接收到的所述带标签的输入数据,生成所述第一用户用的学习完毕模型,将所述第一用户用的学习完毕模型经由所述第二通信部发送到所述第一用户的ai控制装置,使该第一用户的ai控制装置执行所述第一用户用的学习完毕模型。12.根据权利要求10所述的服务器装置,其中,所述接收的输入数据是标注有由该接收的输入数据的发送者即用户输入的标签的带
标签的输入数据,所述第二控制部,根据所述标签,将所述带标签的输入数据存储于所述第二存储部,响应于从第一用户接收到所述带标签的输入数据,使用接收到的所述带标签的输入数据、和标注有与从所述第一用户接收到的所述带标签的输入数据的标签的关联度为规定值以上的类似标签并存储于所述第二存储部的、以前从第一用户以外的其他用户接收到的带标签的输入数据,生成所述学习完毕模型。13.根据权利要求10所述的服务器装置,其中,所述接收的输入数据是标注有由该接收的输入数据的发送者即用户输入的标签的带标签的输入数据,所述第二控制部,根据所述标签,将所述带标签的输入数据存储于所述第二存储部,响应于从第一用户接收到所述带标签的输入数据,确定标注有与从所述第一用户接收到的所述带标签的输入数据的标签的关联度为规定值以上的类似标签并且存储于所述第二存储部的、以前从第一用户以外的其他用户接收到的带标签的输入数据,并将表示该其他用户的带标签的输入数据的关联度信息经由所述第二通信部提示给所述第一用户的ai控制装置,根据从接受到所述关联度信息的提示的所述第一用户的ai控制装置经由所述第二通信部接收的请求,选择性地,仅使用从所述第一用户接收到的所述带标签的输入数据来生成学习完毕模型,或者使用从所述第一用户接收到的所述带标签的输入数据、和所述关联度信息所表示的所述其他用户的带标签的输入数据来生成学习完毕模型。14.根据权利要求12所述的服务器装置,其中,所述带标签的输入数据包括由该带标签的输入数据的发送者即用户输入的可否使用信息,即表示其他用户可否使用该带标签的输入数据的可否使用信息,所述第二控制部,使用存储于所述第二存储部的、以前从所述第一用户以外的其他用户接收到的带标签的输入数据中的包括肯定性的可否使用信息的带标签的输入数据,来生成所述学习完毕模型。15.根据权利要求13所述的服务器装置,其中,所述带标签的输入数据包括由该带标签的输入数据的发送者即用户输入的可否使用信息,即表示其他用户可否使用该带标签的输入数据的可否使用信息,所述第二控制部,仅使用所述关联度信息所表示的所述第一用户以外的其他用户的带标签的输入数据中的、包括肯定性的可否使用信息的带标签的输入数据,来生成所述学习完毕模型。16.根据权利要求12或13所述的服务器装置,其中,所述第二存储部还保存收费表,该收费表包括使用所述第一用户的带标签的输入数据生成学习完毕模型的单价、和使用所述其他用户的带标签的输入数据所需的单价,所述第二控制部,
随着与从所述第一用户接收到的所述带标签的输入数据对应的所述学习完毕模型的生成,参照所述收费表来计算向所述第一用户收取的金额,并经由所述第二通信部发送到所述第一用户的ai控制装置10。17.根据权利要求14或15所述的服务器装置,其中,所述第二存储部还保存收费表,该收费表包括使用所述第一用户的带标签的输入数据生成学习完毕模型的单价、使用所述其他用户的带标签的输入数据所需的单价、以及根据所述可否使用信息所表示的可否而决定的单价,所述第二控制部,随着与从所述第一用户接收到的所述带标签的输入数据对应的所述学习完毕模型的生成,参照所述收费表来计算向所述第一用户收取的金额,并经由所述第二通信部发送到所述第一用户的ai控制装置10。18.一种ai控制方法,其使用能够与多个用户使用的多个ai控制装置连接的服务器装置,其包括:从所述多个用户的ai控制装置接收与各所述用户的识别信息相关联的输入数据;将所述接收的输入数据存储于存储部;使用所述接收的输入数据,针对所述每个用户,学习所述接收的输入数据的特征,并生成从未知的输入数据中检测具有所述特征的输入数据的学习完毕模型;以及针对所述每个用户使生成的学习完毕模型存储于所述存储部。

技术总结
一种AI控制装置(10),其能够与服务器装置(30)连接,该服务器装置(30)从多个用户识别各个用户并接收输入数据,并针对每个用户基于输入数据生成学习完毕模型,该AI控制装置(10)具备:控制部(11);以及通信部(17),其与服务器装置(30)连接。控制部(11)获取输入数据,将能够识别AI控制装置(10)的用户的识别信息与获取的输入数据相关联,并经由通信部(17)发送到服务器装置(30)。控制部(11)执行学习完毕模型,该学习完毕模型是使用所发送的获取的输入数据,通过服务器装置(30)与其他用户的学习完毕模型分开生成的,且该学习完毕模型学习获取的输入数据的特征,以从未知的输入数据中检测具有该特征的输入数据。有该特征的输入数据。有该特征的输入数据。


技术研发人员:河合祐马
受保护的技术使用者:TOA株式会社
技术研发日:2020.03.19
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-6160.html

最新回复(0)