一种算力供给节点对外开放服务架构和接口设计的制作方法

专利2024-10-15  38



1.本发明涉及算力网络技术领域,具体为一种算力供给节点对外开放服务架构和接口设计。


背景技术:

2.现有技术,主要聚焦于算力网络中的算力调度、算力迁移、算力切片等领域,对于承接计算任务的算力供给节点,缺乏标准化的服务架构和对外开放接口设计,使得不同规格的算力供给节点的选择过多的依赖于算力调度节点的综合判断能力,增加了算力网络的调度难度。
3.综上所述,本发明通过设计一种算力供给节点对外开放服务架构和接口设计来解决存在的问题。


技术实现要素:

4.本发明的目的在于提供一种算力供给节点对外开放服务架构和接口设计,以解决上述背景技术中提出的问题。
5.为实现上述目的,本发明提供如下技术方案:
6.一种算力供给节点对外开放服务架构和接口设计,包括算力需求方、算力调度节点和算力供给节点,所述算力供给节点中各模块功能自下而上设计,具体如下:
7.1)硬件层:管理硬件,提供cpu、gpu、存储、电源、温度、负载等指标监测和预警,以及承接虚拟层下发的计算和存储任务;可以是单台服务器,也可以是服务器集群构成;
8.2)虚拟层:提供硬件资源的颗粒化和虚拟化封装,把算力/存储资源封装成颗粒化的可调度单位,比如:算力颗粒:1kh/s=每秒1,000哈希;存储颗粒:32mb/个;
9.3)任务容器:为每个计算任务提供相互隔离的容器服务,每个任务容器中承载独立的计算任务参数、算力和存储资源,实现不同任务之间的安全隔离,其中算力/存储资源的最小单位是虚拟层定义的1个算力/存储颗粒,根据任务需求配置具体颗粒数量;
10.4)结果校验:根据任务下发的结果校验参数,对任务计算结果进行校验;校验合格的等待算力任务编排模块取数据;校验不合格的,指示任务容器模块重新计算;
11.5)任务编排:管理算力供给节点上运行的所有计算任务;维护动态变化的计算任务表;
12.6)状态感知:实时感知算力供给节点当前状态,实时上报给算力对外开放接口;
13.7)对外开放接口:负责与外部的算力调度节点交互,承接计算任务,反馈计算结果;接口交互参数有:算力供给节点状态、本节点算力/存储颗粒标准、安全隔离能力、结果校验能力、可支撑的业务类型、本端ip、对端ip、计算任务参数、结果数据。
14.作为本发明优选的方案,所述接口交互的具体流程如下:
15.s1,算力供给节点的状态感知,与任务编排,实时同步更新算力供给节点状态;
16.s2,算力调度节点向算力供给节点发起状态查询请求;
17.s3,算力供给节点的对外开放接口透传查询请求到状态感知;
18.s4,状态感知反馈“节点开放/关闭,本节点算力/存储颗粒标准、算力/存储余量、安全隔离能力、结果校验能力、可支撑的业务类型、算力供给节点ip”给对外开放接口;
19.s5,对外开放接口透传给算力调度节点;
20.s6,算力调度节点根据算力供给节点反馈的当前状态和能力,进行计算任务匹配;
21.s7,当计算任务需求与算力供给节点的当前状态和能力匹配成功,则算力调度节点向对外开放接口下发计算任务参数,包括:计算参数,算力需求,存储需求,结果校验参数等;
22.s8,对外开放接口转发计算任务参数到任务容器;
23.s9,任务容器为新的计算任务分配容器资源、算力/存储资源,启动计算任务;
24.s10,在计算过程中,任务容器根据任务编排定义的刷新间隔,实时向任务编排上报任务执行进度和当前状态;
25.s11,任务编排实时维护和刷新任务表;
26.s12,当任务计算完成,任务容器将计算任务信息、结果数据和校验参数推送给结果校验;
27.s13,结果校验启动任务校验,并告知任务编排,该任务状态从计算中变为校验中;
28.s14,当结果校验执行完毕,且校验结果符合要求,结果校验告知任务编排,该任务状态变为完成;
29.s15,结果校验将任务信息、计算结果和校验结果推送给对外开放接口;
30.s16,对外开放接口向算力调度节点透传以上数据信息,交互流程完毕。
31.作为本发明优选的方案,所述不同任务之间的安全隔离包括但不仅限于任务参数、算力、存储、中间数据/结果均安全隔离。
32.作为本发明优选的方案,所述实时感知算力供给节点当前状态包括但不仅限于是否承接计算任务、当前并行计算任务量、当前算力/存储空闲量和对外开放ip地址。
33.作为本发明优选的方案,所述维护动态变化的计算任务表,包括但不仅限任务id,所属容器id、任务进度和占用算力/存储资源量。
34.作为本发明优选的方案,所述算力调度节点向对外开放接口下发计算任务参数包括但不仅限于:计算参数、算力需求、存储需求和结果校验参数等。
35.与现有技术相比,本发明的有益效果是:
36.1、本发明中,通过设计标准化的算力供给节点服务架构和对外开放接口,使得不同规格的算力供给节点都具备了管理本节点计算任务,实时刷新本节点状态的能力,为上层的算力调度提供了实时、标准化的交互接口,解决了不同规格的算力供给节点由于硬件标准、算力/存储颗粒标准、业务类型承接能力、安全隔离能力等存在巨大差异,导致算力调度层在选择算力供给节点时的判断困难的问题,提高了算力承接的效率,有效的解决了现有技术,主要聚焦于算力网络中的算力调度、算力迁移、算力切片等领域,对于承接计算任务的算力供给节点,缺乏标准化的服务架构和对外开放接口设计,使得不同规格的算力供给节点的选择过多的依赖于算力调度节点的综合判断能力的问题。
附图说明
37.图1为本发明算力供给节点服务架构结构示意图;
38.图2为本发明虚拟层架构结构示意图;
39.图3为本发明任务容器架构结构示意图;
40.图4为本发明任务编排架构结构示意图;
41.图5为本发明交互流程结构示意图;
42.图6为本发明图5交互流程续结构示意图;
43.图7为本发明算力调度节点根据算力供给节点反馈的当前状态和能力,进行计算任务匹配结构示意图。
具体实施方式
44.下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
45.为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述,给出了本发明的若干实施例,但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
46.需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件,当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件,本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
47.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同,本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明,本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
48.请参阅图1-7,本发明提供一种技术方案:
49.一种算力供给节点对外开放服务架构和接口设计,包括算力需求方、算力调度节点和算力供给节点。
50.本方案在算力网络中,当算力需求方发起计算需求,经过算力网络中的算力调度节点进行算力调度和匹配过程中,作为算力供给节点,如何为算力网络提供标准的、统一的算力能力开放服务架构和接口。
51.一、算力供给节点对外开放服务架构
52.算力供给节点服务架构见图1;
53.各模块功能设计自下而上描述如下:
54.1)硬件层:管理硬件,提供cpu、gpu、存储、电源、温度、负载等指标监测和预警,以及承接虚拟层下发的计算和存储任务;可以是单台服务器,也可以是服务器集群构成;
55.2)虚拟层:提供硬件资源的颗粒化和虚拟化封装,把算力/存储资源封装成颗粒化的可调度单位,比如:算力颗粒:1kh/s=每秒1,000哈希;存储颗粒:32mb/个,示意图见图2;
56.3)任务容器:为每个计算任务提供相互隔离的容器服务,每个任务容器中承载独立的计算任务参数、算力和存储资源,实现不同任务之间的安全隔离(任务参数、算力、存储、中间数据/结果等均安全隔离),其中算力/存储资源的最小单位是虚拟层定义的1个算力/存储颗粒,根据任务需求配置具体颗粒数量,示意图见图3;
57.4)结果校验:根据任务下发的结果校验参数,对任务计算结果进行校验;校验合格的等待算力任务编排模块取数据;校验不合格的,指示任务容器模块重新计算;
58.5)任务编排:管理算力供给节点上运行的所有计算任务;维护动态变化的计算任务表,包括任务id,所属容器id,任务进度,占用算力/存储资源量等,示意图见图4;
59.6)状态感知:实时感知算力供给节点当前状态(包括:是否承接计算任务,当前并行计算任务量,当前算力/存储空闲量,对外开放ip地址),实时上报给算力对外开放接口;
60.7)对外开放接口:负责与外部的算力调度节点交互,承接计算任务,反馈计算结果;接口交互参数有:算力供给节点状态、本节点算力/存储颗粒标准、安全隔离能力、结果校验能力、可支撑的业务类型、本端ip、对端ip、计算任务参数、结果数据;接口交互流程见后文详述。
61.二、算力对外开放接口交互流程
62.交互流程示意图见图5和图6;
63.1)算力供给节点的状态感知,与任务编排,实时同步更新算力供给节点状态;
64.2)算力调度节点向算力供给节点发起状态查询请求;
65.3)算力供给节点的对外开放接口透传查询请求到状态感知;
66.4)状态感知反馈“节点开放/关闭,本节点算力/存储颗粒标准、算力/存储余量、安全隔离能力、结果校验能力、可支撑的业务类型、算力供给节点ip”给对外开放接口;
67.5)对外开放接口透传给算力调度节点;
68.6)算力调度节点根据算力供给节点反馈的当前状态和能力,进行计算任务匹配,示例见图7;
69.7)当计算任务需求与算力供给节点的当前状态和能力匹配成功,则算力调度节点向对外开放接口下发计算任务参数,包括:计算参数,算力需求,存储需求,结果校验参数等;
70.8)对外开放接口转发计算任务参数到任务容器;
71.9)任务容器为新的计算任务分配容器资源、算力/存储资源,启动计算任务;
72.10)在计算过程中,任务容器根据任务编排定义的刷新间隔,实时向任务编排上报任务执行进度和当前状态;
73.11)任务编排实时维护和刷新任务表;
74.12)当任务计算完成,任务容器将计算任务信息、结果数据和校验参数推送给结果校验;
75.13)结果校验启动任务校验,并告知任务编排,该任务状态从计算中变为校验中;
76.14)当结果校验执行完毕,且校验结果符合要求,结果校验告知任务编排,该任务状态变为完成;
77.15)结果校验将任务信息、计算结果和校验结果推送给对外开放接口;
78.16)对外开放接口向算力调度节点透传以上数据信息,交互流程完毕。
79.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:
1.一种算力供给节点对外开放服务架构和接口设计,包括算力需求方、算力调度节点和算力供给节点,其特征在于:所述算力供给节点中各模块功能自下而上设计,具体如下:1)硬件层:管理硬件,提供cpu、gpu、存储、电源、温度、负载等指标监测和预警,以及承接虚拟层下发的计算和存储任务;可以是单台服务器,也可以是服务器集群构成;2)虚拟层:提供硬件资源的颗粒化和虚拟化封装,把算力/存储资源封装成颗粒化的可调度单位,比如:算力颗粒:1kh/s=每秒1,000哈希;存储颗粒:32mb/个;3)任务容器:为每个计算任务提供相互隔离的容器服务,每个任务容器中承载独立的计算任务参数、算力和存储资源,实现不同任务之间的安全隔离,其中算力/存储资源的最小单位是虚拟层定义的1个算力/存储颗粒,根据任务需求配置具体颗粒数量;4)结果校验:根据任务下发的结果校验参数,对任务计算结果进行校验;校验合格的等待算力任务编排模块取数据;校验不合格的,指示任务容器模块重新计算;5)任务编排:管理算力供给节点上运行的所有计算任务;维护动态变化的计算任务表;6)状态感知:实时感知算力供给节点当前状态,实时上报给算力对外开放接口;7)对外开放接口:负责与外部的算力调度节点交互,承接计算任务,反馈计算结果;接口交互参数有:算力供给节点状态、本节点算力/存储颗粒标准、安全隔离能力、结果校验能力、可支撑的业务类型、本端ip、对端ip、计算任务参数、结果数据。2.根据权利要求1所述的一种算力供给节点对外开放服务架构和接口设计,其特征在于:所述接口交互的具体流程如下:s1,算力供给节点的状态感知,与任务编排,实时同步更新算力供给节点状态;s2,算力调度节点向算力供给节点发起状态查询请求;s3,算力供给节点的对外开放接口透传查询请求到状态感知;s4,状态感知反馈“节点开放/关闭,本节点算力/存储颗粒标准、算力/存储余量、安全隔离能力、结果校验能力、可支撑的业务类型、算力供给节点ip”给对外开放接口;s5,对外开放接口透传给算力调度节点;s6,算力调度节点根据算力供给节点反馈的当前状态和能力,进行计算任务匹配;s7,当计算任务需求与算力供给节点的当前状态和能力匹配成功,则算力调度节点向对外开放接口下发计算任务参数,包括:计算参数,算力需求,存储需求,结果校验参数等;s8,对外开放接口转发计算任务参数到任务容器;s9,任务容器为新的计算任务分配容器资源、算力/存储资源,启动计算任务;s10,在计算过程中,任务容器根据任务编排定义的刷新间隔,实时向任务编排上报任务执行进度和当前状态;s11,任务编排实时维护和刷新任务表;s12,当任务计算完成,任务容器将计算任务信息、结果数据和校验参数推送给结果校验;s13,结果校验启动任务校验,并告知任务编排,该任务状态从计算中变为校验中;s14,当结果校验执行完毕,且校验结果符合要求,结果校验告知任务编排,该任务状态变为完成;s15,结果校验将任务信息、计算结果和校验结果推送给对外开放接口;s16,对外开放接口向算力调度节点透传以上数据信息,交互流程完毕。
3.根据权利要求1所述的一种算力供给节点对外开放服务架构和接口设计,其特征在于:所述不同任务之间的安全隔离包括但不仅限于任务参数、算力、存储、中间数据/结果均安全隔离。4.根据权利要求1所述的一种算力供给节点对外开放服务架构和接口设计,其特征在于:所述实时感知算力供给节点当前状态包括但不仅限于是否承接计算任务、当前并行计算任务量、当前算力/存储空闲量和对外开放ip地址。5.根据权利要求1所述的一种算力供给节点对外开放服务架构和接口设计,其特征在于:所述维护动态变化的计算任务表,包括但不仅限任务id,所属容器id、任务进度和占用算力/存储资源量。6.根据权利要求2所述的一种算力供给节点对外开放服务架构和接口设计,其特征在于:所述算力调度节点向对外开放接口下发计算任务参数包括但不仅限于:计算参数、算力需求、存储需求和结果校验参数等。

技术总结
本发明涉及算力网络技术领域,尤其为一种算力供给节点对外开放服务架构和接口设计,包括算力需求方、算力调度节点和算力供给节点,本发明通过设计标准化的算力供给节点服务架构和对外开放接口,使得不同规格的算力供给节点都具备了管理本节点计算任务,实时刷新本节点状态的能力,为上层的算力调度提供了实时、标准化的交互接口,解决了不同规格的算力供给节点由于硬件标准、算力/存储颗粒标准、业务类型承接能力、安全隔离能力等存在巨大差异,导致算力调度层在选择算力供给节点时的判断困难的问题,提高了算力承接的效率。提高了算力承接的效率。提高了算力承接的效率。


技术研发人员:姚健 高娅楠 朱奕健 韩喆 罗宇鸿
受保护的技术使用者:联通(上海)产业互联网有限公司
技术研发日:2022.06.21
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-9997.html

最新回复(0)