网络状态恢复方法、处理系统和计算设备集群与流程

专利检索2025-02-02 6

本技术涉及通信，尤其涉及一种网络状态恢复方法和计算设备集群。

背景技术：

1、传统服务实体多为专用硬件，随着网络功能虚拟化(network functionvirtualization,缩写nfv)的不断发展，网络服务逐步从专用硬件设备转移到通用服务器的虚拟机或容器中，以进行资源整合、复用，提高系统灵活性、可扩展性，降低总的生产成本。

2、nfv的一个重要优势是弹性伸缩。目前，业界通过快慢路径的方法可有效解决转发性能弹性伸缩的问题，例如awz hyperplane平台将转发网元分类为top、flow master、decider。

3、服务实体故障后需要进行容灾恢复，目前，控制器通知引流实体将受到影响的网络服务实例的转发快表同步给“容灾对端”的服务实体来恢复网络状态记录；或者，控制器通知受到影响的网络服务实例的容灾对端，向引流实体拉取受到影响的网络服务实例的转发快表。

4、但是，上述方法对控制器的控制编排复杂，在存在大量转发快表的容灾恢复的场景下，容易增加控制器的服务压力。

5、公开于该背景技术部分的信息仅仅旨在增加对本技术的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

技术实现思路

1、本技术实施例提供了一种网络状态恢复方法、处理系统和计算设备集群，控制器仅仅需要通知引流实体开启容灾恢复流程即可，无需对容灾恢复流程进行控制编排，容灾恢复简单可靠，控制器服务压力较小；另外，能够在固定容灾恢复周期内恢复业务相关的信息；同时，容灾恢复过程中通过网络报文采样触发转发快表的透传，仅仅考虑业务相关的转发快表的恢复。

2、第一方面，本技术实施例提供了一种网络状态恢复方法，应用于处理系统，所述处理系统包括控制器和一个区域的多个可用区，所述可用区包括多个引流实体和多个服务实体，所述服务实体用于记录在所述服务实体上运行的至少一个网络服务实例下的网络状态数据，所述引流实体用于访问所述多个可用区的任一服务实体，基于所述服务实体发送的所述网络状态数据创建转发快表，所述转发快表用于转发网络报文，包括：

3、所述控制器在感知到所述多个可用区中第一可用区的第一服务实体故障后，确定所述第一服务实体在故障前运行的第一网络服务实例；

4、所述控制器从所述多个可用区中确定所述第一网络服务实例的第二服务实体；其中，所述第二服务实体位于所述多个可用区中的第二可用区，为所述第一网络服务实例的容灾对端；

5、所述控制器向所述多个可用区中正常工作的至少部分第一引流实体发送第一容灾恢复启动请求；

6、每个所述第一引流实体基于所述第一容灾恢复启动请求，启动第一容灾恢复流程；其中，所述第一容灾恢复流程为在容灾恢复周期内，通过采样规则对所述第一网络服务实例对应的第一网络报文采样，并将采样到的第一网络报文所匹配的第一转发快表，透传给所述第二服务实体；

7、所述第二服务实体基于接收到的所述第一转发快表恢复所述第一网络服务实例下的网络状态记录。

8、本方案中，控制器仅仅需要通知引流实体开启容灾恢复流程即可，无需对容灾恢复流程进行控制编排，容灾恢复简单可靠；另外，能够在固定容灾恢复周期内恢复业务相关的信息；同时，容灾恢复过程中通过网络报文采样触发转发快表的透传，仅仅考虑业务相关的转发快表的恢复。

9、在一种可能的实现方式中，所述第一可用区包括第三服务实体，所述第三服务实体和所述第一服务实体互为主备模式或主主模式；

10、所述控制器在感知到所述多个可用区中第一可用区的第一服务实体故障后，确定所述第一服务实体在故障前运行的第一网络服务实例，包括：

11、所述控制器在感知到所述多个可用区中第一可用区的第一服务实体和所述第三服务实体故障后，确定所述第一服务实体和所述第三服务实体所影响到的第一网络服务实例。

12、本方案中，在可用区的用于运行第一网络服务实例的服务实体全部故障后，开启容灾恢复。

13、在一种可能的实现方式中，所述第二可用区包括第四服务实体，所述第四服务实体和所述第二服务实体互为主备模式或主主模式，作为所述第一网络服务实例的容灾对端。

14、在一个例子中，所述第一容灾恢复启动请求指示将主动触发采样后的第一网络报文所匹配的转发快表，透传给所述第二服务实体和第四服务实体，以使所述第二服务实体和所述第四服务实体恢复所述第一网络服务实例下的网络状态记录。

15、本方案中，转发快表可以同时透传给多个服务实体，从而快速实现网络状态记录的恢复。

16、在一个例子中，所述方法还包括：所述控制器向所述多个可用区正常工作的至少部分第二引流实体发送第二容灾恢复启动请求；每个所述第二引流实体基于所述第二容灾恢复启动请求，启动第二容灾恢复流程；其中，所述第二容灾恢复流程包括在容灾恢复周期内，通过采样规则对所述第一网络服务实例对应的第一网络报文采样，并将采样到的第一网络报文所匹配的第一转发快表，透传给所述第四服务实体；所述第四服务实体基于接收到的第一转发快表恢复所述第一网络服务实例下的网络状态记录。

17、本方案中，可以并行开启多个容灾恢复流程，从而快速实现网络状态记录的恢复。

18、在一个例子中，所述方法还包括：所述第二服务实体向所述第四服务实体发送恢复后的网络状态记录；所述第四服务实体对所述发送至所述第四服务实体备份。

19、本方案中，第二服务实体将恢复后的网络状态记录同步到第四服务实体备份，从而快速实现网络状态恢复。

20、在一种可能的实现方式中，所述容灾恢复周期为所述引流实体中的转发快表共享的报文采样周期。

21、在一种可能的实现方式中，所述采样规则为按照预设报文接收时长采样；所述第一网络报文为计时时长超过所述预设报文接收时长的网络报文。

22、在一种可能的实现方式中，所述采样规则为固定数目采样；所述第一网络报文为所述发送端对应的多个网络报文中适配所述固定数目的网络报文。

23、在一种可能的实现方式中，所述多个可用区中正常工作的至少部分第一引流实体包括目标引流实体，所述方法还包括：所述目标引流实体在所述容灾恢复周期之后，对所述第一网络服务实例对应的第二网络报文采样，并将采样到的第二网络报文和其所匹配的第二转发快表，透传给所述第二服务实体；所述第二服务实体在所述第二转发快表和恢复后的网络状态记录存在冲突时，向所述目标引流实体发送所述第二转发快表的删除通知；所述目标引流实体删除所述第二转发快表。

24、本方案中，容灾恢复之后，服务实体发现转发快表和网络状态记录存在冲突，则重置网络状态记录，确保业务正常。

25、在一种可能的实现方式中，所述第二服务实体删除和所述第二转发快表存在冲突的网络状态记录。

26、本方案中，容灾恢复之后，服务实体发现转发快表和网络状态记录存在冲突，则重置网络状态记录，确保业务正常。

27、第二方面，本技术实施例提供了一种处理系统，所述处理系统包括多个可用区和控制器，所述控制器管理一个区域的多个可用区，所述可用区包括多个引流实体和多个服务实体，所述服务实体用于记录在所述服务实体上运行的至少一个网络服务实例下的网络状态记录，所述引流实体用于访问所述多个可用区的任一服务实体，基于所述服务实体发送的所述网络状态记录创建转发快表，基于所述转发快表用于转发网络报文；

28、所述控制器用于在感知到所述多个可用区中第一可用区的第一服务实体故障后，确定所述第一服务实体在故障前运行的第一网络服务实例；

29、所述控制器用于从所述多个可用区中确定所述第一网络服务实例的第二服务实体；其中，所述第二服务实体位于所述多个可用区中的第二可用区，为所述第一网络服务实例的容灾对端；

30、所述控制器用于向所述多个可用区中正常工作的至少部分第一引流实体发送第一容灾恢复启动请求；

31、每个所述第一引流实体用于基于所述第一容灾恢复启动请求，启动第一容灾恢复流程；其中，所述第一容灾恢复流程为在容灾恢复周期内，通过采样规则对所述第一网络服务实例对应的第一网络报文采样，并将采样到的第一网络报文所匹配的第一转发快表，透传给所述第二服务实体；

32、所述第二服务实体用于基于接收到的所述第一转发快表恢复所述第一网络服务实例下的网络状态记录。

33、本方案中的有益效果参见上文，不再赘述。

34、在一种可能的实现方式中，所述第一可用区包括第三服务实体，所述第三服务实体和所述第一服务实体互为主备模式或主主模式；

35、所述控制器用于在感知到所述多个可用区中第一可用区的第一服务实体和所述第三服务实体故障后，确定所述第一服务实体和所述第三服务实体所影响到的第一网络服务实例。

36、本方案中，在可用区的用于运行第一网络服务实例的服务实体全部故障后，开启容灾恢复。

37、在一种可能的实现方式中，所述第二可用区包括第四服务实体，所述第四服务实体和所述第二服务实体互为主备模式或主主模式，作为所述第一网络服务实例的容灾对端。

38、在一个例子中，所述第一容灾恢复启动请求指示将主动触发采样后的第一网络报文所匹配的转发快表，透传给所述第二服务实体和第四服务实体，以使所述第二服务实体和所述第四服务实体恢复所述第一网络服务实例下的网络状态记录。

39、本方案中，转发快表可以同时透传给多个服务实体，从而快速实现网络状态记录的恢复。

40、在一个例子中，所述控制器用于向所述多个可用区正常工作的至少部分第二引流实体发送第二容灾恢复启动请求；每个所述第二引流实体用于基于所述第二容灾恢复启动请求，启动第二容灾恢复流程；其中，所述第二容灾恢复流程包括在容灾恢复周期内，通过采样规则对所述第一网络服务实例对应的第一网络报文采样，并将采样到的第一网络报文所匹配的第一转发快表，透传给所述第四服务实体；所述第四服务实体用于基于接收到的第一转发快表恢复所述第一网络服务实例下的网络状态记录。

41、本方案中，可以并行开启多个容灾恢复流程，从而快速实现网络状态记录的恢复。

42、在一个例子中，所述第二服务实体用于向所述第四服务实体发送恢复后的网络状态记录；所述第四服务实体用于对所述发送至所述第四服务实体备份。

43、本方案中，第二服务实体将恢复后的网络状态记录同步到第四服务实体备份，从而快速实现网络状态恢复。

44、在一种可能的实现方式中，所述容灾恢复周期为所述引流实体中的转发快表共享的报文采样周期。

45、在一种可能的实现方式中，所述采样规则为按照预设报文接收时长采样；所述第一网络报文为计时时长超过所述预设报文接收时长的网络报文。

46、在一种可能的实现方式中，所述采样规则为固定数目采样；所述第一网络报文为所述发送端对应的多个网络报文中适配所述固定数目的网络报文。

47、在一种可能的实现方式中，所述多个可用区中正常工作的至少部分第一引流实体包括目标引流实体；所述目标引流实体用于在所述容灾恢复周期之后，对所述第一网络服务实例对应的第二网络报文采样，并将采样到的第二网络报文和其所匹配的第二转发快表，透传给所述第二服务实体；所述第二服务实体用于在所述第二转发快表和恢复后的网络状态记录存在冲突时，向所述目标引流实体发送所述第二转发快表的删除通知；所述目标引流实体用于删除所述第二转发快表。

48、本方案中，容灾恢复之后，服务实体发现转发快表和网络状态记录存在冲突，则重置网络状态记录，确保业务正常。

49、在一种可能的实现方式中，所述第二服务实体用于删除和所述第二转发快表存在冲突的网络状态记录。

50、本方案中，容灾恢复之后，服务实体发现转发快表和网络状态记录存在冲突，则重置网络状态记录，确保业务正常。

51、第三方面，本技术实施例提供了一种计算设备集群，包括：至少一个计算设备，每个计算设备包括处理器和存储器；所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令，以使得所述计算设备集群执行如第一方面中所提供的方法。

52、第四方面，本技术实施例提供了一种计算设备集群，其特征在于，计算设备集群运行计算机程序指令，以执行如第一方面中所提供的方法。

53、第五方面，本技术实施例提供了一种计算机存储介质，计算机存储介质中存储有指令，当指令在计算机上运行时，使得计算机执行如第一方面中所提供的方法。

54、第六方面，本技术实施例提供了一种包含指令的计算机程序产品，当指令在计算机上运行时，使得计算机执行如第一方面中所提供的方法。

技术特征：

1.一种网络状态恢复方法，其特征在于，应用于处理系统，所述处理系统包括控制器和一个区域的多个可用区，所述可用区包括多个引流实体和多个服务实体，所述服务实体用于记录在所述服务实体上运行的至少一个网络服务实例下的网络状态数据，所述引流实体用于访问所述多个可用区的任一服务实体，基于所述服务实体发送的所述网络状态数据创建转发快表，所述转发快表用于转发网络报文，包括：

2.根据权利要求1所述的方法，其特征在于，所述第一可用区包括第三服务实体，所述第三服务实体和所述第一服务实体互为主备模式或主主模式；

3.根据权利要求1所述的方法，其特征在于，所述第二可用区包括第四服务实体，所述第四服务实体和所述第二服务实体互为主备模式或主主模式，作为所述第一网络服务实例的容灾对端。

4.根据权利要求3所述的方法，其特征在于，所述第一容灾恢复启动请求指示将主动触发采样后的第一网络报文所匹配的转发快表，透传给所述第二服务实体和第四服务实体，以使所述第二服务实体和所述第四服务实体恢复所述第一网络服务实例下的网络状态记录。

5.根据权利要求3所述的方法，其特征在于，所述方法还包括：

6.根据权利要求3所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述容灾恢复周期为所述引流实体中的转发快表共享的报文采样周期；或者，

8.根据权利要求1所述的方法，其特征在于，所述多个可用区中正常工作的至少部分第一引流实体包括目标引流实体，所述方法还包括：

9.根据权利要求8所述的方法，其特征在于，所述方法还包括：

10.一种处理系统，其特征在于，所述处理系统包括多个可用区和控制器，所述控制器管理一个区域的多个可用区，所述可用区包括多个引流实体和多个服务实体，所述服务实体用于记录在所述服务实体上运行的至少一个网络服务实例下的网络状态记录，所述引流实体用于访问所述多个可用区的任一服务实体，基于所述服务实体发送的所述网络状态记录创建转发快表，基于所述转发快表用于转发网络报文；

11.一种计算设备集群，其特征在于，包括至少一个计算设备，每个计算设备包括处理器和存储器；

12.一种包含指令的计算机程序产品，其特征在于，当所述指令被计算设备集群运行时，使得所述计算设备集群执行如权利要求的1至9任一所述的方法。

13.一种计算机可读存储介质，其特征在于，包括计算机程序指令，当所述计算机程序指令由计算设备集群执行时，所述计算设备集群执行如权利要求1至9任一所述的方法。

技术总结
本申请提供了一种网络状态恢复方法、系统和计算设备集群。该方法包括：控制器在感知到多个可用区中第一可用区的第一服务实体故障后，确定第一服务实体在故障前运行的第一网络服务实例；从多个可用区中确定第一网络服务实例的在第二可用区的第二服务实体；向多个可用区中至少部分第一引流实体发送第一容灾恢复启动请求；每个第一引流实体基于第一容灾恢复启动请求，在容灾恢复周期内，通过采样规则对第一网络服务实例对应的第一网络报文采样，并将采样到的第一网络报文所匹配的第一转发快表透传给第二服务实体；第二服务实体基于此恢复第一网络服务实例下的网络状态记录。由此，控制器仅仅需要通知引流实体开启容灾恢复流程即可，服务压力较小。

技术研发人员：左建威,付萌,李晓文
受保护的技术使用者：华为云计算技术有限公司
技术研发日：
技术公布日：2024/5/29

转载请注明原文地址:https://win.8miu.com/read-1149464.html

专利

最新回复(0)