一种PCIe系统温度控制方法和装置与流程

专利检索2025-03-06  21


本发明属于温度控制领域,特别涉及一种pcie系统温度控制方法和装置。


背景技术:

1、随着芯片复杂度的提升,芯片的温度控制越来越成为关系到整个系统可靠性的重要因素。在超过芯片的正常工作温度时,器件的可靠性将会指数级下降,影响芯片的使用寿命。对于pcie高速i/o芯片,由于负责整个高速数据i/o的交互,pcie协议需要实时进行大量的数据传输,表面温度会更高,因此需要温度管理控制系统对芯片温度进行实时监测、响应以及管理,否则会增加芯片的静态功耗,而且会使芯片可靠性显著降低,增加器件失效风险。

2、为了支持更高的传输效率,pcie标准协议支持多端口传输,一个端口支持一个或多个物理层组成一个端口,每个端口相互独立,具有更高的传输效率。一种典型的多端口阵列如图1所示。

3、传统的pcie系统温度控制方法在芯片层面加入温度控制模块tsensor。当芯片工作温度过高超过警戒值时,tsensor模块向芯片上报温度异常中断,cpu对整个系统强制关闭操作,防止芯片因温度过热而造成器件的损坏。可见,传统方案温度超过阈值后对整个系统直接关闭,缺乏当前传输状态检测,会直接影响当前pcie系统的正常业务传输,无法区分各个端口当前传输状态,无法精确地对各个端口在不影响业务传输的前提下进行独立的温度控制。

4、此外,pcie系统通过自带活动状态功耗管理模块(aspm)的自动管理功耗状态,包括链路进入l0s、l1、l1.1、l1.2等状态,可以有效降低系统运行功耗。而传统方案缺乏功耗状态和系统温度之间的交互,进入低功耗模式的计时器在初始配置后为固定值,不能根据温度动态调节进入低功耗模式的时间,从而无法自适应地调节pcie控制器的温度。


技术实现思路

1、本发明的目的在于提供一种pcie系统温度控制方法和装置,在保证数据业务完整性的前提下,动态自适应地对pcie系统进行温度调节。

2、根据本发明的第一方面,提供了一种pcie系统温度控制方法,包括:

3、实时监测pcie系统的当前温度,在当前温度超过预设的预警温度阈值时,如果目标链路未处于第一低功耗状态,则修改对应aspm模块的第一低功耗状态的计时器值,以缩短目标链路进入第一低功耗状态的时间;

4、如果当前温度超过预设的最高温度阈值,则在目标链路已被设置为第一低功耗状态时,将目标链路设置为第二低功耗状态,在目标链路未处于第一低功耗状态时,降低目标链路的链路速率,其中所述最高温度阈值高于所述预警温度阈值,并且所述第二低功耗状态的功耗低于所述第一低功耗状态;

5、在当前温度低于预设的最低温度阈值时,将处于第一低功耗状态和第二低功耗状态的端口状态恢复为正常功耗状态,并将链路速率被降低的端口进行速率恢复。

6、优选地,所述在将目标链路设置为第一低功耗状态之后,进一步包括:

7、如果当前温度低于所述预警温度阈值,则将所述aspm模块的第一低功耗状态的计时器值改回默认值。

8、所述降低目标链路的链路速率,进一步包括:

9、对目标链路启动降速或降lane操作,如果当前温度仍然超过所述最高温度阈值,则依次对其他端口进行降速或降lane操作,直到当前温度不超过所述最高温度阈值。

10、所述第一低功耗状态为aspm l1低功耗状态,所述第二低功耗状态为aspm l1.1或l1.2低功耗子状态。

11、所述将目标链路设置为第二低功耗状态,进一步包括:

12、将目标链路设置为aspm l1.1或l1.2低功耗子状态,如果当前温度仍然超过所述最高温度阈值,则依次将其他端口设置为aspm l1.1或l1.2低功耗子状态,直到当前温度不超过所述最高温度阈值。

13、根据本发明的第二方面,提供了一种pcie系统温度控制装置,包括:

14、温度监测单元,用于实时监测pcie系统的当前温度;

15、第一控制单元,用于在当前温度超过预设的预警温度阈值时,如果目标链路未处于第一低功耗状态,则修改对应aspm模块的第一低功耗状态的计时器值,以缩短目标链路进入第一低功耗状态的时间;

16、第二控制单元,用于在当前温度超过预设的最高温度阈值时,在目标链路已被设置为第一低功耗状态时,将目标链路设置为第二低功耗状态,在目标链路未处于第一低功耗状态时,降低目标链路的链路速率,其中所述最高温度阈值高于所述预警温度阈值,并且所述第二低功耗状态的功耗低于所述第一低功耗状态;

17、第三控制单元,用于在当前温度低于预设的最低温度阈值时,将处于第一低功耗状态和第二低功耗状态的端口状态恢复为正常功耗状态,并将链路速率被降低的端口进行速率恢复。

18、相比于相关技术,本发明的技术方案具备以下优点:

19、通过设置最低温度阈值、预警温度阈值、最高温度阈值三个档位,利用tsensor模块与pcie系统之间的交互,对pcie系统传输过程温度进行监测,结合当前链路所处传输状态,在系统温度超过阈值温度时,分别选择对目标链路进行降低aspm进入l1的计时器配置、启动目标链路进入l1.1/l1.2子状态、启动目标链路降速和降lane操作来实现降低温度,更加直接、精确地对温度进行控制,更快地进入低功耗模式,本发明提出的pcie系统温度控制方法简单清晰、易于实现,全程无需主机干预,将pcie中的aspm机制与温度控制结合,可以保证业务传输的完整性、不影响业务正常传输。

20、本发明的其它特征和优点将在随后的说明书中阐述,并且部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可以通过在说明书以及附图中所指出的结构和流程来实现和获取。



技术特征:

1.一种pcie系统温度控制方法,其特征在于,包括:

2.根据权利要求1所述的pcie系统温度控制方法,其特征在于,在将目标链路设置为第一低功耗状态之后,进一步包括:

3.根据权利要求1所述的pcie系统温度控制方法,其特征在于,所述降低目标链路的链路速率,进一步包括:

4.根据权利要求1所述的pcie系统温度控制方法,其特征在于,所述第一低功耗状态为aspm l1低功耗状态,所述第二低功耗状态为aspm l1.1或l1.2低功耗子状态。

5.根据权利要求4所述的pcie系统温度控制方法,其特征在于,所述将目标链路设置为第二低功耗状态,进一步包括:

6.一种pcie系统温度控制装置,其特征在于,包括:

7.根据权利要求6所述的pcie系统温度控制装置,其特征在于,所述第一控制单元,进一步用于:

8.根据权利要求6所述的pcie系统温度控制装置,其特征在于,所述第二控制单元,进一步用于:

9.根据权利要求6所述的pcie系统温度控制装置,其特征在于,所述第一低功耗状态为aspm l1低功耗状态,所述第二低功耗状态为aspm l1.1或l1.2低功耗子状态。

10.根据权利要求9所述的pcie系统温度控制装置,其特征在于,所述第二控制单元,进一步用于:


技术总结
本发明提供了一种PCIe系统温度控制方法和装置,实时监测PCIe系统的当前温度,在当前温度超过预设的预警温度阈值时,如果目标链路未处于第一低功耗状态,则修改对应ASPM模块的第一低功耗状态的计时器值,以缩短目标链路进入第一低功耗状态的时间;如果当前温度超过预设的最高温度阈值,在目标链路已被设置为第一低功耗状态时,将目标链路设置为第二低功耗状态,在目标链路未处于第一低功耗状态时,降低端口链路速率;在当前温度低于预设的最低温度阈值时,将处于第一和第二低功耗状态的链路恢复为正常状态,并将链路速率被降低的端口进行速率恢复。本发明在保证数据业务完整性的前提下,动态自适应地对PCIe系统进行温度调节。

技术研发人员:杨亮,李明,王剑铎,梁明明,申正,吴崇杰
受保护的技术使用者:无锡众星微系统技术有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1150790.html

最新回复(0)