一种车规芯片中存储失效检测与修复方法及装置与流程

专利检索2024-11-07  4


本发明属于存储异常检测,尤其涉及一种车规芯片中存储失效检测与修复方法及装置。


背景技术:

1、车规级芯片,指技术标准达到车规级,可应用于汽车控制的芯片。车规芯片的安全性至关重要,在车规芯片的相关开发过程中,需要通过功能安全分析方法学对于芯片中的相关功能模块进行加固处理,以保证芯片不会因为随机硬件失效而出现功能失效,进而对驾驶人的人身安全产生威胁。现有芯片故障注入测试,多为软件故障模拟故障注入,包括jtag等故障模拟,该模拟方式不仅限制了芯片本身需具有软件编程功能,还对芯片类型及芯片功能进行了局限。也就是说,存储失效检测与修复是保障车规芯片安全的重要一环,也是不可缺少的一环,但是往往被忽视;

2、常见soc车规芯片架构中,包含多个总线master(cpu/dma/…)和多个总线slaver(ram/rom/flash, peripherals)通过总线矩阵互联;为了提高车规芯片的可靠性,一方面,车规mcu中对各类片上存储(ram/rom/flash)等都会增加ecc bit和logic来解决多个数据bit的失效问题。另外一方面,为了提高车规芯片的安全性,通常会在系统启动时对片上存储通过bist engine进行自检。如果自检失败,则车规芯片进入安全态。在车规芯片运行时,则无法通过bist来检测片上存储的问题,且一般bist都不区分ecc和data bits,无法识别是单bit还是多bit ecc错误。bist一般会对存储进行读写操作,导致存储中应用数据被修改。 这些都是现有技术中的常见手段。而当存储出现永久ecc错误时,则车规芯片会反复出现ecc错误,导致车规芯片无法使用或者系统级失效。当出现可以纠正的ecc错误时,意味着存储出现老化有潜在失效风险,现有技术中缺乏相应方法对存储潜在失效进行预警和规避;另外,随着片上存储容量的增大,为了提高车规芯片良率,片上存储中都会增加一些冗余存储。当产品测试发现部分存储损坏时,通过使用冗余存储替换损坏存储来提高良率。这种通过冗余存储来提高良率的方法仅仅在产品测试时使用,在产品使用中则无法使用冗余存储。

3、本发明增加片上硬件逻辑实现的mfmu模块,仅需要简单的数字逻辑功能,容易实现,对整个系统结构影响很小; 此外,修复方式是热替换,可以在系统运行时动态监测片上存储是否有潜在或永久失效风险,不需要停机;利用空闲的存储总线使用间隙主动检测片上存储是否有潜在失效风险,不会增加系统负担。


技术实现思路

1、为了解决现有技术中的上述问题,本发明提出了一种车规芯片中存储失效检测与修复方法及装置,所述装置和车规芯片存储总线相连以对车规芯片上设置的各类型存储单元进行监测;

2、所述装置包括:片上存储总线监测模块、片上存储访问模块、片上存储冗余块替换控制模块、mfmu中断和复位模块;

3、所述片上存储总线监测模块,用于监测车规芯片是否达到内部监测条件;所述内部监测条件是:监测到车规芯片存储总线处于空闲状态的时间长度是否达到监测启动阈值;

4、片上存储访问模块,用于基于固有的读传输逻辑发起对车规芯片上不同类型存储单元读传输,并记录ecc错误类型和数量;具体的:按照读传输比例发起对车规芯片上不同类型存储单元的读传输;并在读传输结束后通过和每个存储单元连接的ecc单元记录ecc错误类型和数量;其中:所述读传输比例是指在单元检测时间内或单位读传输次数内针对不同类型存储单元的读传输频率比值或次数比例;

5、片上存储冗余块替换控制模块,用于记录车规芯片上设置的存储冗余块的使用信息;根据使用信息确定可用存储冗余块;根据所记录的ecc错误类型、数量、ecc错误存储地址和ecc错误类型,确定待替换块;通过存储总线配置使能各类型存储单元内部冗余块替换逻辑完成车规芯片上待替换块的替换;用可用存储冗余块替换待替换块;当不存在可用存储冗余块时;记录不存在可用存储冗余块的存储单元类型、ecc错误存储地址和ecc错误类型,并触发mfmu中断和复位模块;

6、mfmu中断和复位模块,用于输出mfmu中断或者复位信号给车规芯片来指示车规芯片上存储出现ecc异常且无冗余块可以替换;

7、所述按照读传输比例发起对车规芯片上不同类型存储单元的读传输,具体为:在内部监测情况下,固有的读传输逻辑按照默认的读传输比例发起对车规芯片上不同类型存储单元的读传输;根据默认的读传输比例依次对不同类型的存储单元发起访问请求和数据传输;此时,根据片上存储访问模块的相应寄存器单元的默认值发起对车规芯片上不同类型存储单元的读传输;在外部监测情况下,根据外部监测指令内的读传输比例计算各个类型存储单元的访问频率/次数,并将所述访问频率/次数写入片上存储访问模块的相应寄存器单元中,固有的读传输逻辑在执行针对不同类型存储单元的读传输操作的过程中,读取所述寄存器单元中的访问频率,并基于所述访问频率发起对车规芯片上不同类型存储单元的读传输;其中:所述外部监测情况是车规芯片操作系统所发起的,在操作系统发起外部监测时,在外部监测指令中写入动态计算的读传输比例。

8、进一步的,存储单元包括:flash、ram和/或rom。

9、进一步的,监测启动阈值是预设值。

10、进一步的,所述使用信息包括是否可使用,剩余可用存储冗余块的数量和比例。

11、进一步的,所述单元检测时间和单位读传输次数均是预设值。

12、进一步的,所述单元检测时间是1s。

13、进一步的,所述系统所在车规芯片中设置有多个控制单元。

14、一种车规芯片中存储失效检测与修复系统,所述系统包括所述的车规芯片中存储失效检测与修复装置。

15、一种车规芯片,所述车规芯片包括所述的车规芯片中存储失效检测与修复装置。

16、一种车规芯片中存储失效检测与修复方法,所述方法采用所述的车规芯片中存储失效检测与修复装置进行车规芯片中存储失效检测与修复。

17、本发明的有益效果包括:

18、(1)增加设置的mfmu模块,仅需要简单的数字逻辑功能,容易实现,对整个系统结构影响很小; 此外,修复方式是热替换,可以在系统运行时动态监测片上存储是否有潜在或永久失效风险,不需要停机;利用空闲的存储总线使用间隙主动检测片上存储是否有潜在失效风险,不会增加系统负担;

19、(2)本发明通过内外部监测的配合,适应性的和动态的进行存储单元监测,大大提高了存储失效监测和修复的效率; 通过内部监测快速简单的进行常规检测和快速修复;进一步的,通过外部监测,根据上层逻辑的运行情况和访问情况,给出顶层逻辑对存储单元状态的判断;从而结合底层和上层逻辑的双层信息来给出完成的存储失效检测的时机;

20、(3)通过操作系统的软件逻辑动态量化计算读传输比例,充分利用操作系统层拥有的丰富计算资源,动态计算和改变针对不同存储单元类型的读传输方式,有机的进行软硬件存储失效检测结合,有针对性和预测性的上层运行情况所发现的重点存储单元类型提高读传输的次数,从而提高失效监测的效率。


技术特征:

1.一种车规芯片中存储失效检测与修复装置,其特征在于,所述装置和车规芯片存储总线相连以对车规芯片上设置的各类型存储单元进行监测;

2.根据权利要求1所述的车规芯片中存储失效检测与修复装置,其特征在于,存储单元包括:flash、ram和/或rom。

3.根据权利要求2所述的车规芯片中存储失效检测与修复装置,其特征在于,监测启动阈值是预设值。

4.根据权利要求3所述的车规芯片中存储失效检测与修复装置,其特征在于,所述使用信息包括是否可使用,剩余可用存储冗余块的数量和比例。

5.根据权利要求4所述的车规芯片中存储失效检测与修复装置,其特征在于,所述单元检测时间和单位读传输次数均是预设值。

6.根据权利要求5所述的车规芯片中存储失效检测与修复装置,其特征在于,所述单元检测时间是1s。

7.根据权利要求6所述的车规芯片中存储失效检测与修复装置,其特征在于,所述系统所在车规芯片中设置有多个控制单元。

8.一种车规芯片中存储失效检测与修复系统,其特征在于,所述系统包括如权利要求1-7中任一项所述的车规芯片中存储失效检测与修复装置。

9.一种车规芯片,其特征在于,所述车规芯片包括如权利要求1-7中任一项所述的车规芯片中存储失效检测与修复装置。

10.一种车规芯片中存储失效检测与修复方法,其特征在于,所述方法采用如权利要求1-7中任一项所述的车规芯片中存储失效检测与修复装置进行车规芯片中存储失效检测与修复。


技术总结
本发明涉及一种车规芯片中存储失效检测与修复方法及装置,所述装置包括:所述装置和车规芯片存储总线相连以对车规芯片上设置的各类型存储单元进行监测;所述装置包括:片上存储总线监测模块、片上存储访问模块、片上存储冗余块替换控制模块、MFMU中断和复位模块;本发明采用热替换进行检测和修复方式,可以在操作系统运行时动态监测片上存储是否有潜在或永久失效风险,不需要停机,不会增加系统负担。

技术研发人员:周建,王超凡,耿晓祥,王超
受保护的技术使用者:江苏云途半导体有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1145638.html

最新回复(0)