我有一块运行FreeRTOS的STM32F4电路板(上面有3个任务),我每15-50分钟就会收到一个HardFault。
我的硬件: 3个编码器,6个模拟输入,10个数字输入和3个PWM输出,用于直流电机。
一开始,我认为是一些StackOverflow,而不是我为每个任务实现uxTaskGetStackHighWaterMark();
并检查它不是它。
然后我实现了一些HardFault处理程序:
void HardFault_Handler(void)
{
__asm volatile
(
" tst lr, #4 \n"
" ite eq \n"
" mrseq r0, msp \n"
" mrsne r0, psp \n"
" ldr r1, [r0, #24] \n"
" ldr r2, handler2_address_const \n"
" bx r2 \n"
" handler2_address_const: .word prvGetRegistersFromStack \n"
);
}
void prvGetRegistersFromStack( uint32_t *pulFaultStackAddress )
{
volatile uint32_t CFSRValue = SCB->CFSR;
volatile uint32_t HFSRValue = SCB->HFSR;
char stepError [100] = "";
if ((HFSRValue & (1 << 30)) != 0) {
CFSRValue >>= 16;
if((CFSRValue & (1 << 9)) != 0) strcpy(stepError," Divide by zero");
if((CFSRValue & (1 << 8)) != 0) strcpy(stepError," Unaligned access");
if((CFSRValue & (1 << 3)) != 0) strcpy(stepError," No coprocessor UsageFault" );
if((CFSRValue & (1 << 2)) != 0) strcpy(stepError," Invalid PC load UsageFault");
if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state");
if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
}
volatile uint32_t r0;
volatile uint32_t r1;
volatile uint32_t r2;
volatile uint32_t r3;
volatile uint32_t r12;
volatile uint32_t lr; /* Link register. */
volatile uint32_t pc; /* Program counter. */
volatile uint32_t psr;/* Program status register. */
r0 = pulFaultStackAddress[ 0 ];
r1 = pulFaultStackAddress[ 1 ];
r2 = pulFaultStackAddress[ 2 ];
r3 = pulFaultStackAddress[ 3 ];
r12 = pulFaultStackAddress[ 4 ];
lr = pulFaultStackAddress[ 5 ];
pc = pulFaultStackAddress[ 6 ];
psr = pulFaultStackAddress[ 7 ];
GPIO_WriteLed(0,1);
for(int i=0;i<=10;i++)
{
PWM_Change_DutyCycle(i,0);
}
for(;;);
}
从这个实现中,我得到了那些结果(每个都是HardFault,有时候PC是0),看起来非常随机(对我来说):
1- if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state"); pc=0
2- if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
0800807d: ...IncrementTick+252 ldr r3, [r7, #8] - pc=134250621 - lr=2779096485
3- if((CFSRValue & (1 << 8)) != 0) strcpy(stepError," Unaligned access");
0800d63b: MX_ADC1_Init+290 ldr r3, [pc, #240] ; (0x800d72c <MX_ADC1_Init+532>)
4- if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state");
addr 0
5-080124c9: SysTick_Handler+8 bl 0x80072cc <osSystickHandler>
6- if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
08012521: SysTick_Handler+8 bl 0x80072cc <osSystickHandler>
此致
答案 0 :(得分:0)
该问题并未明确说明,但据我了解,该线程不是关于硬故障的来源,而是到目前为止显示的测试思想是否还可以,并且可以执行其他哪些操作来定位错误。
这个问题现在已经很老了,但是此评估板旨在帮助遇到相同问题的其他人,因此让我们阅读对此类问题普遍感兴趣的问答。
为了追溯问题,以下策略可以提供帮助:
如果您可以应用跟踪硬件(因为硬件目标支持它并且您有足够的昂贵设备...),请使用它:片外ETM跟踪和经典断点故障处理程序,那么您的搜索可能会超过50分钟。
我想当前情况没有满足条件。 不过,在一些专业项目中,设计另一个PCB并购买一个好的调试/跟踪适配器要比让一些开发人员搜索数周便宜。 也许具有完全JTAG / TPIU访问权限的STM32评估板是您的部分解决方案...
有很多错误模型,其中硬故障处理程序报告给您的地址与错误源无关。 不过,通过检查(使用内存映射)地址可能属于哪个函数或变量/缓冲区,您可能会得到一些有用的想法。 通过在模块之间放置未使用的“间隔”缓冲区(一个或几个字就足够了)来修改错误的环境,然后重新运行测试。 如果您在这些未使用的区域中写入一些魔术图案,则可以监视它们的损坏并将其用作“ canaries”,以检测错误在哪种情况下发生。
如果这样做没有帮助,请逐步停用软件的不同组件,然后重新运行并检查硬故障何时消失。 如果尚未使用过,您可能需要一些自动化的耐力测试环境,以便您的工作(和搜索时间)不会爆炸。
据我所知 STM32F4 有一个内存保护单元。 您可以激活它吗?