访问外部设备时,ARM Cortex上的SIGBUS

时间:2018-03-27 19:34:25

标签: linux arm fpga sigbus

我有一台运行Linux的Zynq UltraScale MPSoC,内置四核ARM Cortex。有时,会发生一个生成SIGBUS错误的事件。我在下面提供了一个调试分析片段。我确信dst和src的值在合法区域。实际访问本身是从FPGA存储器资源到内部ARM存储器位置的复制例程。

我在另一篇文章中读到,SIGBUS的原因可能是I / O故障。任何人都可以扩展相对于ARM的“I / O故障”吗?我想象一下,类似于失败的公交承认。

相对于ARM Cortex,是否有机器检查寄存器,可以进一步了解SIGBUS的原因?

#0 ecfm_copy_table_entry_backward (dst=dst@entry=0xee189830, src=<optimized out>, num_words=num_words@entry=72) at src/software/saos-sds/ecfm_driver/ecfm_driver.c:478
#1 0xf658347c in ecfm_copy_table_entry_backward (num_words=72, src=<optimized out>, dst=0xee189830) at src/software/saos-sds/ecfm_driver/ecfm_driver.c:1186
#2 ecfm_get_rx_stats (session_id=session_id@entry=2637, stat=stat@entry=0xee189830) at src/software/saos-sds/ecfm_driver/ecfm_driver.c:1185
#3 0x011c463c in eCfmApiGetRxProcessingStats (sessionId=<optimized out>, stat=0xee1898e0) at src/software/saos-sds/leos/platform/common/src/eCfmApi.c:1836
#4 0x011d6aac in halFPGAGetStats (pPlatformData=pPlatformData@entry=0xe7f98abc, lossStats=0xee1899a8, lossStats@entry=0xee1899a0)
at src/software/saos-sds/leos/platform/common/src/halEcfmFpgaApi.c:2214
#5 0x00a71870 in cfmAgentReadHwStats (data=0xe7f98a70, role=<optimized out>, testType=<optimized out>) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmApal.c:1760
#6 0x009fd39c in cfmTestSessionSmiSmEvent (pSession=0xe7f98a70, event=event@entry=CfmTestSmiEvent_DeltaTComplete)
at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfm.c:26242
#7 0x00a75f04 in cfmApalOamFpgaSessionStatusIntHdlr (context=<optimized out>, pMsg=<optimized out>) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmApal.c:2461
#8 cfmApalOamFpgaHalY1731IntHdlr (context=<optimized out>, pMsg=0x37b7768 <__func__.44940>) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmApal.c:2548
#9 0x00a7cf04 in oamMsgDispatchMsgList (msgList=msgList@entry=0x68dfae8, pMsgContext=pMsgContext@entry=0xee189bc8)
at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/oamMsg.c:92
#10 0x00a76e50 in cfmHalDispatchMsgList (cpe=<optimized out>, msgList=msgList@entry=0x68dfae8) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmApal.c:594
#11 0x00a8f2cc in CfmAgentMsgHdlr (sig=<optimized out>) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmAgent.c:1335
#12 0x00a9045c in cfmAgentTmoHdlr (cycle=<optimized out>, extraProcTimeMs=0) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmAgent.c:1383
#13 0x00a90598 in cfmAgentMain (arg=<optimized out>) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmAgent.c:1441
#14 0x0112ea8c in thread_prologue (arg=<optimized out>) at src/software/saos-sds/leos/os/linux/src/ose_shim.c:1273
#15 0xf704af8c in start_thread (arg=0xee18a3e0) at pthread_create.c:335
#16 0xf646b0a0 in ?? () at ../sysdeps/unix/sysv/linux/arm/clone.S:89
from /localdata/perforce/ankgoyal/oneos/branches/saos-sds/dev/main/build/saos-sds/fs/eredan_tarfs/debug/eredan/armv7a/lib/libc.so.6
Backtrace stopped: previous frame identical to this frame (corrupt stack?)
(gdb) ore was generated by `/mnt/apps/bin/leos -s'.
(gdb) Program terminated with signal SIGBUS, Bus error.

1 个答案:

答案 0 :(得分:1)

SIGBUS是一个由Linux内核生成的软件信号,因此您需要了解内核生成SIGBUS信号的原因。这可能是也可能不是由硬件例外造成的。

确保数据正确对齐其类型以及您正在使用的内容。 SIGBUS的原因之一是无效对齐。尝试使用未经优化的代码重现错误(例如,对于GCC或Clang,而不传递-O选项)。

如果您已确认对齐不是问题,请检查访问的范围。如果由于访问设备总线而获得SIGBUS,则需要弄清楚该内存如何映射到您的进程中,以及该设备在该地址处暴露的内容。

检查内核日志。它们可能包含来自SIGBUS生成的调试信息。

如果信号是由硬件故障引起的,则异常的原因确实在寄存器中传达,但只有内核才能读取该寄存器的值。相关寄存器DFSRDFAR表示数据提取或存储失败,IFSRIFAR表示指令错误。但是,如果您设法查找内核中发生的情况,则只能使用此信息。