如何在CPU上调试rcu_sched自检停顿?

时间:2018-08-06 10:33:28

标签: linux linux-kernel kernel cpu scheduling

我在syslog中跟踪了一些跟踪,跟踪持续了1-2个小时,然后内核挂起了。

  

7月12日23:30:06(无)user.err内核:[177167.456815]信息:rcu_sched   在CPU {21}上自我检测到的失速(t = 666938 jiffies g = 8770896   c = 8770895 q = 2179231)

     

7月12日23:30:06(无)user.info内核:[177167.456822]发送NMI   所有CPU:7月12日23:30:06(无)user.warn内核:[177167.458912]   CPU 21的NMI回溯

     

7月12日23:30:06(无)user.warn内核:[177167.458914] CPU:21 PID:   10269 Comm:dbclient污染:G W O 3.14.22-Aum#1

     

Jul 12 23:30:06(无)user.warn内核:[177167.458915]硬件   名称:Sophos XG /将由O.E.M.填写BIOS 5.6.5 12/29/2016

     

7月12日23:30:06(无)user.warn内核:[177167.458916]任务:   ffff8800683486c0 ti:ffff8802261a2000 task.ti:ffff8802261a2000

     

7月12日23:30:06(无)user.warn内核:[177167.458917] RIP:   0010:[] [] delay_tsc + 0x2e / 0x60

     

7月12日23:30:06(无)user.warn内核:[177167.458920] RSP:   0018:ffff8806674a3ea0 EFLAGS:00000046

     

7月12日23:30:06(无)user.warn内核:[177167.458921] RAX:   0000000046e88b04 RBX:00000000000003e9 RCX:0000000046e88ab8

     

7月12日23:30:06(无)user.warn内核:[177167.458922] RDX:   00000000008c1ddb RSI:0000000000000015 RDI:0000000000039feb

     

Jul 12 23:30:06(无)user.warn内核:[177167.458923] RBP:   0000000000001000 R08:ffffffff8162bbb8 R09:000000000000d59a

     

7月12日23:30:06(无)user.warn内核:[177167.458924] R10:   0000000000000000 R11:ffff8806674a3c6e R12:0000000000000400

     

7月12日23:30:06(无)user.warn内核:[177167.458925] R13:   0000000000000086 R14:0000000000000002 R15:000000000000000d

     

7月12日23:30:06(无)user.warn内核:[177167.458926] FS:   0000000000000000(0000)GS:ffff8806674a0000(0063)   knlGS:00000000f75aa700

     

7月12日23:30:06(无)user.warn内核:[177167.458927] CS:0010 DS:   002b ES:002b CR0:0000000080050033

     

7月12日23:30:06(无)user.warn内核:[177167.458928] CR2:   00007f6bd542a000 CR3:000000022624c000 CR4:00000000001407e0

     

7月12日23:30:06(无)user.warn内核:[177167.458929]堆栈:

     

Jul 12 23:30:06(无)user.warn内核:[177167.458929]   ffffffff81028522 000000000000b022 ffffffff8162bbb8 ffffffff81029732

     

Jul 12 23:30:06(无)user.warn内核:[177167.458931]   0000000000000016 0000000000002710 0000ffffffffffff 0000000000000015

     

Jul 12 23:30:06(无)user.warn内核:[177167.458933]   ffffffff8162bbc0 000000000021409f ffffffff815f35c0 ffffffff810298ed

     

7月12日23:30:06(无)user.warn内核:[177167.458935]调用跟踪:

     

7月12日23:30:06(无)user.warn内核:[177167.458936]

     

Jul 12 23:30:06(无)user.warn内核:[177167.458936]   []? native_safe_apic_wait_icr_idle + 0x22 / 0x50

     

Jul 12 23:30:06(无)user.warn内核:[177167.458943]   []? default_send_IPI_mask_sequence_phys + 0xc2 / 0xd0

     

Jul 12 23:30:06(无)user.warn内核:[177167.458945]   []? arch_trigger_all_cpu_backtrace + 0x4d / 0x80

     

Jul 12 23:30:06(无)user.warn内核:[177167.458949]   []? rcu_check_callbacks + 0x365 / 0x5a0

     

Jul 12 23:30:06(无)user.warn内核:[177167.458951]   []? __tasklet_hi_schedule + 0x50 / 0x50

     

Jul 12 23:30:06(无)user.warn内核:[177167.458954]   []? update_process_times + 0x3b / 0x60

     

Jul 12 23:30:06(无)user.warn内核:[177167.458957]   []? tick_handle_periodic + 0x18 / 0x60

     

Jul 12 23:30:06(无)user.warn内核:[177167.458959]   []? smp_apic_timer_interrupt + 0x36 / 0x50

     

Jul 12 23:30:06(无)user.warn内核:[177167.458963]   []? apic_timer_interrupt + 0x67 / 0x70

     

7月12日23:30:06(无)user.warn内核:[177167.458964]

     

7月12日23:30:06(无)user.warn内核:[177167.458965]
  []? __tasklet_hi_schedule + 0x50 / 0x50

     

Jul 12 23:30:06(无)user.warn内核:[177167.458969]   []? _raw_spin_unlock_irqrestore + 0x5 / 0x10

     

Jul 12 23:30:06(无)user.warn内核:[177167.458971]   []? print_cpu + 0x172 / 0x3e0

     

Jul 12 23:30:06(无)user.warn内核:[177167.458972]   []? __tasklet_hi_schedule + 0x50 / 0x50

     

Jul 12 23:30:06(无)user.warn内核:[177167.458974]   []? timer_list_show + 0xb0 / 0x100

     

Jul 12 23:30:06(无)user.warn内核:[177167.458978]   []? seq_read + 0x134 / 0x380

     

7月12日23:30:06(无)user.warn内核:[177167.458980]   []? ktime_get_ts + 0x3d / 0xe0

     

Jul 12 23:30:06(无)user.warn内核:[177167.458983]   []? proc_reg_read + 0x34 / 0x70

     

Jul 12 23:30:06(无)user.warn内核:[177167.458985]   []? vfs_read + 0x85 / 0x130

     

Jul 12 23:30:06(无)user.warn内核:[177167.458986]   []? SyS_read + 0x3d / 0xb0

     

Jul 12 23:30:06(无)user.warn内核:[177167.458988]   []? sysenter_dispatch + 0x7 / 0x1e

     

Jul 12 23:30:06(无)user.warn内核:[177167.458989]代码:25 1c   b0 00 00 0f 1f 00 0f ae e8 0f 31 89 c1 eb 12 0f 1f 40 00 f3 90 65 8b   14 25 1c b0 00 00 39 d6 75 1a 0f 1f 00 0f ae e8 0f 31 <48> c1 e2 20 89   c0 48 09 c2 89 d0 29 ca 39 fa 72 d9 c3 29 c1 89

这里的通话跟踪没有太大帮助,我也不知道是什么原因造成了停顿。

0 个答案:

没有答案