我正在使用带有ARM cortex_A9_MPCORE处理器的开发板(雪球),使用3.0.8+内核运行linux。 我使用GDB和openocd进行调试。
我正在寻找一种方法来查找用户模式进程的地址空间,尤其是文本段和用户模式堆栈。
首先我查看/ proc /“PID”/ maps,例如我正在为其中一个进程运行此输出:
# cat /proc/1124/maps
00008000-000d5000 r-xp 00000000 b3:02 181 /system/bin/lbsd
000d5000-000f8000 rw-p 000cd000 b3:02 181 /system/bin/lbsd
000f8000-0014a000 rw-p 00000000 00:00 0 [heap]
0014a000-0014c000 rw-p 00000000 00:00 0 [heap]
.
.
.
b0001000-b0009000 r-xp 00001000 b3:02 183 /system/bin/linker
b0009000-b000a000 rw-p 00009000 b3:02 183 /system/bin/linker
b000a000-b0015000 rw-p 00000000 00:00 0
bea00000-bea21000 rw-p 00000000 00:00 0 [stack]
ffff0000-ffff1000 r-xp 00000000 00:00 0 [vectors]
然后使用GDB我编写了一个脚本,用于解析板上运行的任务列表,从init_task开始,对于每个任务,它获取task_struct中找到的mm_struct的值,然后提取start_code,end_code和start_stack的值。最后,脚本解析mmap指向的不同内存区域。 当电路板处于调试状态时脚本运行,皮质a9的两个核都停止
以下是与上述相同过程的GDB脚本的输出:
taskaddr 0xdf29f140
Name: lbsd
mm start text 8000
mm end text d4ba4
mm start stack bee63df0
####MEMORY REGIONS#####
vm_start 0x8000
vm_end 0xd5000
vm_flags 0x8001875
-----------------------
vm_start 0xd5000
vm_end 0xf8000
vm_flags 0x8101873
-----------------------
vm_start 0xf8000
vm_end 0x14a000
vm_flags 0x100073
-----------------------
vm_start 0x14a000
vm_end 0x14c000
vm_flags 0x100073
-----------------------
.
.
.
-----------------------
vm_start 0xb0001000
vm_end 0xb0009000
vm_flags 0x8000875
-----------------------
vm_start 0xb0009000
vm_end 0xb000a000
vm_flags 0x8100873
-----------------------
vm_start 0xb000a000
vm_end 0xb0015000
vm_flags 0x100073
-----------------------
vm_start 0xbee42000
vm_end 0xbee64000
vm_flags 0x100173
-----------------------
vm_start 0xffff0000
vm_end 0xffff1000
vm_flags 0x40c0055
-----------------------
内存区域匹配除了堆栈之外使用的方法,在/ proc方法的输出中它从bea00000开始,而在mm_struct的start_stack字段中它在bee63df0,而vm_struct指向的内存区域表示bee42000 。 有人可以解释这些值的差异吗?
我的第二个问题是关于00008000和000d5000之间的第一个存储区域的值,它对应于该过程的文本部分。我注意到很多进程共享这些地址。内核如何设法获取文本内存区域的真实地址?
答案 0 :(得分:1)
在ARM上,堆栈会逐渐减少。这意味着堆栈从更高的地址开始。这在堆栈vm_flags
的{{1}}中可见,其中vma
位已设置。
堆栈VM_GROWSDOWN
的{{1}}为vma
,比vm_end
的{{1}}高出528个字节。发生这种情况是因为在同一个VMA中堆栈顶部之上有一些东西:命令行,环境和辅助向量。
我不知道为什么堆栈(只有它)位于0xbee64000
的不同地址。查看内核源代码,我看到start_stack
可以显示为0xbee63df0
当且仅当/proc/<pid>/maps
在其中时,所以如果vma
与您相同查看[stack]
,start_stack
无法标记为start_stack
。我能想到的唯一解释是它来自可执行文件的不同运行,并且除了堆栈之外的所有内容都禁用了地址布局随机化。
现在是第二个问题。
当您的进程正在运行时,硬件使用页表从虚拟地址(例如/proc/<pid>/maps
)映射到页面的物理地址。内核也可以这样做;它有一个指向其vma
中进程的根页表([stack]
)的指针。一旦它具有物理页码(0x8000
),它就可以到达相应的pgd
。有一大堆宏和函数可以完成所有这些操作。
但是页面可能会丢失。例如,您的可执行文件的其中一个页面可能尚未出现故障。页面表中该页面的条目将显示为缺失。然后内核查看相应的mm_struct
,其中pfn
内的偏移量具有从某处获取页面的足够信息,并将其插入页面表中。