我能够反汇编如下的目标文件。但我只想以二进制格式将指令的原始数字(如55、48等)以二进制格式转储到文件中,以用于特定功能(例如add4)。
我可以编写一个程序来解析otool的输出。但是有更简单的方法吗?
我的操作系统是Mac OS X。
$ cat add.c
long x;
long add2(long num) {
return num + 2;
}
long add4(long num) {
return num + 4;
}
$ clang -c -o add.o add.c
$ otool -tvjV add.o
add.o:
(__TEXT,__text) section
_add4:
0000000000000000 55 pushq %rbp
0000000000000001 48 89 e5 movq %rsp, %rbp
0000000000000004 48 89 7d f8 movq %rdi, -0x8(%rbp)
0000000000000008 48 8b 7d f8 movq -0x8(%rbp), %rdi
000000000000000c 48 83 c7 04 addq $0x4, %rdi
0000000000000010 48 89 f8 movq %rdi, %rax
0000000000000013 5d popq %rbp
0000000000000014 c3 retq
0000000000000015 66 2e 0f 1f 84 00 00 00 00 00 nopw %cs:_add4(%rax,%rax)
000000000000001f 90 nop
_add2:
0000000000000020 55 pushq %rbp
0000000000000021 48 89 e5 movq %rsp, %rbp
0000000000000024 48 89 7d f8 movq %rdi, -0x8(%rbp)
0000000000000028 48 8b 7d f8 movq -0x8(%rbp), %rdi
000000000000002c 48 83 c7 02 addq $0x2, %rdi
0000000000000030 48 89 f8 movq %rdi, %rax
0000000000000033 5d popq %rbp
0000000000000034 c3 retq
答案 0 :(得分:0)
您可以使用nm -nU add.o
来获取符号地址。您可以搜索感兴趣的符号并获取其地址和后续地址。这给了您符号的开始和(大约)长度。然后,您可以使用任何工具从文件进行十六进制转储,以仅读取该部分。
例如:
exec 3< <(nm -nU add.o | grep -A1 -w _add4 | cut -d ' ' -f 1)
read start <&3
read end <&3
3<&-
offset=$(otool -lV add.o | grep -A3 -w "segname __TEXT" | grep -m1 offset | cut -c 12-)
if [ -n "$end" ] ; then length_arg="-n $(( "0x$end" - "0x$start" ))" ; fi
hexdump -C -s $((0x$start + $offset)) $length_arg add.o
答案 1 :(得分:0)
您可以使用objdump,然后提取操作码部分。可以按照以下步骤进行。
$ objdump -d add.o | grep add4 -A10 | cut -f 2 | grep -v ':'
grep的-v标志告诉它打印不包含冒号的所有行。
输出:
55
48 89 e5
48 89 7d f8
48 8b 45 f8
48 83 c0 04
5d
c3
-A10告诉grep在比赛后打印10行。
现在要将其输出到文件中,我们首先将操作码格式化为十六进制格式,例如“ \ x45”。 上面的输出可以有多个空格,并且每行的末尾都有一个空格,因此我们首先将其删除,因为它可能会干扰我们的sed。
$ objdump -d add.o | grep add4 -A10 | cut -f 2 | grep -v ':' | sed 's/ */ /g' | sed 's/ $//g'
添加'\ x'部分,首先添加中间的空格,然后添加每行中的第一个十六进制。
$ objdump -d add.o | grep add4 -A10 | cut -f 2 | grep -v ':' | sed 's/ */ /g' | sed 's/ $//g' | sed 's/ /\\x/g' | sed 's/^/\\x/g'
\x55
\x48\x89\xe5
\x48\x89\x7d\xf8
\x48\x8b\x45\xf8
\x48\x83\xc0\x04
\x5d
\xc3
将它们全部括起来并加引号。
$ objdump -d add.o | grep add4 -A10 | cut -f 2 | grep -v ':' | sed 's/ */ /g' | sed 's/ $//g' | sed 's/ /\\x/g' | sed 's/^/\\x/g' | tr -d '\n' | sed 's/^/\"/g' | sed 's/$/\"/g'
"\x55\x48\x89\xe5\x48\x89\x7d\xf8\x48\x8b\x45\xf8\x48\x83\xc0\x04\x5d\xc3"
现在,我们得到了一个C样式的字符串,我们将其传递给printf,然后将输出重定向到文件。
$ printf $(objdump -d add.o | grep add4 -A10 | cut -f 2 | grep -v ':' | sed 's/ */ /g' | sed 's/ $//g' | sed 's/ /\\x/g' | sed 's/^/\\x/g' | tr -d '\n' | sed 's/^/\"/g' | sed 's/$/\"/g') | sed 's/^\"//g' | sed 's/\"$//g' > add4.bin
printf之后的最后两个sed将删除由于某些原因保留在printf输出中的引号。
转储我们得到的文件:
$ hexdump -C add4.bin
00000000 55 48 89 e5 48 89 7d f8 48 8b 45 f8 48 83 c0 04 |UH..H.}.H.E.H...|
00000010 5d c3 |].|
00000012