如何仅在目标文件中打印函数的二进制代码?

时间:2019-02-19 17:35:07

标签: macos object disassembly objdump otool

我能够反汇编如下的目标文件。但我只想以二进制格式将指令的原始数字(如55、48等)以二进制格式转储到文件中,以用于特定功能(例如add4)。

我可以编写一个程序来解析otool的输出。但是有更简单的方法吗?

我的操作系统是Mac OS X。

$ cat add.c
long x;
long add2(long num) {
  return num + 2;
}
long add4(long num) {
  return num + 4;
}
$ clang -c -o add.o add.c
$ otool -tvjV add.o 
add.o:
(__TEXT,__text) section
_add4:
0000000000000000    55  pushq   %rbp
0000000000000001    48 89 e5    movq    %rsp, %rbp
0000000000000004    48 89 7d f8     movq    %rdi, -0x8(%rbp)
0000000000000008    48 8b 7d f8     movq    -0x8(%rbp), %rdi
000000000000000c    48 83 c7 04     addq    $0x4, %rdi
0000000000000010    48 89 f8    movq    %rdi, %rax
0000000000000013    5d  popq    %rbp
0000000000000014    c3  retq
0000000000000015    66 2e 0f 1f 84 00 00 00 00 00   nopw    %cs:_add4(%rax,%rax)
000000000000001f    90  nop
_add2:
0000000000000020    55  pushq   %rbp
0000000000000021    48 89 e5    movq    %rsp, %rbp
0000000000000024    48 89 7d f8     movq    %rdi, -0x8(%rbp)
0000000000000028    48 8b 7d f8     movq    -0x8(%rbp), %rdi
000000000000002c    48 83 c7 02     addq    $0x2, %rdi
0000000000000030    48 89 f8    movq    %rdi, %rax
0000000000000033    5d  popq    %rbp
0000000000000034    c3  retq

2 个答案:

答案 0 :(得分:0)

您可以使用nm -nU add.o来获取符号地址。您可以搜索感兴趣的符号并获取其地址和后续地址。这给了您符号的开始和(大约)长度。然后,您可以使用任何工具从文件进行十六进制转储,以仅读取该部分。

例如:

exec 3< <(nm -nU add.o | grep -A1 -w _add4 | cut -d ' ' -f 1)
read start <&3
read end <&3
3<&-
offset=$(otool -lV add.o | grep -A3 -w "segname __TEXT" | grep -m1 offset | cut -c 12-)
if [ -n "$end" ] ; then length_arg="-n $(( "0x$end" - "0x$start" ))" ; fi
hexdump -C -s $((0x$start + $offset)) $length_arg add.o

答案 1 :(得分:0)

您可以使用objdump,然后提取操作码部分。可以按照以下步骤进行。

$ objdump -d add.o | grep add4 -A10 | cut -f 2 | grep -v ':'

grep的-v标志告诉它打印不包含冒号的所有行。

输出:

    55                   
    48 89 e5             
    48 89 7d f8          
    48 8b 45 f8          
    48 83 c0 04          
    5d                
    c3

-A10告诉grep在比赛后打印10行。

现在要将其输出到文件中,我们首先将操作码格式化为十六进制格式,例如“ \ x45”。 上面的输出可以有多个空格,并且每行的末尾都有一个空格,因此我们首先将其删除,因为它可能会干扰我们的sed。

$ objdump -d add.o | grep add4 -A10 | cut -f 2 | grep -v ':' | sed 's/ */ /g' | sed 's/ $//g'

添加'\ x'部分,首先添加中间的空格,然后添加每行中的第一个十六进制。

$ objdump -d add.o | grep add4 -A10 | cut -f 2 | grep -v ':' | sed 's/ */ /g' | sed 's/ $//g' | sed 's/ /\\x/g' | sed 's/^/\\x/g'

\x55
\x48\x89\xe5
\x48\x89\x7d\xf8
\x48\x8b\x45\xf8
\x48\x83\xc0\x04
\x5d
\xc3

将它们全部括起来并加引号。

$ objdump -d add.o | grep add4 -A10 | cut -f 2 | grep -v ':' | sed 's/ */ /g' | sed 's/ $//g' | sed 's/ /\\x/g' | sed 's/^/\\x/g' | tr -d '\n' | sed 's/^/\"/g' | sed 's/$/\"/g'

"\x55\x48\x89\xe5\x48\x89\x7d\xf8\x48\x8b\x45\xf8\x48\x83\xc0\x04\x5d\xc3"

现在,我们得到了一个C样式的字符串,我们将其传递给printf,然后将输出重定向到文件。

$ printf $(objdump -d add.o | grep add4 -A10 | cut -f 2 | grep -v ':' | sed 's/ */ /g' | sed 's/ $//g' | sed 's/ /\\x/g' | sed 's/^/\\x/g' | tr -d '\n' | sed 's/^/\"/g' | sed 's/$/\"/g') | sed 's/^\"//g' | sed 's/\"$//g' > add4.bin

printf之后的最后两个sed将删除由于某些原因保留在printf输出中的引号。

转储我们得到的文件:

$ hexdump -C add4.bin

00000000  55 48 89 e5 48 89 7d f8  48 8b 45 f8 48 83 c0 04  |UH..H.}.H.E.H...|
00000010  5d c3                                             |].|
00000012