如何从AIX上的本机代码调用系统函数?

时间:2016-03-11 06:35:57

标签: c mono aix jit

我的目的是从本机代码调用系统调用或libc函数。 本机代码是一个可执行的内存块,我将一些机器代码插入其中。在本机代码中,我尝试调用puts()或printf()函数来输出字符串。然后我调用本机代码。这个序列模型是Mono尝试做的。但是当我将Mono移植到AIX中时,我在调用诸如printf()或abs()之类的系统库函数时遇到了段错误。我想它必须在某个地方打破调用堆栈。但是我无法解决这个问题我不熟悉IBM powerpc平台。 我编写了一个简单的程序来演示序列,它也会在调用puts()时导致段错误。这需要很多时间,请给我一些建议,提前谢谢!

#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/mman.h>


typedef uint8_t        guint8;
typedef int16_t        gint16;
typedef uint16_t       guint16;
typedef int32_t        gint32;
typedef uint32_t       guint32;
typedef int64_t        gint64;
typedef uint64_t       guint64;
typedef float          gfloat;
typedef double         gdouble;
typedef int32_t        gboolean;
typedef void *         gpointer;
typedef enum {
        ppc_r0 = 0,
        ppc_r1,
        ppc_sp = ppc_r1,
        ppc_r2,
        ppc_r3,
        ppc_r4,
        ppc_r5,
        ppc_r6,
        ppc_r7,
        ppc_r8,
        ppc_r9,
        ppc_r10,
        ppc_r11,
        ppc_r12,
        ppc_r13,
        ppc_r14,
        ppc_r15,
        ppc_r16,
        ppc_r17,
        ppc_r18,
        ppc_r19,
        ppc_r20,
        ppc_r21,
        ppc_r22,
        ppc_r23,
        ppc_r24,
        ppc_r25,
        ppc_r26,
        ppc_r27,
        ppc_r28,
        ppc_r29,
        ppc_r30,
        ppc_r31
} PPCIntRegister;
typedef enum {
        ppc_lr = 256,
        ppc_ctr = 256 + 32,
        ppc_xer = 32
} PPCSpecialRegister;
#define G_STMT_START    do
#define G_STMT_END      while (0)
#define ppc_load32(c,D,v) G_STMT_START {        \
                ppc_lis ((c), (D),      (guint32)(v) >> 16);    \
                ppc_ori ((c), (D), (D), (guint32)(v) & 0xffff); \
        } G_STMT_END
#define ppc_emit32(c,x) do { *((guint32 *) (c)) = (guint32) (x); (c) = (gpointer)((guint8 *)(c) + sizeof (    guint32));} while (0)
#define ppc_stwux(c,S,A,B) ppc_emit32(c, (31 << 26) | (S << 21) | (A << 16) | (B << 11) | (183 << 1) | 0)
#define    ppc_or(c,a,s,b) ppc_emit32 (c, (31 << 26) | ((s) << 21) | ((a) << 16) | ((b) << 11) | 888)
#define    ppc_mr(c,a,s)   ppc_or     (c, a, s, s)
#define   ppc_ori(c,S,A,ui) ppc_emit32 (c, (24 << 26) | ((S) << 21) | ((A) << 16) | (guint16)(ui))
#define ppc_addis(c,D,A,i) ppc_emit32 (c, (15 << 26) | ((D) << 21) | ((A) << 16) | (guint16)(i))
#define   ppc_lis(c,D,v)   ppc_addis  (c, D, 0, (guint16)(v))
#define ppc_load_sequence(c,D,v) ppc_load32 ((c), (D), (guint32)(v))
#define ppc_load_func(c,D,V)          ppc_load_sequence ((c), (D), (V))
#define ppc_mtspr(c,spr,S) ppc_emit32 (c, (31 << 26) | ((S) << 21) | ((spr) << 11) | (467 << 1))
#define  ppc_mtlr(c,S)     ppc_mtspr  (c, ppc_lr, S)
#define  ppc_blrl(c)       ppc_emit32 (c, 0x4e800021)
#define ppc_mfspr(c,D,spr) ppc_emit32 (c, (31 << 26) | ((D) << 21) | ((spr) << 11) | (339 << 1))
#define  ppc_mflr(c,D)     ppc_mfspr  (c, D, ppc_lr)
#define   ppc_stw(c,S,d,A) ppc_emit32 (c, (36 << 26) | ((S) << 21) | ((A) << 16) | (guint16)(d))
#define  ppc_stwu(c,s,d,A) ppc_emit32 (c, (37 << 26) | ((s) << 21) | ((A) << 16) | (guint16)(d))
#define  ppc_addi(c,D,A,i) ppc_emit32 (c, (14 << 26) | ((D) << 21) | ((A) << 16) | (guint16)(i))
#define   ppc_lwz(c,D,d,A) ppc_emit32 (c, (32 << 26) | ((D) << 21) | ((A) << 16) | (guint16)(d))
#define   ppc_blr(c)       ppc_emit32 (c, 0x4e800020)
#define  ppc_bl(c,li)       ppc_emit32 (c, (18 << 26) | ((li) << 2) | 1)
#define PPC_CALL_REG ppc_r12

void foo()
{
  puts("Hello");
}

int main() 
{
  unsigned char codebuf [1024];
  unsigned char* code;
  void * mem;
  unsigned char* codest;
  void *values[1];
  int rc;

  foo();
  code = codest = codebuf;
  ppc_load_func(code, PPC_CALL_REG, *((void **)foo));
  ppc_mtlr(code, PPC_CALL_REG);
  ppc_blrl(code);

  mem = mmap(NULL, code - codest, PROT_WRITE | PROT_EXEC,
    MAP_ANONYMOUS | MAP_PRIVATE, -1, 0);
  memcpy(mem, codest, code - codest);
  void (*func) () = &mem;
  func();  

  return 0;
}

我必须使用gcc。这些宏是从Mono复制的。当不调用系统库函数时,func()是好的。 它可以进入func(),但是当调用puts时,寄存器R2值以某种方式被操纵。我不知道为什么?以下是我的测试框上的调试步骤:

127       func();
=> 0x10000760 <main+304>:       80 1f 00 40     lwz     r0,64(r31)
   0x10000764 <main+308>:       7c 0b 03 78     mr      r11,r0
   0x10000768 <main+312>:       81 2b 00 00     lwz     r9,0(r11)
   0x1000076c <main+316>:       90 41 00 14     stw     r2,20(r1)
   0x10000770 <main+320>:       7c 0a 03 78     mr      r10,r0
   0x10000774 <main+324>:       81 6a 00 08     lwz     r11,8(r10)
   0x10000778 <main+328>:       7d 29 03 a6     mtctr   r9
   0x1000077c <main+332>:       7c 0a 03 78     mr      r10,r0
   0x10000780 <main+336>:       80 4a 00 04     lwz     r2,4(r10)
   0x10000784 <main+340>:       4e 80 04 21     bctrl
   0x10000788 <main+344>:       80 41 00 14     lwz     r2,20(r1)

以上是输入func()的要点。 下面是核心转储快照:

(gdb) 
    0x10000550      90        puts("Hello");
    0x1000054c <foo+20>: 80 62 00 58     lwz     r3,88(r2)
 => 0x10000550 <foo+24>: 48 00 03 41     bl      0x10000890 <puts>
    0x10000554 <foo+28>: 80 41 00 14     lwz     r2,20(r1)
(gdb) 
    0x10000890 in puts ()
 => 0x10000890 <puts+0>: 81 82 00 5c     lwz     r12,92(r2)
(gdb) 
    0x10000894 in puts ()
 => 0x10000894 <puts+4>: 90 41 00 14     stw     r2,20(r1)
(gdb) info reg r12
    r12            0x0      0
(gdb) ni
    0x10000898 in puts ()
 => 0x10000898 <puts+8>: 80 0c 00 00     lwz     r0,0(r12)
(gdb) 
    0x1000089c in puts ()
 => 0x1000089c <puts+12>:        80 4c 00 04     lwz     r2,4(r12)
(gdb) 
    0x100008a0 in puts ()
 => 0x100008a0 <puts+16>:        7c 09 03 a6     mtctr   r0
(gdb) info reg r0
    r0             0x0      0
(gdb) ni
    0x100008a4 in puts ()
 => 0x100008a4 <puts+20>:        4e 80 04 20     bctr
(gdb) 
Program received signal SIGILL, Illegal instruction.
    0x00000000 in ?? ()
 => 0x00000000:  00 00 00 00     .long 0x0
在puts()中,它跳转到错误的地址0x0,在func()的开头,编译器修改了R2( lwz r2,4(r10)),它导致了问题,但它是编译器生成的代码,我无法改变它。我不知道如何处理这个问题。请帮我!谢谢。

1 个答案:

答案 0 :(得分:1)

您需要了解“胶水代码”和“glink代码”。

作为一种实用的方法,只需编写一个主要调用的简单程序。然后通过代码查看生成的组件以及单步(即stepi)。

“函数指针”puts()在另一个模块中时不指向可执行文件。相反,它指向一个有三个条目的toc条目:函数的地址,模块的toc,以及我无法回忆的另一个值。胶水代码/ glink代码(IIRC)将r11中的指针带到此条目,然后它将正确调用目标函数。

返回后,bl之后的下一条指令将是恢复toc的指令。

编译器,ld以及加载器都参与了实现这一目标的魔力。

快乐狩猎......