在x64 ASM中循环并打印argv []

时间:2016-05-13 12:28:38

标签: macos assembly 64-bit x86-64 att

我一直在研究基本上while循环来遍历所有CLI参数。在解决方案只打印1个元素时,我注意到了一些事情;这是让我来到这里的思考过程。

我注意到如果我lea 16(%rsp), %someRegisterToWrite,我就能得到/打印argv [1]。接下来我尝试了lea 24(%rsp), %someRTW,这让我可以访问argv [2]。我继续往上看,看看它是否会继续工作,而且确实如此。

我的想法是继续向%someRTW添加8并增加“计数器”直到计数器等于argc。当输入单个参数但是没有打印2个参数时,下面的代码工作得很好,当我输入3个参数时,它将打印前两个参数,中间没有空格。

.section __DATA,__data
.section __TEXT,__text
.globl _main
_main:
    lea (%rsp), %rbx        #argc
    lea 16(%rsp), %rcx      #argv[1]
    mov $0x2, %r14          #counter
    L1:
    mov (%rcx), %rsi        #%rsi = user_addr_t cbuf
    mov (%rcx), %r10
    mov 16(%rcx), %r11      
    sub %r10, %r11          #Get number of bytes until next arg
    mov $0x2000004, %eax    #4 = write
    mov $1, %edi            #edi = file descriptor 
    mov %r11, %rdx          #user_size_t nbyte
    syscall
    cmp (%rbx), %r14        #if counter < argc
    jb L2
    jge L3
    L2:
    inc %r14                
    mov 8(%rcx), %rcx       #mov 24(%rsp) back into %rcx
    mov $0x2000004, %eax
    mov $0x20, %rsi         #0x20 = space
    mov $2, %rdx
    syscall
    jmp L1
    L3:
    xor %rax, %rax
    xor %edi, %edi
    mov $0x2000001, %eax
    syscall

2 个答案:

答案 0 :(得分:3)

我将假设在64位OS / X上,您正在组装和链接,以便您有意绕过 C 运行时代码。一个例子是在没有 C 运行时启动文件和系统库的情况下进行静态构建,并且您指定_main是您的程序入口点。除非被覆盖,否则_start通常是进程入口点。

在这种情况下,64位内核会将macho64程序加载到内存中,并使用程序参数和环境变量以及其他内容设置进程堆栈。启动时的Apple OS / X进程堆栈状态与第3.4节中的System V x86-64 ABI中记录的相同:

Initial Process Stack

一个观察结果是参数指针列表以NULL(0)地址终止。您可以使用它来循环遍历所有参数,直到找到NULL(0)地址作为依赖argc中的值的替代方法。

问题

一个问题是您的代码假定寄存器都在SYSCALL内保留。 SYSCALL 指令本身将破坏 RCX R11 的内容:

  

SYSCALL在特权级别0调用OS系统调用处理程序。它通过从IA32_LSTAR MSR加载RIP(在将SYSCALL之后的指令的地址保存到RCX之后)来实现。 (WRMSR指令确保IA32_LSTAR MSR始终包含规范地址。)

     

SYSCALL还将RFLAGS保存到R11中,然后使用IA32_FMASK MSR(MSR地址C0000084H)屏蔽RFLAGS;具体来说,处理器清除RFLAGS中与IA32_FMASK MSR中设置的位相对应的每一位

避免这种情况的一种方法是尝试使用 RCX R11 以外的寄存器。否则,您必须通过 SYSCALL 保存/恢复它们如果您需要保持其值不受影响。内核还会使用返回值删除 RAX

Apple OS/X system calls的列表提供了所有可用内核函数的详细信息。在64位OS / X代码中,每个系统调用号都有0x2000000 added

  

在64位系统中,Mach系统调用是正数,但前缀为0x2000000 - 这清楚地将它们与POSIX调用分开并消除歧义,POSIX调用前缀为0x1000000

计算命令行参数长度的方法不起作用。一个参数的地址不一定必须放在前一个参数之后的内存中。正确的方法是编写从您感兴趣的参数开始处开始的代码,并搜索NUL(0)终止字符。

这个打印空格或分隔符的代码不会起作用:

mov 8(%rcx), %rcx       #mov 24(%rsp) back into %rcx
mov $0x2000004, %eax
mov $0x20, %rsi         #0x20 = space
mov $2, %rdx
syscall

使用sys_write系统调用时, RSI 寄存器是指向字符缓冲区的指针。你不能传递像0x20(空格)这样的立即值。您需要将空格或其他分隔符(如新行)放入缓冲区并通过 RSI 传递该缓冲区。

修订代码

此代码采用先前信息中的一些想法和额外的清理,并将每个命令行参数(不包括程序名称)写入标准输出。每个都将由换行符分隔。达尔文OS / X的换行符是0x0a\n)。

# In 64-bit OSX syscall numbers = 0x2000000+(32-bit syscall #)
SYS_EXIT  = 0x2000001
SYS_WRITE = 0x2000004

STDOUT    = 1

.section __DATA, __const
newline: .ascii "\n"
newline_end: NEWLINE_LEN = newline_end-newline

.section __TEXT, __text
.globl _main
_main:
    mov (%rsp), %r8             # 0(%rsp) = # args. This code doesn't use it
                                #    Only save it to R8 as an example.
    lea 16(%rsp), %rbx          # 8(%rsp)=pointer to prog name
                                # 16(%rsp)=pointer to 1st parameter
.argloop:
    mov (%rbx), %rsi            # Get current cmd line parameter pointer
    test %rsi, %rsi
    jz .exit                    # If it's zero we are finished

    # Compute length of current cmd line parameter
    # Starting at the address in RSI (current parameter) search until
    # we find a NUL(0) terminating character.
    # rdx = length not including terminating NUL character

    xor %edx, %edx              # RDX = character index = 0
    mov %edx, %eax              # RAX = terminating character NUL(0) to look for
.strlenloop:
         inc %rdx               # advance to next character index
         cmpb %al, -1(%rsi,%rdx)# Is character at previous char index
                                #     a NUL(0) character?
         jne .strlenloop        # If it isn't a NUL(0) char then loop again
    dec %rdx                    # We don't want strlen to include NUL(0)

    # Display the cmd line argument
    # sys_write requires:
    #    rdi = output device number
    #    rsi = pointer to string (command line argument)
    #    rdx = length
    #
    mov $STDOUT, %edi
    mov $SYS_WRITE, %eax
    syscall

    # display a new line
    mov $NEWLINE_LEN, %edx
    lea newline(%rip), %rsi     # We use RIP addressing for the
                                #     string address
    mov $SYS_WRITE, %eax
    syscall

    add $8, %rbx                # Go to next cmd line argument pointer
                                #     In 64-bit pointers are 8 bytes
    # lea 8(%rbx), %rbx         # This LEA instruction can replace the
                                #     ADD since we don't care about the flags
                                #     rbx = 8 + rbx (flags unaltered)
    jmp .argloop

.exit:
    # Exit the program
    # sys_exit requires:
    #    rdi = return value
    #
    xor %edi, %edi
    mov $SYS_EXIT, %eax
    syscall

如果您打算在各个地方使用strlen之类的代码,那么我建议您创建一个执行该操作的函数。为简单起见,我在代码中硬编码strlen。如果您希望提高strlen实施效率,那么一个好的起点就是Agner Fog&#39; Optimizing subroutines in assembly language

此代码应使用以下代码编译并链接到不带 C 运行时的静态可执行文件:

gcc -e _main progargs.s -o progargs -nostartfiles -static

答案 1 :(得分:2)

正如您已经弄清楚的那样,堆栈上的第一个参数是参数的数量,第三个参数和后面的参数是cli参数。 第二个是程序的实际名称。 您不必关心argc,因为您可以弹出堆栈直到值为零。一个简单的解决方案是:

add $0x10, %rsp
L0:
  pop %rsi
  or %rsi, %rsi
  jz L2
  mov %rsi, %rdi
  xor %rdx, %rdx
  L1:
    mov (%rsi), %al
    inc %rsi
    inc %rdx
    or %al, %al
  jnz L1
  ;%rdx - len(argument)
  ;%rdi - argument
  ;< do something with the argument >
  jmp L0
L2:

如果你想在每个参数后面有空格或换行符,只需打印它:)。

lea (newline), %rsi
mov $0x02, %rdx
mov STDOUT, %rdi
mov sys_write, %rax
[...]
newline db 13, 10, 0

我对%rax中的系统调用号有点困惑,但我猜它是OSX的东西? 正如Jester和Peter Cordes已经提到的那样,系统调用会覆盖寄存器: %rcx带有返回地址(%rip),%r11带有标志(%rflags)。 我建议您查看intel x86_64文档:http://www.intel.com/content/dam/www/public/us/en/documents/manuals/64-ia-32-architectures-software-developer-manual-325462.pdf

此代码的另一件事:

jb L2
jge L3
L2:

argc和counter是无符号的,所以这看起来好一点,我想:

jae L3

很抱歉,如果代码不起作用。我通常使用intel-syntax而且我没有测试它,但我知道你得到它:)。