学习和理解二进制机器

时间:2021-04-18 21:39:00

标签: binary machine-code

每个程序在一天结束时都由一个二进制系统组成。那么处理器如何理解这个复杂的代码呢?在哪里可以找到描述特定特殊情况的模式列表?

我知道我很可笑,你可能不明白。我会马上解释。

Python 代码: !!!我知道 python 代码没有翻译成机器语言。 (啊,有些人...)


a = 1

if a==1:
         a+=2

COMPARISON

PYTHON SYNTAX           MACHINE CODE                                  MEAN

a=1                     10010(a)  111(=) 1(value)                     define variable

if  a==1                101010(if) 10010(a) 111(=) 111(=) 1(value)    condition                     

a = a + 2             10010(a) 111(=) 10010(a) 101(+) 2(value)      increase the value of y by two 

以上内容100%错误。但我想你明白我想说什么。

1 个答案:

答案 0 :(得分:0)

你理解错了。

当有人告诉您人类可读的代码被翻译成机器代码时,代码并不是简单地按原样编码到处理器。它使用处理器理解和支持的指令完全重写。这就是编译为 x32 或 x64 或 ARM 的程序不同且大多不兼容的原因(因为每个程序都支持不同的操作集)。

为了说明这一点,想象一个简单的 IF 语句的执行,我不知道直接支持它的处理器(它可能存在也可能不存在)。但是所有处理器都支持条件跳转操作(例如,如果为零则跳转,如果不是零则跳转等),这类似于某些编程语言中的 GOTO 语句(每个人都说这是一种不好的做法)。

所以,当你写这样的东西时:

if a == b:
  # do something

# next statement

在机器代码中,它被翻译成这样:

0001:               # this is the address of the code, just for reference
                    # each line has an address, even when not explicit written
                    # the size of each line depends of the instruction and the
                    # number of parameters it take
  MOV regA, a       # copy the contents of A from memory to a processor register named "regA"
  MOV regB, b       # copy the contents of B from memory to a processor register named "regB"
  SUB regA, regB    # runs subtration operation, with result stored in a special register
  JNZ 0100          # jump to address 0100 if the special register is NOT zero
  JMP 0050          # jump to address 0050 (unconditionally)
0050:
  # do something
  #
  JMP 0100          # jumo to address 0100 (unconditionally)
0100:
  # next statement
  #

请注意,在示例代码中,我们比较了两个变量。但是在机器代码中,它会减去它们并测试结果是否为零。如果为零,则它们相等。如果不是,则它们不相等。我使用这个例子只是为了证明机器代码可能与我们使用编程语言编写的完全不同。

这是如何转换为 0 和 1 的?每个操作都被翻译成一个“操作码”,它是该处理器中该操作的标识。

ADD -> 0000 0001  # the opcode may be different for different processors
SUB -> 0000 0010
MOV -> 0000 0011
...

在操作码之后,我们有指令的参数。参数传递的方式可能会有所不同,但基本上每个处理器寄存器也有一个标识,变量实际上是内存地址(已经是数字)。所以机器代码中的一条指令看起来像:

 0000 0011    1010 1010    1110 1010 1111 0000
|_________|  |_________|  |___________________|
     |            |                   |
 MOV opcode    regA id        address of "a"

所以,在完成这个关于人类可读代码如何翻译成机器代码的令人难以置信的总结性解释时,请注意机器只能理解他们的语言(通常是一组非常有限的基本算术运算、跳转和操纵内存的能力)。编译器/解释器的主要挑战是将我们编写的语言(包括所有装饰品,如包、类、对象等)翻译成机器可以理解的语言,而不改变语义。