Java break / label语句可以在字节码混淆中充当“goto”吗?

时间:2013-01-24 07:38:35

标签: java bytecode

我试图在反编译后对一些Java .class文件进行反混淆处理,而且我遇到了代码的一部分,它以一种我认为不能使用标签的方式使用标签。我不知道这是否是反编译器误解标签的错误,或者代码是否故意以这种方式混淆。换句话说,可以在Java字节码中以这种方式使用标签吗?

请注意,标签出现在相关的break语句之后,而不是之前。它几乎似乎是使用它们作为goto,而不是用于走出循环的标签。根本没有循环,所以我对它们应该如何在这里使用感到困惑。

这里发生了什么?我在评论中标记了3个标签(###)

if (i != 96)
  {
    if ((i ^ 0xFFFFFFFF) != -98)
    {
      if (i == 98)
        break label417;  // ### Here are the three breaks... The relevant labels appear later in the code
      if (i != 99)
        break label540;
      if (!bool)
        break label461;
    }
  }
  else
  {
    if (localwb == this.localWB5)
    {
      if (this.localWB4 != null) {
          this.localWB4.a((byte)-92, this);
        if (!bool);
      }
      else
      {
          this.localWB6.a((byte)-9, this);
      }
      return true;
    }
    if (localwb == this.localWB4)
    {
        this.localWB6.a((byte)-59, this);
      return true;
    }
    if (this.localWB3 != localwb)
      break label540;
      this.localWB2.a((byte)-38, this);
    return true;
  }
  if (this.localWB6 == localwb)
  {
    if (this.localWB4 != null) {
        this.localWB4.a((byte)-122, this);
      if (!bool);
    }
    else {
        this.localWB5.a((byte)-63, this);
    }
    return true;
  }
  if (this.localWB4 == localwb)
  {
    this.localWB5.a((byte)-22, this);
    return true;
  }
  if ((this.localWB2 == localwb) && (this.localWB3.M))
  {
    this.localWB3.a((byte)-84, this);
    return true;
    label417:  //  ### The first label.  Note how this next if-statement has inaccessible code... if the above if-statement is true, it would have already returned true;  However, the label appears after the return statement, almost as if the label is being used as a goto.
    if (localwb == this.localWB2)
    {
        this.localWB6.a((byte)-86, this);
      return true;
    }
    if (this.localWB3 == localwb)
    {
      this.localWB5.a((byte)-31, this);
      return true;
      label461:  //  ###  The second label
      if ((this.localWB6 == localwb) || (this.localWB4 == localwb))
      {
          this.localWB2.a((byte)-60, this);
        return true;
      }
      if (localwb == this.localWB5)
      {
        if (this.localWB3.M)
        {
          this.localWB3.a((byte)-44, this);
          if (!bool);
        }
        else {
            this.localWB2.a((byte)-9, this);
        }
        return true;
      }
    }
  }
  label540:  //  ###  The final label.

4 个答案:

答案 0 :(得分:5)

goto bytecode instruction(是的,它实际上称为“goto”)用于实现break和其他构造。

goto本身的规范将目标限制在与goto指令相同的方法内。

4.10. Verification of class Files中定义了许多其他约束,特别是Checking Code中的约束,它描述了如何验证方法的实际字节码

怀疑你不能用goto产生对局部变量和操作数堆栈的不一致解释,例如要求目标指令与源指令兼容,但是我的实际规范是用Prolog编写的,如果有人得到相关的信息,我会感激不尽。

答案 1 :(得分:2)

break <label>可用于退出代码块,如下所示:

public static boolean is_answer(int arg) {
    boolean ret = false;
    label: {
        if (arg != 42)
            break label;
        ret = true;
    }
    return ret;
}

但是,由于以下JLS要求,您显示的反编译代码不是有效的Java:

  

break语句将控件从封闭语句中转移出来

答案 2 :(得分:2)

问题源于Java和字节码之间的不匹配。 Java强加了许多字节码级别不存在的限制。如果您正在做的只是反编译正常编译的Java类文件,这将不是问题。但是,混淆器通常会将方法的控制流重新排列为不再与有效Java对应的等效版本。如你所见,一个天真的反编译器会混淆并发出无效的Java。

如果您对反编译混淆的类文件感兴趣,可以尝试我写的开源Krakatau Decompiler。尝试将混淆的字节码转换回有效的Java会更加智能,因此它通常可以反编译其他反编译器无法实现的类。但是,即使它有效,结果代码也可能不会很好,反编译器可能仍会失败。

答案 3 :(得分:0)

每当我对Java语言及其编写方式有疑问时,我都会参考方便的Java语言规范,这是非常详尽的文档。

来自14.15. The break statement

  

break语句必须引用直接封闭的方法,构造函数或初始化程序中的标签。没有非本地跳跃。如果在立即封闭的方法,构造函数或初始化程序中没有带标识符的标签语句作为其标签包含break语句,则会发生编译时错误。

我没有看到任何说明标签的标签;必须在休息之前或“围观”。