我目前正在尝试让我的自定义编译器允许使用try/catch
作为表达式,即在堆栈上留下一个值。类型检查器和后端已经支持这个,但问题似乎是ASM的COMPUTE_FRAMES
。使用以下代码进行检测:
private void write(MethodWriter writer, boolean expression)
{
org.objectweb.asm.Label tryStart = new org.objectweb.asm.Label();
org.objectweb.asm.Label tryEnd = new org.objectweb.asm.Label();
org.objectweb.asm.Label endLabel = new org.objectweb.asm.Label();
boolean hasFinally = this.finallyBlock != null;
writer.writeLabel(tryStart);
if (this.action != null)
{
if (expression && !hasFinally)
{
this.action.writeExpression(writer);
}
else
{
this.action.writeStatement(writer);
}
writer.writeJumpInsn(Opcodes.GOTO, endLabel);
}
writer.writeLabel(tryEnd);
for (int i = 0; i < this.catchBlockCount; i++)
{
CatchBlock block = this.catchBlocks[i];
org.objectweb.asm.Label handlerLabel = new org.objectweb.asm.Label();
// Check if the block's variable is actually used
if (block.variable != null)
{
// If yes register a new local variable for the exception and
// store it.
int localCount = writer.registerLocal();
writer.writeLabel(handlerLabel);
writer.writeVarInsn(Opcodes.ASTORE, localCount);
block.variable.index = localCount;
if (expression && !hasFinally)
{
block.action.writeExpression(writer);
}
else
{
block.action.writeStatement(writer);
}
writer.resetLocals(localCount);
}
// Otherwise pop the exception from the stack
else
{
writer.writeLabel(handlerLabel);
writer.writeInsn(Opcodes.POP);
if (expression && !hasFinally)
{
block.action.writeExpression(writer);
}
else
{
block.action.writeStatement(writer);
}
}
writer.writeTryCatchBlock(tryStart, tryEnd, handlerLabel, block.type.getInternalName());
writer.writeJumpInsn(Opcodes.GOTO, endLabel);
}
if (hasFinally)
{
org.objectweb.asm.Label finallyLabel = new org.objectweb.asm.Label();
writer.writeLabel(finallyLabel);
writer.writeInsn(Opcodes.POP);
writer.writeLabel(endLabel);
if (expression)
{
this.finallyBlock.writeExpression(writer);
}
else
{
this.finallyBlock.writeStatement(writer);
}
writer.writeFinallyBlock(tryStart, tryEnd, finallyLabel);
}
else
{
writer.writeLabel(endLabel);
}
}
编译此代码:
System.out.println(try Integer.parseInt("10") catch (Throwable t) 10)
我在课程加载时得到以下VerifyError
:
java.lang.VerifyError: Inconsistent stackmap frames at branch target 17
Exception Details:
Location:
dyvil/test/Main.main([Ljava/lang/String;)V @14: goto
Reason:
Current frame's stack size doesn't match stackmap.
Current Frame:
bci: @14
flags: { }
locals: { '[Ljava/lang/String;' }
stack: { integer }
Stackmap Frame:
bci: @17
flags: { }
locals: { '[Ljava/lang/String;' }
stack: { top, integer }
Bytecode:
0000000: b200 1412 16b8 001c a700 0957 100a a700
0000010: 03b6 0024 b1
Exception Handler Table:
bci [3, 11] => handler: 11
Stackmap Table:
same_locals_1_stack_item_frame(@11,Object[#30])
full_frame(@17,{Object[#38]},{Top,Integer})
由于我认为ASM在计算具有输出值的try/catch
块的堆栈帧时没有问题,我的检测代码是否有问题? (请注意,ClassWriter.getCommonSuperclass
虽然在此不需要,但却已正确实施。)
答案 0 :(得分:3)
显然,ASM只能为正确的代码计算堆栈图帧,因为没有堆栈映射可以修复损坏的代码。我们可以在分析异常时了解出了什么问题。
java.lang.VerifyError: Inconsistent stackmap frames at branch target 17
有一个分支定位字节代码位置17
。
Exception Details:
Location:
dyvil/test/Main.main([Ljava/lang/String;)V @14: goto
分支的来源是位置goto
14
指令
Reason:
Current frame's stack size doesn't match stackmap.
非常自我解释。您唯一需要考虑的是非匹配帧并不一定表示错误的堆栈图计算;可能是字节码本身违反了约束,计算出的堆栈图只反映了这一点。
Current Frame:
bci: @14
flags: { }
locals: { '[Ljava/lang/String;' }
stack: { integer }
在14
,分支的来源(goto
指令的位置),堆栈包含一个int
值。
Stackmap Frame:
bci: @17
flags: { }
locals: { '[Ljava/lang/String;' }
stack: { top, integer }
在17
,分支的目标,是堆栈上的两个值。
Bytecode:
0000000: b200 1412 16b8 001c a700 0957 100a a700
0000010: 03b6 0024 b1
好吧,这里没有对字节码进行反汇编,但是你不能说异常消息在这一点上过于简单。手动反汇编字节码会产生:
0: getstatic 0x0014
3: ldc 0x16
5: invokestatic 0x001c
8: goto +9 (=>17)
11: pop
12: bipush #10
14: goto +3 (=>17)
17: invokevirtual 0x0024
20: return
Exception Handler Table:
bci [3, 11] => handler: 11
我们在这里看到的是有两种方法可以到达位置17
,一种是getstatic, ldc, invokestatic
的普通执行,另一种是异常处理程序,从11
开始,执行pop
bipush
。我们可以推断出后者在堆栈上确实有一个int
值,因为它弹出异常并推动一个int
常量。
对于前者,这里没有足够的信息,即我不知道被调用方法的签名,但是,因为验证者没有拒绝从goto
到8
的{{1}} {1}},可以安全地假设堆栈确实在分支之前保存了两个值。由于17
生成两个值,因此getstatic, ldc
方法必须具有static
或void ()
签名。这意味着在分支之前不使用第一个value (value)
指令的值。
→阅读完评论后,错误变得明显:第一个getstatic
指令读取getstatic
,您希望在方法结束时使用System.out
来调用println
,但是,发生异常时,堆栈被刷新,堆栈中没有PrintWriter
,但异常处理程序尝试恢复并加入代码路径,在PrintWriter
调用println
所需的位置。重要的是要理解异常处理程序总是以一个由单个元素组成的操作数堆栈开始,即异常。在发生异常之前您可能已经推送的值都不会持续存在。因此,如果您想在受保护的代码之前预取字段值(如System.out
)并使用它,无论是否发生异常,您都必须将其存储在本地变量中并在之后检索。
似乎ASM从第一个分支之前的状态派生了位置@17
的堆栈映射帧,并且当它与第二个分支之前的状态帧连接时,它只关注类型而不是不同的深度,这是一个遗憾,因为这是一个容易发现的错误。但它只是一个缺失的功能(因为COMPUTE_FRAMES
未指定进行错误检查),而不是错误。