我试图找出LLVM如何实现RVO。对我来说最简单的想法是在参数和memcpy中指向需要从函数返回的任何值。然后运行memcpyopt
传递并尽可能以这种方式获取RVO。
似乎发生了什么,使用-fno-elide-constructors:
define void @_Z3fooic(%struct.X* noalias sret, i32, i8 signext) #0 {
..
call void @llvm.memcpy.p0i8.p0i8.i64(i8* %12, i8* %13, i64 20, i32 4, i1 false)
ret void
并且没有它似乎所有操作都直接应用于%0
。
这是正确的理解还是我错过了一些警告?
修改
define i8 @make_positive_point_x_I64_y_I64(i64 %x, i64 %y, %Point*) {
entry:
%1 = or i64 %x, %y
%2 = icmp slt i64 %1, 0
br i1 %2, label %exit, label %merge
merge: ; preds = %entry
%3 = alloca %Point, align 8
call void @"Point___new_self_&Point_x_I64_y_I64"(%Point* nonnull %3, i64 %x, i64 %y)
%4 = bitcast %Point* %0 to i8*
%5 = bitcast %Point* %3 to i8*
call void @llvm.memcpy.p0i8.p0i8.i64(i8* %4, i8* %5, i64 zext (%Point* inttoptr (i64 16 to %Point*) to i64), i32 1, i1 false)
br label %exit
exit: ; preds = %entry, %merge
%.0 = phi i8 [ 0, %merge ], [ 1, %entry ]
ret i8 %.0
}
似乎memcpyopt
还不够,因为它无法识别它可以使用%0
代替%3
。