精确的Perl位置,例如B :: Deparse

时间:2015-10-28 16:42:14

标签: perl trepan

Perl中一个长期存在的问题是如何identify a location with finer granularity than a line number。 (请点击链接获取更多信息。)这个问题是关于如何实现的。

最有希望的方法是使用正在考虑的Perl操作码地址并解析周围的语句。在子例程的级别,B::Deparse将在给定代码引用的情况下重新创建Perl。理想的是修改 B :: Deparse 以允许您提供一个提供的操作来开始解压缩。如果不这样做,它可以代替解析封闭子程序,显示遇到的每个语句的操作码地址。请参阅下面的代码以获取此示例。

B::Concise可以显示子程序的操作码反汇编。在它的反汇编输出中,它给出了地址,它给出的地址与返回的地址相匹配,比如Devel::Callsite

问题是,在如下所述检测B :: Deparse之后,它给出的OP地址与 B :: Concise Devel :: Callsite 。下面给出的输出显示了这一点。

我可以规范化地址,使它们引用相对偏移而不是绝对地址。然而,这是很多工作,很糟糕,而且我甚至不能完全确定它会起作用,因为 Deparse 可能会通过“悲观化”改变代码,或者,我想,撤消优化。

具体而言,下面是一些显示不匹配的代码。请注意,反汇编中没有显示deparse给出的地址。

use B::Deparse;
use B::Concise qw(set_style);
sub foo() {
    my $x=1; $x+=1;
}

my $deparse = B::Deparse->new("-p", "-l", "-sC");

$body = $deparse->coderef2text(\&foo);
print($body, "\n");
my $walker = B::Concise::compile('-basic', 'foo', \&foo);
B::Concise::set_style_standard('debug');
B::Concise::walk_output(\my $buf);
$walker->();            # walks and renders into $buf;
print($buf);

package B::Deparse;

# Modified to show OP addresses
sub lineseq {
    my($self, $root, $cx, @ops) = @_;
    my($expr, @exprs);

    my $out_cop = $self->{'curcop'};
    my $out_seq = defined($out_cop) ? $out_cop->cop_seq : undef;
    my $limit_seq;
    if (defined $root) {
    $limit_seq = $out_seq;
    my $nseq;
    $nseq = $self->find_scope_st($root->sibling) if ${$root->sibling};
    $limit_seq = $nseq if !defined($limit_seq)
               or defined($nseq) && $nseq < $limit_seq;
    }
    $limit_seq = $self->{'limit_seq'}
    if defined($self->{'limit_seq'})
    && (!defined($limit_seq) || $self->{'limit_seq'} < $limit_seq);
    local $self->{'limit_seq'} = $limit_seq;

    my $fn = sub {
        my ($text, $i) = @_;
        my $op = $ops[$i];
        push @exprs, sprintf("# op: 0x%x\n%s ", $op, $text);
    };
    $self->walk_lineseq($root, \@ops, $fn);
    # $self->walk_lineseq($root, \@ops,
    #              sub { push @exprs, $_[0]} );

    my $sep = $cx ? '; ' : ";\n";
    my $body = join($sep, grep {length} @exprs);
    my $subs = "";
    if (defined $root && defined $limit_seq && !$self->{'in_format'}) {
    $subs = join "\n", $self->seq_subs($limit_seq);
    }
    return join($sep, grep {length} $body, $subs);
}

我从运行中获得的输出是:

() {
    # op: 0x14a4b30
#line 4 "deparse-so.pl"
    (my $x = 1) ;
    # op: 0x14a4aa0
#line 4 "deparse-so.pl"
    ($x += 1) ;
}
main::foo:
UNOP (0xeb9978)
    op_next     0
    op_sibling  0
    op_ppaddr   PL_ppaddr[OP_LEAVESUB]
    op_type     175
    op_flags    4
    op_private  65  
    op_first    0xeab7a0
LISTOP (0xeab7a0)
    op_next     0xeb9978
    op_sibling  0
    op_ppaddr   PL_ppaddr[OP_LINESEQ]
    op_type     181
    op_flags    12
    op_private  0   
    op_first    0xeab7e8
    op_last     0xeb9a20
COP (0xeab7e8)
    op_next     0xeab890
    op_sibling  0xeab848
    op_ppaddr   PL_ppaddr[OP_NEXTSTATE]
    op_type     182
    op_flags    1
    op_private  0   0
BINOP (0xeab848)
    op_next     0xeb99c0
    op_sibling  0xeb99c0
    op_ppaddr   PL_ppaddr[OP_SASSIGN]
    op_type     37
    op_flags    69
    op_private  2   
    op_first    0xeab890
    op_last     0xeab8d0
SVOP (0xeab890)
    op_next     0xeab8d0
    op_sibling  0xeab8d0
    op_ppaddr   PL_ppaddr[OP_CONST]
    op_type     5
    op_flags    2
    op_private  0   
    op_sv       0xea3c40
OP (0xeab8d0)
    op_next     0xeab848
    op_sibling  0
    op_ppaddr   PL_ppaddr[OP_PADSV]
    op_type     9
    op_flags    178
    op_private  128 
COP (0xeb99c0)
    op_next     0xeab768
    op_sibling  0xeb9a20
    op_ppaddr   PL_ppaddr[OP_NEXTSTATE]
    op_type     182
    op_flags    1
    op_private  0   0
BINOP (0xeb9a20)
    op_next     0xeb9978
    op_sibling  0
    op_ppaddr   PL_ppaddr[OP_ADD]
    op_type     63
    op_flags    70
    op_private  2   
    op_first    0xeab768
    op_last     0xeb9a68
OP (0xeab768)
    op_next     0xeb9a68
    op_sibling  0xeb9a68
    op_ppaddr   PL_ppaddr[OP_PADSV]
    op_type     9
    op_flags    50
    op_private  0   
SVOP (0xeb9a68)
    op_next     0xeb9a20
    op_sibling  0
    op_ppaddr   PL_ppaddr[OP_CONST]
    op_type     5
    op_flags    2
    op_private  0   
    op_sv       0xea3c10
B::Concise::compile(CODE(0xea3c70))
UNOP (0xeb9978)
    op_next     0
    op_sibling  0
    op_ppaddr   PL_ppaddr[OP_LEAVESUB]
    op_type     175
    op_flags    4
    op_private  65  
    op_first    0xeab7a0
LISTOP (0xeab7a0)
    op_next     0xeb9978
    op_sibling  0
    op_ppaddr   PL_ppaddr[OP_LINESEQ]
    op_type     181
    op_flags    12
    op_private  0   
    op_first    0xeab7e8
    op_last     0xeb9a20
COP (0xeab7e8)
    op_next     0xeab890
    op_sibling  0xeab848
    op_ppaddr   PL_ppaddr[OP_NEXTSTATE]
    op_type     182
    op_flags    1
    op_private  0   0
BINOP (0xeab848)
    op_next     0xeb99c0
    op_sibling  0xeb99c0
    op_ppaddr   PL_ppaddr[OP_SASSIGN]
    op_type     37
    op_flags    69
    op_private  2   
    op_first    0xeab890
    op_last     0xeab8d0
SVOP (0xeab890)
    op_next     0xeab8d0
    op_sibling  0xeab8d0
    op_ppaddr   PL_ppaddr[OP_CONST]
    op_type     5
    op_flags    2
    op_private  0   
    op_sv       0xea3c40
OP (0xeab8d0)
    op_next     0xeab848
    op_sibling  0
    op_ppaddr   PL_ppaddr[OP_PADSV]
    op_type     9
    op_flags    178
    op_private  128 
COP (0xeb99c0)
    op_next     0xeab768
    op_sibling  0xeb9a20
    op_ppaddr   PL_ppaddr[OP_NEXTSTATE]
    op_type     182
    op_flags    1
    op_private  0   0
BINOP (0xeb9a20)
    op_next     0xeb9978
    op_sibling  0
    op_ppaddr   PL_ppaddr[OP_ADD]
    op_type     63
    op_flags    70
    op_private  2   
    op_first    0xeab768
    op_last     0xeb9a68
OP (0xeab768)
    op_next     0xeb9a68
    op_sibling  0xeb9a68
    op_ppaddr   PL_ppaddr[OP_PADSV]
    op_type     9
    op_flags    50
    op_private  0   
SVOP (0xeb9a68)
    op_next     0xeb9a20
    op_sibling  0
    op_ppaddr   PL_ppaddr[OP_CONST]
    op_type     5
    op_flags    2
    op_private  0   
    op_sv       0xea3c10

最后,作为鼓励人们在这里提供帮助的方法,如果解决了这个问题,解决方案可能会出现在Perl调试器Devel::Trepan中,并且可以让您在调试器中停止时可靠地确切知道自己的位置。 / p>

注意:编辑以使问题更清晰。

2 个答案:

答案 0 :(得分:2)

svref_2object返回一个对象,该对象允许您从传递给svref_2object的参数引用的结构中提取信息。

您正在打印该对象的地址(标记为B::CV类的标量)。

use B qw( );

sub foo { }

my $cv = B::svref_2object(\&foo);

printf "%x\n", \&foo;                 # Numification of 1st ref to &foo.
printf "%x\n", \&foo;                 # Numification of 2nd ref to &foo.
printf "%x\n", $cv;                   # Numification of ref to B::CV object.
printf "%x\n", $cv->object_2svref();  # Numification of 3rd ref to &foo.
printf "%x\n", $$cv;  # Address of struct referenced by svref_2object's arg (Undocumented)

引用数字代表它们引用的地址,因此我们得到:

3c5eaf8
3c5eaf8
3c5e1b0
3c5eaf8
3c5eaf8

答案 1 :(得分:1)

嵌入评论中的池上的答案建议让我找到了我在第一个提出的解决方案中所做的概念缺陷:在 B :: Deparse 里面,一个词汇数组变量存储了OP和那些是实际代码OP结构的隐式指针。使用未记录的$$来获取标量隐式指向的基础地址,以提供正确的地址。所以在我的猴子修补的 B :: Deparse :: lineseq 代码中,改变了:

push @exprs, sprintf("# op: 0x%x\n%s ", $op, $text);

为:

push @exprs, sprintf("# op: 0x%x\n%s ", $$op, $text);
                                        ^^

给了我一个我可以用来匹配结果的地址。

尽管如此,还有一些工作要做到这一点,所以如果还有其他方法或建议,我很乐意听到它们。

Devel::Trepan版本0.70现在可以在上面代码的deparse命令中进行适当修改,以便能够显示将要运行多个语句中的哪一个。