perl获取嵌套函数和参数(text :: balanced或plain perl)

时间:2016-03-25 16:35:19

标签: regex perl perl-module

我有一个包含以下内容的文本文件,并希望使用perl在数组或其他数据结构中提取嵌套函数(包括rootfunc)。

输入文件内容:

rootfunc aaa with string1 {
    blah blah
    subfunc bbb (different parameters) {
        blah blah
    }
    subfunc others_in_aaa (different parameters) {
        blah blah
    }
}

rootfunc ccc with string2 {
    blah blah
    if (blah) {
        blah blah
    } else {
        blah blah
    }
    subfunc others_in_ccc (different parameters) {
        blah blah
    }
}

rootfunc others with stringothers {
    blah blah
    subfunc others_in_others (different parameters) {
        blah blah
    }
}

我想用输出提取所有的rootfunc和subfunc,如下所示:

预期输出文件(不是,if / else也被删除):

rootfunc aaa with string1 {
    subfunc bbb (different parameters) {
    }
    subfunc others_in_aaa (different parameters) {
    }
}

rootfunc ccc with string2 {
    subfunc others_in_ccc (different parameters) {
    }
}

rootfunc others with stringothers {
    subfunc others_in_others (different parameters) {
    }
}

使用perl脚本如下所示,我只能提取rootfunc括号中的内容,然后获取subfunc中的内容,但rootfunc名称/参数和子函数名称/参数将丢失:

PERL SCRIPT:

use Text::Balanced qw(extract_multiple extract_bracketed);

open(FILE, "/tmp/a") || die "Unable to open /tmp/a: $!\n";
{
    local $/=undef;
    my $file = <FILE>;
}
close(FILE);
my @array = extract_multiple($file, [sub{extract_bracketed($_[0], '{}')},], undef, 1);

有什么方法可以获得所需的输出吗?谢谢,

1 个答案:

答案 0 :(得分:2)

假设subfunc是关键字,您可以使用正则表达式。我将它分成两个// //,但它可以合并。

sub squeeze {
    my( $s ) = @_;
    $s =~ s/(?<=\{\n)[^(){}]*?(?= *subfunc)//sg;
    $s =~ s/(?<=\{)[^(){}]*?(?=\})//sg;
    return $s;
}

如果有嵌套大括号,则Text :: Balanced可以与正则表达式结合使用:

sub squeeze {
    my( $s ) = @_;
    my $out = '';
    while( $s =~ s/^(\s*rootfunc[^{]*\{).*?(?=\s*subfunc)//s ){
        $out .= $1 ;
        while( $s =~ s/^(\s*subfunc[^)]+\)\s*).*?(?=\{)//s ){
            $out .= $1;
            my( $ext, $rem ) = extract_bracketed( $s, '{' );
            $out .= "{}";
            $s = $rem;
        }
        $out .= "}";
        if( $s =~ s/^(\s+\})//s ){
            $s .= $1;
        }
    } 
    return $out;
}