我有一个包含以下内容的文本文件,并希望使用perl在数组或其他数据结构中提取嵌套函数(包括rootfunc)。
输入文件内容:
rootfunc aaa with string1 {
blah blah
subfunc bbb (different parameters) {
blah blah
}
subfunc others_in_aaa (different parameters) {
blah blah
}
}
rootfunc ccc with string2 {
blah blah
if (blah) {
blah blah
} else {
blah blah
}
subfunc others_in_ccc (different parameters) {
blah blah
}
}
rootfunc others with stringothers {
blah blah
subfunc others_in_others (different parameters) {
blah blah
}
}
我想用输出提取所有的rootfunc和subfunc,如下所示:
预期输出文件(不是,if / else也被删除):
rootfunc aaa with string1 {
subfunc bbb (different parameters) {
}
subfunc others_in_aaa (different parameters) {
}
}
rootfunc ccc with string2 {
subfunc others_in_ccc (different parameters) {
}
}
rootfunc others with stringothers {
subfunc others_in_others (different parameters) {
}
}
使用perl脚本如下所示,我只能提取rootfunc括号中的内容,然后获取subfunc中的内容,但rootfunc名称/参数和子函数名称/参数将丢失:
PERL SCRIPT:
use Text::Balanced qw(extract_multiple extract_bracketed);
open(FILE, "/tmp/a") || die "Unable to open /tmp/a: $!\n";
{
local $/=undef;
my $file = <FILE>;
}
close(FILE);
my @array = extract_multiple($file, [sub{extract_bracketed($_[0], '{}')},], undef, 1);
有什么方法可以获得所需的输出吗?谢谢,
答案 0 :(得分:2)
假设subfunc
是关键字,您可以使用正则表达式。我将它分成两个// //,但它可以合并。
sub squeeze {
my( $s ) = @_;
$s =~ s/(?<=\{\n)[^(){}]*?(?= *subfunc)//sg;
$s =~ s/(?<=\{)[^(){}]*?(?=\})//sg;
return $s;
}
如果有嵌套大括号,则Text :: Balanced可以与正则表达式结合使用:
sub squeeze {
my( $s ) = @_;
my $out = '';
while( $s =~ s/^(\s*rootfunc[^{]*\{).*?(?=\s*subfunc)//s ){
$out .= $1 ;
while( $s =~ s/^(\s*subfunc[^)]+\)\s*).*?(?=\{)//s ){
$out .= $1;
my( $ext, $rem ) = extract_bracketed( $s, '{' );
$out .= "{}";
$s = $rem;
}
$out .= "}";
if( $s =~ s/^(\s+\})//s ){
$s .= $1;
}
}
return $out;
}