使用XML :: TWIG进行大型xml文件解析失败

时间:2012-01-31 05:24:29

标签: perl xml-twig

我正在尝试使用XML :: Twig解析一个大的xml文件(大约100,000条记录),但perl解析失败并出现错误:

perl.exe - Application Error: 
The instruction at "0x28086920" referenced memory at "0x00000004". The memory could not be "written"...

我读到XML::Twig解析大型xml文件没有任何问题,但在我的情况下,它失败并出现上述错误。

我的.pl文件有一个forloop代码,可以旋转100,000次,如下所示:

foreach my $d1(@detailData)   {
    if ($d1->first_child('a')->getElementsByTagName('b')) {
        $id= $d1->first_child('a')->first_child('x')->field('b');
    }
    ....
    .....
    ......

}

在forloop里面我有大约20个if循环,如上所述。是否会导致内存问题?

有谁能建议我如何克服这些记忆问题?

1 个答案:

答案 0 :(得分:6)

在谷歌搜索perl "The memory could not be written"之后,我猜想问题来自于在内存中一次加载文件,例如参见http://www.perlmonks.org/?node_id=457265或(不太可能)混合使用不同编译器编译的模块(例如,使用带有Cygwin perl的Activestate包,请参阅http://cygwin.com/ml/cygwin/2006-12/msg00798.html)。

对于XML :: Twig来处理大文件,你需要告诉它在哪个级别处理文件的部分(通常通过定义处理子树的处理程序,然后丢弃它),参见文档模块。