我有一个持续运行的爬网(使用Perl LWP),我使用HTML :: TreeBuilder在抓取的网页上进行提取。我刻苦地删除了我创建的HTML :: TreeBuilder的每个实例,但是爬虫的内存占用缓慢而稳定地上升(我正在观察每个被抓取的页面都会增加10到30个字节(我正在使用Valgrind)测量堆使用情况。)
现在流程如下:
有没有人有关于LWP或TreeBuilder中是否存在内存泄漏的提示?我已经阅读了一些关于LWP内存泄漏的报告,但我没有看到对此事的回应。
我正在运行Perl v5.10.1
谢谢!
答案 0 :(得分:0)
我认为HTML :: TreeBuilder存在问题。
您可以查看以下链接:
1)Stackoverflow memory leak in HTML::TreeBuilder
2)Perlmonks Memory Leak? i'm clueless.
我希望这些链接可以帮到你。