应用错误收集

PHPCRAWL - 如何为特定的链接名称添加过滤器？

时间：2017-06-05 19:32:34

标签： php phpcrawl

我在其中一个项目中使用网络抓取工具http://phpcrawl.cuab.de并且到目前为止工作正常，但我不知道如何排除或跳过具体的链接名。

我已经使用了一些规则来忽略特定的文件类型

$crawler->addURLFilterRule("#\.(jpg|jpeg|gif|png|css|js|pdf|swf|ico)$# i");

请参阅http://phpcrawl.cuab.de/classreferences/PHPCrawler/overview.html

但是如何为链接中的名称添加过滤器？

即。忽略包含％feed％或％imprint％等的链接。

0 个答案:

没有答案