Crawlspider SgmlLinkExtractor允许参数

时间:2013-01-06 02:35:08

标签: regex scrapy

SgmlLinkExtractor方法中的allow参数是否接受正确的正则表达式字符串?

我正在尝试在地址中跟随带有“/ insertsomephrase /”的html链接,然后在“/ insertsomeotherphrase /”的链接之后进行解析。如何在正则表达式中执行此操作?

我很困惑正则表达式如何执行此操作,因为似乎正则表达式代码作用于字符串而不是html元素。

感谢您的帮助。

0 个答案:

没有答案