我想知道HTML链接解析器预处理器的工作原理,它如何检索所有链接以及HTML响应中存在的所有其他元素。至于我在每个博客上都检查过,它会写出。*将提取所有链接但是如果我不想要链接那么其他元素怎么办?我想测试其他元素,比如我想要获取图像源或我想玩下拉或单选按钮作为回应。我该如何提取这些? 是否会有任何其他正则表达式或相同的。*?
答案 0 :(得分:0)
此修饰符解析来自服务器的HTML响应并提取链接和表单
因此HTML链接解析器有两个主要用例:
在这两种情况下,您都需要提供Perl-5 Compatible Regular Expression以限制抓取到当前域或缩小选项选项。
如果您需要获取图像源,最佳选择是使用CSS/JQuery Extractor配置如下:
img
src