实现指向并单击Web数据提取器

时间:2012-12-18 06:21:24

标签: html css web-scraping web-crawler jsoup

我使用jsoup构建了一个Web爬虫。在当前版本中,用户必须使用Firefinder进入CSS选择器。

我想简化这一点,以便不了解CSS的用户也可以使用我的工具。我找到了这个工具http://www.mozenda.com,看到他们有一个点击界面,用于选择网页中的特定元素。

如何实现这样的界面?或者还有其他任何方法可以让用户简单地为我的引擎提供输入吗?

1 个答案:

答案 0 :(得分:1)

我写了Greasemonkey script来执行此操作并点击。

您可以查看源代码,了解它是如何完成的(捕获文档mouseup事件,然后使用window.getSelection获取元素)