Jsoup喜欢Node.js的库

时间:2016-03-24 15:34:47

标签: javascript node.js web-crawler jsoup

Node.js是否有任何API可以从URL和静态HTML获取和查询html?

我喜欢做类似这样的事情来使用webscrap:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

我看一下这个Question并查看了大部分API,但我没有找到(也许我无法识别)任何类似的东西。

1 个答案:

答案 0 :(得分:3)

where timestamp_column between :ts1 and :ts2可能就是你想要的https://github.com/tmpvar/jsdom 您可以将它与jquery结合使用来查询dom。这是一个关于我如何在我的一个项目https://github.com/gabesoft/seryth/blob/master/lib/sanitizer.js上使用它的示例 您可能还需要Jsdom从网址https://github.com/request/request

获取html