Node.js是否有任何API可以从URL和静态HTML获取和查询html?
我喜欢做类似这样的事情来使用webscrap:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");
我看一下这个Question并查看了大部分API,但我没有找到(也许我无法识别)任何类似的东西。
答案 0 :(得分:3)
where timestamp_column between :ts1 and :ts2
可能就是你想要的https://github.com/tmpvar/jsdom
您可以将它与jquery结合使用来查询dom。这是一个关于我如何在我的一个项目https://github.com/gabesoft/seryth/blob/master/lib/sanitizer.js上使用它的示例
您可能还需要Jsdom
从网址https://github.com/request/request