我正在尝试创建一个简单的Web scraper,它可以执行以下操作:
我认为Node.js / jQuery最容易实现这样的功能。 任何人都可以指点我一个教程或者快点把东西放在一起吗?
答案 0 :(得分:4)
昨天刚刚阅读了有关scraping with NodeJS and Chimera的关于黑客新闻的文章。同一位作者在Enhanced web scraping with NodeJS上写了一篇早期文章。
Chimera看起来很酷,因为它使用无头网络浏览器(QtWebkit),所以你可以让页面加载他们用JS加载的任何内容,这是我在工作中构建的刮刀所需要的。