我只有帖子的网址,例如http://www.avc.com/a_vc/2011/08/html5-continued.html,有什么办法可以获得这篇文章的内容吗?我的意思是,排除菜单,徽标和广告。非常感谢!
答案 0 :(得分:4)
如果你想要抓住网站,首先要考虑这是否合法。
然后,您可以通过相应元素获取innerHTML
(或使用jQuery - .html()
)。在您的情况下,这是disqus_post_message
正如@bensiu所说,使用RSS提要会更容易。
由于您标记了Java,因此以下是可用的库: