如何从博客中获取帖子的内容?

时间:2011-08-11 21:01:30

标签: java javascript html rss

我只有帖子的网址,例如http://www.avc.com/a_vc/2011/08/html5-continued.html,有什么办法可以获得这篇文章的内容吗?我的意思是,排除菜单,徽标和广告。非常感谢!

1 个答案:

答案 0 :(得分:4)

如果你想要抓住网站,首先要考虑这是否合法。

然后,您可以通过相应元素获取innerHTML(或使用jQuery - .html())。在您的情况下,这是disqus_post_message

正如@bensiu所说,使用RSS提要会更容易。

由于您标记了Java,因此以下是可用的库: