从html源提取信息?

时间:2012-05-15 22:13:20

标签: java android regex web-scraping

如何使用网站中包含的特定信息? 现在,我得到了整个网站的InputStream。然后,尝试使用RegEx提取有用信息。

现在我被告知RegEx从HTML中提取真的很糟糕。 Android有什么其他的东西?

如何使用和提取网站的特定部分?

2 个答案:

答案 0 :(得分:0)

我建议您使用JSoup library

答案 1 :(得分:0)

您有很多情况需要从XML解析和提取元素:

还有一个很好的简单库jsoup