阅读网站内容Java

时间:2012-06-17 15:14:32

标签: java android html

我正在开发一个Android应用程序,在网站中我以编程方式将数据提交到搜索框并通过Java检索结果。

我使用URLConnect Java获取数据。我得到源代码即html代码......

Urlconnection a = .connect to host

getinputstream

read data

我使用这些功能 现在,如果该网站的内容如下:

sahil
3/5 patel chowk
965955

因为这些细节将在html标签内,我想提取这些信息。任何想法?

3 个答案:

答案 0 :(得分:2)

您是否看过JSoup:http://jsoup.org/它的HTML解析器可以满足您的需求。

答案 1 :(得分:0)

我的猜测在这种情况下使用正则表达式将非常适合您:How to use regular expressions to parse HTML in Java?

答案 2 :(得分:0)

使用JTiddy很容易使用java库从html页面中提取内容。