使用HTTPClient获取部分数据

时间:2014-02-18 04:28:21

标签: java html http httpclient

我正在使用HTTPClient连接到网站。

byte[] responseBody = method.getResponseBody();
System.out.println(new String(responseBody));

我现在只希望检索html的一部分。即我想要在标签<td><font size=\"2\">之后和</font>

之前显示的文字

如何针对上述问题使用拆分功能?

我用过

String[] substr = new String(responseBody).split("<td><font size=\"2\">");

但它给出了地址。

我想要显示文字。

我该如何解决这个问题?

1 个答案:

答案 0 :(得分:0)

对于一个简单的案例,您可以使用正则表达式匹配并删除所有会留下数据的标记。

\<[^\>]*\>