我正在使用HTTPClient
连接到网站。
byte[] responseBody = method.getResponseBody();
System.out.println(new String(responseBody));
我现在只希望检索html的一部分。即我想要在标签<td><font size=\"2\">
之后和</font>
如何针对上述问题使用拆分功能?
我用过
String[] substr = new String(responseBody).split("<td><font size=\"2\">");
但它给出了地址。
我想要显示文字。
我该如何解决这个问题?
答案 0 :(得分:0)
对于一个简单的案例,您可以使用正则表达式匹配并删除所有会留下数据的标记。
\<[^\>]*\>