只删除字符串的一部分

时间:2014-06-03 19:22:26

标签: java string split

如果我有以下字符串:

< asd="testJava"><a href="/title/text/">BLA BLA <asddead>

如何才能获得BLA BLA字符串。

我尝试拆分,但它删除了我所有的字符,我只需删除那些来自&#34;&gt;&#34;到&#34;&lt;&#34;。 收到字符串后,我会将ArrayList添加到array.add(); 有人可以帮助我删除字符串的代码吗? 谢谢!

2 个答案:

答案 0 :(得分:2)

使用正则表达式替换<>之间的所有内容:

String newText = oldText.replaceAll("<[^>]*>", "").trim();

另外2个笔记:

  1. 这不适用于<a href="foo>com">BLA BLA</a>之类的内容,因为正则表达式会匹配>中的foo>com而不是正确的.trim()。在这种情况下,我会推荐一个合适的HTML / XML解析器。

  2. 添加<img> <br> BLA BLA以删除文本之前/之后的任何空格。没有它,'BLA BLA'将无法解析为' BLA BLA',但{{1}}

答案 1 :(得分:1)

忽略将此解决方案扩展到完整HTML解析器的含义... 你可以将replaceAll与正则表达式一起使用。

str = str.replaceAll("<[^>]*>","");

应该替换所有的html,只留下你的BLABLA标签