如果我有以下字符串:
< asd="testJava"><a href="/title/text/">BLA BLA <asddead>
如何才能获得BLA BLA字符串。
我尝试拆分,但它删除了我所有的字符,我只需删除那些来自&#34;&gt;&#34;到&#34;&lt;&#34;。
收到字符串后,我会将ArrayList
添加到array.add();
有人可以帮助我删除字符串的代码吗?
谢谢!
答案 0 :(得分:2)
使用正则表达式替换<
和>
之间的所有内容:
String newText = oldText.replaceAll("<[^>]*>", "").trim();
另外2个笔记:
这不适用于<a href="foo>com">BLA BLA</a>
之类的内容,因为正则表达式会匹配>
中的foo>com
而不是正确的.trim()
。在这种情况下,我会推荐一个合适的HTML / XML解析器。
添加<img> <br> BLA BLA
以删除文本之前/之后的任何空格。没有它,'BLA BLA'
将无法解析为' BLA BLA'
,但{{1}}
答案 1 :(得分:1)
忽略将此解决方案扩展到完整HTML解析器的含义... 你可以将replaceAll与正则表达式一起使用。
str = str.replaceAll("<[^>]*>","");
应该替换所有的html,只留下你的BLABLA标签