我有一个像这样的java字符串:
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed
scelerisque enim a ornare auctor. Duis quam nisi, mattis vel leo eu,
luctus porta <img src="http://www.test.com" ...
我想在上一个字符串中只保留此文字:(不含<img ...
)
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed
scelerisque enim a ornare auctor. Duis quam nisi, mattis vel leo eu,
luctus porta
你能帮我用Java做这件事吗?
答案 0 :(得分:5)
假设你给出了唯一的字符串,最后也是<img
。
String[] strArray = string.split("<img");
String result= strArray [0];
答案 1 :(得分:2)
您只需使用.subString()
和.indexOf()
:
result = string.subString(0, string.indexOf("<img"));
虽然您需要首先检查索引是否为-1 ...
答案 2 :(得分:1)
string.substring(0, string.indexOf("<img"));
答案 3 :(得分:0)
删除标签的简单解决方案是
text = text.replaceAll("<[^>]*>","")
但我认为如果内部有更复杂的标签,可能需要解析为HTML并删除标签。