标签: java string
可能重复: Removing HTML from a Java String
我正在从网站上拉一个字符串并对其进行过滤,以便它是全文。不幸的是我的文本中仍然有一些html例如:<! blah blah>因为它来自一个网站,我不能直接删除这个文本而且我不确切知道要开始删除的索引。
<! blah blah>
有人可以帮我写一个能删除'&lt;'之间所有内容的函数吗?和'&gt;'并返回正确的字符串?感谢