您好,首先感谢您的帮助。
我需要对Java中的大量字符串执行一些数据操作。
这是我必须修改的字符串的一个例子:
<span foreground="blue" weight="bold">accomplish</span> vt, vi, 완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다 <span foreground="blue" weight="bold">accomplish</span> a, prep, 완성한, 숙달한, 소양(교양)이 있는
我需要做什么:
从上面的字符串中删除所有
<span..../span>
我需要拿出来:
a vt, vi, 准备等等。不要带走所有字符,只有特定的 a, vt, vi, 准备,和其他一些。
编辑编辑 所以预期的输出是:
완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다 완성한, 숙달한, 소양(교양)이 있는
我想我必须使用正则表达式,但我绝对是新手。
请有人帮我一下吗?
由于
答案 0 :(得分:4)
将String#replaceAll()
与正则表达式一起使用:
<span.*?/span>
.replaceAll()
将正则表达式作为第一个参数,而.replace()
采用String
(一个CharSequence
。
Java代码:
String s = "<span foreground=\"blue\" weight=\"bold\">accomplish</span> vt, vi, 완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다 <span foreground=\"blue\" weight=\"bold\">accomplish</span> a, prep, 완성한, 숙달한, 소양(교양)이 있는 ";
System.out.println(s.replaceAll("<span.*?/span>", ""));
输出:
vt, vi, 완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다 a, prep, 완성한, 숙달한, 소양(교양)이 있는
如果您需要更多内容,可以使用|
运算符将它们放入正则表达式中。例如:
<span.*?/span>|a,|vt,|vi,|prep,|whateverYouWantDontForgetToEscape
工作代码:
System.out.println(s.replaceAll("<span.*?/span>|a,|vt,|vi,|prep,", ""));
输出:
완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다 완성한, 숙달한, 소양(교양)이 있는
根据您刚刚发布的预期输出,您还希望删除重复的空格。为此,请使用此正则表达式:
(<span.*?/span>|a,|vt,|vi,|prep,)(\s(?<=\s))*
Java代码:
System.out.println(s.replaceAll("(<span.*?/span>|a,|vt,|vi,|prep,)(\\s(?<=\\s))*", ""));
输出:
완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다 완성한, 숙달한, 소양(교양)이 있는