如何用Java替换字符串(Regex?)

时间:2013-05-17 18:40:40

标签: java regex string

您好,首先感谢您的帮助。

我需要对Java中的大量字符串执行一些数据操作。

这是我必须修改的字符串的一个例子:

<span foreground="blue" weight="bold">accomplish</span> vt, vi, 완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다  <span foreground="blue" weight="bold">accomplish</span> a, prep, 완성한, 숙달한, 소양(교양)이 있는 

我需要做什么:

从上面的字符串中删除所有

<span..../span> 

我需要拿出来:

a vt, vi, 准备等等。

不要带走所有字符,只有特定的 a, vt, vi, 准备,和其他一些。

编辑编辑 所以预期的输出是:

    완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다 완성한, 숙달한, 소양(교양)이 있는 

我想我必须使用正则表达式,但我绝对是新手。

请有人帮我一下吗?

由于

1 个答案:

答案 0 :(得分:4)

String#replaceAll()与正则表达式一起使用:

<span.*?/span>

.replaceAll()将正则表达式作为第一个参数,而.replace()采用String(一个CharSequence

Java代码:

String s = "<span foreground=\"blue\" weight=\"bold\">accomplish</span> vt, vi, 완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다  <span foreground=\"blue\" weight=\"bold\">accomplish</span> a, prep, 완성한, 숙달한, 소양(교양)이 있는 ";
System.out.println(s.replaceAll("<span.*?/span>", ""));

输出:

vt, vi, 완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다   a, prep, 완성한, 숙달한, 소양(교양)이 있는 


更新

如果您需要更多内容,可以使用|运算符将它们放入正则表达式中。例如:

<span.*?/span>|a,|vt,|vi,|prep,|whateverYouWantDontForgetToEscape

工作代码:

System.out.println(s.replaceAll("<span.*?/span>|a,|vt,|vi,|prep,", ""));

输出:

   완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다     완성한, 숙달한, 소양(교양)이 있는 

更新2:

根据您刚刚发布的预期输出,您还希望删除重复的空格。为此,请使用此正则表达式:

(<span.*?/span>|a,|vt,|vi,|prep,)(\s(?<=\s))*

Java代码:

System.out.println(s.replaceAll("(<span.*?/span>|a,|vt,|vi,|prep,)(\\s(?<=\\s))*", ""));

输出:

완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다  완성한, 숙달한, 소양(교양)이 있는