提取文本中的所有关键字,然后将每个匹配项分成3组

时间:2018-07-12 21:30:08

标签: c# regex

^(.*)(th)(.*)$

这就是我所做的,但是并不能捕获文本中的所有th关键字。

我将举例说明必须如何工作。

示例1:

文本: Th 电子书 Th eif

匹配1:

  • 第1组。”
  • 第2组。'Th'
  • 第3组:“预订”

匹配2:

  • 第1组。”
  • 第2组。'Th'
  • 第3组,“ ief”

示例1:

文字:哈利·波特与凤凰城的 th e阶

匹配1:

  • 第1组:'哈利·波特与'
  • 第2组。'th'
  • 第3组。''e订单'

匹配2:

  • 第1组。”
  • 第2组。'th'
  • 第3组。'ePhoenix'

如果有人想知道为什么我要这样3个组,那是因为我试图用keyword替换<mark>keywrod</mark>并保持所有相同,但是我很难制作正则表达式模式独自一人。

1 个答案:

答案 0 :(得分:1)

检查下一个正则表达式(?i)(.*?)(th)((?:(?!th).)*)

here在线试用。

要获取正则表达式的解释,请单击here