用于删除标记

时间:2016-06-09 10:31:20

标签: regex

我正在使用CAT软件翻译文档,而且我在处理标记严重的文档时遇到问题。该软件支持正则表达式,我希望可以创建一个来帮助我解决这个问题。我需要一个正则表达式来选择光标插入点到"小于"之间的所有内容。符号<,标志着标签的开始。这将允许我立即开始输入,用我的翻译替换原始文本。 然后我需要另一个表达式来跳转标签,也就是说,将光标放在最后一个"大于"之后。符号,可以被识别为没有跟随"小于"符号。换句话说,正则表达式将命令将光标移动到"大于"之后的位置。 >除了"小于"之外的任何其他符号。 <符号。 这是一个例子:

> Some student will investigate two dialects of </s1></s0><s2><s3>every
> </s3></s2><s4><s5>language </s5></s4>

插入点位于句子的开头,就在单词&#34; Some&#34;之前。我需要一个正则表达式,它将选择所有文本直到&#34;小于&#34; &LT;符号,即&#34;之后的#34;。在这一点上,我需要一个正则表达式,它会在单词&#34;每个&#34;之前跳过插入点。

2 个答案:

答案 0 :(得分:0)

可以使用

完成选择下一个标记
[^<]*

然后有点不清楚第二个正则表达式 - 跳过标记 - 应该只是匹配标记。那就是

<[^>]*>

如果应该选择下一个文本,那就更复杂了。但是,让我们从这开始;)。

答案 1 :(得分:0)

[^>]*(?=<) 将在><之间找到所有文字。但是,它将找到选择结果,而不是将光标放在某处。