需要在不使用“regexp”的情况下注释单词

时间:2017-10-17 06:12:24

标签: regex uima ruta

需要注释/匹配单词(章节)。在下面的示例输入文本中,单词章节出现两次。

DECLARE Chapter;
   W{REGEXP("Chapter",true),-PARTOF(Chapter)-> MARK(Chapter)};

当我使用Regexp条件时,它仅注释不包含标记的单词(即),并且包含标记的单词未注释

(i.e C</span><span style="font-family:Times New Roman Bold; 000000; position:relative;top:1pt;mso-text-raise:-1pt">hapter).

还有其他方法可以注释吗?

示例输入文字:

<p class="CN" data-name="CN"><span data-bkmark="para10000"></span><span style="font-family:Times New Roman; 000000">C</span><span style="font-family:Times New Roman Bold; 000000; position:relative;top:1pt;mso-text-raise:-1pt">hapter</span><span style="font-family:Times New Roman; 000000; position:relative;top:1pt;mso-text-raise:-1pt"> </span><span style="font-family:Times New Roman; 000000">O</span><span style="font-family:Times New Roman Bold; 000000; position:relative;top:1pt;mso-text-raise:-1pt">ne</span><span data-bkmark="para10000"></span></p>
<p class="Text" data-name="Text"><span style="font-family:Times New Roman; font-size:12pt; 000000">This chapter provides an overview of nursing </span></p>

0 个答案:

没有答案