如何设置SRX规则以在字符之前和之后中断

时间:2017-06-29 23:36:10

标签: regex text-segmentation

我正在使用SRX规范www.ttt.org/oscarstandards/srx/srx10.html

更新SRX规则文件

没有明确提及如何在某个文本之后的之前进行休息。

在文档中,子弹字符\u2022出现并且需要在其自己的段中,因此需要在之前和之后中断。

我想出的唯一解决方案是:

<rule break="yes">
    <afterbreak>\u2022</afterbreak>
</rule>
<rule break="yes">
    <beforebreak>\u2022</beforebreak>
</rule>

这是正确的语法吗?

1 个答案:

答案 0 :(得分:1)

根据1.2. Regular Expressions section, 1.2.1. Metacharacters table

  

\uhhhh将字符与十六进制值hhhh匹配。
  ...
  \x{hhhh}将字符与十六进制值hhhh匹配   \xhh将字符与两位十六进制值hh

匹配

你可以使用三种符号中的任何一种,但我想你可能只是保留SRX规则。