使用正则表达式分隔文档

时间:2016-03-05 19:49:08

标签: javascript regex node.js

我正在处理几个文件中的文档,在处理文档之前,我需要定义一个文档的开始和结束位置。为此,我使用以下正则表达式:

MINISTÉRIO\sDO\sTRABALHO\sE\sEMPREGO(?:[^P]*(?:P(?!ÁG\s:\s\d+\/\d+)[^P]*)*)PÁG\s:\s\d+\/(\d+)\b(?:\D*(?:(?!\1\/\1)\d\D*)*)\1\/\1(?:[^Z]*(?:Z(?!6:\s\d+)[^Z]*)*)Z6:\s\d+

Example is here

正在100%工作,问题是,有时文字不是这样我展示的......它带有空格和线条。如您所见here,该文档与前一个文档相同,但正则表达式不起作用。我想知道为什么不工作以及如何解决这个问题?

另外,我需要修改正则表达式而不是文本,导致我访问的唯一真实部分是正则表达式。

OBS:我正在使用Node.JS,这就是我在这篇文章中用JS标记的原因。

0 个答案:

没有答案