一般

Question

我想从以下示例txt中提取数据

START
A: 567 B:345
C: 345 D:485


START
A: 345 B:267
C: 980 D:054

我正在使用这个正则表达式而没有任何积极的结果：

$regex = '~'
       . '^(?P<header>.*START:.*)$'
       //. '^(.*A: \d{3} B: \d{3}.*)$'
       //. '(.*C: \d{3} D: \d{3}.*)$'
       . '~m'
;

这给了我以下结果：

Array
(
    [0] => Array
        (
            [0] =>  START:
            [header] =>     START:
            [1] =>  START:
        )

    [1] => Array
        (
            [0] =>  START:
            [header] =>     START:
            [1] =>  START:
        )

)

但是一旦我取消注释行

. '^(.*A: \d{3} B: \d{3}.*)$'

和

. '(.*C: \d{3} D: \d{3}.*)$'

我没有匹配！

如何提取此数据？

我尝试删除行锚^的开头并将行结束$更改为\n但没有成功

一般

如果我有数据开始行后跟n条数据行，然后是数据行结束，然后是一行，我该如何提取数据或更多空行？

Answer 1

试试这个：

(START)\s+(A:\s+\d+\s+B:\d+)\s+(C:\s+\d+\s+D:\d+)

<强>匹配

MATCH 1
1.  [0-5]   `START`
2.  [6-18]  `A: 567 B:345`
3.  [19-31] `C: 345 D:485`
MATCH 2
1.  [34-39] `START`
2.  [40-52] `A: 345 B:267`
3.  [53-65] `C: 980 D:054`

Regex101 Demo
Ideone Demo

Answer 2

在将多行字符串与修饰符m (MULTILINE匹配时，您必须确保将新行与[\r\n]或更好的\R匹配。

对于正则表达式后的输入应该有效：

/^(?<header>START)$\R+^(?<line1>A:\h*\d{3}\h+B:\h*\d{3})$\R+^(?<line2>C:\h*\d{3}\h+D:\h*\d{3})$/m

\R匹配任何换行符，\h匹配PCRE中的任何水平空格。

here

覆盖多行的正则表达式

一般

2 个答案: