我想从以下示例txt中提取数据
START
A: 567 B:345
C: 345 D:485
START
A: 345 B:267
C: 980 D:054
我正在使用这个正则表达式而没有任何积极的结果:
$regex = '~'
. '^(?P<header>.*START:.*)$'
//. '^(.*A: \d{3} B: \d{3}.*)$'
//. '(.*C: \d{3} D: \d{3}.*)$'
. '~m'
;
这给了我以下结果:
Array
(
[0] => Array
(
[0] => START:
[header] => START:
[1] => START:
)
[1] => Array
(
[0] => START:
[header] => START:
[1] => START:
)
)
但是一旦我取消注释行
. '^(.*A: \d{3} B: \d{3}.*)$'
和
. '(.*C: \d{3} D: \d{3}.*)$'
我没有匹配!
如何提取此数据?
我尝试删除行锚^
的开头并将行结束$
更改为\n
但没有成功
如果我有数据开始行后跟n条数据行,然后是数据行结束,然后是一行,我该如何提取数据或更多空行?
答案 0 :(得分:1)
试试这个:
(START)\s+(A:\s+\d+\s+B:\d+)\s+(C:\s+\d+\s+D:\d+)
<强>匹配强>
MATCH 1
1. [0-5] `START`
2. [6-18] `A: 567 B:345`
3. [19-31] `C: 345 D:485`
MATCH 2
1. [34-39] `START`
2. [40-52] `A: 345 B:267`
3. [53-65] `C: 980 D:054`
答案 1 :(得分:1)
在将多行字符串与修饰符m (MULTILINE
匹配时,您必须确保将新行与[\r\n]
或更好的\R
匹配。
对于正则表达式后的输入应该有效:
/^(?<header>START)$\R+^(?<line1>A:\h*\d{3}\h+B:\h*\d{3})$\R+^(?<line2>C:\h*\d{3}\h+D:\h*\d{3})$/m
\R
匹配任何换行符,\h
匹配PCRE中的任何水平空格。