我需要在通常包含邮政编码的网页上抓取数据。在源代码中,HTML将如下所示12345<br>USA
。
我的模式如下:
$pattern = '\d{5}<br>USA';
我确定我没有逃避HTML标记或其他内容,但我无法找到正确的方法来编写此标记。
答案 0 :(得分:1)
答案 1 :(得分:0)
我也认为你需要逃避坟墓/小佬...认为正则表达式缺乏你想捕捉的东西......可以做类似......
<?php
$data = '12345<br>USA Foo Bar 12345 Blah Blah 90210';
$pattern = '#(\d{5})<br>USA#';
$matches = [];
preg_match($pattern, $data, $matches);
var_dump($matches);
/*
array (size=2)
0 => string '12345<br>USA' (length=12)
1 => string '12345' (length=5)
*/