使用正则表达式在Html中查找模式

时间:2014-05-09 15:25:13

标签: html regex

我正在浏览html页面以获取数据。

正则表达式是否适用于此类任务?我正在搜索我的数据所在的模式。

如果正则表达式是正确的做法。我会很感激帮助找到这种模式:

<span>3060</span>

模式恰好是span元素

内的四位数(0-9)

由于

1 个答案:

答案 0 :(得分:1)

试试这个:

preg_match_all("/(<span>\d{4}<\/span>)/", $myinput, $myoutput);

http://3v4l.org/72ClO

请注意这不解析HTML。它会查找以<span>开头然后有4位数的内容,然后是</span>。那里有一个空间,但都会失败。

使用此选项仅获取4位数

preg_match_all("/<span>(\d{4})<\/span>/", $myinput, $myoutput);

http://3v4l.org/FF4Y9