需要一点reg-exp帮助

时间:2011-05-12 14:05:56

标签: php html regex

我在reg-exp上很可怕,所以我需要一些帮助才能做到正确。

我有一个包含从PDF创建的HTML代码的PHP变量。这些页面与以下样式的注释分开:

<!-- Page 1 -->

我需要的是分割每个评论的内容,以便我可以将页面彼此分开。我尝试使用explode('<!-- Page', $content),但是在下一页的开头留下了剩下的标签,所以显然这不是一个足够好的解决方案。

所以我需要帮助的是找到一个将在<!-- Page X -->分割的reg-exp,其中X可以是任意数字。有人能帮帮我吗?

2 个答案:

答案 0 :(得分:3)

简单的正则表达式:

<!-- Page [0-9]+ -->

答案 1 :(得分:3)

这似乎工作正常;

<?php

$foo = '

Hello.

<!-- Page 2 -->

Bar

<!-- Page 3 -->

Foo
';

$pages = array_map( 'trim', preg_split( '~<!-- Page (\d+) -->~m', $foo ) );

var_dump( $pages );

输出:

berry@berry-pc:~$ php foo.php 
    array(3) {
  [0]=>
  string(6) "Hello."
  [1]=>
  string(3) "Bar"
  [2]=>
  string(3) "Foo"
}

希望有所帮助。