我在reg-exp上很可怕,所以我需要一些帮助才能做到正确。
我有一个包含从PDF创建的HTML代码的PHP变量。这些页面与以下样式的注释分开:
<!-- Page 1 -->
我需要的是分割每个评论的内容,以便我可以将页面彼此分开。我尝试使用explode('<!-- Page', $content)
,但是在下一页的开头留下了剩下的标签,所以显然这不是一个足够好的解决方案。
所以我需要帮助的是找到一个将在<!-- Page X -->
分割的reg-exp,其中X可以是任意数字。有人能帮帮我吗?
答案 0 :(得分:3)
简单的正则表达式:
<!-- Page [0-9]+ -->
答案 1 :(得分:3)
这似乎工作正常;
<?php
$foo = '
Hello.
<!-- Page 2 -->
Bar
<!-- Page 3 -->
Foo
';
$pages = array_map( 'trim', preg_split( '~<!-- Page (\d+) -->~m', $foo ) );
var_dump( $pages );
输出:
berry@berry-pc:~$ php foo.php
array(3) {
[0]=>
string(6) "Hello."
[1]=>
string(3) "Bar"
[2]=>
string(3) "Foo"
}
希望有所帮助。