正则表达式-需要使用preg_split
来分隔单词
----------------------- Page 1-----------------------
text of page 1
----------------------- Page 2-----------------------
text of page 2
----------------------- Page 3-----------------------
text of page 3
我需要将每个页面文本分解为一个数组。
array( [0]=> "text of page 1", [1] => "text of page 2",[2]=>"text of page 3")
我使用了以下正则表达式
((7[-])(page)( )[1-100](7[-]))
答案 0 :(得分:3)
您可以执行以下操作,假设P
之前和e
之后始终有一个空格,并且数字和-
之间没有空格。
\s*-+ Page \d+-+\n
\s*
匹配上一页的尾随空白。-+ Page \d+-+
与--------- Page x-----------
行匹配\n
,以便每个拆分都没有开头的新行。请注意,拆分数组的第一个元素将为空字符串或空格,并且可以将其丢弃。