使用php正则表达式查找包含单词的整行

时间:2013-02-03 17:59:42

标签: php regex line preg-match-all

我想在文本中搜索“会话”一词。但我想检索出现这个词的整行。到目前为止,我已经想出了这个。

$pattern="[^\\n]*session[^\\n]*";
preg_match_all($pattern,$content, $matches, PREG_OFFSET_CAPTURE);

但是我收到错误“Unknown modifier'*'”。任何想法如何制作这样的正则表达式?

1 个答案:

答案 0 :(得分:8)

您的正则表达式缺少分隔符,因此您的错误:

$pattern = "/[^\\n]*session[^\\n]*/";
// or, with single quotes, you don't need to escape \n
$pattern = '/[^\n]*session[^\n]*/';

如果我正确地解释了您的意图,那么您尝试匹配零或多个而不是换行符,然后是“会话”,然后是零或多个换行符。

更简单(可能更正确)的模式是:

$pattern = '/^.*\bsession\b.*$/m';

也就是说,从一行开始(^)匹配0或更多任何字符(.*),一个单词边界(\b),单词“session” “,另一个单词边界,另一个字符系列和行尾($),匹配多行(m修饰符)。

你有点用^重新发明锚点$[^\n]),这有点不明显,但是错过了单词边界,这可能不是你想要的'匹配any word that contains the word "session"。也就是说,你的将匹配包含“会话”或“所有权”或“强迫症”或“abcsessionxyz”的行,而我的不会;如果不需要,您可以移除\b的屈服/^.*session.*$/m,我们的模式或多或少会相同。

这是一个概念验证,找到包含单词的整个中间行:

<?php

$lines ="This is a test
of skipping the word obsessions but
finding the word session in a
bunch of lines of text";

$pattern = "/^.*\bsession\b.*$/m";

$matches = array();
preg_match($pattern, $lines, $matches);

var_dump($matches);

输出:

array(1) {
  [0]=>
  string(29) "finding the word session in a"
}

你的模式会找到“跳过”强迫症“这一词的界限。