正则表达式从查询字符串的第一个大写到句子结尾匹配

时间:2011-10-28 00:43:43

标签: php regex string

我需要找到一个或多个字符串的句子。这将是从第一个大写字母或中断线到终点或断点线。

我得到的是这个,但当然根本不起作用:

$search_string='example';

$regex = '\[A-Z]{1}[a-z]*\s*'.$search_string.'\s*[a-zA-Z]*\i';

preg_match_all($regex, $content, $matches);  

如果单词重复多于句子,我将需要检索两个句子。我不确定我是否能很好地解释它;请评论,我会再次尝试解释。


修改

我有一个wordpress网站,里面有很多帖子和pdf,docs等。我使用一个名为swish-e的搜索引号来索引所有并显示结果。 当有人搜索任何字符串时,我想显示该字符串的摘要而不是完整的帖子/或pdf。

因此,如果用户搜索“example”字符串,我需要显示所有句子或至少其中一些单词示例出现的句子。 这就是为什么我在开始时要求大写字母和结束时的终点。我知道这不会是完美的,但至少我需要涵盖一些场景(大写字母/断线等)

希望它更清楚,再次感谢很多

3 个答案:

答案 0 :(得分:2)

您的search_string应该是preg_quote'd,或者用户可以使用特殊字符操作结果,例如|

$search_string='example';
$regex = '/[A-Z][a-z ]*\b'.preg_quote($search_string,"/").'\b.*?(?:[.!?]|$)/i';
preg_match_all($regex, $content, $matches);  

我认为判决可以终止。要么 ?或者!

您可能不希望为模式分隔符使用\字符 - 如果它完全有效,则可能会产生奇怪的行为。您还可以将i模式修改器应用于您的模式,因此[a-z]也将匹配大写字母,[A-Z]将匹配小写字母。

编辑:

此解决方案更灵活,但不要求句子以大写字母开头。如果你想使用它,由你决定:

$search_string='example';
$regex = '/[^.!?\n]*\b'.preg_quote($search_string,"/").'\b[^.!?\n]*/i';
preg_match_all($regex, $content, $matches);  

答案 1 :(得分:1)

怎么样:

$search=preg_quote('example');

$regex = '/[A-Z][^\.]+\s+'.$search.'\s[^\.]+/i';

preg_match_all($regex, $content, $matches);  

基本上:

  • 大写字母
  • 一个或多个非.
  • 的内容
  • 一个或多个空格
  • 你的模式
  • 一个或多个不是点的东西。

应匹配不包括尾随.

的句子

这是一个更完整的解决方案(已检查并正在处理)处理“转到下一行”问题,以及被引号括起来的字词:

$content = "Sentence one. This is an example sentence. Sentence two. Sentence with the word 'example' in it\nthat goes over multiple lines. this isn't starting with a capital letter, for example.";
$search=preg_quote('example');
$regex = '/[A-Z][^\.\n]+\W'.$search.'\W[^\.\n]+/';

preg_match_all($regex, $content, $matches);  
print_r($matches);

打印:

Array
(
    [0] => Array
        (
            [0] => This is an example sentence
            [1] => Sentence with the word 'example' in it
        )
)

答案 2 :(得分:1)

这个正则表达式会做你想要的:

$regex = '/[A-Z\n]{1}([a-z]*?\s*)+'.$search_string.'(\s*?[a-zA-Z]*)+[\.\n]/';

在这里你可以看到它的工作原理:

http://ideone.com/aCJJZ