我想在php中搜索一个特殊条件的文本文件:当第一次匹配字符串时,开始收集文本,当第二次匹配相同的字符串时,停止收集文本。
例如。如果字符串是'world'并在下面的行搜索它: “我们的世界有196个国家,但其中只有192个是联合国会员国。我们的世界是非常普通的。'
然后我想要这样的文字:'有196个国家,但其中只有192个是联合国会员。我们的'匹配变量。
我在preg_match()中尝试了很多正则表达式,但没有结果,那么还有更好的方法吗?
感谢
答案 0 :(得分:2)
使用lookbehind和lookahead:
/(?<=world ).*?(?= world)/
在此处查看:[{3}}
...这是一个使用PHP的演示:http://regex101.com/r/tW2bT8
答案 1 :(得分:0)
$lines = file($filename);
$keep = false;
$keepTrailing = true; //Flag that decides wether to keep trailing capture segments or not.
$extractions = array();
$current = '';
foreach($lines as $line){
$parts = preg_split('/\bworld\b/i', $line);
$current .= $parts[0];
for ($i = 1; $i<count($parts); $i++){
if ($keep) $extractions[] = $current;
$keep = !$keep;
$current = $parts[$i];
}
}
if ($keep && $keepTrailing)
$extractions[] = $current;
var_dump($extractions);
基本上,通过迭代文件一次,你可以简单地分割关键词(“世界”)上的每一行 - 我使用\b
锚来确保它不会分裂为“世俗”或其他垃圾。我已经包含一个标志来决定是否保留尾随捕获段。你不一定需要它,但它可能有所帮助。此解决方案中唯一不直观的部分是将当前捕获保留在$current
变量中,这基本上允许您扫描多个换行符。
你知道,这可以很容易地变成一个功能。
function capturingSearchWithKeyword($filename, $keyword, $keepTrailing = true, $trim = false){
$lines = file($filename);
$keep = false;
$extractions = array();
$current = '';
foreach($lines as $line){
$parts = preg_split("/\\b$keyword\\b/i", $line);
$current .= $parts[0];
for ($i = 1; $i<count($parts); $i++){
if ($keep){
if ($trim) $current = trim($current);
$extractions[] = $current;
}
$keep = !$keep;
$current = $parts[$i];
}
}
if ($keep && $keepTrailing)
$extractions[] = $current;
return $extractions
}