我有许多字符串(推特推文),当我回复它时,我想从中删除链接。
我无法控制字符串,即使所有链接都以http开头,它们也可以以" /"结尾。或者";"没有,被跟踪或不被空间跟随。 此外,有时链接和它之前的单词之间没有空格。
此类字符串的一个示例:
The Third Culture: The Frontline of Global Thinkinghttp://is.gd/qFioda;via @edge
我尝试使用preg_replace,但无法找到适合所有例外情况的解决方案:
<?php echo preg_replace("/\http[^)]+\;/","",$feed->itemTitle); ?>
知道我该怎么办?
编辑:我试过了
<?php echo preg_replace('@(https?://([-\w\.]+[-\w])+(:\d+)?(/([\w/_\.#-]*(\?\S+)?[^\.\s])?)?)@', ' ', $feed->itemTitle); ?>
但仍未成功。
编辑2:我找到了这个:
<?php echo preg_replace('^(ht|f)tp(s?)\:\/\/[0-9a-zA-Z]([-.\w]*[0-9a-zA-Z])*(:(0-9)*)*(\/?)([a-zA-Z0-9\-\.\?\,\'\/\\\+&%\$#_]*)?$^',' ', $feed->itemTitle); ?>
按预期删除链接,但当链接与其前面的单词之间没有空格时,它也会删除整个字符串。
答案 0 :(得分:16)
如果你想删除所有内容,链接和链接后,例如通过你的例子中的东西,下面可能会帮助你:
$string = "The Third Culture: The Frontline of Global Thinkinghttp://is.gd/qFioda;via @edge";
$regex = "@(https?://([-\w\.]+[-\w])+(:\d+)?(/([\w/_\.#-]*(\?\S+)?[^\.\s])?).*$)@";
echo preg_replace($regex, ' ', $string);
如果你想保留它们:
$string = "The Third Culture: The Frontline of Global Thinkinghttp://is.gd/qFioda;via @edge";
$regex = "@(https?://([-\w\.]+[-\w])+(:\d+)?(/([\w/_\.#-]*(\?\S+)?[^\.\s])?)?)@";
echo preg_replace($regex, ' ', $string);
答案 1 :(得分:1)
我会做这样的事情:
$input = "The Third Culture: The Frontline of Global Thinkinghttp://is.gd/qFioda;via @edge";
$replace = '"(https?://.*)(?=;)"';
$output = preg_replace($replace, '', $input);
print_r($output);
它也适用于多次出现:
$output = preg_replace($replace, '', $input."\n".$input);
print_r($output);