php:从字符串中删除URL

时间:2014-07-05 16:35:47

标签: php regex string

我有许多字符串(推特推文),当我回复它时,我想从中删除链接。

我无法控制字符串,即使所有链接都以http开头,它们也可以以" /"结尾。或者";"没有,被跟踪或不被空间跟随。 此外,有时链接和它之前的单词之间没有空格。

此类字符串的一个示例:

The Third Culture: The Frontline of Global Thinkinghttp://is.gd/qFioda;via @edge

我尝试使用preg_replace,但无法找到适合所有例外情况的解决方案:

<?php echo preg_replace("/\http[^)]+\;/","",$feed->itemTitle); ?>

知道我该怎么办?

编辑:我试过了

<?php echo preg_replace('@(https?://([-\w\.]+[-\w])+(:\d+)?(/([\w/_\.#-]*(\?\S+)?[^\.\s])?)‌​?)@', ' ', $feed->itemTitle); ?>

但仍未成功。

编辑2:我找到了这个:

<?php echo preg_replace('^(ht|f)tp(s?)\:\/\/[0-9a-zA-Z]([-.\w]*[0-9a-zA-Z])*(:(0-9)*)*(\/?)([a-zA-Z0-9\-‌​\.\?\,\'\/\\\+&amp;%\$#_]*)?$^',' ', $feed->itemTitle); ?>

按预期删除链接,但当链接与其前面的单词之间没有空格时,它也会删除整个字符串。

2 个答案:

答案 0 :(得分:16)

如果你想删除所有内容,链接和链接后,例如通过你的例子中的东西,下面可能会帮助你:

$string = "The Third Culture: The Frontline of Global Thinkinghttp://is.gd/qFioda;via @edge";
$regex = "@(https?://([-\w\.]+[-\w])+(:\d+)?(/([\w/_\.#-]*(\?\S+)?[^\.\s])?).*$)@";
echo preg_replace($regex, ' ', $string);

如果你想保留它们:

$string = "The Third Culture: The Frontline of Global Thinkinghttp://is.gd/qFioda;via @edge";
$regex = "@(https?://([-\w\.]+[-\w])+(:\d+)?(/([\w/_\.#-]*(\?\S+)?[^\.\s])?)?)@";
echo preg_replace($regex, ' ', $string);

答案 1 :(得分:1)

我会做这样的事情:

$input = "The Third Culture: The Frontline of Global Thinkinghttp://is.gd/qFioda;via @edge";
$replace = '"(https?://.*)(?=;)"';

$output = preg_replace($replace, '', $input);
print_r($output);

它也适用于多次出现:

$output = preg_replace($replace, '', $input."\n".$input);
print_r($output);