Question

我希望尝试确定一个正则表达式来解析来自此谷歌警报重定向的内部网址

http://www.google.com/url?sa=X&q=http://weheartit.com/entry/29409069&ct=ga&cad=CAcQARgAIAEoATAAOABAo5aK_gRIAlgBYgVlbi1VUw&cd=jRWL16jvo8k&usg=AFQjCNGbJMqWtbCxpcJdu4PGD6RToU6NTw

我需要做的是删除第一部分

http://www.google.com/url?sa=X&q=

我还会删除

的尾随字符串

&ct=ga&cad=CAcQARgAIAEoATAAOABAo5aK_gRIAlgBYgVlbi1VUw&cd=jRWL16jvo8k&usg=AFQjCNGbJMqWtbCxpcJdu4PGD6RToU6NTw

所以我要结束的结尾网址是

http://weheartit.com/entry/29409069

我只想更新此感谢您的帮助。这是drupal链接模块中的一个问题，它已经修复了

Answer 1

仍然不清楚你想要完成什么，无论是提取还是删除周围的部分，都不是很难：

preg_match('#q=(http://[^&]+)#', $source, $result);
print $result[1];

或者其他：

= preg_replace('#^.+q=([^&]+).+$#', '$1', $source);

会工作。

另请参阅Open source RegexBuddy alternatives和Online regex testing以获取一些有用的工具，或RegExp.info获取更好的教程。

同样，另一种选择在于parse_url和parse_str

Answer 2

如果确实想要手动将网址剥离，您可以......

$ cat parseurl.php 
#!/usr/local/bin/php
<?php

$url="http://www.google.com/url?sa=X&q=http://weheartit.com/entry/29409069&ct=ga&cad=CAcQARgAIAEoATAAOABAo5aK_gRIAlgBYgVlbi1VUw&cd=jRWL16jvo8k&usg=AFQjCNGbJMqWtbCxpcJdu4PGD6RToU6NTw";

# Parts of this section could be replaced with parse_url()
$junk = explode("?", $url);
$parts = explode("&", $junk[1]);
$gvar = array();
foreach ($parts as $thisone) {
  $junk = explode("=", $thisone);
  $gvar[$junk[0]]=$junk[1];
}

print_r($gvar);

printf("Embedded URL: %s\n", $gvar["q"]);

$ ./parseurl.php 
Array
(
    [sa] => X
    [q] => http://weheartit.com/entry/29409069
    [ct] => ga
    [cad] => CAcQARgAIAEoATAAOABAo5aK_gRIAlgBYgVlbi1VUw
    [cd] => jRWL16jvo8k
    [usg] => AFQjCNGbJMqWtbCxpcJdu4PGD6RToU6NTw
)
Embedded URL: http://weheartit.com/entry/29409069
$

要使用parse_url（）和parse_str执行此操作，您可能会使用以下内容：

<?php

$url="http://www.google.com/url?sa=X&q=http://weheartit.com/entry/29409069&ct=ga&cad=CAcQARgAIAEoATAAOABAo5aK_gRIAlgBYgVlbi1VUw&cd=jRWL16jvo8k&usg=AFQjCNGbJMqWtbCxpcJdu4PGD6RToU6NTw";

parse_str( parse_url($url, PHP_URL_QUERY), $gvar );
printf("Embedded URL: %s\n", $gvar['q']);

这看起来似乎更容易，但我会留下第一个版本，这样你就可以看到“可能”发生在“引擎盖下”。： - ）

为drupal字段确定url的正则表达式

2 个答案: