我希望尝试确定一个正则表达式来解析来自此谷歌警报重定向的内部网址
http://www.google.com/url?sa=X&q=http://weheartit.com/entry/29409069&ct=ga&cad=CAcQARgAIAEoATAAOABAo5aK_gRIAlgBYgVlbi1VUw&cd=jRWL16jvo8k&usg=AFQjCNGbJMqWtbCxpcJdu4PGD6RToU6NTw
我需要做的是删除第一部分
http://www.google.com/url?sa=X&q=
我还会删除
的尾随字符串&ct=ga&cad=CAcQARgAIAEoATAAOABAo5aK_gRIAlgBYgVlbi1VUw&cd=jRWL16jvo8k&usg=AFQjCNGbJMqWtbCxpcJdu4PGD6RToU6NTw
所以我要结束的结尾网址是
http://weheartit.com/entry/29409069
我只想更新此感谢您的帮助。这是drupal链接模块中的一个问题,它已经修复了
答案 0 :(得分:1)
仍然不清楚你想要完成什么,无论是提取还是删除周围的部分,都不是很难:
preg_match('#q=(http://[^&]+)#', $source, $result);
print $result[1];
或者其他:
= preg_replace('#^.+q=([^&]+).+$#', '$1', $source);
会工作。
答案 1 :(得分:1)
如果确实想要手动将网址剥离,您可以......
$ cat parseurl.php
#!/usr/local/bin/php
<?php
$url="http://www.google.com/url?sa=X&q=http://weheartit.com/entry/29409069&ct=ga&cad=CAcQARgAIAEoATAAOABAo5aK_gRIAlgBYgVlbi1VUw&cd=jRWL16jvo8k&usg=AFQjCNGbJMqWtbCxpcJdu4PGD6RToU6NTw";
# Parts of this section could be replaced with parse_url()
$junk = explode("?", $url);
$parts = explode("&", $junk[1]);
$gvar = array();
foreach ($parts as $thisone) {
$junk = explode("=", $thisone);
$gvar[$junk[0]]=$junk[1];
}
print_r($gvar);
printf("Embedded URL: %s\n", $gvar["q"]);
$ ./parseurl.php
Array
(
[sa] => X
[q] => http://weheartit.com/entry/29409069
[ct] => ga
[cad] => CAcQARgAIAEoATAAOABAo5aK_gRIAlgBYgVlbi1VUw
[cd] => jRWL16jvo8k
[usg] => AFQjCNGbJMqWtbCxpcJdu4PGD6RToU6NTw
)
Embedded URL: http://weheartit.com/entry/29409069
$
要使用parse_url()和parse_str执行此操作,您可能会使用以下内容:
<?php
$url="http://www.google.com/url?sa=X&q=http://weheartit.com/entry/29409069&ct=ga&cad=CAcQARgAIAEoATAAOABAo5aK_gRIAlgBYgVlbi1VUw&cd=jRWL16jvo8k&usg=AFQjCNGbJMqWtbCxpcJdu4PGD6RToU6NTw";
parse_str( parse_url($url, PHP_URL_QUERY), $gvar );
printf("Embedded URL: %s\n", $gvar['q']);
这看起来似乎更容易,但我会留下第一个版本,这样你就可以看到“可能”发生在“引擎盖下”。 : - )