从PHP中的另一个站点的页面中提取内容的最小脚本

时间:2011-03-31 12:40:12

标签: php web-scraping

很简单的事情。我有时想访问都市词典,但它被阻挡在我所在的位置。 给出像

这样的形式
<form method="get" action="<?PHP echo htmlspecialchars($_SERVER['PHP_SELF']); ?>">
<input type="text" name="what" value="" />
<input type="submit" />
</form>

我需要添加什么才能让它返回城市词典中的条目内容以输入值?例如,使用CURL或getFile或尽可能简单的东西

更新

这有效!

<form method="get" action="">
<input type="text" name="what" value="" />
<input type="submit" />
</form>

<?PHP
$what = isSet($_GET["what"])?htmlentities($_GET["what"]):"";
echo file_get_contents("http://www.urbandictionary.com/define.php?term=".urlencode($what));
?>

3 个答案:

答案 0 :(得分:1)

非常简单,非常奇怪file_get_contents($_POST['what']);

答案 1 :(得分:0)

您需要使用PHP进行一些DOM解析。您可以在PHP5中使用本机DOM解析器(推荐,请参阅此处http://www.ibm.com/developerworks/library/os-xmldomphp/),或使用简单HTML DOM解析器(http://simplehtmldom.sourceforge.net/)等库。

然后,您可以使用您的帖子数据来选择网址。

答案 2 :(得分:-1)

也许您正在寻找像http://pici.picidae.net/之类的东西,而不是编写一些会被您的网络阻止的东西。