如何通过PHP获取网站信息

时间:2009-10-30 04:42:58

标签: php

如何通过PHP获取网站信息。

不使用

  

file_get_contents

有没有其他方法可以获取网站信息。

示例网址:http://www.quarkbase.com/google.com

在此页面中,您将获得有关GOOGLE页面的完整信息。像这样如果我输入网站的任何网址,我需要获取有关该网站的更多信息。

我希望查询非常明确。

如果您对查询有任何疑问,请与我们联系

先谢谢

FERO

4 个答案:

答案 0 :(得分:1)

查看curl函数。

php.net有basic example

答案 1 :(得分:1)

您可能想要查看从C。

移植的f *()函数

它们允许更精细的流操作。

一些好的提示here

$handle = fopen( "http://www.quarkbase.com/google.com/", "r", false, $context );
$text = '';
while ( !feof( $handle ) )
    $text .= fread( $handle, 8192 );
fclose( $handle ); 

答案 2 :(得分:0)

cURL无法解决他的问题。它可以帮助他截取网站的截图,但是他们关于URL的信息来自众多来源。交通信息来自Alexa,他们从相关网站获取社交网络统计信息,以及有关运营网站的公司的任何信息,这些信息来自单独的数据库,或者他们让员工输入有关他们索引的较大网站的信息。

仅通过阅读页面来源无法识别该类型的信息。他们使用大量算法搜索页面内容的模式,他们使用Alexa的API获取其使用数据,他们使用社交网络服务的API从中挖掘数据等。

这绝对不是一件容易的事......

答案 3 :(得分:0)

那么......网站信息,您指的是注册商和域名信息?比如通过dnsstuff.com或其他拥有该域名的公司的元信息。

自动抓取许多这类数据可能会非常棘手。您不仅需要从一些地方获取该信息,而且如果他们发现您不遵守他们的robots.txt,许多地方都会阻止您。

您需要更精确地列出要收集的内容。谷歌的“DNS工具”,你会找到像http://dnsstuff.com这样的东西,让你更接近获取这些信息。有时你必须去networkolutins.com这样的注册商那里获取信息。另外,查看unix whois命令和unix dig命令。