如何通过PHP获取网站信息。
不使用
file_get_contents
有没有其他方法可以获取网站信息。
示例网址:http://www.quarkbase.com/google.com
在此页面中,您将获得有关GOOGLE页面的完整信息。像这样如果我输入网站的任何网址,我需要获取有关该网站的更多信息。
我希望查询非常明确。
如果您对查询有任何疑问,请与我们联系
先谢谢
FERO
答案 0 :(得分:1)
查看curl函数。
php.net有basic example。
答案 1 :(得分:1)
您可能想要查看从C。
移植的f *()函数它们允许更精细的流操作。
一些好的提示here。
$handle = fopen( "http://www.quarkbase.com/google.com/", "r", false, $context );
$text = '';
while ( !feof( $handle ) )
$text .= fread( $handle, 8192 );
fclose( $handle );
答案 2 :(得分:0)
cURL无法解决他的问题。它可以帮助他截取网站的截图,但是他们关于URL的信息来自众多来源。交通信息来自Alexa,他们从相关网站获取社交网络统计信息,以及有关运营网站的公司的任何信息,这些信息来自单独的数据库,或者他们让员工输入有关他们索引的较大网站的信息。
仅通过阅读页面来源无法识别该类型的信息。他们使用大量算法搜索页面内容的模式,他们使用Alexa的API获取其使用数据,他们使用社交网络服务的API从中挖掘数据等。
这绝对不是一件容易的事......
答案 3 :(得分:0)
那么......网站信息,您指的是注册商和域名信息?比如通过dnsstuff.com或其他拥有该域名的公司的元信息。
自动抓取许多这类数据可能会非常棘手。您不仅需要从一些地方获取该信息,而且如果他们发现您不遵守他们的robots.txt,许多地方都会阻止您。
您需要更精确地列出要收集的内容。谷歌的“DNS工具”,你会找到像http://dnsstuff.com这样的东西,让你更接近获取这些信息。有时你必须去networkolutins.com这样的注册商那里获取信息。另外,查看unix whois命令和unix dig命令。