这很奇怪,在某些页面上它会返回HTML,其他页面会在返回的字符串的开头和结尾添加数字($out
)。
function lookupPage($page, $return = true) {
$fp = fsockopen("127.0.0.1", 48580, $errno, $errstr, 5);
if (!$fp) {
return false;
}
else {
$out = "";
$headers = "GET /" . $page . " HTTP/1.1\r\n";
$headers .= "Host: www.site.com\r\n";
$headers .= "Connection: Close\r\n\r\n";
fwrite($fp, $headers);
stream_set_timeout($fp, 300);
$info = stream_get_meta_data($fp);
while (!feof($fp) && !$info['timed_out'] && ($line = stream_get_line($fp, 1024)) !== false) {
$info = stream_get_meta_data($fp);
if ($return) $out .= $line;
}
fclose($fp);
if (!$info['timed_out']) {
if ($return) {
$out = substr($out, strpos($out, "\r\n\r\n") + 4);
return $out;
}
else {
return true;
}
}
else {
return false;
}
}
}
... e.g
3565
<html>
<head>
...
</html>
0
答案 0 :(得分:2)
它是HTTP 1.1协议的一部分,您将以HTTP 1.0方式对其进行解码。您可以检查值并根据需要修剪它们。它们只显示响应的长度,因此浏览器知道它有完整的响应。
也可以查看file_get_contents
答案 1 :(得分:0)
我的猜测是服务器响应分块数据。