我正在尝试获取http://betsbc.com的内容。
但是没有什么能做到这一点:cURL,wget,file_get_contents
,Ruby的file.open
,python的urllib2.urlopen
。没有。
但我可以成功地从浏览器中打开它。
我曾在Cloud9和我的托管中尝试过。
我做错了什么?
提前致谢
答案 0 :(得分:0)
Curl似乎对我有用。
它返回一个几乎没有内容的html页面结构,所以我猜它都是在javascript中生成的。
您可能会遇到一些连接限制,无法访问该网站。
在这里您可以看到返回的内容:pastebin.com/8JYpe9B1
$ curl http://betsbc.com
<html><head><title>BetCity - ▒▒▒▒▒▒▒▒▒▒▒▒ ▒▒▒▒▒▒▒▒</title>
<meta name="keywords" content="betcity,▒▒▒▒▒▒▒,▒▒▒▒▒▒▒▒▒▒▒▒,▒▒▒▒▒▒▒▒,▒▒,▒▒▒▒▒▒▒▒▒▒▒▒ ▒▒▒▒▒▒▒▒,▒▒▒▒▒▒▒▒▒▒▒▒ ▒▒▒▒▒▒▒,▒▒▒▒▒▒,▒▒▒▒▒,▒▒▒▒▒▒▒▒▒▒,live ▒▒▒▒▒▒▒▒▒▒,live ▒▒▒▒▒▒,▒▒▒▒▒▒▒▒▒,▒▒▒▒▒▒,▒▒▒▒▒▒,▒▒▒▒▒▒,on-line,sports,soccer,hockey,basketball,tennis">
<meta name="page-topic" content="sports"><meta name="description" content="Betcity - ▒▒▒▒▒▒▒▒▒▒▒▒ ▒▒▒▒▒▒▒▒. ▒▒▒▒▒ ▒▒▒▒▒▒ ▒▒ ▒▒▒▒▒▒▒▒▒▒ ▒▒▒▒▒▒▒.">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<script type="text/javascript">
var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www.");
document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E"));
</script>
<script type="text/javascript">
try {
var pageTracker = _gat._getTracker("UA-120364-2");
pageTracker._trackPageview();
} catch(err) {}</script>
</head>
<frameset rows="111,*,38" border="0">
<frame name="btop" src="top.php" marginwidth="0" marginheight="0" scrolling="no" frameborder="0" noresize>
<frame name="center" src="center.php" marginwidth="0" marginheight="0" scrolling="no" frameborder="0" noresize>
<frame name="bottom" src="bottom.php" marginwidth="0" marginheight="0" scrolling="no" frameborder="0" noresize>
</frameset></html>