网页抓取 - 如何阅读基于swf的网站内容

时间:2012-05-17 19:35:32

标签: c# web-scraping

要阅读html网站的内容,请使用WebClient:

WebClient client = new WebClient();
byte[] html      = client.DownloadData(url);
UTF8Encoding utf = new UTF8Encoding();
return utf.GetString(html);

网站如www.bet365.com时的问题。赔率显示在swf中。我怎样才能读取赔率? 我无法通过Ctrl + U或Firebug在Mozilla中显示网站的内容。在IE(F12)检查工作。

由于

2 个答案:

答案 0 :(得分:1)

据我所知,你无法抓取Flash内容。

然而,您可以尝试使用代理工具(例如FiddlerWireshark来嗅探.swf发起的HTTP流量,并祈祷它未加密。

通过分析这些HTTP请求,您将能够提取检索数据的请求并使用WebClientHttpWebRequest自动执行这些请求。

在自动化数据提取之前,请确保允许这样做,并且您没有违反任何网站条款和条件。

答案 1 :(得分:0)

他们有一个xml Feed,他们发给联盟会员,没有人在刮他们的实际网站