C#如何从asp + javascript网站中提取数据

时间:2010-01-05 19:47:18

标签: c# javascript parsing

我想创建C#程序,它将从站点中提取一些数据。 这个网站是博彩公司:bet365.com/home/,我需要得到:

  1. 特定市场名称+赔率(例如:足球 - 巴克莱英超联赛 - 斯托克对富勒姆 - 2.75 | 3.20 | 2.62)
  2. 另一个市场+赔率(例如:赛马 - 林菲尔德 - 12:30 - 3.2 | 4.3 | 5.2 | 6.7 | 8.62 | ..)
  3. 还有不同格式的赔率(十进制,小数,美国)我需要选择十进制
  4. 但是当我打开这个网站作为文本文件时 - 没有所有数据 - 所以我不能用HTML解析器解析它。我需要一个建议 - 从这种网页中提取数据的最佳方法是什么?

2 个答案:

答案 0 :(得分:0)

您要做的是Scraping(或网页抓取)。

你必须做一些阅读才能学习各种方法。肯定没有一种简单的方法可以做到这一点。

我还冒昧地猜测一个博彩网站已采取措施阻止你这样做。

答案 1 :(得分:0)

数据很可能是通过AJAX加载的。这意味着您加载的HTML页面主要包含静态内容。显示HTML后,数据将从另一个URL加载。您可以使用Firebug来分析正在加载的数据。

一旦掌握了URL,您现在可以抓取您所追踪的数据的URL。刮擦通常会拉入原始文本并使用正则表达式。