使用Python刮取* .aspx内容

时间:2010-04-29 23:34:53

标签: asp.net python web-scraping

我在ASPX中抓取动态生成的表时遇到了困难。试图从像GasPrices这样的网站上榨取汽油价格。我可以提取天然气价格表中的所有信息(地址,提交的时间等),实际天然气价格除外。

有没有办法可以降低汽油价格?即以某种方式获得它的文本表示。我对ASP / ASPX并不是很熟悉 - 但是现在生成的内容并没有出现在最终的HTML中。我正在使用Python进行抓取,但除非有特定的库,否则这无关紧要......

提前致谢。

1 个答案:

答案 0 :(得分:4)

页面的来源(aspx)不是问题。

看起来他们正在积极尝试阻止抓手。这些数字不是字体,而是几个div元素彼此相邻而background images是数字。 他们真的不想被刮掉。

(当然,如果你真的认定你可能会把div的类名映射到......他们的'加密'不是很好')

请注意链接页面底部的版权声明