Python网站源码提取

时间:2014-03-30 20:46:35

标签: python html

我使用urllib2下载网站的来源,但出了点问题。 来源于此网站:http://www.starfm.com/ 我想要做的就是下载整个html,然后解析它提取"正在播放"来自网站的部分。

但是,当我使用此代码下载源代码时

response = urllib2.urlopen('http://www.starfm.com/')
html = response.read()
a = open("C:\\users\\Leonardo\\Desktop\\source.txt","w")
a.write(html)
a.close()

最终来源并未显示网站上的当前艺术家"现在播放"部分。

为什么呢? 我该怎么办?

非常感谢。

-Leonardo

1 个答案:

答案 0 :(得分:0)

"正在玩#34;来自javascript,也许它会在onload()事件中加载该信息,在这种情况下,您的代码只是在阅读内容。

也许这个问题可以帮到你

Get page generated with Javascript in Python