Question

我使用urllib2下载网站的来源，但出了点问题。来源于此网站：http://www.starfm.com/ 我想要做的就是下载整个html，然后解析它提取＆＃34;正在播放＆＃34;来自网站的部分。

但是，当我使用此代码下载源代码时

response = urllib2.urlopen('http://www.starfm.com/')
html = response.read()
a = open("C:\\users\\Leonardo\\Desktop\\source.txt","w")
a.write(html)
a.close()

最终来源并未显示网站上的当前艺术家＆＃34;现在播放＆＃34;部分。

为什么呢？我该怎么办？

非常感谢。

-Leonardo

Answer 1

＆＃34;正在玩＃34;来自javascript，也许它会在onload（）事件中加载该信息，在这种情况下，您的代码只是在阅读内容。

也许这个问题可以帮到你

Get page generated with Javascript in Python

Python网站源码提取

1 个答案: