从网页保存动态内容?

时间:2009-08-04 22:26:35

标签: php web-applications dynamic-content

是否可以从网站保存动态文本并将其转储到我服务器上的文件中?我感兴趣的具体案例是从此页面保存歌曲标题http://www.z1035.com/player.php 并将所有歌曲标题保存在我服务器上的文件中。这可能吗?我可以用什么方法来做这件事?

2 个答案:

答案 0 :(得分:5)

你所指的通常被称为'刮痧'。这是一篇关于PHP的一种方法的文章:

http://www.developertutorials.com/blog/php/easy-screen-scraping-in-php-simple-html-dom-library-simplehtmldom-398/

答案 1 :(得分:0)

在我看来,Python的URLLib库使得抓取变得非常简单。

import urllib, re

url = "http://www.z1035.com/player.php"
f = urllib.urlopen(url)
t = f.read()
#  use regular expression here 
m = re.search(t, "some pattern")
print m.group(1)

这将加载外部资源,就像它是本地文件一样,并允许您根据需要解析它。

曾几何时我想保存我收听的电台节目的所有列表。我使用Python下载了所有tracklist的列表,然后以编程方式访问每个列表并将内容附加到文件中。它非常方便,可能需要20行。