简单的Web爬虫(例程)

时间:2013-11-22 18:25:31

标签: web-crawler

我是初学程序员,我正在尝试根据公共网站每天显示的公共信息创建一个数据库(一个50行和5列的小表)。 我的意思是每天进入这个网站4次,并存储一个显示在本网站的表格。我需要一些帮助/提示以下几点,我认为我应该攻击以构建这个数据库:

1)我应该使用哪种编程语言?

2)我应该在哪里存储程序?

3)它将存储数据的位置?

4)该计划应如何运作? [这里有两个问题:i)如何进入网站并存储数据; ii)每天如何做,每天4次,特定时间]

任何关于这些问题的提示都会很棒。 感谢

2 个答案:

答案 0 :(得分:4)

您可以将脚本发布为网络应用,并允许用户在必要时查看结果。

答案 1 :(得分:-2)

如果你问我应该用什么语言,你必须真正开始编程。我会回答一个问题:你知道哪种语言?

在我看来,最简单的方法是使用小型php脚本,将文件或数据库中的信息作为cron作业每天运行4次。