创建一个只访问我的网站的机器人

时间:2012-01-09 00:58:53

标签: bots

我自动拥有一个Wordpress网站,从RSS源获取一些信息,发布它,然后在内置的Wordpress功能的帮助下,为该帖子设置一个名称和值的自定义字段。问题是,当有人访问已发布的帖子时,此自定义字段才会设置。因此,我必须访问要应用的自定义字段的每个新帖子或等待访问者这样做。

我期待创建一个机器人,网络抓取工具或蜘蛛,只需在一小时内访问我的所有新网页或其他任何内容,以便在发布帖子时自动应用自定义字段。

有任何方法可以使用PHP或其他基于Web的语言创建它。我在Mac上,所以我不认为Visual Basic是一种解决方案,但我可以尝试安装它。

2 个答案:

答案 0 :(得分:9)

例如,您可以编写一个调用wget的shell脚本(或者如果您没有它,则可以改为调用curl -0)并安排它每小时运行一次,例如使用cron

它可以像下面的脚本一样简单:

#!/bin/sh
curl -0 mysite.com

假设它被称为visitor.sh并且设置为可执行,那么您可以通过键入crontab -e来安排它来编辑您的crontab。 Here是一个解释如何执行第二部分的链接。您基本上需要将此行添加到您的crontab:

0    *    *    *    *    /path/to/.../visitor.sh

(表示:每小时运行位于/path/to/.../visitor.sh的脚本。)

请注意,该脚本将从您的计算机运行,因此它只会在计算机运行时运行。

答案 1 :(得分:0)

crontab是一个很好的观点,您也可以使用curllynx来浏览网页。它们的重量非常轻。