需要帮助在Perl中创建Web spider / bot脚本

时间:2012-08-09 21:33:23

标签: perl scripting web-crawler

我使用Perl作为此作业的唯一语言

我的目标:

创建一个将创建Web spider / bot的Perl脚本。 我的脚本将从互联网上下载一个网页,搜索并提取元标记, 然后在MySQL数据库中索引它们。

我的数据库可以通过网络界面通过元标记字段或URL进行搜索。

我的脚本还将显示完整的数据库,其中包括一个列出数据库中记录数的特殊字段。

所以我的问题是:

如何为从网上下载网页并提取元标记的网络蜘蛛创建脚本?

我可以阅读哪些资源来帮助我创建此脚本或任何脚本?

感谢您的时间!

1 个答案:

答案 0 :(得分:3)

你的教授。假设您具有Perl的一些知识并且还使用CPAN模块。如果您不了解CPAN,请启动here。一旦熟悉了如何从CPAN安装和使用模块,请安装其中一个模块,然后开始编写代码。

“我如何创建脚本”太笼统了。如果您不熟悉Perl,请尝试Impatient Perl或来自Perl.org或各种tutorial sites的任何其他资源。