我使用Perl作为此作业的唯一语言
我的目标:
创建一个将创建Web spider / bot的Perl脚本。 我的脚本将从互联网上下载一个网页,搜索并提取元标记, 然后在MySQL数据库中索引它们。
我的数据库可以通过网络界面通过元标记字段或URL进行搜索。
我的脚本还将显示完整的数据库,其中包括一个列出数据库中记录数的特殊字段。
所以我的问题是:
如何为从网上下载网页并提取元标记的网络蜘蛛创建脚本?
我可以阅读哪些资源来帮助我创建此脚本或任何脚本?
感谢您的时间!
答案 0 :(得分:3)
你的教授。假设您具有Perl的一些知识并且还使用CPAN模块。如果您不了解CPAN,请启动here。一旦熟悉了如何从CPAN安装和使用模块,请安装其中一个模块,然后开始编写代码。
“我如何创建脚本”太笼统了。如果您不熟悉Perl,请尝试Impatient Perl或来自Perl.org或各种tutorial sites的任何其他资源。