perl网络教程

时间:2011-05-17 21:47:34

标签: perl web-applications

到目前为止,我一直在使用wget和curl来进行屏幕抓取。现在我想切换到perl。什么是一个很好的教程,将涵盖perl中的基本Web编程(最好不重述基础知识)?我说的是基本的东西,比如获取和解析页面,提交表单,代理等等。

3 个答案:

答案 0 :(得分:2)

我过去曾使用WWW-Mechanize来实现基本的网页抓取功能,包括表单提交等。

有一些非常好的examples

答案 1 :(得分:1)

答案 2 :(得分:0)

除了Perl之外你需要的工具:

  1. HTTP Live Headers (Firefox扩展程序)或eqv。将Javascript请求反向设计为原始GET / POST,以便您可以使用Mechanize或LWP等模仿它。
  2. 正如其他海报所提到的,一个好的无头浏览器是WWW::Mechanize模块。
  3. 我建议花点时间学习HTML::TreeBuilder&特别是HTML::TreeBuilder::XPathHTML::Query。当你想要从HTML文档中获取实际数据时,最后两个将变得非常方便。
  4. HTML::TableExtract也是一个很好的模块,可以在需要时从HTML表中提取数据。
  5. 基本上,使用上述所有内容将使您能够抓取大多数网站。

    玩得开心( - :