简单的PHP Web爬虫,用于提交表单并存储返回的结果

时间:2013-03-14 16:37:58

标签: php web-crawler

对于我正在开发的系统,我需要以编程方式转到特定页面。在表单中填写一个字段(我知道输入元素的id和名称),提交并存储结果。

我见过几个不同的Perl,python和java类。不过我想用PHP做这件事,还没找到任何东西。

我确实有权从网站上获取信息。

感谢任何帮助

3 个答案:

答案 0 :(得分:1)

看看David Walsh的简单解释。

http://davidwalsh.name/curl-post

您可以轻松地将响应(在此示例中为$ result)存储在数据库或日志文件中。

答案 1 :(得分:1)

通常PHP抓取工具/抓取工具使用CURL - http://php.net/manual/en/book.curl.php。 它允许您从运行PHP的服务器进行查询,并从您需要爬网的网站获取响应。它以纯文本格式返回响应数据,解析它取决于您。您可以手动检查表单在手动执行时提交的内容,并通过curl执行相同的操作。

答案 2 :(得分:0)

您也可以尝试phpcrawl(http://phpcrawl.cuab.de),似乎满足您的所有需求。 (参见“addPostData()” - 方法)