如何判断页面是否为登录页面?

时间:2011-03-29 01:43:07

标签: php curl

我正在编写一个PHP脚本,使用cURL搜索和读取html内容。

我想从内容和/或响应标题中确定目标页面是否需要登录才能访问。

我理解通常,在匿名请求页面时,如果需要,服务器将重定向到登录页面。如果我错了,请纠正我。

我已经阅读并得到了一些想法:

  1. 搜索refresh元标记或当http返回代码为302时,检查它是否引用了&action=login(或类似)的URI
  2. 在有效页面的正文中搜索登录表单。 (我知道在同一页面上可能有内容和登录表单)
  3. 这些方法是否有效以及这些方法的准确性如何?我可以使用哪些其他技巧/标志来识别/建议登录页面?或者这是一项不可能完成的目标,以达到60-70%的准确度?

    注意:我不是在试图查找是否是需要登录的页面。

    以下是相关选项,仅供参考。

    curl_setopt($ch, CURLOPT_HEADER, 1);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
    curl_setopt($ch, CURLOPT_MAXREDIRS, 5);
    

    提前谢谢

1 个答案:

答案 0 :(得分:2)

在重定向目标网页上查找带有<input type='password'

的表单