我正在编写一个PHP脚本,使用cURL搜索和读取html内容。
我想从内容和/或响应标题中确定目标页面是否需要登录才能访问。
我理解通常,在匿名请求页面时,如果需要,服务器将重定向到登录页面。如果我错了,请纠正我。
我已经阅读并得到了一些想法:
refresh
元标记或当http返回代码为302时,检查它是否引用了&action=login
(或类似)的URI 这些方法是否有效以及这些方法的准确性如何?我可以使用哪些其他技巧/标志来识别/建议登录页面?或者这是一项不可能完成的目标,以达到60-70%的准确度?
注意:我不是在试图查找是否是需要登录的页面。
以下是相关选项,仅供参考。
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_MAXREDIRS, 5);
提前谢谢
答案 0 :(得分:2)
在重定向目标网页上查找带有<input type='password'