我想编写一个脚本来登录并与网页进行交互,并且有点不知道从哪里开始。我可能想出html解析,但我如何处理登录部分?我打算使用bash,因为这是我最熟悉的,但我愿意接受任何其他建议。我只是在寻找一些参考资料或链接来帮助我入门。我不确定密码是否存储在cookie或诸如此类的东西中,那么我如何评估这种情况呢?
谢谢,
丹
答案 0 :(得分:4)
看看cURL,它通常在Linux / Unix环境中可用,它允许您编写对网页的调用脚本,包括POST参数(比如用户名和密码),并让你管理cookie存储,以便后续调用(在网站中获取不同的页面)可以使用相同的cookie(因此您的登录将在调用中保持不变)。
答案 1 :(得分:2)
我前段时间做过类似的事情,我不得不在一个页面中登录并反复发布相同的数据......
看看here。我使用了wget,因为我没有使用curl。
答案 2 :(得分:1)
在此网站上搜索screen scraping。因为你需要处理cookies,javascript和隐藏字段(viewstate!),它会变得毛茸茸。通常,您需要抓取登录页面以获取隐藏字段,然后发布到登录页面。玩得开心:D