Python中的Python过滤URL

时间:2014-06-27 15:32:07

标签: python web-scraping python-requests

你会猜到的:我很新:)目前正在学习python并且进展顺利。经过一些理论(learnpythonthehardway.com)和大量的谷歌搜索和阅读,我试图用我的第一个真实世界脚本进入主题。任务是从Web读取一些值,在这种情况下使用Login表单进行保护。我已设法请求发布登录数据。

现在问题是这个登录在JS重定向发生之前似乎没有效果。第一个站点的响应包含一些以

开头的html
<script>document.href='/file.php?...stuff...'</script>

我试图搜索正则表达式替换或其他东西,但无法找到一种聪明的方法来过滤掉那里的路径/ url部分。如果我有,我将手动获取此页面,看看它是否有效,会话后仍然存在。

由于此HTML / JS过滤在以后获取我的内容非常重要,这是我真正喜欢做的一部分,但我已经陷入困境。

希望你能帮忙!

谢谢, 弗兰克

0 个答案:

没有答案