我需要自动执行登录:http://gsc.klub-modul.dk/。登录后,我需要能够从该域获取页面,这需要我登录。据我所知,该站点使用ASP.NET与服务器进行交互。我对所有建议持开放态度。我正在寻找一个脚本来做这件事,因为我还是新手。
答案 0 :(得分:2)
您要做的是僵尸(自动访问网站或在线游戏),请按照以下步骤操作,
使用这些图书馆Mecanize / twill / scrapy / Beautiful Soup
http://docs.python-guide.org/en/latest/scenarios/scrape/
http://www.pythonforbeginners.com/python-on-the-web/web-scraping-with-beautifulsoup/
http://arunrocks.com/easy-practical-web-scraping-in-python/
https://classic.scraperwiki.com/docs/python/python_intro_tutorial/
Scraping sites that require login with Python
Scrape a web page that requires they give you a session cookie first
Fake a cookie to scrape a site in python
Python Scraping Web with Session Cookie
我认为如果您之前没有制作过Web抓取工具(web-bot或bot-tool),那么您应该从诸如从不需要登录的页面获取特定信息等小事做起,然后转到更多复杂情景
答案 1 :(得分:2)
像往常一样,Asp.Net使用cookie进行会话,授权需求。所以基本上你只需要使用Login,Password参数向登录页面发出POST请求,然后你需要从响应中获取cookie,然后用这些cookie对所需页面发出新请求。
默认情况下,这些cookie名为ASP.NET_SessionId和ASPXAUTH
答案 2 :(得分:0)
我已经研究过类似的问题,但使用的是通用方法。我使用greasemonkey addon in firefox登录游戏并将数据保存在不同的数据库中。后来我发现自己可以自己写一个插件(mozilla ref)
这两种技术都只依赖于javascript。(example of a login script of fb in greasemonkey)
该网站也在asp.net上!您只需要接收cookie并从javascript代码登录。 Jsoup是解析数据和登录的另一种方法。