我想要做的就是制作一个刮刀,并且有一个登录页面,我填写下一页所需的三个值中的两个
刮刀需要用户名,密码,然后是令牌,
我自动填充用户名和密码,并将html响应缩小到python中的一个输入标记。
标签代码为:
<input type="hidden" name="licence[_csrf_token]" value="SOME RANDOM CHECKSUM" id="licence__csrf_token" />
有没有办法得到这个以及校验和是动态的,因为它改变了长度。
答案 0 :(得分:0)
BeautifulSoup是解析任意HTML的一种好方法:
from bs4 import BeautifulSoup
html_doc = '''<input type="hidden"
name="licence[_csrf_token]"
value="SOME RANDOM CHECKSUM"
id="licence__csrf_token" />'''
soup = BeautifulSoup(html_doc)
print soup.input['value']