Python解析单行XML

时间:2015-05-26 13:39:35

标签: python html xml scraper

我想要做的就是制作一个刮刀,并且有一个登录页面,我填写下一页所需的三个值中的两个

刮刀需要用户名,密码,然后是令牌,

我自动填充用户名和密码,并将html响应缩小到python中的一个输入标记。

标签代码为:

<input type="hidden" name="licence[_csrf_token]" value="SOME RANDOM CHECKSUM" id="licence__csrf_token" />

有没有办法得到这个以及校验和是动态的,因为它改变了长度。

1 个答案:

答案 0 :(得分:0)

BeautifulSoup是解析任意HTML的一种好方法:

from bs4 import BeautifulSoup

html_doc = '''<input type="hidden" 
                     name="licence[_csrf_token]" 
                     value="SOME RANDOM CHECKSUM"
                     id="licence__csrf_token" />'''

soup = BeautifulSoup(html_doc)
print soup.input['value']