使用BeautifulSoup获取所选选项

时间:2013-04-05 14:08:53

标签: python html beautifulsoup option selected

from bs4 import BeautifulSoup
soup = BeautifulSoup( '''<SELECT>
<option value="1">ONE</option>
<option value="2" selected>TWO</option>
<option value="3">THREE</option>
<option value="4">FOUR</option>
<option value="5">FIVE</option>
</SELECT>''' )

print( soup.findAll('option', selected=True) )

输出结果为:

[]

我想在上面的例子中获取所选选项的字符串。但是如果“选择”没有分配给任何东西,我就无法得到正确的选项,它不一定必须设置为True。

from bs4 import BeautifulSoup

soup = BeautifulSoup( '''<SELECT>
<option value="1">ONE</option>
<option value="2" selected=''>TWO</option>
<option value="3">THREE</option>
<option value="4">FOUR</option>
<option value="5">FIVE</option>
</SELECT>''' )

print( soup.findAll('option', selected=True) )

输出结果为:

[<option selected="" value="2">TWO</option>]

由于我只是在阅读html文件,因此我无法控制该部分。有办法解决吗?我正在使用BeahutifulSoup 4.1.3和python 3.3.0

0 个答案:

没有答案