from bs4 import BeautifulSoup
soup = BeautifulSoup( '''<SELECT>
<option value="1">ONE</option>
<option value="2" selected>TWO</option>
<option value="3">THREE</option>
<option value="4">FOUR</option>
<option value="5">FIVE</option>
</SELECT>''' )
print( soup.findAll('option', selected=True) )
输出结果为:
[]
我想在上面的例子中获取所选选项的字符串。但是如果“选择”没有分配给任何东西,我就无法得到正确的选项,它不一定必须设置为True。
from bs4 import BeautifulSoup
soup = BeautifulSoup( '''<SELECT>
<option value="1">ONE</option>
<option value="2" selected=''>TWO</option>
<option value="3">THREE</option>
<option value="4">FOUR</option>
<option value="5">FIVE</option>
</SELECT>''' )
print( soup.findAll('option', selected=True) )
输出结果为:
[<option selected="" value="2">TWO</option>]
由于我只是在阅读html文件,因此我无法控制该部分。有办法解决吗?我正在使用BeahutifulSoup 4.1.3和python 3.3.0