使用beautifulsoup提取HTML属性值列表

时间:2016-02-16 15:06:30

标签: python html list python-3.x beautifulsoup

给定一个包含元素列表的页面,例如<input>个元素,所有元素都有一个共同的类,例如category-checkbox,如何使用beautifulsoup将所有这些元素的值提取到列表中? E.g:

<input type="checkbox" class="category-checkbox" value="apples" />
<input type="checkbox" class="category-checkbox" value="pears" />
<input type="checkbox" class="category-checkbox" value="oranges" />

1 个答案:

答案 0 :(得分:1)

我最终将元素映射到新列表:

# assume the html variable is a beautifulsoup object
input_values = [
    element.get('value') for element in
    html.findAll('input', {"class": "category-checkbox"})
]
# category_input_values is now [ 'apples', 'pears', 'oranges' ]