我尝试使用BeautifulSoup
仅提取特定表单的输入字段。
使用以下内容提取表单:
soup.find('form')
现在我想提取所有仅为该表单的子项的输入字段。
我如何用BS做到这一点?
答案 0 :(得分:3)
正如评论中所述,链find
和find_all()
用于特定情境搜索:
form = soup.find('form')
inputs = form.find_all('input')
如果您只想要直接input
元素,请添加recursive=False
:
form.find_all('input', recursive=False)
或者,使用CSS selectors:
soup.select("form input")
并且,仅获得直接input
子元素:
soup.select("form > input")