我正在喝美味的汤。 我有一个html字符串:
<div><b>ignore this</b>get this</div>
如何检索&#34;得到此&#34;,而忽略&#34; 忽略此&#34;
由于
答案 0 :(得分:8)
您可以获取div
文本,而不是以递归方式检索子文本:
>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('<div><b>ignore this</b>get this</div>')
>>> soup.div.find(text=True, recursive=False)
u'get this'
这与儿童的文本位置无关:
>>> soup = BeautifulSoup('<div>get this<b>ignore this</b></div>')
>>> soup.div.find(text=True, recursive=False)
u'get this'