在BeautifulSoup
中,.text
和.get_text()
之间有什么区别吗?
获取元素的文本应该首选哪一个?
>>> from bs4 import BeautifulSoup
>>>
>>> html = "<div>text1 <span>text2</span><div>"
>>> soup = BeautifulSoup(html, "html.parser")
>>> div = soup.div
>>> div.text
'text1 text2'
>>> div.get_text()
'text1 text2'
答案 0 :(得分:18)
看起来像.text
is just a property that calls get_text
。因此,不带参数调用get_text
与.text
相同。但是,get_text
还可以支持各种关键字参数,以更改其行为方式(separator
,strip
,types
)。如果您需要更多控制结果,那么您需要功能表。