我用bs4提取了如下的html
<div class="a-section a-spacing-small" id="productDescription">
<!-- show up to 2 reviews by default -->
<p>Satin Smooth Universal Protective Wax Pot Collars by Satin Smooth</p>
</div>
要提取文本,我正在使用text.strip()
output.text()
它给了我输出"TypeError: 'str' object is not callable"
使用output.get_text()
和output.getText()
时,我得到了所需的文字
这3个有什么区别?为什么get_text()和getText()给出相同的输出?
答案 0 :(得分:2)
它们非常相似:
concat
是将标签文本作为字符串返回的函数.get_text
是调用.text
的属性(因此,它是相同的,除了不使用括号)get_text
是.getText
的别名我会尽可能使用get_text
,并在需要传递自定义参数(例如.text
)时使用.get_text(...)
。
答案 1 :(得分:0)
据我所知,这是非常基础的。
.text
只给你字符串形式的输出,而
getText()
使您可以将各种自定义参数应用于您想要的给定对象的字符串