getText()vs text()vs get_text()

时间:2018-08-30 09:41:31

标签: python python-3.x beautifulsoup

我用bs4提取了如下的html

<div class="a-section a-spacing-small" id="productDescription">
<!-- show up to 2 reviews by default -->
<p>Satin Smooth Universal Protective Wax Pot Collars by Satin Smooth</p>
</div>

要提取文本,我正在使用text.strip()

output.text()

它给了我输出"TypeError: 'str' object is not callable"

使用output.get_text()output.getText()时,我得到了所需的文字

这3个有什么区别?为什么get_text()和getText()给出相同的输出?

2 个答案:

答案 0 :(得分:2)

它们非常相似:

  • concat是将标签文本作为字符串返回的函数
  • .get_text是调用.text的属性(因此,它是相同的,除了不使用括号)
  • get_text.getText的别名

我会尽可能使用get_text,并在需要传递自定义参数(例如.text)时使用.get_text(...)

答案 1 :(得分:0)

据我所知,这是非常基础的。

.text 只给你字符串形式的输出,而 getText() 使您可以将各种自定义参数应用于您想要的给定对象的字符串