Beautiful Soup返回包含在<div>标签中的元素。如何剥离它们?</div>

时间:2014-09-23 19:40:58

标签: python beautifulsoup

我正在尝试解析此网页中的信息:http://bigcharts.marketwatch.com/quickchart/quickchart.asp?symb=AAPL

python代码

list = [td.find('div') for td in soup1.find_all('td')]

返回20个项目。例如

print list[10]

返回

<div>100.60</div>

如何才能让美丽的汤回归“100.60”。或者,我怎么能剥离标签?

1 个答案:

答案 0 :(得分:3)

您可以使用text.text方法获取代码中的.string。在你的情况下,两者都有效。 .text将返回unicode字符串,.string将返回NavigableString个对象。

print list[10].text

,或者

print list[10].string

同时检查difference between .text and .string

您也可以使用strip方法为string对象剥离它们。等,

list[10].text.strip()