我正在尝试解析此网页中的信息:http://bigcharts.marketwatch.com/quickchart/quickchart.asp?symb=AAPL
python代码
list = [td.find('div') for td in soup1.find_all('td')]
返回20个项目。例如
print list[10]
返回
<div>100.60</div>
如何才能让美丽的汤回归“100.60”。或者,我怎么能剥离标签?
答案 0 :(得分:3)
您可以使用text
或.text
方法获取代码中的.string
。在你的情况下,两者都有效。 .text
将返回unicode
字符串,.string
将返回NavigableString
个对象。
print list[10].text
,或者
print list[10].string
同时检查difference between .text
and .string
。
您也可以使用strip
方法为string
对象剥离它们。等,
list[10].text.strip()