如何从HTML中的此属性提取字符串?

时间:2018-11-28 06:07:40

标签: python beautifulsoup

我有这行python代码:

print(soup.find_all("tr")[1].find_all("td")[2])

它给了我这串HTML:

<td class="description" classname="description" data-track-string="ls_24_hour_ls_24_hour_toggle" headers="description" title="Some clouds. Low 27F. Winds SE at 5 to 10 mph."><span>Partly Cloudy</span></td>

现在,我只想打印设置为等于“标题”的文本。

例如,

在title =“ Some cloud。Low 27F。Wind SE at 5 to 10 mph。”中,我只是希望终端显示字符串“ Some cloud。Low 27F。Winds SE at 5 to 10 mph。”。

我将如何实现这一目标?

很抱歉,如果这是一个基本问题,但是我没有发现任何可以解决我的特定问题的信息。谢谢。

1 个答案:

答案 0 :(得分:0)

您可以使用简单的字符串操作。

a = '<td class="description" classname="description" data-track-string="ls_24_hour_ls_24_hour_toggle" headers="description" title="Some clouds. Low 27F. Winds SE at 5 to 10 mph."><span>Partly Cloudy</span></td>'
count = len("title=")
b = a.find("title=")
c = a.find('><span>')
d = a[b+count:c]
print (d)

或者您也可以使用regex