Question

我有这行python代码：

print(soup.find_all("tr")[1].find_all("td")[2])

它给了我这串HTML：

<td class="description" classname="description" data-track-string="ls_24_hour_ls_24_hour_toggle" headers="description" title="Some clouds. Low 27F. Winds SE at 5 to 10 mph."><span>Partly Cloudy</span></td>

现在，我只想打印设置为等于“标题”的文本。

例如，

在title =“ Some cloud。Low 27F。Wind SE at 5 to 10 mph。”中，我只是希望终端显示字符串“ Some cloud。Low 27F。Winds SE at 5 to 10 mph。”。

我将如何实现这一目标？

很抱歉，如果这是一个基本问题，但是我没有发现任何可以解决我的特定问题的信息。谢谢。

Answer 1

您可以使用简单的字符串操作。

a = '<td class="description" classname="description" data-track-string="ls_24_hour_ls_24_hour_toggle" headers="description" title="Some clouds. Low 27F. Winds SE at 5 to 10 mph."><span>Partly Cloudy</span></td>'
count = len("title=")
b = a.find("title=")
c = a.find('><span>')
d = a[b+count:c]
print (d)

或者您也可以使用regex。

如何从HTML中的此属性提取字符串？

1 个答案: