我有这行python代码:
print(soup.find_all("tr")[1].find_all("td")[2])
它给了我这串HTML:
<td class="description" classname="description" data-track-string="ls_24_hour_ls_24_hour_toggle" headers="description" title="Some clouds. Low 27F. Winds SE at 5 to 10 mph."><span>Partly Cloudy</span></td>
现在,我只想打印设置为等于“标题”的文本。
例如,
在title =“ Some cloud。Low 27F。Wind SE at 5 to 10 mph。”中,我只是希望终端显示字符串“ Some cloud。Low 27F。Winds SE at 5 to 10 mph。”。
我将如何实现这一目标?
很抱歉,如果这是一个基本问题,但是我没有发现任何可以解决我的特定问题的信息。谢谢。
答案 0 :(得分:0)
您可以使用简单的字符串操作。
a = '<td class="description" classname="description" data-track-string="ls_24_hour_ls_24_hour_toggle" headers="description" title="Some clouds. Low 27F. Winds SE at 5 to 10 mph."><span>Partly Cloudy</span></td>'
count = len("title=")
b = a.find("title=")
c = a.find('><span>')
d = a[b+count:c]
print (d)
或者您也可以使用regex
。