<a href="javascript:void(0)" style="color : #346fda;" data-toggle="tooltip" data-placement="top" title="" data-original-title="DOB - 23-10-1940">
76 years old</a>
我正在尝试使用Python 3.5从上面的html代码中删除“DOB - 23-10-1940”。使用时:
//td/a[@href]/text()'
它只返回“76岁”
我不知道如何在我的脚本中调用它。有人可以帮忙吗?
编辑:为了完整性,我用来从html中提取数据,这对其他元素很有效:
for url in list_of_urls:
responses = requests.get(url)
html_tree = html.fromstring(responses.content)
d_o_b = html_tree.xpath('//a[contains(@data-original-title, "DOB - 23-10-1940")]')
答案 0 :(得分:0)
//td/a[@href]/@data-original-title
这是一个属性,使用@
来访问它。
答案 1 :(得分:0)
//a[contains(@data-original-title,"DOB - 23-10-1940")]
我认为有更美观的解决方案,但它应该有效
UP:
from grab import Grab
g = Grab()
g.go('https://www.futbin.com/17/player/50')
for elem in g.doc.select('//*[@id="info_content"]/table/tr'):
print(elem.select('td').text())
结果:
Iniesta
FC Barcelona
Spain
LaLiga Santander
4
4
Right
171cm | 5'7"
68
Normal
Med
High
2016-09-21
N\A
32 years old