如何从html中删除此特定元素?

时间:2017-03-13 11:23:16

标签: html xpath

<a href="javascript:void(0)" style="color : #346fda;" data-toggle="tooltip" data-placement="top" title="" data-original-title="DOB - 23-10-1940">
                                        76 years old</a>

我正在尝试使用Python 3.5从上面的html代码中删除“DOB - 23-10-1940”。使用时:

//td/a[@href]/text()'

它只返回“76岁”

我不知道如何在我的脚本中调用它。有人可以帮忙吗?

编辑:为了完整性,我用来从html中提取数据,这对其他元素很有效:

for url in list_of_urls:
    responses = requests.get(url)
    html_tree = html.fromstring(responses.content)
    d_o_b = html_tree.xpath('//a[contains(@data-original-title, "DOB - 23-10-1940")]')

2 个答案:

答案 0 :(得分:0)

//td/a[@href]/@data-original-title

这是一个属性,使用@来访问它。

答案 1 :(得分:0)

//a[contains(@data-original-title,"DOB - 23-10-1940")]

我认为有更美观的解决方案,但它应该有效

UP:

from grab import Grab
g = Grab()
g.go('https://www.futbin.com/17/player/50')

for elem in g.doc.select('//*[@id="info_content"]/table/tr'):
    print(elem.select('td').text())

结果:

Iniesta
FC Barcelona
Spain
LaLiga Santander
4
4
Right
171cm | 5'7"
68
Normal
Med
High
2016-09-21
N\A
32 years old