从网站上删除所有名称

时间:2016-12-13 02:28:23

标签: python html

我目前正在尝试从特定网站中查找所有名称。我按照python-guide.org上的指南取得了一些进展。我能够从某个站点获取大量信息,但不是我所追踪的信息。到目前为止,这是我的代码:

from lxml import html
import requests

page =     requests.get('http://www.behindthename.com/names/gender/feminine/usage/african')
tree = html.fromstring(page.content)


#This will create a list of buyers:
Names = tree.xpath('//div[@class="browsename"]/text()')

print 'Names: ', Names

不幸的是,这会返回大量信息,但不会返回名称列表。我不确定我做错了什么,但我确定它与@ class =“bowsername”有关。我对HTML不是很熟悉。

1 个答案:

答案 0 :(得分:0)

也许,你应该使用:

//div[@class="browsename"]/b/a/text()

在chrome中,您可以使用F12检查元素,然后使用CTRL + F,并输入您的xpath。 Chrome会向您显示您选择的元素。