Python / Xpath - 如何刮取href字段

时间:2016-02-13 18:28:14

标签: python lxml scrape scraper

例如,从下一页我想提取团队名称

http://www.scoresandodds.com/grid_20150409.html

我试过了:

from lxml import html
import requests

pageNBA = requests.get('http://www.scoresandodds.com/grid_20150409.html')
treeNBA = html.fromstring(pageNBA.text)
team = treeNBA.xpath('//a[@href="/statfeed/statfeed.php?page=nba/nbateam&teamid=CHICAGO&season="]/text()')

我认为我的问题出在我定义位置的团队线上,我该如何找到一个href。

1 个答案:

答案 0 :(得分:0)

你可以使用xpath如下:

XPath选择器表达式

//td[@class='name']/a