Question

例如，从下一页我想提取团队名称

http://www.scoresandodds.com/grid_20150409.html

我试过了：

from lxml import html
import requests

pageNBA = requests.get('http://www.scoresandodds.com/grid_20150409.html')
treeNBA = html.fromstring(pageNBA.text)
team = treeNBA.xpath('//a[@href="/statfeed/statfeed.php?page=nba/nbateam&amp;teamid=CHICAGO&amp;season="]/text()')

我认为我的问题出在我定义位置的团队线上，我该如何找到一个href。

Answer 1

你可以使用xpath如下：

XPath选择器表达式

//td[@class='name']/a

Python / Xpath - 如何刮取href字段

1 个答案:

XPath选择器表达式