例如,从下一页我想提取团队名称
http://www.scoresandodds.com/grid_20150409.html
我试过了:
from lxml import html
import requests
pageNBA = requests.get('http://www.scoresandodds.com/grid_20150409.html')
treeNBA = html.fromstring(pageNBA.text)
team = treeNBA.xpath('//a[@href="/statfeed/statfeed.php?page=nba/nbateam&teamid=CHICAGO&season="]/text()')
我认为我的问题出在我定义位置的团队线上,我该如何找到一个href。
答案 0 :(得分:0)
你可以使用xpath如下:
//td[@class='name']/a