使用YQL和XPath从HTML获取数据

时间:2011-06-29 17:26:28

标签: html xpath yql

我一直在玩YQL试图更好地理解它,因为它似乎是一个非常整洁的服务,但我不得不承认我是新手,当它来了。我已经完成了一些教程和示例,并在一定程度上理解它。我接下来要做的是尝试从网站上提取统计数据,以显示潜在团队网站上的联盟统计数据,看看它是否有效。

我的YQL查询

select * from html
where url="http://www.nwjhl.com/leagues/standingsTotals.cfm?leagueID=15654&clientID=4594"

返回了一些结果,但显然我不需要全部内容,我只是想拉动积分榜。我已经设法在本地页面上显示结果但是当我尝试将结果缩小到团队排名时,我得不到树中返回的结果。我假设它与我的xpath

有关
select * from html
where url="http://www.nwjhl.com/leagues/standingsTotals.cfm?leagueID=15654&clientID=4594"
and xpath="/html/body/table/tbody/tr[3]/td/table/tbody/tr/td[2]/table/tbody/tr[2]"

成为新人我不知道这是否可能,只是想知道是否有人可以引导我走上正确的轨道或知道这个案例的好教程。

1 个答案:

答案 0 :(得分:1)

这应该是你想要的:

SELECT * FROM html 
WHERE url="http://www.nwjhl.com/leagues/standingsTotals.cfm?leagueID=15654&clientID=4594" 
AND xpath="//tr[@class='boxscores_tables1'] | //tr[@class='boxscores_tables2']"