来自Yahoo Pipes Feed的YQL XPath

时间:2012-01-01 02:05:02

标签: loops xpath web-scraping yql yahoo-pipes

我遇到这种情况,我需要从网页上获取一些数据,而我正在尝试使用Yahoo Pipes来制作一个快速原型。我将数据划分为“Fetch Page”,然后我将YQL查询添加到“循环”中,这样​​我就可以浏览“获取页面”模块中的每个结果并提取我需要的数据,同时保持“获取”中的分组页面“模块。

当我向其添加要求URL的XPath时,YQL查询总是发送错误。

所以我的问题是,如果可以让XPath使用来自循环的Feed吗?

1 个答案:

答案 0 :(得分:1)

使用存储在您网域中的CSV文件粘贴fetch page模块中的分组。使用Yahoo Pipes中的循环查询CSV文件以获取数据:

select * from html where url in (select col0 from csv where url="http://abdefg/foo.csv") and xpath="//title"