我正在尝试抓取一个网站 我已经使用XPATh查询了文章的标题,日期,然后是正文。
select * from html where url="mywebsite.com/myarticle" and xpath="headlineXpath | DateXpath | BodyXpath"
现在xml中的结果是标题,日期,然后是正文,这就是我要找的东西
但是当我以json格式得到结果时,我会以另一个顺序得到它标题,正文然后日期
我的问题:如何根据给定XPATHS的顺序在json中得到结果?
谢谢你的帮助
答案 0 :(得分:0)
你有没有尝试过:
select headline, date, body from html where ...
而不是使用*?我不太了解YQL所以我可能不参与参数,但我们的想法是使用显式选择而不是通配符来指定字段的顺序。