关于使用YQL在json中获取html网页的初学者问题

时间:2011-02-12 04:57:18

标签: yql

我正在尝试使用yql抓取一个网页。我想输出它作为json会给我所有的内容作为一个对象。但是,如果有任何html标签,如<强大>该文字未包含在“内容”中。有什么方法可以解决这个问题,还是应该将它作为xml和regex标记出来?

1 个答案:

答案 0 :(得分:0)

如果你的YQL语句从* html 中选择*,那么它应该返回页面中的所有元素。其中url =“http://www.cnn.com”。

select * from html where url="http://www.cnn.com".