我正在尝试使用yql抓取一个网页。我想输出它作为json会给我所有的内容作为一个对象。但是,如果有任何html标签,如<强大>该文字未包含在“内容”中。有什么方法可以解决这个问题,还是应该将它作为xml和regex标记出来?
答案 0 :(得分:0)
如果你的YQL语句从* html 中选择*,那么它应该返回页面中的所有元素。其中url =“http://www.cnn.com”。
select * from html where url="http://www.cnn.com".