我正在尝试使用YQL解析页面。正在解析HTML表。问题是YQL会自动添加HTML“p”标记,而它不包含在原始HTML中。应该做什么,以便YQL不应该返回HTML。
如果在td标签中查找如下所示,则包含p标签,其中可以看到原始html here在表html中没有p标签。
<tr>
<td class="ttl">
<a href="#" onclick="helpW('h_weight.htm');">Weight</a>
</td>
<td class="nfo">
<p>169 g</p>
</td>
</tr>
答案 0 :(得分:0)
这不是YQL,而是HTML5引擎本身。 HTML5的一部分理念是,如果你给它无效的HTML,它会通过添加你错过的任何元素为你修复它,你在查询中看到的是代表修复内容的树。 (是的,这使得查询很难。但这不是责备责任的地方......)