如何使用= ImportXML从具有特定类属性的html标记中提取数据。

时间:2014-03-22 00:06:58

标签: xml xpath google-sheets

我正试图从网站上提取数据。这是html源代码

<div class="sort-by">
<span class="totalrows js-totalrows">13386</span>
</div>

我正在使用的代码= ImportXML是:

=ImportXML("websitehere.com", "//span")

我得到了数百个结果,但页面上有数百个跨度。我需要获取跨越范围内的数字。所以我的问题是如何更改请求,以便它只提取&#39; span&#39;内的信息。有一组&total;总共js-totalrows&#39;这样它只会为我画一个数字。提前谢谢!

1 个答案:

答案 0 :(得分:1)

尝试使用更具体的XPath来过滤掉不相关的跨度,例如通过仅查询具有“sort-by”类的div下的类“totalrows js-totalrows”的跨度:

=ImportXML("websitehere.com", "//div[@class='sort-by']/span[@class='totalrows js-totalrows']")

或者如果你想要更简单的XPath来查询具有'totalrows js-totalrows'类的span元素,这将会:

=ImportXML("websitehere.com", "//span[@class='totalrows js-totalrows']")

无论如何,重点是我们使用方括号([])来声明XPath中要选择的元素(a.k.a过滤器)的规范。