Question

我正试图从网站上提取数据。这是html源代码

<div class="sort-by">
<span class="totalrows js-totalrows">13386</span>
</div>

我正在使用的代码= ImportXML是：

=ImportXML("websitehere.com", "//span")

我得到了数百个结果，但页面上有数百个跨度。我需要获取跨越范围内的数字。所以我的问题是如何更改请求，以便它只提取＆＃39; span＆＃39;内的信息。有一组＆total;总共js-totalrows＆＃39;这样它只会为我画一个数字。提前谢谢！

Answer 1

尝试使用更具体的XPath来过滤掉不相关的跨度，例如通过仅查询具有“sort-by”类的div下的类“totalrows js-totalrows”的跨度：

=ImportXML("websitehere.com", "//div[@class='sort-by']/span[@class='totalrows js-totalrows']")

或者如果你想要更简单的XPath来查询具有'totalrows js-totalrows'类的span元素，这将会：

=ImportXML("websitehere.com", "//span[@class='totalrows js-totalrows']")

无论如何，重点是我们使用方括号（[]）来声明XPath中要选择的元素（a.k.a过滤器）的规范。