我正试图从网站上提取数据。这是html源代码
<div class="sort-by">
<span class="totalrows js-totalrows">13386</span>
</div>
我正在使用的代码= ImportXML是:
=ImportXML("websitehere.com", "//span")
我得到了数百个结果,但页面上有数百个跨度。我需要获取跨越范围内的数字。所以我的问题是如何更改请求,以便它只提取&#39; span&#39;内的信息。有一组&total;总共js-totalrows&#39;这样它只会为我画一个数字。提前谢谢!
答案 0 :(得分:1)
尝试使用更具体的XPath来过滤掉不相关的跨度,例如通过仅查询具有“sort-by”类的div下的类“totalrows js-totalrows”的跨度:
=ImportXML("websitehere.com", "//div[@class='sort-by']/span[@class='totalrows js-totalrows']")
或者如果你想要更简单的XPath来查询具有'totalrows js-totalrows'类的span元素,这将会:
=ImportXML("websitehere.com", "//span[@class='totalrows js-totalrows']")
无论如何,重点是我们使用方括号([]
)来声明XPath中要选择的元素(a.k.a过滤器)的规范。