Google Sheet importxml-如何仅检索前5个值?

时间:2020-02-09 01:44:38

标签: xpath web-scraping google-sheets google-sheets-formula google-sheets-importxml

我尝试使用Google Sheet的importxml函数获取值列表,但只需要前12个值。

那我该怎么办?

我的查询:=IMPORTXML("https://muagame.vn/may-ps4.html","//h3")

2 个答案:

答案 0 :(得分:2)

  • 您想使用https://muagame.vn/may-ps4.html的xpath从//h3的URL中检索值。
  • 使用//h3的xpath时,将检索12个项目。您要检索前5个项目。

如果我的理解正确,那么这个答案如何?请认为这只是几个可能的答案之一。

在此答案中,xpath被修改。请如下修改=IMPORTXML("https://muagame.vn/may-ps4.html","//h3")的xpath。

发件人:

//h3

收件人:

//li[position()<=5]/h3
  • 在HTML数据中,标记h3被放置在标记li中。因此,为了检索h3的前5个项目,我使用了li[position()<=5]

结果:

enter image description here

在这种情况下,公式为=IMPORTXML("https://muagame.vn/may-ps4.html","//li[position()<=5]/h3")

参考:

如果我误解了你的问题,而这不是你想要的结果,我深表歉意。

答案 1 :(得分:2)

尝试:

=QUERY(IMPORTXML("https://muagame.vn/may-ps4.html", "//h3"), "limit 5")

0


或:

=ARRAY_CONSTRAIN(IMPORTXML("https://muagame.vn/may-ps4.html", "//h3"), 5, 1)