使用importxml在Google SpreadSheets中导入日期

时间:2018-02-23 18:45:34

标签: html xpath web-scraping google-sheets

我正在尝试在我的Google电子表格中复制此页面上的数据(http://www.progsport.com/icehockey/)。

我需要表格中的所有数据,我想将它们分开。我设法用指令复制匹配列: = IMPORTXML(B7;“// td / pre”),其中B7是网址。

现在我想复制其余部分,但我不知道,因为它们是特殊课程。我做了几次测试而且没有得到它。如何找到该数据,例如所有行的(Photo1)的数量? 在其他细胞中有图像。我想复制图像的链接以便稍后处理它们。如何在文档中复制这些链接? (照片2)

非常感谢您的时间。

Photo 1

Photo 2

1 个答案:

答案 0 :(得分:0)

这个答案怎么样?我把http://www.progsport.com/icehockey/放到" A1"对于这个样本。

对于Q1:

=IMPORTXML(A1, "//tr[contains(@class, 'f')]")

结果:

enter image description here

列C-F是图像。因此无法将数据检索为文本数据。

对于Q2:

=ARRAYFORMULA("http://www.progsport.com/" & IMPORTXML(A1, "//tr[@class='f2']//img[@class='im']/@src"))

结果:

enter image description here

如果这对你没用,我很抱歉。