Google电子表格importxml:如何获取XML中所有元素节点的名称

时间:2016-11-12 11:35:26

标签: xml xpath google-sheets

我正在尝试使用importxml函数导入XML。

<item>
    <name>James</name>
    <date>11/11/2016</date>
    <description>Student</description>
</item>

如果我使用,

=importxml(URL, "//item")

我可以导入信息,但不能导入每个信息的名称。

我想拉这样的东西

name      date       description
James     11/11/2016 Student

要执行此操作的任何xPath函数吗?

1 个答案:

答案 0 :(得分:1)

您可以使用以下公式获取标题:

=unique(arrayformula(regexreplace(transpose(split(IMPORTDATA(A1),"><",false)),">.*|\/","")))

基本上我做的是使用importdata来拉取页面上的所有内容,然后使用分割和转置函数,我强制它根据每个嵌套项><进行拆分,转置是垂直交换。

此时您会看到:

enter image description here

然后使用带有arrayformula的regexreplace,我使用">.*|\/"删除标题后面的所有数据,然后使用unique来为我提供所有标题的最终唯一列表。

enter image description here