从xml页面中提取数据

时间:2013-03-30 00:53:39

标签: xml

您好我想从此页面获取一些信息http://www.fuzzwork.co.uk/blueprints/xml/598/35/5我需要“实际数量”。

我正在使用谷歌文档excel doc。尝试使用importxml导入它。

这是我到目前为止所得到的:

= IMPORTXML(http://www.fuzzwork.co.uk/blueprints/xml/598/35/5?, “// totalmaterials [@ ID = '34' ] // actualquantity”)

只是为了确保你知道我在这里要做的是获取在单元格中打印出的实际数量。

我试着谷歌它无济于事。

我认为对于知道自己在做什么的人来说这很简单。

感谢您的帮助。

2 个答案:

答案 0 :(得分:0)

您的XPath需要包含您所追求的目标元素的完整路径。我将其放入Google文档并获得了一份数据列表:

=importXml("http://www.fuzzwork.co.uk/blueprints/xml/598/35/5"; "//blueprint/basematerials/material/@actualquantity")

如果您在问题中演示的特定元素之后完全按照您的说法操作并插入ID过滤器:

=importXml("http://www.fuzzwork.co.uk/blueprints/xml/598/35/5"; "//blueprint/basematerials/material[@id='34']/@actualquantity")

答案 1 :(得分:0)

我不熟悉Excel的这一部分,但我将您的数据放入本地文件,添加了DTD,并使用了以下查询:

    doc("actual_quantity-with-dtd.xml")//totalmaterials/material/(data(@id), ",",data(@actualquantity),",")

,它提供了以下输出,您可以将其作为csv文件导入Excel。

    <?xml version="1.0" encoding="UTF-8"?>34 , 16043 , 35 , 13537 , 36 , 2507 , 37 , 100 , 39 , 2 , 38 , 2 , 40 , 1 ,