bash,xmlstarlet提取两个节点

时间:2017-12-19 21:28:31

标签: bash macos sed kml xmlstarlet

所以,我试图从KML文件中提取一些地理数据。我看到的一切表明我可以在bash中使用xmlstarlet。我试图从样本数据的这个(代表性)部分获取CSV文件(之前修改为单行):

<?xml version="1.0" encoding="UTF-8"?>
<kml xmlns="http://www.opengis.net/kml/2.2" 
     xmlns:gx="http://www.google.com/kml/ext/2.2">
  <Document>
    <Placemark>
      <open>1</open>
      <gx:Track>
        <altitudeMode>clampToGround</altitudeMode>
        <when>2015-12-24T18:20:57Z</when>
        <gx:coord>-87.2788204 36.5984675 0</gx:coord>
        <when>2015-12-24T18:20:42Z</when>
        <gx:coord>-87.2784049 36.597298699999996  0</gx:coord>
      </gx:Track>
    </Placemark>
  </Document>
</kml>

那就是:

2015-12-24 18:20:57 -87.2788204 36.5984675 0
2015-12-24 18:20:42 -87.2784049 36.597298699999996 0

使用sed(OSX Sierra)进行一些处理后。

使用以下内容,我可以提取&#34; gx:coord&#34;节点,但同样不适用于&#34;当&#34;节点(为什么?):

xmlstarlet sel -t -m '//gx:coord' -v . -n <in.kml > out.csv

在尝试将多个sed迭代的基本解决方案拼凑在一起之后,我回到这个解决方案,它将始终如一地工作,干净利落地产生最佳结果(xmlstarlet产生&#34;当&#34;和&# 34; gx:coord&#34;数据......我不熟悉XLST)。关于实现这一目标的命令或步骤的建议?谢谢!

1 个答案:

答案 0 :(得分:1)

因为when位于默认名称空间http://www.opengis.net/kml/2.2中。

尝试将前缀绑定到命名空间(使用-N)。

示例...

xmlstarlet sel -N kml='http://www.opengis.net/kml/2.2' -t -m '//gx:coord' -v "concat(preceding-sibling::kml:when[1],' ',.)" -n in.kml

...输出

2015-12-24T18:20:57Z -87.2788204 36.5984675 0
2015-12-24T18:20:42Z -87.2784049 36.597298699999996  0

我刚注意到你还试图在when上进行一些字符串操作。它可能在命令行上变得丑陋,所以我更喜欢XSLT,但这里有一个选项...

xmlstarlet sel -N kml='http://www.opengis.net/kml/2.2' -t -m '//gx:coord' -v "concat(translate(preceding-sibling::kml:when[1],'TZ','  '),.)" -n in.kml

...输出

2015-12-24 18:20:57 -87.2788204 36.5984675 0
2015-12-24 18:20:42 -87.2784049 36.597298699999996  0