所以,我试图从KML文件中提取一些地理数据。我看到的一切表明我可以在bash中使用xmlstarlet。我试图从样本数据的这个(代表性)部分获取CSV文件(之前修改为单行):
<?xml version="1.0" encoding="UTF-8"?>
<kml xmlns="http://www.opengis.net/kml/2.2"
xmlns:gx="http://www.google.com/kml/ext/2.2">
<Document>
<Placemark>
<open>1</open>
<gx:Track>
<altitudeMode>clampToGround</altitudeMode>
<when>2015-12-24T18:20:57Z</when>
<gx:coord>-87.2788204 36.5984675 0</gx:coord>
<when>2015-12-24T18:20:42Z</when>
<gx:coord>-87.2784049 36.597298699999996 0</gx:coord>
</gx:Track>
</Placemark>
</Document>
</kml>
那就是:
2015-12-24 18:20:57 -87.2788204 36.5984675 0
2015-12-24 18:20:42 -87.2784049 36.597298699999996 0
使用sed(OSX Sierra)进行一些处理后。
使用以下内容,我可以提取&#34; gx:coord&#34;节点,但同样不适用于&#34;当&#34;节点(为什么?):
xmlstarlet sel -t -m '//gx:coord' -v . -n <in.kml > out.csv
在尝试将多个sed迭代的基本解决方案拼凑在一起之后,我回到这个解决方案,它将始终如一地工作,干净利落地产生最佳结果(xmlstarlet产生&#34;当&#34;和&# 34; gx:coord&#34;数据......我不熟悉XLST)。关于实现这一目标的命令或步骤的建议?谢谢!
答案 0 :(得分:1)
因为when
位于默认名称空间http://www.opengis.net/kml/2.2
中。
尝试将前缀绑定到命名空间(使用-N
)。
示例...
xmlstarlet sel -N kml='http://www.opengis.net/kml/2.2' -t -m '//gx:coord' -v "concat(preceding-sibling::kml:when[1],' ',.)" -n in.kml
...输出
2015-12-24T18:20:57Z -87.2788204 36.5984675 0
2015-12-24T18:20:42Z -87.2784049 36.597298699999996 0
我刚注意到你还试图在when
上进行一些字符串操作。它可能在命令行上变得丑陋,所以我更喜欢XSLT,但这里有一个选项...
xmlstarlet sel -N kml='http://www.opengis.net/kml/2.2' -t -m '//gx:coord' -v "concat(translate(preceding-sibling::kml:when[1],'TZ',' '),.)" -n in.kml
...输出
2015-12-24 18:20:57 -87.2788204 36.5984675 0
2015-12-24 18:20:42 -87.2784049 36.597298699999996 0