从大型一行文件中隔离记录

时间:2013-01-08 12:01:37

标签: python python-3.x kml

我正在使用Python 3.3我想在一行上编辑一个1.4Mb的google earth POI文件(.klm)。我需要隔离开始<placemark>和结束</placemark>的可变长度记录,检查每个记录的特定单词,丢弃那些没有它的记录,并保存剩下的记录。

有没有这方面的工具?

1 个答案:

答案 0 :(得分:2)

KML是一种XML格式。

使用XML解析器对其进行解析(例如标准库中包含的xml.etree.ElementTreelxml)。

您可以使用PyKML这样的专用软件包为您提供包含信息的更高级API,尽管该特定软件包尚未准备好Python 3。

我确实设法在该项目的文件上运行2to3 tool,因此您的里程可能会有所不同。测试失败但失败看起来是良性的(典型的python 2到3的翻译差异)。