python - 如何合并几个子文件夹中的几个CSV，删除重复项并将标题添加到新的CSV中？

我有两个数据集A和B。

数据集A：子文件夹中的一堆csv（每次1-2-3）。它们没有任何标题，并且上一个CSV的最后一行与下一个CSV的第一行相同。 CSV的名称是随机的，但是它们是有序的。我想用python编写一个脚本，该脚本可以进入每个子文件夹，合并这些CSV，删除重复项，并将标题的第一行添加到最后一个。列如下：

一周中的GPS秒|纬度|长|椭球高|间距卷标题

数据集B：一堆文本文件，每列之间有一个空格。它们与数据集A具有相同的文件夹结构。在这些文本文件中，各列如下：

GPS标准时间| OSTM15 Easting | OSTM15北向|大地水准面高度| 间距卷标题

我也希望将这些文本文件合并为CSV。之后，我要从中复制大地水准面高度并覆盖数据集A中CSV中的椭圆高度。

示例：数据集A： -文件夹结构：20190326_OS1\R0，其中R0为1次运行，而20190326_OS1包含多次运行。在R0中，有3个文件： -20190326_102847_WGS -20190326_103117_WGS -20190326_103321 -有时名称末尾缺少_WGS。 -CSV中的数据如下

数据集B： -文件夹结构：20190326_OS1\R0。与上一个相同，名称相同。 -文本文件中的数据

最终CSV示例：

谢谢！

如何合并几个子文件夹中的几个CSV，删除重复项并将标题添加到新的CSV中？

0 个答案: