我有两个数据集A和B。
数据集A:子文件夹中的一堆csv(每次1-2-3)。它们没有任何标题,并且上一个CSV的最后一行与下一个CSV的第一行相同。 CSV的名称是随机的,但是它们是有序的。我想用python编写一个脚本,该脚本可以进入每个子文件夹,合并这些CSV,删除重复项,并将标题的第一行添加到最后一个。列如下:
一周中的GPS秒|纬度|长|椭球高|间距卷 标题
数据集B:一堆文本文件,每列之间有一个空格。它们与数据集A具有相同的文件夹结构。在这些文本文件中,各列如下:
GPS标准时间| OSTM15 Easting | OSTM15北向|大地水准面高度| 间距卷标题
我也希望将这些文本文件合并为CSV。 之后,我要从中复制大地水准面高度并覆盖数据集A中CSV中的椭圆高度。
示例:
数据集A:
-文件夹结构:20190326_OS1\R0
,其中R0为1次运行,而20190326_OS1包含多次运行。在R0中,有3个文件:
-20190326_102847_WGS
-20190326_103117_WGS
-20190326_103321
-有时名称末尾缺少_WGS。
-CSV中的数据如下
数据集B:
-文件夹结构:20190326_OS1\R0
。与上一个相同,名称相同。
-文本文件中的数据
最终CSV示例:
谢谢!