将不同文件中的CSV列导入新文件

时间:2013-07-06 10:23:37

标签: csv merge diff

我有2个CSV文件几乎完全相同,但有以下不同之处:

  1. 第一个列有“日期”。
  2. 第二个没有“日期”,也比第一个(“电子邮件”)少50行。
  3. 他们是创建日期的订阅者列表。然而,第二个是更新列表,其中包含想要删除的订阅者,但不再创建日期。

    有没有办法通过引用“电子邮件”列将第1个CSV栏中的“日期”导入第2个CSV,这样我才能获得该订阅者的正确日期?

1 个答案:

答案 0 :(得分:0)

对不起,似乎没有现成的(可能是晚上值得努力的)命令行工具。

您可以查看不同的方法,一种复杂的方法是将其加载到表中,合并(使用两个表上的select和join)并将其作为csv导出。

我能想到的最简单的方法是使用R(假设您的CSV中有标题名称?):

csv1_data <- read.csv('/path/to/csv1.csv')
csv2_data <- read.csv('/path/to/csv2.csv')

merged_csv <- merge(csv1_data, csv2_data)
write.table(merged_csv,file="/path/to/merged_csv.csv",sep=",",row.names=T)

前2行使用默认的S3方法加载R中的数据,3行merges,最后一行将结果导出为带有标题的csv文件。

希望这有帮助!