从文件中查找唯一值

时间:2011-01-14 22:40:16

标签: csv

我有一个6 MB大小的csv文件。我想通过A列和A列过滤数据。 C列,以便我需要删除任何重复项。什么是最简单的方法,以及如何做到这一点。非常感谢任何帮助。

2 个答案:

答案 0 :(得分:9)

cat foo.csv | cut -f2 -d , | sort | uniq

它将为您提供第二栏中的唯一ID

cat foo.csv | cut -f1 -d , | sort | uniq

它将为您提供第1列中的唯一ID

-f < number > : column number

-d  < space >< delimiter > : file delimiter 

答案 1 :(得分:4)

使用cut或awk选择字段。排序和uniq删除重复项。例如

awk -F"," '{print $1}' A.csv|sort|uniq