如何删除一个单词(而不是数字)相同的所有行,我该怎么办?这是一个例子:
4,5876746600174000,dog
4,5876736392287000,nacho
4,5876692287755000,dog
4,5876684072439000,tree
4,5876692287773600,dog
4,5876692879655000,dog
4,5876692434755000,frog
我想让它自动删除每一行" dog"之后已经提到过一次,包括所有内容......任何想法?它显然是一个csv文件,所以也许它更快开放办公室?
答案 0 :(得分:0)
要忽略第3个字段的重复行,您可以使用:
sort -t, -k3 file.csv|sort -t, -k3 -u
会给你:
4,5876692287755000,dog
4,5876692434755000,frog
4,5876736392287000,nacho
4,5876684072439000,tree
请勿尝试仅使用一个sort
缩短时间,因为sort -t, -k3 -u file.csv
会给您不同的结果:
4,5876746600174000,dog
4,5876692434755000,frog
4,5876736392287000,nacho
4,5876684072439000,tree
注意dog
行的第二个字段具有不同的值(它忽略除dog
的最后一行之外的所有行
我认为将CSV文件导入某个数据库(sqlite?)应该也不错。您可以使用SELECT
制作GROUP BY
。