根据shell

时间:2018-05-27 20:20:17

标签: bash shell cut uniq

我有一个文件emails.csv

>cat emails.csv
1,joe,joe@gmail.com,32
2,jim,jim@hotmail.fr,23
3,steve,steve_smith@temporary.com.br,45
4,joseph,joseph@protonmail.com,23
5,jim,jim29@bluewin.ch,29
6,hilary,hilary@bluewin.ch,32

当我找到另一个具有相同的最后一个字段(年龄)的条目时,我想只保留第一个条目 - 基于最后一个字段的唯一条目。我想要的输出是:

1,joe,joe@gmail.com,32
2,jim,jim@hotmail.fr,23
3,steve,steve_smith@temporary.com.br,45
5,jim,jim29@bluewin.ch,29

以下脚本可以进行过滤:

> cut -d, -f4 emails.csv |
> while read age1;
> do line=1;continue_loop=1 cut -d, -f4 emails.csv | while read age;
> do if [[ $age1 == $((age)) ]] && [[ $continue_loop == $1 ]];
> then cat emails.csv | head -n $line | tail -n 1;
> continue_loop=0; fi;
> let line++;
> done;
> done | sort

但是,我正在寻找一个不需要两个循环的解决方案,因为这似乎有点过于复杂。

1 个答案:

答案 0 :(得分:1)

sort -t, -k4 emails.csv | sed -e 's/,/ /g' | uniq -f3 | sed -e 's/ /,/g'

但似乎其他一些语言如Perl或Pyhon会帮助你写出更稳定而不是那么难看的解决方案