如何在第二列中对单词频率进行排序和列出?

时间:2018-10-14 13:34:00

标签: sorting multiple-columns uniq

我的数据输入如下:

1RDD4_00022_02842   o220
1RDD4_00024_03137   o132
1RDD4_00035_05208   o216
1RDD4_00045_05573   o132
1RDD4_00046_02134   o132
1RDD4_00051_04040   o154

我想按数字顺序在右列中排序并列出单词的出现频率,以便输出如下所示:

    o132 3
    o154 1
    o216 1
    o220 1

我尝试了以下管道,但它仅适用于输入的左列,而且我不知道如何修改右列:

sed 's/\.//g;s/\(.*\)/\L\1/;s/\ /\n/g' inputfile | sort | uniq -c

1 个答案:

答案 0 :(得分:0)

使用

cat inputfile | cut -f2

cat inputfile | awk '{print $2}'

(沉重) 仅选择第二列

cat inputfile | cut -f2 | sort | uniq -c