Question

我的数据输入如下：

1RDD4_00022_02842   o220
1RDD4_00024_03137   o132
1RDD4_00035_05208   o216
1RDD4_00045_05573   o132
1RDD4_00046_02134   o132
1RDD4_00051_04040   o154

我想按数字顺序在右列中排序并列出单词的出现频率，以便输出如下所示：

我尝试了以下管道，但它仅适用于输入的左列，而且我不知道如何修改右列：

sed 's/\.//g;s/\(.*\)/\L\1/;s/\ /\n/g' inputfile | sort | uniq -c

Answer 1

使用

cat inputfile | cut -f2

或

cat inputfile | awk '{print $2}'

（沉重）仅选择第二列

cat inputfile | cut -f2 | sort | uniq -c