如何计算bash和list中的唯一字符串

时间:2016-02-02 05:09:26

标签: bash text text-processing

我有一个csv文件,如何计算给定字段(字段#2),对于唯一字符串,然后使用bash脚本列出其旁边频率的所有唯一字符串?

理想情况下,我希望看到第二个字段中出现的所有唯一字符串的打印出来,以及它们出现在bash中的次数?

1 个答案:

答案 0 :(得分:1)

如果你有一个非常简单的CSV:

awk -F, '{a[$2]++}END{for(i in a)print i": "a[i]}' < file

由于没有标准的Unix工具,我知道它可以正确读取CSV,对于更复杂的CSV文件,您需要更高的编程语言:

ruby -rcsv -e 'a = Hash.new(0); STDIN.each_line { |l| a[CSV.parse(l)[0][1]] += 1 }; a.each { |k, v| puts "#{k}: #{v}" }' < file