我有一个csv文件,如何计算给定字段(字段#2),对于唯一字符串,然后使用bash脚本列出其旁边频率的所有唯一字符串?
理想情况下,我希望看到第二个字段中出现的所有唯一字符串的打印出来,以及它们出现在bash中的次数?
答案 0 :(得分:1)
如果你有一个非常简单的CSV:
awk -F, '{a[$2]++}END{for(i in a)print i": "a[i]}' < file
由于没有标准的Unix工具,我知道它可以正确读取CSV,对于更复杂的CSV文件,您需要更高的编程语言:
ruby -rcsv -e 'a = Hash.new(0); STDIN.each_line { |l| a[CSV.parse(l)[0][1]] += 1 }; a.each { |k, v| puts "#{k}: #{v}" }' < file