Question

我有一个csv文件，如何计算给定字段（字段＃2），对于唯一字符串，然后使用bash脚本列出其旁边频率的所有唯一字符串？

理想情况下，我希望看到第二个字段中出现的所有唯一字符串的打印出来，以及它们出现在bash中的次数？

Answer 1

如果你有一个非常简单的CSV：

awk -F, '{a[$2]++}END{for(i in a)print i": "a[i]}' < file

由于没有标准的Unix工具，我知道它可以正确读取CSV，对于更复杂的CSV文件，您需要更高的编程语言：

ruby -rcsv -e 'a = Hash.new(0); STDIN.each_line { |l| a[CSV.parse(l)[0][1]] += 1 }; a.each { |k, v| puts "#{k}: #{v}" }' < file