我喜欢使用Python,因为它易于学习语法,但是,我最近了解到它在CSVs方面不支持UTF-8。由于我经常使用CSV,这对我来说似乎是一个严重的问题。是否有另一种脚本语言具有简单的语法,当我需要管理非常大的CSV UTF-8文件时,我可以学习它?
答案 0 :(得分:2)
如果您正在使用该命令并且可以安装另一个命令行工具,我强烈建议csvfix。
安装完成后,您可以健壮地查询任何csv文件,例如
csvfix order -f 1,3 file.csv
将提取csv的第1列和第3列。
有完整的命令列表here
请参阅此相关question
答案 1 :(得分:1)
我建议使用gawk
。 E.g:
awk -F ";" '{print $1 ";" $2}' FILE.csv
将打印FILE.CSV
的前两个(;
分隔)列。要使用UTF-8,您应该像以下一样使用它:
LC_ALL = C awk'BEGIN {print length(“árvíztűrőtükörkúrópék”)}' =>三十 LC_ALL = en_US.utf8 awk'BEGIN {print length(“árvíztűrőtükörkúrópék”)}' => 21
(或者,如果您一直使用UTF-8,则可以全局设置LC_ALL,并且您使用* nix,例如.bashrc
,export LC_ALL=en_US.utf8
。
awk
是一个古老但却非常强大且快速的工具。
HTH