用于处理CSV的最简单的脚本语言

时间:2011-11-05 08:39:18

标签: scripting csv

我喜欢使用Python,因为它易于学习语法,但是,我最近了解到它在CSVs方面不支持UTF-8。由于我经常使用CSV,这对我来说似乎是一个严重的问题。是否有另一种脚本语言具有简单的语法,当我需要管理非常大的CSV UTF-8文件时,我可以学习它?

2 个答案:

答案 0 :(得分:2)

如果您正在使用该命令并且可以安装另一个命令行工具,我强烈建议csvfix

安装完成后,您可以健壮地查询任何csv文件,例如

csvfix order -f 1,3 file.csv

将提取csv的第1列和第3列。

有完整的命令列表here

请参阅此相关question

答案 1 :(得分:1)

我建议使用gawk。 E.g:

awk -F ";" '{print $1 ";" $2}' FILE.csv

将打印FILE.CSV的前两个(;分隔)列。要使用UTF-8,您应该像以下一样使用它:

LC_ALL = C awk'BEGIN {print length(“árvíztűrőtükörkúrópék”)}'    =>三十    LC_ALL = en_US.utf8 awk'BEGIN {print length(“árvíztűrőtükörkúrópék”)}'    => 21

(或者,如果您一直使用UTF-8,则可以全局设置LC_ALL,并且您使用* nix,例如.bashrcexport LC_ALL=en_US.utf8

awk是一个古老但却非常强大且快速的工具。

HTH