我有很多任务要做,从格式化的.csv文件中分离电压数据。
13/03/2014 18:48,71.556671,71.651062,71.639755,72.130692,71.961441,72.646423,72.262756,72.334511,7.812012
我是RegExpressions的新手,我如何反复从第10列获取数据? 我有超过10,000,000个文件要减少,平均为32,000个exel to graph。任何建议都非常欢迎,尝试使用PowerGrep来加快速度。
答案 0 :(得分:0)
并非我会说正则表达式是 工具,但是这里有:
(?:[^,]*,){9}([^,]*)
即。九个"列"用逗号分隔的非逗号,然后捕获第1组中的第十个。
E.g。使用它与Perl单线:
perl -ne 'chomp; /(?:[^,]*,){9}([^,]*)/ and print "$1\n"'