Bash脚本将数据从csv中提取出来

时间:2011-09-22 17:51:28

标签: regex linux bash

我有一个包含以下数据的文件:

20,2011/09/22,HUOT             ,CLAUDE       J,     ,DEX ,006403,MTRL,07:10,QBEC,10:29
020,2011/09/22,HUOT             ,CLAUDE       J,02001,DEX ,003470,MTRL,07:10,QBEC,10:29
020,2011/09/22,HUOT             ,CLAUDE       J,02003,DEX ,003307,MTRL,07:10,QBEC,10:29
020,2011/09/22,HUOT             ,CLAUDE       J,02004,DEX ,003309,MTRL,07:10,QBEC,10:29
020,2011/09/22,HUOT             ,CLAUDE       J,     ,DEX ,003310,MTRL,07:10,QBEC,10:29

我正在尝试提取特定字段和特定范围内的数字。

3400s,4000s和7300s。对于上面的代码,我希望得到3470.

在bash脚本中执行此操作的最佳方法是什么?

4 个答案:

答案 0 :(得分:2)

awk是这项工作的好工具。

awk -F, '$7 ~ /(34|40|73)[0-9][0-9]$/ {print}' filename

答案 1 :(得分:0)

您可以这样做:

cut -d, -f9 data_file | while read number ; do if test $number -gt 3400 -a $number -lt 3500 ; then echo $number ; done

答案 2 :(得分:0)

这将给你3470结果:

awk -F, '$7~/^00(34|40|70)/{print 1*$7}' inputFile

对于你给出的例子,grep也可以这样做:

grep -oP "(?<=00)(34|40|70)\d+" inputFile

上面的grep cmd也会给你3470。

答案 3 :(得分:0)

#!/bin/bash
OLDIFS="$IFS"
IFS=","
while read -r line
do
    set -- $line
    [[ ${7:2} =~ ^(34|40|73) ]] && echo "${7:2}"
done < "file"
IFS="$OLDIFS"