更改文件中的分隔符

时间:2013-01-24 00:22:50

标签: csv sed awk

下面我有他们应该的文件,而且还有我迄今为止所做的文件。我认为在我的代码中是问题的根源:分隔符,但我不能更好。

我的源文件以;作为分隔符,我的数据库的文件有,作为分隔符;此外,字符串介于“”:

之间

类别文件应如下所示:

"1","1","testcategory","testdescription"

制造商提交文件,如下:

"24","ASUS",NULL,NULL,NULL
"23","ASROCK",NULL,NULL,NULL
"22","ARNOVA",NULL,NULL,NULL

我现在拥有的东西:

- category file:
1;2;Alarmen en beveiligingen;
2;2;Apparatuur en toebehoren;
3;2;AUDIO;

- manufacturers file:
315;XTREAMER;NULL;NULL;NULL
316;XTREMEMAC;NULL;NULL;NULL
317;Y-CAM;NULL;NULL;NULL
318;ZALMAN;NULL;NULL;NULL

我尝试了一下使用sed;首先,在类别文件:

cut -d ";" -f1 /home/arno/pixtmp/pixtmp.csv |sort | uniq >        /home/arno/pixtmp/categories_description-in.csv
sed 's/^/;2;/g' /home/arno/pixtmp/categories_description-in.csv > /home/arno/pixtmp/categories_description-in.tmp
sed -e "s/$/;/" /home/arno/pixtmp/categories_description-in.tmp > /home/arno/pixtmp/categories_description-in.tmp2
awk 'BEGIN{n=1}{printf("%s%s\n",n++,$0)}' /home/arno/pixtmp/categories_description-in.tmp2 > /home/arno/pixtmp/categories_description$

然后在制造商档案中:

cut -d ";" -f5 /home/arno/pixtmp/pixtmp.csv |sort | uniq > /home/arno/pixtmp/manufacturers-in
sed 's/^/;/g' /home/arno/pixtmp/manufacturers-in > /home/arno/pixtmp/manufacturers-tmp
sed -e "s/$/;NULL;NULL;NULL/" /home/arno/pixtmp/manufacturers-tmp > /home/arno/pixtmp/manufacturers-tmp2
awk 'BEGIN{n=1}{printf("%s%s\n",n++,$0)}' /home/arno/pixtmp/manufacturers-tmp2 > /home/arno/pixtmp/manufacturers.ok

1 个答案:

答案 0 :(得分:2)

您尝试使用cut,sed和AWK来解决问题。 AWK本身足以解决您的问题。

我编写了一个可以处理两个示例的AWK程序。如果NULL不是特殊情况,并且制造商的文件格式不同,则需要制作两个AWK程序,但我认为应该清楚如何进行。

我们这里所做的就是告诉AWK“字段分隔符”是分号。然后AWK将输入行拆分为我们的字段。我们遍布各个领域,随时打印。

#!/usr/bin/awk -f

BEGIN {
    FS = ";"

    DQUOTE = "\""
}

function add_quotes(s) {
    if (s == "NULL")
        return s
    else
        return DQUOTE s DQUOTE
}

NF > 0 {
    # if input ended with a semicolon, last field will be empty
    if ($NF == "")
        NF -= 1  # subtract one from NF to forget the last field

    if (NF > 0)
    {
        for (i = 1; i <= NF - 1; ++i)
            printf("%s,", add_quotes($i))
        printf("%s\n", add_quotes($i))
    }
}