将文件的特定列复制到C中的另一个文件

时间:2013-08-01 00:31:59

标签: c file-io gnuplot

我有两个文件,第一个看起来像这样

125 6.678
435 9.084
234 8.874

以及我的程序生成的大约2,048,000个条目。 第二个文件是由gnuplot生成的文件,看起来有点像:

65 321456 985
78 98374  834
54 8493   848

等约有2,048,000个条目。

现在我需要做的是用3D中的gnuplot绘制第一个文件的第二列和第二个文件的两列。我认为第一个任务是将它们全部放入同一个文件中,我只想编写一个简单的c程序,快速读取这两个文件并将相关列放在一个文件中,但我不知道该怎么做。我知道如何复制文件的全部内容并使用c程序将它们写入另一个文件 - 例如,为此,我有以下代码:

#include <stdio.h>
#include <stdlib.h>

int main (int argc, const char * argv[])
{
FILE *avalanche_size_BM;
FILE *avalanche_size_BM_2000;
char ch;


avalanche_size_BM = fopen("/Users/maheensiddiqui/Documents/MSc_Proj/avalanche_size_BM.dat","r");

if (avalanche_size_BM == NULL) 
{
    printf("I couldn't open.\n");
    exit(0);
}
avalanche_size_BM_2000 = fopen("/Users/maheensiddiqui/Desktop/avalanche_size_BM_2000.dat", "w");
if (avalanche_size_BM_2000 == NULL) 
{
    printf("I couldn't open.\n");
    exit(0);
}

printf("\n success!!");

while((ch=getc(avalanche_size_BM))!=EOF)
      putc(ch,avalanche_size_BM_2000);

fclose(avalanche_size_BM);
fclose(avalanche_size_BM_2000);



return(0);
}

但是我怎么告诉它只是读取第一个文件中的第二列和第二个文件中的前两列并将它们(而不是所有列)复制到第三个文件,我可以用它来绘制我的3 -D情节。

非常感谢任何帮助!

谢谢

2 个答案:

答案 0 :(得分:4)

非C答案

这假设您只是想要结果而不是真的担心如何在C中执行此操作。

要使用简单的命令行工具生成文件,您可以使用pasteawk来获取结果:

paste读取多个文件,并将所有行组合在一起,用制表符分隔

所以,如果您有两个文件,如foo.txt和bar.txt,它们具有以下内容:

foo.txt的:

a1 b1 c1 
a2 b2 c2

跳回到bar.txt:

d1 e1 f1
d2 e2 f2

paste foo.txt bar.txt输出:

a1 b1 c1    d1 e1 f1
a2 b2 c2    d2 e2 f2

然后,您可以使用awk过滤掉所需的列。

因此,例如,如果您想要列2,4和5(b1,d1,e1),您可以使用以下内容:

paste foo.txt bar.txt | awk '{ print $2 " " $4 " " $5 }'

我将假设两个文件都有IDENTICAL条目数 从Finder在OSX中启动命令shell - &gt;应用

在shell提示符下你可以这样做:

$ cd Desktop
$ paste avalanche_size_BM.dat avalanche_size_BM_2000.dat | \
    awk '{ print $2 " " $4 " " $5 }' > avalanche_size_3d.dat

这将在第一个文件的第2列的Desktop子目录和第二个文件的前两列中创建一个名为avalanche_size_3d.dat的文件(当它们粘贴在一起时,它们最终位于第4和第5位)。

C-应答

这基本上就像编写一个小的粘贴实用程序

#include <stdio.h>
#include <stdlib.h>

int main()
{
     FILE *fp1 = fopen ("file1", "r");
     FILE *fp2 = fopen("file2", "r");
     FILE *out = fopen("fileout", "w");

     while (!feof(fp1) && !feof(fp2)) {
         char buf[256], col1[256], col2[256], col3[256];
         if ( fgets(buf, sizeof(buf), fp1) == 0 )
            break;
         sscanf(buf, "%s %s", col2, col1); /* we only need col1, col2 is reused later */
         if ( fgets(buf, sizeof(buf), fp2) == 0 ) 
            break;
         sscanf(buf, "%s %s", col2, col3); 
         fprintf(out, "%s %s %s\n", col1, col2, col3);
     }
     fclose(fp1);
     fclose(fp2);
     fclose(out);
}

答案 1 :(得分:2)

在C中,最简单的方法是从两个文件中读取一行,然后将这两行作为一行打印到第三个文件中。完成后,您可以解析实际要打印的每行的哪些部分,但将这两个文件合并为一个可能足以让您使用gnuplot绘制数据。

要阅读输入行,您可以使用fgets()。您可以为每一行使用两个单独的缓冲区。从第一个文件中获取第一行,最后删除换行符,然后将其打印到新文件中。然后,从第二个文件中打印该行。

char buf1[MAX_LINE];
char buf2[MAX_LINE];
FILE *infile1 = fopen(..., "r");
FILE *infile2 = fopen(..., "r");
FILE *outfile = fopen(..., "w");

while (fgets(buf1, sizeof(buf1), infile1) != 0
       && fgets(buf2, sizeof(buf2), infile2) != 0) {
    strchr(buf1, '\n')[0] = '\0';
    fprintf(outfile, "%s %s", buf1, buf2);
}

fclose(outfile);
fclose(infile1);
fclose(infile2);

在您阅读一行输入后,您可以使用sscanf()解析输入以检索您要打印的行的部分:

int file1_column1;
double file1_column2;
sscanf(buf1, "%d %lf", &file1_column1, &file1_column2);

int file2_column1;
int file2_column2;
int file2_column3;
sscanf(buf2, "%d %d %d", &file2_column1, &file2_column2, &file2_column3);

您可以使用fprintf()打印出值:

fprintf(outfile, "%f %d %d\n", file1_column2, file2_column1, file2_column3);