如何将数据集从文本文件读取到2D矩阵

时间:2015-08-20 12:01:46

标签: c matrix formatted-input

我有一个表格

的数据集
0.547,0.797,2.860,1.398,Sharp-Right-Turn

0.541,0.786,2.373,1.919,Sharp-Right-Turn

0.549,0.784,2.370,1.930,Sharp-Right-Turn

0.983,0.780,2.373,1.701,Move-Forward

0.984,0.780,2.372,1.700,Move-Forward

0.983,0.780,2.378,1.602,Move-Forward

0.983,0.780,2.381,1.701,Move-Forward

.
.


ROWS=5456, COL 5

在MATLAB中很容易将文本文件加载到数据矩阵中。但我在C中挣扎 我试过这段代码

int main()
{
    struct node {
        float at1;
        float at2;
        float at3;
        float at4;
        char at5[30];
    } record[ROW][COL];

    FILE *file;
    int i, j;

    memset(record, 0, sizeof(record)); 
    file = fopen("sensor.txt", "r");

    if (file == NULL) {
        printf("File does not exist!");
    } else {
        for (i = 0; i < ROW; ++i) {
            for (j = 0; j < COL; ++j) {
                fscanf(file, "%f,%f,%f,%f,%s", &record[i][j].at1, &record[i][j].at2, &record[i][j].at3, &record[i][j].at4, &record[i][j].at5);
            }   
        }   
    }   
    fclose(file);

    for (i = 0; i < ROW; ++i)
        for (j = 0; j < COL; ++j) {
            printf("%f\t%f\t%f\t%f\t%s\n", record[i][j].at1, record[i][j].at2, record[i][j].at3, record[i][j].at4, record[i][j].at5);
        }
    return 0;
}

我只获得了0.000000的无限行和4列。

我想将前四列保存在一个矩阵中,将最后一列保存为另一个列矩阵。我能这样做吗?

我必须构建一个分类器,我很容易在MATLAB中使用它而不使用预定义的函数,但在C中读取数据会妨碍我的代码。

我知道这可能是一个重复的问题,但我在其他线程中尝试过解决方案,他们没有处理我的数据集。

1 个答案:

答案 0 :(得分:2)

首先,您已经定义了一个包含所有字段的记录,它们共同构成了每一行。这意味着当您阅读时,您拥有行的所有值,因此结构维度应该是可用的最大记录,即单维结构数组record

但你不能在堆栈上分配如此庞大的结构,它会溢出,最好将它分配到动态内存中:

struct node {
    float at1;
    float at2;
    float at3;
    float at4;
    char at5[30];
} record;

struct node *record = malloc(sizeof(struct node) * MAXRECORDS);

另一个错误出现在scanf中,结构record的最后一个字段已经是指向char的指针,因此您无需取消引用它。

这是一个有效的代码:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define MAXRECORDS 10

int main(int argc, char *argv[])
{
    struct node {
        float at1;
        float at2;
        float at3;
        float at4;
        char at5[30];
    };

    struct node *record = malloc(sizeof(struct node) * MAXRECORDS);

    FILE *file;
    int nRecords = 0;

    memset(record, 0, sizeof(record));
    file = fopen("sensor.txt", "r");

    if (file == NULL)
    {
        printf("File does not exist!");
    }
    else
    {
        while (EOF != fscanf(file, "%f,%f,%f,%f,%s", &record[nRecords].at1, &record[nRecords].at2, 
                                &record[nRecords].at3, &record[nRecords].at4, record[nRecords].at5) && nRecords<MAXRECORDS)
        {
            nRecords++;
        }
    }

    fclose(file);

    for (int i = 0; i < nRecords; ++i)
    {
        printf("%f\t%f\t%f\t%f\t%s\n",
                record[i].at1, record[i].at2, 
                record[i].at3, record[i].at4, record[i].at5);
    }
    return 0;
}

在“真正的”应用程序中,您希望将数组维度化为足够大的值,当您到达分配空间的末尾时,可以为其他数据重新分配它。这使您可以在阅读之前阅读您想要的条目数而不知道它们的数量。

P.S。我添加了检查以读取最大记录数。但这仍然是一个样本,许多检查仍然缺失,即我不检查malloc返回的值。