我有很多.csv文件,我想读入MATLAB,但沿途做一些组织
我的第一个问题是我的数据如下:
[...
file1
ex1
6;0
8;0
9;1
file1
ex2
7;0
8;1
3;2
file1
ex3
7;0
8;1
3;2
由于某些原因,MATLAB上的导入向导只接受第一个标题文本,然后是下面的数据集,当它到达下一个文本标题时抛弃所有内容。那么如何组织文件以使其看起来像这样呢?
[...
file1......file1.....file1
ex1.......ex2.......ex3
6;0.......7;0.......7;0
8;0.......8;1.......8;1
9;1.......3;2.......3;2
注意:不同ex的行数总是不同的,因此您不能只将文件溢出到常规块中。
我的第二个问题是比较来自不同文件的相同实验。所以我想从所有不同的文件中取出“ex1”下面的列,然后在新矩阵中相互水平对齐。所以它看起来像这样:
file1.....file2.....file3.....
ex1.......ex1.......ex1.......
6;0.......6;0.......6;0.......
8;0.......8;0.......8;0.......
9;1.......9;1.......9;1.......
注意:不同文件中的ex有不同的顺序。我需要根据匹配其中一行标题来匹配文件中的ex(例如,无论何时称为'track1')。
这就是actual data的样子。
答案 0 :(得分:1)
由于每个ex中的行数不同,因此必须使用单元格矩阵。
file = 'file1.csv';
h = 2; % # header lines
num_ex = 3;
r = h; % track the current row in the file
data = cell(1,num_ex);
for i=1:num_ex
s = importdata(file, ';', r);
x = s.data;
data{i} = x;
r = r + size(x,1) + h;
end
然后,您可以使用大括号单元格矩阵表示法访问数据
ex = 2;
x = data{ex};
所以你得到了
x = [ 7 0
8 1
3 2 ]
对于第二个问题,您可以添加一个循环来浏览每个文件
filenames = {'file1.csv', 'file2.csv', 'file3.csv'};
h = 2; % # header lines
num_ex = 3;
r = h; % track the current row in the file
data = cell(1,num_ex);
for i=1:num_ex
for f=1:length(filenames)
file = filenames{f};
s = importdata(file, ';', r);
x = s.data;
data{i} = [data{i} x];
end
r = r + size(x,1) + h;
end
因此data{1}
包含ex 1等的所有数据
答案 1 :(得分:1)
虽然我认识到这不是您问题的完整解决方案,但我经常用来克服文本编辑的替代解决方案(以及在MATLAB中解析时可怕的速度损失)是通过MATLAB连接器加载数据Java或C#。
从MATLAB调用C#和Java相当容易,我做了很多我的文本。