我目前正在使用matlab,我已经将csv文件上传到我命名为B的单元格数组中。我现在要做的是将B的信息输入到3维单元格阵列中,第3维数组是B的第一列,是从“chr1”到“chr24”的字符串。 B的全长是m,任何“chr”的最大长度是maxlength。我怀疑这是解决问题的最好方法,但这是我的代码:
for j = 1:m ,
Ind = findstr(B{1}{j}, 'chr');
Num = B{1}{j}(Ind+3:end-1);
cnum = str2num(Num);
for i = 1:24,
if cnum == i;
for k = 2:9 ,
for l = 1:maxlength ,
C{l}{k}{i} = B{k}{j};
C{l}{k}{i}
end
end
end
end
end
由此产生的3-D数组与初始数组中的相应值不匹配。我也想知道这是否是创建三维数组的正确方法,我似乎无法在matlab网站上找到任何关于它们的内容。 感谢
答案 0 :(得分:1)
您的方法存在一些可能的问题:首先,Matlab索引与c风格索引到表格不同。 myCell{i}{j}
是单元阵列的第j个元素,它包含在单元阵列myCell
的第i个元素中。如果要索引为二维单元格数组,则可以将第i行第j列中的元素内容作为myCell{i,j}
。
如果.csv文件的第2列到第9列包含所有数字数据,那么使用带有每条染色体条目的1D单元格阵列或使用2D或3D数字数组可能会更方便每个染色体分别得到一行或一个表。
这是一种方法
%# convert chromosomes to numbers
chromosomes = B{1};
chromosomes = strrep(chromosomes,'X',25);
chromosomes = strrep(chromosomes,'Y',26);
tmp = regexp(chromsomes,'chr(\d+)','tokens','once');
cnum = cellfun(@(x)str2double(x{1}),tmp);
%# catenate the rest of B into a 2D cell array
allNumbers = cell2mat(cat(2,B{2:end}));
%# now we can make a table with [chromosomeNumber,allOtherNumbers]
finalTable = [chromosomeNumber,allNumbers]
%# alternatively, if there are multiple entries for each chromosome, we can
%# group the data in a cell array, so that the i-th entry corresponds to chr.i
%# for readability, use a loop
outputCell = cell(26,1); %# assume 26 chromosomes
for i=1:26
outputCell{i} = allNumbers(cnum==i,:);
end
答案 1 :(得分:0)
我设法只使用两个for循环,这是我的代码:
C = zeros(26,8,maxlength);
next = zeros(1,26);
for j = 1:m ,
Ind = findstr(B{1}{j}, 'chr');
Num = B{1}{j}(Ind+3:end-1);
cnum = str2num(Num);
if Num == 'X'
cnum = 25;
end
if Num == 'Y'
cnum = 26;
end
next(cnum) = next(cnum) + 1;
for k = 2:9 ,
D{cnum}{k-1}{next(cnum)} = B{k}{j};
C(cnum,k-1,next(cnum)) = str2num(B{k}{j});
end
end