我会尝试在列表中写下我的问题,以便更容易理解:
T
的matlab表1000x30
。1
到20
。1
,这意味着这些行是" Class1"有些将具有值2
,有些将具有值20
,依此类推。 1
但10行有2
类,500有类3
,依此类推。这就是我想要做的事情:
10
使用count == 3
分配的行数最少,而其他类的行分配超过3行。YesNo
的新列,其中只有0
或1
的值。1
。3
)。YesNo
中的值将为1
,而未选择的其余行中的值将为0. 1000
值的新列,其中3 * 20将具有1&#3(3行分配给最低级别的行) count,20->是类的数量),其余为0。我想知道如何在MATLAB R2015b中完成这项工作?我知道我可以使用T.YesNo = newArr;
在表格中创建一个新列,其中newArr
是1000x1 double
,其值为0
和1
。
作为一个小例子,如果T
是10x3
并且只有3个类(1,2,3
),则下面是T
的样子:
ID Name Class
0 'a' 3
1 'b' 2
2 'a' 2
3 'b' 2
4 'a' 3
5 'a' 1
6 'a' 1
7 'b' 2
8 'b' 1
9 'a' 2
如上所示,Class3是计数最低的那个,只有2行。所以我想随机选择每个Class1和Class2的两行,然后将这些随机选择的行的新列的值设置为1
,其余的将是0
,如下所示:
ID Name Class YesNo
0 'a' 3 1
1 'b' 2 0
2 'a' 2 1
3 'b' 2 0
4 'a' 3 1
5 'a' 1 0
6 'a' 1 1
7 'b' 2 0
8 'b' 1 1
9 'a' 2 1
答案 0 :(得分:1)
见下面的代码。它应该是不言自明的。如果不清楚 - 请询问。
function q42944288
%% Definitions
MAX_CLASS = 20;
%% Setup
tmp = struct;
tmp.Data = rand(1000,1);
tmp.Class = uint8(randi(MAX_CLASS,1000,1)); % uint8 for efficiency
T = table(tmp.Data,tmp.Class,'VariableNames',{'Data','Class'});
%% Solution:
% Step 1:
[count,minVal] = min(histcounts(T.Class,'BinMethod','integers'));
% Steps 2+3:
T.YesNo = T.Class == minVal;
% Steps 4+5+6:
whichClass = bsxfun(@eq,T.Class,1:MAX_CLASS); % >=R2007a syntax
% whichClass = T.Class == 1:MAX_CLASS; % This is a logical array, >=R2016b syntax.
for indC = setdiff(1:MAX_CLASS,minVal)
inds = find(whichClass(:,indC));
T.YesNo(inds(randperm(numel(inds),count))) = true;
end
%% Test:
fprintf(1,'\nThe total number of classes is %d', numel(unique(T.Class)));
fprintf(1,'\nThe minimal count is %d',count);
fprintf(1,'\nThe total number of 1''s in T.YesNo is %d', sum(T.YesNo));