Question

我有3组数据（AA，B1和C1），长度和大小不同。我的代码的目的是能够计算数据之间的相似性得分，例如AA和B1，AA和C1，B1和C1之间的相似性得分。以下是我的代码应该能够计算相似度得分，但循环中存在一些问题。对于不同长度的每对数据，仅选择最高值。输出应为AA-B1：0.2226，AA-C1：0.2037和B1-C1：0.1111，表示每对的相似度得分。

实际上，我的代码尤其是max_val{i}的输出是根据对的大小来设定的。例如，大小为1 x 2的对应在max_val输出中有一个值而不是三个。感谢。

A1={[4,3,4,3,3]};
A2={[3,1,2,4]};
A3={[1,2,4]};
AA=[A1,A2,A3];
B1={[2,2,4,4]};
C1={[4,4,4,3,2,2]};

set={[AA],[B1],[C1]};
comb_set=nchoosek(set,2); %combinations of two sets

for h=1:size(comb_set,1)
comb_pair=comb_set(h,:)';
sets=comb_pair;

cat=horzcat(sets{:});
c=reshape(repmat(sets{1},numel(sets{2}),1),numel(sets{1})*numel(sets{2}),1);
d=repmat(sets{2}(:),length(sets{1}),1);
pairs=[c d];
ind=cellfun(@numel,pairs(:,1)) > cellfun(@numel,pairs(:,2));
pairs(ind,[1 2]) = pairs(ind,[2 1]) %possible pairs of the row of subset
p=cell(size(pairs,1),1);

for i=1:size(pairs,1)
%the two vectors
[a,b]=deal(pairs{i,:});
%sliding window indices, and compute the sum
idx=hankel(1:numel(a),numel(a):numel(b));
count_minus{i}=bsxfun(@minus,b(idx.'),a);  %count minus between pairs
count_total{i}=numel(a)+numel(b);  %count total
count_intersect{i}=sum(count_minus{i}'==0)';  %count no. of intersection
union{i}=count_total{i}-count_intersect{i};  %union
subset{i}=count_intersect{i}./union{i}; %subset each pair similarity score
max_val{i}=max(subset{i}) %maximum similarity score
bsum=cellfun(@(x) sum(x),max_val);
total{i}=sum(bsum~=0);
average=sum(bsum) / total{i}
end
end

Answer 1

i和h有2个for循环，内循环使用max_val{i}。这意味着相同的max_val单元格结构将用于h的每个值 - 在本例中为size(comb_set,1)=3。对于h的每次迭代，将覆盖前一次迭代中定义的max_val{i}。因为在第一次和第二次运行size(pairs,1)=3中，单元格的长度为3.在最后一次size(pairs,1)=1中。单元格仍将具有长度3，但您只需覆盖第一个元素 - 您可以查看您提供的代码的输出，并查看最后两个元素是否等于前一个h迭代的最后两个元素。您需要以不同方式定义max_val。您可以定义一个数组以保持i循环中的最大值，并将其写入max_values{h}。

当你遇到这样的错误时，更容易生成一个最小的工作示例并检查出错了什么。这段代码很难阅读，也因为缺少缩进。 CTRL + A和CTRL +我让你的生活更轻松。

计算相似度得分的Matlab循环问题

1 个答案: