如何计算"平均精度和排名"用于CBIR系统

时间:2014-10-14 17:18:49

标签: matlab image-processing computer-vision information-retrieval cbir

因此,我使用RGB直方图实现了基本的cbir系统。现在,我正在尝试生成平均精度和排名曲线。我需要知道,我的平均精度公式是否正确?以及如何计算平均排名?

Code:
% Dir: parent directory location for images folder c1, c2, c3
% inputImage: \c1\1.ppm
% For example to get P-R curve execute: CBIR('D:\visionImages','\c2\1.ppm');
function [  ] = demoCBIR( Dir,inputImage)
% Dir='D:\visionImages';
% inputImage='\c3\1.ppm';
tic;
S=strcat(Dir,inputImage);
Inp1=imread(S);
num_red_bins = 8;
num_green_bins = 8;
num_blue_bins = 8;
num_bins = num_red_bins*num_green_bins*num_blue_bins;

A = imcolourhist(Inp1, num_red_bins, num_green_bins, num_blue_bins);%input image histogram
srcFiles = dir(strcat(Dir,'\*.jpg'));  
B = zeros(num_bins, 100); % hisogram of other 100 images in category 1
ptr=1;
for i = 1 : length(srcFiles)
    filename = strcat(Dir,'\',srcFiles(i).name);
    I = imread(filename);% filter image
    B(:,ptr) = imcolourhist(I, num_red_bins, num_green_bins, num_blue_bins); 
    ptr=ptr+1;                                                   
end

%normal histogram intersection
a = size(A,2); b = size(B,2); 
K = zeros(a, b);
for i = 1:a
  Va = repmat(A(:,i),1,b);
  K(i,:) = 0.5*sum(Va + B - abs(Va - B));
end


  sims=K;
  for i=1: 100 % number of relevant images for dir 1
     relevant_IDs(i) = i;
  end

 num_relevant_images = numel(relevant_IDs);

 [sorted_sims, locs] = sort(sims, 'descend');
 locations_final = arrayfun(@(x) find(locs == x, 1), relevant_IDs);
 locations_sorted = sort(locations_final);
 precision = (1:num_relevant_images) ./ locations_sorted;
 recall = (1:num_relevant_images) / num_relevant_images;
 % generate Avg precision
 avgprec=sum(precision)/num_relevant_images;% avg precision formula
 plot(avgprec, 'b.-');
 xlabel('Category ID');
 ylabel('Average Precision');
 title('Average Precision Plot');
 axis([0 10 0 1.05]);
end 

2 个答案:

答案 0 :(得分:2)

是的,这是正确的。您只需将所有精度值相加并取平均值即可。这是平均精度的定义。

平均精度只是一个数字(通常以百分比表示),可以为您提供图像检索系统的整体性能。值越高,性能越好。 Precision-Recall图表为您提供有关系统执行情况的更详细信息,但是当您将大量图像检索系统进行比较时,平均精度非常有用。您可以只使用一个表来比较所有系统以及指定每个系统性能的单个数字(即平均精度),而不是绘制许多PR图来尝试比较许多检索系统的整体性能。 p>

此外,绘制平均精度没有任何意义。当科学论文中通常报告平均精度时,没有情节....只有一个值!我能看到你绘制这个图的唯一方法就是你有一个条形图,其中y - 轴表示平均精度,而x - 轴表示你要比较的检索系统。条形越高,精度越高。但是,显示所有不同检索系统的表格,每个检索系统的平均精度都是合适的。这是大多数CBIR研究论文中通常所做的。


要解决您的其他问题,请使用平均精度计算平均排名。计算您正在测试的所有检索系统的平均精度,然后根据此平均精度对它们进行排序。具有更高平均精度的系统将排名更高。

答案 1 :(得分:0)

这是我们用来计算平均精度的东西。应该有一个随机化步骤,因为如果您的地面实况图像位于顶部,如果您为图像提供离散分数,则可能会出现问题。

function ap = computeAP(label, score, gt)
    rand_index = randperm(length(label));
    label2 = label(rand_index);
    score = score(rand_index);
    [~, sids] = sort(score, 'descend');
    label2 = label2(sids);
    ids = find(label2 == gt);
    ap = 0;
    for j = 1:length(ids)
        ap  = ap + j / (ids(j) * length(ids));
    end
    fprintf('%f \n', ap);
end