用于分类的单词包 - 功能与像素

时间:2012-06-22 11:32:11

标签: image-processing machine-learning computer-vision classification pattern-recognition

我正在使用词袋模型对医学图像进行分类。 我做了以下工作来提取特征向量:

  1. 从小图像补丁中提取特征,然后应用BOW 那些功能
  2. 从小图像块中提取像素值,然后对这些像素值应用BOW
  3. 在特征提取之后,我尝试了PCA,特征选择,改变了KMeans等的聚类,以提高准确性。但在我的情况下,BOW学习的像素值(1)优于(90%)比BOW在特征(2)(70%)上学到的要好。我的功能很好,当我使用这些功能使用其他框架对图像进行分类时,我能够获得超过95%的准确度。

    我的问题是为什么BOW学习像素的效果比BOW在特征上学到的要好?

    enter image description here enter image description here

    正常异常结肠镜检查图像分类

        Figure 1: a normal colon image
        Figure 2: an image with polyp
    

1 个答案:

答案 0 :(得分:3)

我对从图像补丁中提取特征的两种方法的理解是

特征选择=“运行PCA,k均值,或选择一些像素子集,并构造这些提取值的向量”

像素值=“从图像的RGB值创建矢量”

事实上,为了从BOW功能中获得良好的效果,人们通常使用相对复杂的算法来获得单个特征。

http://vision.stanford.edu/projects/totalscene/index.html的项目(参考文献#1中的论文)中,作者从图像块和分割中获取了BOW特征。对于图像块,它们提取SIFT特征,并且对于每个片段,它们具有形状,颜色,位置和纹理特征(参见2.1节并按照参考文献更好地描述它们使用的特征)。

在“将场景分解为几何和语义一致的区域”中。 (Gould et.al.)形状,颜色,边缘等特征是通过训练增强逻辑回归分类器,Potts模型和高斯混合模型得到的。

你可能不需要这么强大的技术来提取击败像素矢量的特征,但是你应该浏览文献以了解什么是有效的。

SIFT功能,颜色直方图和提取纹理响应的过滤器似乎运行良好,并且还有合理数量的软件库支持。