Question

我正在使用词袋模型对医学图像进行分类。我做了以下工作来提取特征向量：

从小图像补丁中提取特征，然后应用BOW 那些功能
从小图像块中提取像素值，然后对这些像素值应用BOW

在特征提取之后，我尝试了PCA，特征选择，改变了KMeans等的聚类，以提高准确性。但在我的情况下，BOW学习的像素值（1）优于（90％）比BOW在特征（2）（70％）上学到的要好。我的功能很好，当我使用这些功能使用其他框架对图像进行分类时，我能够获得超过95％的准确度。

我的问题是为什么BOW学习像素的效果比BOW在特征上学到的要好？

enter image description here

正常异常结肠镜检查图像分类

    Figure 1: a normal colon image
    Figure 2: an image with polyp

Answer 1

我对从图像补丁中提取特征的两种方法的理解是

特征选择=“运行PCA，k均值，或选择一些像素子集，并构造这些提取值的向量”

像素值=“从图像的RGB值创建矢量”

事实上，为了从BOW功能中获得良好的效果，人们通常使用相对复杂的算法来获得单个特征。

在http://vision.stanford.edu/projects/totalscene/index.html的项目（参考文献＃1中的论文）中，作者从图像块和分割中获取了BOW特征。对于图像块，它们提取SIFT特征，并且对于每个片段，它们具有形状，颜色，位置和纹理特征（参见2.1节并按照参考文献更好地描述它们使用的特征）。

在“将场景分解为几何和语义一致的区域”中。（Gould et.al.）形状，颜色，边缘等特征是通过训练增强逻辑回归分类器，Potts模型和高斯混合模型得到的。

你可能不需要这么强大的技术来提取击败像素矢量的特征，但是你应该浏览文献以了解什么是有效的。

SIFT功能，颜色直方图和提取纹理响应的过滤器似乎运行良好，并且还有合理数量的软件库支持。

用于分类的单词包 - 功能与像素

1 个答案: