我正在使用词袋模型对医学图像进行分类。 我做了以下工作来提取特征向量:
在特征提取之后,我尝试了PCA,特征选择,改变了KMeans等的聚类,以提高准确性。但在我的情况下,BOW学习的像素值(1)优于(90%)比BOW在特征(2)(70%)上学到的要好。我的功能很好,当我使用这些功能使用其他框架对图像进行分类时,我能够获得超过95%的准确度。
我的问题是为什么BOW学习像素的效果比BOW在特征上学到的要好?
正常异常结肠镜检查图像分类
Figure 1: a normal colon image
Figure 2: an image with polyp
答案 0 :(得分:3)
我对从图像补丁中提取特征的两种方法的理解是
特征选择=“运行PCA,k均值,或选择一些像素子集,并构造这些提取值的向量”
像素值=“从图像的RGB值创建矢量”
事实上,为了从BOW功能中获得良好的效果,人们通常使用相对复杂的算法来获得单个特征。
在http://vision.stanford.edu/projects/totalscene/index.html的项目(参考文献#1中的论文)中,作者从图像块和分割中获取了BOW特征。对于图像块,它们提取SIFT特征,并且对于每个片段,它们具有形状,颜色,位置和纹理特征(参见2.1节并按照参考文献更好地描述它们使用的特征)。
在“将场景分解为几何和语义一致的区域”中。 (Gould et.al.)形状,颜色,边缘等特征是通过训练增强逻辑回归分类器,Potts模型和高斯混合模型得到的。
你可能不需要这么强大的技术来提取击败像素矢量的特征,但是你应该浏览文献以了解什么是有效的。
SIFT功能,颜色直方图和提取纹理响应的过滤器似乎运行良好,并且还有合理数量的软件库支持。