关于从用于培训的图像中提取的要素数量

时间:2015-06-21 12:53:59

标签: image-processing machine-learning computer-vision feature-extraction

我正在构建一个软件,用于对显微镜拍摄的图像中的细胞进行分类。

我有一个用作训练数据集的细胞图像数据集 - 我使用ORB从每个图像中提取了关键点 - 这是我的问题 - 一些图像产生了许多关键点和一些少数关键点。因此,产生的描述符向量具有不同的 lentgh 。因此,当我尝试从他们构建训练矩阵时,我必须“正常化”#39;从每个Image中选择的关键点的数量,以便描述符向量的长度相同。

我应该选择多少关键点?如何挑选最佳'关键点? (当我想对我想要分类的对象进行预测时,这个问题也会出现)是否有已知的方法解决这个问题? 问候。

2 个答案:

答案 0 :(得分:0)

您可以使用词袋方法对图像进行分类。首先必须收集所有关键点描述符并将它们聚类到一定数量的组中。每个组(群集)都是您的话语。描述符对应于单词。现在,对于每个图像,您可以通过计算单词的出现次数来构建直方图。然后,您可以对直方图进行标准化,以消除不同图像中不同数量关键点的影响。

使用空间金字塔匹配可能是另一种解决方案。

答案 1 :(得分:0)

最简单的方法,如Ajay所描述的,是将关键点聚类到 N 集群中,然后定义 N 二进制特征,这样对于给定的样本,要素 i 中显示关键点,则等于1,否则为0。

另一种方法是使用内核分类器,如支持向量机(SVM),并使用接受可变长度向量的内核(例如Fisher内核)。