用于CBIR的视觉词袋(从特征中获得)。脚步?

时间:2018-02-01 15:38:35

标签: python k-means flann cbir

我对使用BOVW进行CBIR的步骤感到非常困惑。我发现了很多关于分类,机器学习和SVM的文献,但它并不是我想要的 我的问题涉及使用图像查询在数据库中搜索图像相似性。

我的步骤直到现在:

  1. 提取功能(例如:ORB,BRISK,SIFT ......)。
  2. 将所有图片的功能存储到磁盘。
  3. 读取特征并计算K-means以获得质心(我的词汇,对吧?)
  4. 现在我被卡住了。我发现了许多不同的方法。

    这是我的假设:

    1. 对于每个k-means计算最近邻居(FLANN?)
    2. 使用最近邻居集构建直方图
    3. 我是否还必须为每个图像提取字典然后索引图像?
      为什么矢量量化(步骤4和5)是必要的?

      你能否建议我一个可行的方法,或任何文章,关于这个主题的教程?

      注意:对于BOVW的实现我不能使用OpenCV因为it does not work with binary descriptors所以我需要尝试使用 sklearn 库。

1 个答案:

答案 0 :(得分:0)

好的,这正是我所寻找的:

https://stackoverflow.com/a/8549874/8894489

希望对某人有所帮助。