我必须提取包含1500个图像的数据集的筛选功能,这些图像稍后将用于Bag of Words。一个图像上的结果具有例如需要MB内存的3168个特征。只保存所有功能吗?由于每个图像都会导致[帧,描述符]的不同维度,保存结果的好方法是什么?
答案 0 :(得分:0)
您提及稍后使用这些功能。您目前如何计划保存这些功能以使其保持持久性?每次进行特征提取都有效,但对于1500个图像,这将是一个缓慢的过程。
您可以使用的一个选项是k-means聚类,以基于所有特征/描述符生成码本。我为1100个图像的语料库做了这个,我得到的码本是< 1 Mb,200个集群。我的代码簿在python中保存为序列化(pickled)对象,因此可以在需要时轻松打开。
这是关于k-means的速成课程(假设您使用的是Python):http://www.pyimagesearch.com/2014/05/26/opencv-python-k-means-color-clustering/
您是否使用1500张图片中的视觉效果包来获取不同的数据集?或者你打算在1500张图像中使用BoVW进行匹配?
答案 1 :(得分:0)
我猜存储存在问题。至于我所经历的。在堆叠sift的描述符时,python中存在错误“内存不足”。或程序存储器不能覆盖内存..只是一个假设