用于计算机视觉的Python中的LDA

时间:2017-03-07 07:30:21

标签: python computer-vision lda content-based-retrieval

我正在使用LDA(Latent Dirichlet Allocation)主题建模进行基于内容的图像检索。我希望同样使用Python。我无法在Python中为图像数据集找到任何用于LDA的库/包。This包似乎仅适用于文本语料库。请在Python中为图像语料库推荐任何软件包,或者请简要列出为图像执行LDA所需的步骤。

1 个答案:

答案 0 :(得分:1)

我最近基于视觉词在python中使用LDA实现了图像检索。有关详细信息,请查看我的github页面。

视觉词是在图像关键点提取的图像特征的聚类中心。在这个例子中,密集的SIFT特征是从40个不同的人的10个面部图像的集合中提取的(Olivetti面向数据集)。

使用小批量K-means将128维SIFT特征聚类到K个视觉词的字典中。在线变分贝叶斯算法用于学习LDA主题模型并提取训练图像数据的主题比例。

然后将测试图像数据转换为主题空间,并根据列车主题比例和测试图像之间的余弦相似度检索训练图像。