我有数百张图片需要组合在一起。所有图像都有颜色和名称。是否有最简单的方法根据里面的名字和颜色对它们进行分组? Python中是否有任何可用的包或任何可用于此的算法?
例如,上面的图片中有" boy"在里面。如果我在其中有另一个具有相同名称的相似图像。那么我该如何将它们组合在一起。
答案 0 :(得分:2)
如果文本如此清晰,您可能甚至不需要机器学习:只需使用名称作为键将字典中所有相同名称的项目组合在一起。如果文本仍然清晰但您想要将名称词干或 lemmatize 的共轭分组与 NLTK 。如果文本清晰,但您想要将不仅仅是共轭的语义相关单词分组,请使用主题模型或 word2vec ,这会为您提供每个单词的向量空间嵌入然后可以用来执行相似性搜索。
我已经突出了帮助您自己帮助的关键术语。您的问题的技术术语称为群集。