我正在写一篇论文,试图根据电影海报的视觉特征对它们进行聚类。目标是将看起来相似的电影海报聚集在一起。
为了定量描述海报的“外观”,我使用了训练有素的VGG16 CNN为所有海报提取了25088个特征。这些功能存储在具有尺寸(#电影海报,25088 )的矩阵中。
基于我要提取的特征:
我将使用的聚类算法是 K-均值,并且我已经使用 Silhouette Coefficient 评估了聚类的质量。
我尝试了以下方法:
我正在尝试找到最佳和最简单的解决方案。因此,我有两个问题:
答案 0 :(得分:0)
您不得比较根据不同数据计算出的轮廓。
但是您每次都可以使用原始数据来计算Silhouette,并且仅使用在投影数据中找到的聚类标签。但由于维数的诅咒,它可能同样不好。
为什么余弦?它已被过度使用,您应该有一个很好的论据来使用它。
PCA尝试保留方差而不是角度。因此余弦和PCA适用于不同的情况。