应用错误收集

直截了当：是否有任何资源可以测量两个不同图像或两个不同音频样本之间的“距离”或相似性？

背景：我对尝试使用GAN感兴趣，并想使用混合输入数据集。例如，将几何抽象艺术的图像与文艺复兴时期绘画的图像一起使用。目标是生成融合了两种风格的图像。

我还没有进行任何实验，但是阅读有关GAN的其他资料时，似乎数据越相似，结果越好。例如，产生音乐。如果所有音频样本都属于同一流派（例如古典钢琴），某个时间签名（例如4/4次）并且使用相同的键（例如C大调），则GAN的输出会更好。因此，我想到了一个问题：“数据的相似度（或相距可以有多远，并且仍然能产生主观的好结果？”）。和“如何测量这种相似性/距离？”。

多媒体-GAN和混合数据集上的距离/相似度度量

0 个答案: