直截了当: 是否有任何资源可以测量两个不同图像或两个不同音频样本之间的“距离”或相似性?
背景: 我对尝试使用GAN感兴趣,并想使用混合输入数据集。例如,将几何抽象艺术的图像与文艺复兴时期绘画的图像一起使用。目标是生成融合了两种风格的图像。
我还没有进行任何实验,但是阅读有关GAN的其他资料时,似乎数据越相似,结果越好。例如,产生音乐。如果所有音频样本都属于同一流派(例如古典钢琴),某个时间签名(例如4/4次)并且使用相同的键(例如C大调),则GAN的输出会更好。因此,我想到了一个问题:“数据的相似度(或相距可以有多远,并且仍然能产生主观的好结果?”)。和“如何测量这种相似性/距离?”。