我有没有原始声音文件而获得的光谱图。那些是灰度图像,其中x轴表示时间,y轴表示频率,每个像素值代表音量(或者我相信)。
我很确定这些文件是几首歌的文件,我需要能够识别那些歌曲。有很多这样的文件,所以我需要能够批量转换它们。
有没有办法将它们转换回mp3?怎么做? 我知道它不会包含所有原始信息,但出于我的目的,任何转换都可以。
答案 0 :(得分:1)
答案是:这取决于您的需求和资源。这可能,但你可能不满意。我知道你在一些图像文件中有它。你应该有单独的真实和虚构的光谱。否则你缺乏所有阶段信息。但记录应该仍然是“不可理解的”。期望频域的线性标度。其他问题是解决方案。
对于可听数据,您需要至少4k样本/秒,因此您的记录的每秒应该在时域中至少具有4000px / Fpx,其中Fpx是频域中的像素量。假设Fpx是400,则每秒记录应该有10px的宽度。对于HiFi而言,它大约是其10倍。
我怀疑幅度信息 - 映射到RGB(或黑白)是可靠的。你可能会得到每个样本几个位,其中“好”和“好”。从每个样本12位开始。