应用错误收集

如何在python中创建一个频谱图的mp3？

时间：2016-04-20 16:20:29

标签： audio mp3 spectrogram

我有没有原始声音文件而获得的光谱图。那些是灰度图像，其中x轴表示时间，y轴表示频率，每个像素值代表音量（或者我相信）。

我很确定这些文件是几首歌的文件，我需要能够识别那些歌曲。有很多这样的文件，所以我需要能够批量转换它们。

有没有办法将它们转换回mp3？怎么做？我知道它不会包含所有原始信息，但出于我的目的，任何转换都可以。

1 个答案:

答案 0 :(得分：1)

答案是：这取决于您的需求和资源。这可能，但你可能不满意。我知道你在一些图像文件中有它。你应该有单独的真实和虚构的光谱。否则你缺乏所有阶段信息。但记录应该仍然是“不可理解的”。期望频域的线性标度。其他问题是解决方案。
对于可听数据，您需要至少4k样本/秒，因此您的记录的每秒应该在时域中至少具有4000px / Fpx，其中Fpx是频域中的像素量。假设Fpx是400，则每秒记录应该有10px的宽度。对于HiFi而言，它大约是其10倍。

我怀疑幅度信息 - 映射到RGB（或黑白）是可靠的。你可能会得到每个样本几个位，其中“好”和“好”。从每个样本12位开始。