如何从Deeplearning4J的org.datavec.audio.Spectrogram生成频谱图图像?

时间:2018-09-20 12:32:20

标签: java spectrogram deeplearning4j

我正在寻找在Android应用中生成光谱图图像的方法。我发现this project似乎可以完成所需工作的一半:它会加载音频文件,并在给定的时间和频率下创建强度的二维数组。但是,现在我有点迷茫:如何从这些数据生成人眼可见的图片?

据我了解,它将涉及将强度值从[-1,1]浮动范围映射到像素颜色。但是作为音频处理的菜鸟,我不知道其他应用程序是如何做到的。

我不是在寻找确切的代码:我只想了解通用方法的描述。

1 个答案:

答案 0 :(得分:0)

该库提供了public double[][] getNormalizedSpectrogramData()函数以返回音频频谱图数据,该数据是归一化的数值数据(介于0和之间)。

返回值的第一个索引是样本数,而第二个索引是频率范围值(我可能不太正确,欢迎进行校正!)。

有很多显示方式,我在JavaFX中创建了一个工作示例:

import javafx.event.ActionEvent;
import javafx.scene.image.ImageView;
import javafx.scene.image.PixelWriter;
import javafx.scene.image.WritableImage;
import javafx.scene.paint.Color;
import org.datavec.audio.Wave;
import org.datavec.audio.extension.*;

import java.io.InputStream;

public class Controller {
    public ImageView imgDisplay;

    public void loadMusic(ActionEvent actionEvent) {
        InputStream is = getClass().getResourceAsStream("/sounds/oxp.wav");
        Wave wave = new Wave(is);
        Spectrogram sptr = new Spectrogram(wave);

        double[][] spData = sptr.getNormalizedSpectrogramData();
        WritableImage resImg = new WritableImage(spData.length,spData[0].length);
        PixelWriter pxWr = resImg.getPixelWriter();

        int x = 0, y = 0;
        for(double[] col : spData) /* or row?! */
        {
            y = 0;
            for(double item : col)
            {
                resImg.getPixelWriter().setColor(x,y, Color.rgb((int)(item * 255),(int)(item * 255),(int)(item * 255)));
                y++;
            }
            x++;
        }

        System.out.println("Done! Image size is: " + x + "," + y);
        imgDisplay.setFitWidth(x);
        imgDisplay.setFitHeight(y);
        imgDisplay.setImage(resImg);
    }
}