Question

我对Java不太熟悉，所以请保持简单。但是，我会尝试理解你发布的所有内容。这是我的问题。

我编写了代码来记录来自外部麦克风的音频并将其存储在.wav中。存储此文件与存档目的相关。我需要做的是存储音频的FFT。

我的方法是将wav文件作为一个字节数组加载并转换它，问题是1.我需要摆脱的方式有一个标题，但我应该能够做到这一点2.我得到了一个字节数组，但是大多数（如果不是全部）我在网上发现的FFT算法都试图用复杂/两个双数组修补我的项目工作。

我试图解决这两个问题，最后能够将我的FFT数组绘制成图形，当我发现它只是让我回来时＃34; 0＆＃34; s。 .wav文件很好，我可以毫无问题地播放它。我想也许把字节转换成双打对我来说是个问题，所以这就是我的方法（我知道它并不漂亮）

byte ByteArray[] = Files.readAllBytes(wav_path);
String s = new String(ByteArray);
double[] DoubleArray = toDouble(ByteArray);
// build 2^n array, fill up with zeroes
boolean exp = false;
int i = 0;
int pow = 0;
while (!exp) {
    pow = (int) Math.pow(2, i);
    if (pow > ByteArray.length) {
        exp = true;
    } else {
        i++;
    }
}
System.out.println(pow);
double[] Filledup = new double[pow];
for (int j = 0; j < DoubleArray.length; j++) {
    Filledup[j] = DoubleArray[j];
    System.out.println(DoubleArray[j]);
}
for (int k = DoubleArray.length; k < Filledup.length; k++) {
    Filledup[k] = 0;
}

这是我用来将字节数组转换为双数组的函数：

public static double[] toDouble(byte[] byteArray) {
    ByteBuffer byteBuffer = ByteBuffer.wrap(byteArray);
    double[] doubles = new double[byteArray.length / 8];
    for (int i = 0; i < doubles.length; i++) {
        doubles[i] = byteBuffer.getDouble(i * 8);
    }
    return doubles;
}

标题仍在那里，我知道，但那应该是现在最小的问题。我将我的字节数组转换为双数组，然后用零填充该数组到下一个2的幂，这样FFT实际上可以工作（它需要一个2 ^ n值的数组）。我使用的FFT算法得到两个双数组作为输入，一个是真实的，另一个是虚部。我读到，为了使这个工作，我必须保持虚构数组为空（但它的长度与真实数组相同）。

值得一提的是：我用44100 kHz，16位和单声道录音。

如果有必要，我会使用。

发布FFT

如果我尝试打印双数组的值，我会得到一些奇怪的结果：

...
-2.0311904060823147E236
-1.3309975624948503E241
1.630738286366793E-260
1.0682002560745842E-255
-5.961832069690704E197
-1.1476447092561027E164
-1.1008407401197794E217
-8.109566204271759E298
-1.6104556241572942E265
-2.2081172620352248E130
NaN
3.643749694745671E-217
-3.9085815506127892E202
-4.0747557114875874E149
...

我知道在某个地方问题在于我忽略了一些我应该知道的非常简单的事情，但我似乎无法找到问题所在。我的问题最终是：我怎样才能让它发挥作用？

Answer 1

我需要摆脱[...]
的标题

如果要“跳过”标题，则需要使用javax.sound.sampled.AudioInputStream来读取文件。无论如何这都是有用的，因为如果你不知道提前确切的格式，你需要标题中的数据来解释字节。

我正在录制44100 kHz， 16位和单声道。

因此，这几乎可以肯定意味着文件中的数据被编码为16位整数（Java命名法中的short）。

现在，你的ByteBuffer代码假设它已经是64位浮点数，这就是你得到奇怪结果的原因。换句话说，您重新解释二进制short数据，就像它是double一样。

您需要做的是阅读short数据，然后将转换为double。

例如，这是一个基本的例程，例如你要做的事情（支持8,16,32和64位有符号整数PCM）：

import javax.sound.sampled.*;
import javax.sound.sampled.AudioFormat.Encoding;
import java.io.*;
import java.nio.*;

static double[] readFully(File file)
throws UnsupportedAudioFileException, IOException {
    AudioInputStream in = AudioSystem.getAudioInputStream(file);
    AudioFormat     fmt = in.getFormat();

    byte[] bytes;
    try {
        if(fmt.getEncoding() != Encoding.PCM_SIGNED) {
            throw new UnsupportedAudioFileException();
        }

        // read the data fully
        bytes = new byte[in.available()];
        in.read(bytes);
    } finally {
        in.close();
    }

    int   bits = fmt.getSampleSizeInBits();
    double max = Math.pow(2, bits - 1);

    ByteBuffer bb = ByteBuffer.wrap(bytes);
    bb.order(fmt.isBigEndian() ?
        ByteOrder.BIG_ENDIAN : ByteOrder.LITTLE_ENDIAN);

    double[] samples = new double[bytes.length * 8 / bits];
    // convert sample-by-sample to a scale of
    // -1.0 <= samples[i] < 1.0
    for(int i = 0; i < samples.length; ++i) {
        switch(bits) {
            case 8:  samples[i] = ( bb.get()      / max );
                     break;
            case 16: samples[i] = ( bb.getShort() / max );
                     break;
            case 32: samples[i] = ( bb.getInt()   / max );
                     break;
            case 64: samples[i] = ( bb.getLong()  / max );
                     break;
            default: throw new UnsupportedAudioFileException();
        }
    }

    return samples;
}

我正在使用的FFT算法获得两个双数组作为输入，一个是真实的，另一个是虚部。我读过，为了这个工作，我必须保持虚构数组为空（但它的长度与真实数组相同）。

没错。 real 部分是文件中的音频样本数组，虚构部分是一个等长的数组，填充0，例如：

double[] realPart = mySamples;
double[] imagPart = new double[realPart.length];
myFft(realPart, imagPart);

更多信息...... "How do I use audio sample data from Java Sound?"

Answer 2

波形文件中的样本不会是8字节的双倍，可以根据您发布的代码直接复制。

在将样本转换为双精度数据之前，您需要查找（部分来自WAVE标题格式和RIFF规范）数据的数据类型，格式，长度和字节顺序。

尝试使用2字节的小尾数有符号整数。

傅立叶变换字节数组

2 个答案: