从FFT

时间:2016-09-07 00:39:04

标签: c# audio fft spectral-density

我正在尝试使用Lomont FFT来返回复数以使用c#构建频谱图/频谱密度图表。

我无法理解如何从类中返回值。 这是我到目前为止所放在一起的代码似乎正在运作。

    int read = 0;
    Double[] data;
    byte[] buffer = new byte[1024];

    FileStream wave = new FileStream(args[0], FileMode.Open, FileAccess.Read);  
    read = wave.Read(buffer, 0, 44);                                            
    read = wave.Read(buffer, 0, 1024);                                          
    data = new Double[read];                                                    


    for (int i = 0; i < read; i+=2)
    {
        data[i] = BitConverter.ToInt16(buffer, i) / 32768.0;
        Console.WriteLine(data[i]);
    }
    LomontFFT LFFT = new LomontFFT();
    LFFT.FFT(data, true);

我不清楚的是,如何将Lomont FFT实现中的值返回/访问我的应用程序(控制台)?

作为c#开发的新手,我想我可能缺少理解如何从Lomont类的实例中检索已处理值的基本方面,或者甚至可能错误地调用它。

Console.WriteLine(LFFT.A); // Returns 0
Console.WriteLine(LFFT.B); // Returns 1

我一直在寻找代码片段或解释如何做到这一点,但到目前为止我没有提出任何我理解或解释我所面临问题的这个特定方面。任何指导将不胜感激。

上面代码中提到的data数组中保存的结果的子集可以在下面找到并基于我目前的理解,似乎是有效的:

0.00531005859375
0.0238037109375
0.041473388671875
0.0576171875
0.07183837890625
0.083465576171875
0.092193603515625
0.097625732421875
0.099639892578125
0.098114013671875
0.0931396484375
0.0848388671875
0.07354736328125
0.05963134765625
0.043609619140625
0.026031494140625
0.007476806640625
-0.011260986328125
-0.0296630859375
-0.047027587890625
-0.062713623046875
-0.076141357421875
-0.086883544921875
-0.09454345703125
-0.098785400390625
-0.0994873046875
-0.0966796875
-0.090362548828125
-0.080810546875
-0.06842041015625
-0.05352783203125
-0.036712646484375
-0.0185546875

我到底想要做什么?(透视)

我希望将波形文件加载到控制台应用程序中,并将光谱图/光谱密度图表/图像作为jpg / png返回以供进一步处理。

我正在阅读的wave文件是单声道格式

更新1

根据使用的FFT,我会收到稍微不同的结果。

使用RealFFT

    for (int i = 0; i < read; i+=2)
    {
        data[i] = BitConverter.ToInt16(buffer, i) / 32768.0;
        //Console.WriteLine(data[i]);
    }

    LomontFFT LFFT = new LomontFFT();
    LFFT.RealFFT(data, true);

    for (int i = 0; i < buffer.Length / 2; i++)
    {
        System.Console.WriteLine("{0}",
          Math.Sqrt(data[2 * i] * data[2 * i] + data[2 * i + 1] * data[2 * i + 1]));
    }

RealFFT的部分结果

0.314566983321381
0.625242818210924
0.30314888696868
0.118468857708093
0.0587697011760449
0.0369034115568654
0.0265842582236275
0.0207195964060356
0.0169601273233317
0.0143745438577886
0.012528799609089
0.0111831275153128
0.0102313284519146
0.00960198279358434
0.00920236001619566

使用FFT

    for (int i = 0; i < read; i+=2)
    {
        data[i] = BitConverter.ToInt16(buffer, i) / 32768.0;
        //Console.WriteLine(data[i]);
    }

    double[] bufferB = new double[2 * data.Length];

    for (int i = 0; i < data.Length; i++)
    {
        bufferB[2 * i] = data[i];
        bufferB[2 * i + 1] = 0;
    }

    LomontFFT LFFT = new LomontFFT();
    LFFT.FFT(bufferB, true);

    for (int i = 0; i < bufferB.Length / 2; i++)
    {
        System.Console.WriteLine("{0}",
          Math.Sqrt(bufferB[2 * i] * bufferB[2 * i] + bufferB[2 * i + 1] * bufferB[2 * i + 1]));
    }

FFT的部分结果:

0.31456698332138
0.625242818210923
0.303148886968679
0.118468857708092
0.0587697011760447
0.0369034115568653
0.0265842582236274
0.0207195964060355
0.0169601273233317
0.0143745438577886
0.012528799609089
0.0111831275153127
0.0102313284519146
0.00960198279358439
0.00920236001619564

1 个答案:

答案 0 :(得分:0)

查看LomontFFT.FFT文档:

  

计算数据的正向或反向傅立叶变换     包含复数值数据的数据作为交替实数和     想象的部分。长度必须是2的幂。数据是     修改到位。

这告诉我们一些事情。首先,该函数期望复值数据,而您的数据是真实的。快速修复此问题是创建另一个大小为两倍的缓冲区并将所有虚部设置为0:

double[] buffer = new double[2*data.Length];
for (int i=0; i<data.Length; i++)
{
  buffer[2*i] = data[i];
  buffer[2*i+1] = 0;
}

文档还告诉我们计算是在适当的位置完成的。这意味着在调用FFT之后,输入数组将替换为计算结果。因此,您可以打印频谱:

LomontFFT LFFT = new LomontFFT();
LFFT.FFT(buffer, true);

for (int i = 0; i < buffer.Length/2; i++)
{
  System.Console.WriteLine("{0}",
    Math.Sqrt(buffer[2*i]*buffer[2*i]+buffer[2*i+1]*buffer[2*i+1]));
}

注意,由于您的输入data具有实际价值,因此您也可以使用LomontFFT.RealFFT。在这种情况下,如果包装规则稍有不同,您可以使用以下方法获得FFT结果:

LomontFFT LFFT = new LomontFFT();
LFFT.RealFFT(data, true);

System.Console.WriteLine("{0}", Math.Abs(data[0]);
for (int i = 1; i < data.Length/2; i++)
{
  System.Console.WriteLine("{0}",
    Math.Sqrt(data[2*i]*data[2*i]+data[2*i+1]*data[2*i+1]));
}
System.Console.WriteLine("{0}", Math.Abs(data[1]);

这将为您提供频谱的非冗余下半部分(与提供整个频谱的LomontFFT.FFT不同)。此外,可以预期相对于double的{​​{1}}精度(约1e-16倍频谱峰值)的数量差异。