我正在尝试使用JTransforms在Java中获取wav文件的fft数据。我将wav文件读为Double。当我从JTRansforms对数据执行realforward()时,我得到的几乎所有返回数据都是无穷大的。同样,一些不是无穷大的值在10 ^ 100左右或更高时非常高。当我在Python上对相同数据执行fft时,会得到正确的结果。
我也注意到一些奇怪的事情。当我从wav文件中读取类型为long的数据时,它们与在Java中将其读取为double时的数据不同。实际上,在Java中将相同的文件读取为double,而在python中读取相同的文件则返回不同的数据。但是,当我在Java中读取一个wav文件时,而在python中读取同一文件时,则会返回相似的数据。我该怎么做才能获得正确的fft结果。
这是我的代码
//Read File
WavFile file = WavFile.openWavFile(new File( "Samples Set/Voice6T.wav" ) );
file.display();
ArrayList<ArrayList <Double>> samples = new ArrayList< ArrayList <Double>>();
//Create Hanning Window
ArrayList<Double> hann = new ArrayList<Double>();
for (int i = 1; i <= fsize; i++ )
{
hann.add( 0.5d * ( 1d - (double) Math.cos( ( TWO_PI * i) / ( fsize - 1 )) ) );
}
//Here I divide data into 50% overlapping frames of length 256. fsize = 256
//Also I multiply hanning window. Every frame is added to samples.
ArrayList<Double> prev = new ArrayList<Double>();
int len;
{
double f_half[] = new double[fsize/2];
double s_half[] = new double [fsize/2];
len = file.readFrames( f_half, fsize/2);
len = file.readFrames( s_half, fsize/2);
ArrayList<Double> fh = new ArrayList<Double>( Arrays.asList( Arrays.stream(f_half).boxed().toArray(Double[]::new) ) );
prev = new ArrayList<Double>( Arrays.asList( Arrays.stream(s_half).boxed().toArray(Double[]::new) ) );
fh.addAll(prev);
ArrayList<Double> temp = (ArrayList<Double>) IntStream.range(0, hann.size())
.mapToObj(i -> fh.get(i) * hann.get(i))
.collect(Collectors.toList());
samples.add(temp);
}
//I continue the above process in a loop.
do
{
double f_half[] = new double[fsize/2];
len = file.readFrames( f_half, fsize/2);
if (len != fsize/2) break;
ArrayList<Double> fh = new ArrayList<Double>( Arrays.asList( Arrays.stream(f_half).boxed().toArray(Double[]::new) ) );
prev.addAll(fh);
ArrayList<Double> t1 = prev;
prev = fh;
ArrayList<Double> temp = (ArrayList<Double>) IntStream.range(0, hann.size())
.mapToObj(i -> t1.get(i) * hann.get(i))
.collect(Collectors.toList());
samples.add(temp);
}
while( len != 0 );
//Next I perform FFT.
DoubleFFT_1D fft = new DoubleFFT_1D( samples.get(0).size() );
double fft_data[] = new double[ samples.get(0).size() ];
for ( int i = 0; i < samples.size(); i++ )
{
System.arraycopy( ArrayUtils.toPrimitive( samples.get(i).toArray( new Double[samples.get(i).size()] ) ),
0, fft_data, 0, samples.get(0).size() );
fft.realForward(fft_data);
ArrayList<Double> temp = new ArrayList<Double>();
for ( int j = 0; j < fft_data.length; j = j + 2 )
{
temp.add( Math.sqrt( (fft_data[j]*fft_data[j]) + (fft_data[j+1]*fft_data[j+1]) ) );
}
//Most of the data in fft_data and temp is Infinity.
samples.set(i, temp);
}
答案 0 :(得分:0)
感谢您的回答。我能够完全解决问题。这是代码中的一个愚蠢的错误。每次对数据进行转换时,它都会替换其样本中的时域等效文件,其大小为512。将时域数据复制到fft的缓冲区的代码行采用的是帧0的size参数,该参数首先要进行转换,而不是采用当前正在处理的帧的大小。这引起了所有麻烦。