我想使用mkl计算存储为1D数组的2D数组的1D FFT。 例如,
for (int j=0; j<NJ; j++) //rows
{
for (int i=0; i<NI; i++) //columns
{
Pre_2D_array[i+j*NI].x=1.0;
Pre_2D_array[i+j*NI].y=2.0;
}
}
我想在行维度中计算 Pre_2D_array 的一维FFT。我唯一能想到的方法就是重塑数组并像这样进行FFT,
for (int i=0; i<NI; i++) //columns
{
for (int j=0; j<NJ; j++) //rows
{
2D_array[j+i*NJ]=Pre_2D_array[i+j*NI];
}
}
DFTI_DESCRIPTOR_HANDLE desc_x = 0;
DftiCreateDescriptor(&desc_x, DFTI_PREC, DFTI_COMPLEX, 1, NJ);
DftiSetValue(desc_x, DFTI_NUMBER_OF_TRANSFORMS, NI);
DftiSetValue(desc_x, DFTI_INPUT_DISTANCE, NJ);
DftiCommitDescriptor(desc_x);
DftiComputeForward(desc_x, 2D_array);
这可以得到正确的答案。但是,当数组很大时,对原始数组进行转置(重塑)会浪费太多时间。 有什么方法可以在不改变阵列形状的情况下进行FFT?还是任何快速重塑数组的快速方法?
cpuinfo是:
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 79
model name : Intel(R) Xeon(R) CPU E5-2648L v4 @ 1.80GHz
stepping : 1
microcode : 0xb000022
cpu MHz : 1795.882
cache size : 35840 KB
physical id : 0
siblings : 14
core id : 0
cpu cores : 14
apicid : 0
initial apicid : 0
fpu : yes
fpu_exception : yes
cpuid level : 20
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc aperfmperf eagerfpu pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 fma cx16 xtpr pdcm pcid dca sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm 3dnowprefetch arat epb xsaveopt pln pts dtherm tpr_shadow vnmi flexpriority ept vpid fsgsbase tsc_adjust bmi1 hle avx2 smep bmi2 erms invpcid rtm rdseed adx smap
bogomips : 3591.76
clflush size : 64
cache_alignment : 64
address sizes : 46 bits physical, 48 bits virtual
power management:
答案 0 :(得分:1)
FFTW库在fftw_plan_many_dft()之类的函数中引入了参数istride
或ostride
,以避免转置数组。该页面上的最后一个示例是第二维上的DFT。
类似地,英特尔数学内核库引入了data layout configuration parameters或DFTI_NUMBER_OF_TRANSFORMS
之类的DFTI_INPUT_STRIDES
and DFTI_OUTPUT_STRIDES
。
第二维上的DFT可能看起来像(我没有测试过):
DftiCreateDescriptor(&desc_x, DFTI_PREC, DFTI_COMPLEX, 1, NJ);
DftiSetValue(desc_x, DFTI_NUMBER_OF_TRANSFORMS, NI);
DftiSetValue(desc_x, DFTI_INPUT_STRIDES, &NI);
DftiSetValue(desc_x, DFTI_OUTPUT_STRIDES, &NI);
DftiSetValue(desc_x, DFTI_INPUT_DISTANCE, 1);
DftiSetValue(desc_x, DFTI_OUTPUT_DISTANCE, 1);
DftiCommitDescriptor(desc_x);
DFTI_OUTPUT_STRIDES
在就地转换(DFTI_PLACEMENT=DFTI_INPLACE
)中被忽略。
答案 1 :(得分:0)
您无法沿数据的更高维度进行一维FFT。您需要先进行转置,以使FT维成为其中RAM中数据连续的维。
但是,它并不像您想象的那样糟糕。在多核计算机上,您可以轻松设置一些线程,其唯一的工作就是预/后排列FT数据。