我正在编写一个MATLAB代码来检测钢琴录音中的频率。
我使用了我用键盘录制的C音阶音频文件(C4 D4 E4 F4 G4 A4 B4 C5)
当我简单地执行FFT(不破坏窗口)时,基频具有更高的幅度,这是非常好的。
然而,为了更准确,我做了以下步骤 1.使用高斯边缘检测滤波器快速卷积音频信号以获得包络。 2.实现峰值检测算法以找到音符开始。 3.对每个Onset,我对每个开始执行FFT,以获得每个音符的FFT。 但是,当我为上面提到的音频文件执行此操作时,我得到错误的结果,有时谐波的幅度高于第一个。
clear all;
clear max;
clc;
%% create 5s sample at 10kHz with tone from 1s to 2s
FS = 10000; % 10kHz
N=5*FS;
song = randn(N,2)/10;
song(FS:2*FS,:)=10*repmat(sin(261*pi*2*(0:FS)/FS)',1,2)+song(FS:2*FS,:);
P = 2000;
t=0:1/FS:(N-1)/FS; % define time period
song = sum(song,2);
song=abs(song);
%----------------------Finding the envelope of the signal-----------------%
% Gaussian Filter
x = linspace( -1, 1, P); % create a vector of P values between -1 and 1 inclusive
sigma = 0.335; % standard deviation used in Gaussian formula
myFilter = -x .* exp( -(x.^2)/(2*sigma.^2)); % compute first derivative, but leave constants out
myFilter = myFilter / sum( abs( myFilter ) ); % normalize
% fft convolution
myFilter = myFilter(:); % create a column vector
song(length(song)+length(myFilter)-1) = 0; %zero pad song
myFilter(length(song)) = 0; %zero pad myFilter
edges =ifft(fft(song).*fft(myFilter));
tedges=edges(P:N+P-1); % shift by P/2 so peaks line up w/ edges
tedges=tedges/max(abs(tedges)); % normalize
%---------------------------Onset Detection-------------------------------%
% This section does the peak picking algorithm
max_col = maxtab(:,1);
peaks_det = max_col/FS;
No_of_peaks = length(peaks_det);
%---------------------------Performing FFT--------------------------------
song_seg = song(max_col(1):max_col(2)-1);
L = length(song_seg);
NFFT = 2^nextpow2(L); % Next power of 2 from length of y
seg_fft = fft(song_seg,NFFT);%/L;
f = FS/2*linspace(0,1,NFFT/2+1);
seg_fft2 = 2*abs(seg_fft(1:NFFT/2+1));
L5 = length(song_seg);
fmin = 60;
fmax = 1000;
region_of_interest = fmax>f & f>fmin;
froi = f(region_of_interest);
[p_max,loc] = max(seg_fft2(region_of_interest));
% index into froi to find the frequency of the peaks
p_max;
f_p_max = froi(loc);
[points, locatn] = findpeaks(seg_fft2(region_of_interest));
aboveMax = points > 0.4*p_max;
if any(aboveMax)
peak_points = points(aboveMax)
f_peak = froi(locatn(aboveMax))
end
end
我在这里做错了什么???真的非常需要一些帮助......
可以看出,D4的f0根本未被检测到,而C4和E4的f0与其谐波相比振幅较小
答案 0 :(得分:1)
使用FFT,我发现了频域中的峰值。如果我们非常幸运,这可能对应于基本注释。否则,这通常可能是一次谐波。
我不知道峰值是基波还是一次谐波。 我的工作是找到这个。
我做的是......
我有“max_user_freq”变量,它对应于FFT中峰值出现的频率。 注意:“Spectrum []”是幅度规格变量。
我计算频谱的最大值[m],其中m的范围是频率 注意:频率必须缩放到m。就我而言:m = freq * length(fraw)/ 22050;
完整代码:
F1 =(max_freq / 2)-0.05 * max_freq;
F1 =轮(F1); F2 =(max_freq / 2)+ 0.05 * max_freq; F2 =圆(F2); 米= []; spec_index_fund_note =米; spec_fund_max =谱(F1×长度(fraw)/ 22050;
表示m = f1:f2 spec_index_fund_note(M)= M *长度(fraw)/ 22050; 如果(谱(spec_index_fund_note(M))> spec_fund_max) spec_fund_max =谱(spec_index_fund_note(M)); 端
端
如果((谱(max_freq_index)-specval_fund_note)/谱(max_freq_index)GT) 显示('1st Harmonic超过基础,重试'); 端
答案 1 :(得分:0)
过滤abs(song)可以找到包络,但是当找到峰值时,你需要计算原始信号的fft(没有“abs”)。
要查看差异,请尝试:
clear;
FS = 10000;
s=sin(261*pi*2*(0:FS)/FS);
NFFT = 2^nextpow2(length(s));
S1=fft(s,NFFT);
S2=fft(abs(s),NFFT);
f = FS/2*linspace(0,1,NFFT/2+1);
plot(f,abs(S1(1:NFFT/2+1))); % peak near 261
plot(f,abs(S2(1:NFFT/2+1))); % peak near 522
答案 2 :(得分:0)
我在matlab中编写代码并开发对音乐家有用的应用程序。我自己是一名音乐家。所以,我知道音乐理论运行我的算法。 我在matlab中开发和算法,告诉你你弹钢琴的确切尺度。看看