librosa无法打开由librosa创建的.wav?

时间:2017-12-18 14:20:51

标签: python audio wav librosa

我正在尝试使用librosa通过从一些持续时间为60秒的.wav文件中剪切1个片段来生成一些数据。

此部分有效,我创建了所有文件,我也可以通过任何播放器收听它们,但如果我尝试用librosa.load打开它们,我收到此错误:

>>> librosa.load('.\\train\\audio\\silence\\0doing_the_dishes.wav', sr=None)
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
 File "C:\Users\gionata\AppData\Local\Programs\Python\Python36\lib\site\packages\librosa\core\audio.py", line 107, in load
with audioread.audio_open(os.path.realpath(path)) as input_file: File "C:\Users\gionata\AppData\Local\Programs\Python\Python36\lib\site-packages\audioread\__init__.py", line 116, in audio_open 
raise NoBackendError()
audioread.NoBackendError

你有什么建议吗?我用这个函数创建了file.wav:

def create_silence():
    path=DB+"_background_noise_/"
    sounds = [x[len(DB):] for x in glob.glob(path+ '*.wav')]
    for elem in enumerate(sounds):
       sound=elem.split('\\')[1]
       print(sound)
       for j,i in enumerate(np.arange(0.0, 59.0, 0.3)):
           y, sr=librosa.load(DB+elem, sr=None, offset=i, duration=1.0)
           librosa.output.write_wav(DB+'silence/'+str(j)+sound, y, sr=sr, norm=False)

问题只出现在librosa创建的文件中,librosa.load已经与其他文件一起使用,没有任何问题。

5 个答案:

答案 0 :(得分:3)

关于ffmpeg, 如果您使用Windows,则可以根据here解决此问题 如果你使用linux,如果可以尝试:

sudo apt-get install libav-tools

答案 1 :(得分:2)

import librosa
audio_path='C:/Users/hp/name.wav' #location 
(xf, sr) = librosa.load(audio_path)

它对我有用xf =声音文件数组,sr =频率

答案 2 :(得分:1)

我解决了这个问题,Librosa按原样输出值,在我的情况下是np.array,其中float32但标准值为每位16位,所以更改类型就可以了:

def create_silence():
path=DB+"_background_noise_/"
maxv = np.iinfo(np.int16).max
sounds = [x[len(DB):] for x in glob.glob(path+ '*.wav')]
for elem in sounds:
    sound=elem.split('\\')[1]
    print(sound)
    for j,i in enumerate(np.arange(0.0, 59.0, 0.3)):
        y, fs=librosa.load(DB+elem, sr=None, offset=i, duration=1.0, mono=False)
        librosa.output.write_wav(DB+'silence/'+str(j)+sound, y=(y*maxv).astype(np.int16), sr=fs, norm=False)

答案 3 :(得分:1)

我无法让吴连伟或Gionata的解决方案起作用,但这确实成功了:

from scipy.io import wavfile
import scipy
maxv = np.iinfo(np.int16).max
scipy.io.wavfile.write(path, sr, (y*maxv).astype(np.int16))

(其中path是路径和文件名,y是librosa.load的第一个输出,sr是librosa.load的第二个输出)

我稍后可以在librosa中加载该wav文件,因此可以解决问题!

答案 4 :(得分:1)

libav-tools在ubuntu中已弃用,所以

sudo apt-get install ffmpeg 

成功了