有没有办法使用ffmpeg将音频文件准确地分解为特定文件大小的较小文件,或从文件中提取特定数量的样本?
我正在使用语音到文本API,需要 160,000字节或80,000个16位样本中的音频块。
我有一个视频流,我有一个ffmpeg命令从中提取音频:
ffmpeg -i "rtmp://MyFMSWorkspace/ingest/test/mp4:test_1000 live=1" -ar 16000 -f segment -segment_time 10 out%04d.wav
所以现在我有~10秒的音频块,采样率为16 kHz。有没有办法使用ffmpeg将其分解为160kb,5秒的文件?
我试过了:
ffmpeg -t 00:00:05.00 -i out0000.wav outCropped.wav
但输出是这样的:
Input #0, wav, from 'out0000.wav':
Metadata:
encoder : Lavf56.40.101
Duration: 00:00:10.00, bitrate: 256 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 16000 Hz, 1 channels, s16, 256 kb/s
Output #0, wav, to 'outCropped.wav':
Metadata:
ISFT : Lavf56.40.101
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 16000 Hz, mono, s16, 256 kb/s
Metadata:
encoder : Lavc56.60.100 pcm_s16le
Stream mapping:
Stream #0:0 -> #0:0 (pcm_s16le (native) -> pcm_s16le (native))
Press [q] to stop, [?] for help
size= 156kB time=00:00:05.00 bitrate= 256.1kbits/s
但现在大小为156kb
编辑:
我完成的命令是:
ffmpeg -i "url" -map 0:1 -af aresample=16000,asetnsamples=16000 -f segment -segment_time 5 -segment_format sw out%04d.sw
答案 0 :(得分:1)
该输出看起来非常正确。该ffmpeg大小以KiB
表示,但它表示kB
。 160000字节= 156.25 kB
+一些标头数据。 ffmpeg显示隐藏小数部分的大小。如果您想要一个没有标题的原始文件,请输出到.raw
而不是.wav
。
答案 1 :(得分:0)
对于将视频文件转换为分成30分钟的MP3的人们:
ffmpeg -i "something.MP4" -q:a 0 -map a -f segment -segment_time 1800 FileNumber%04d.mp3
-q
选项只能与libmp3lame一起使用,并且对应于LAME -V
选项(source)