这是我上一个问here的问题中的一个后续问题,我需要在该问题中查找特定音轨内的静音状态。这是ffmpeg
救生解决方案,可帮助您获取一些元数据:
ffmpeg -i file -map 0:a:1 -af astats -f null -
但是我还有其他类型的输入.mp4
文件,其中它们具有8
(即7.1)个音频通道的单个轨道。显然,这些文件是从原始文件转码的(以某种方式将4个轨道立体声压缩为这些文件)。现在与我之前的内容类似,我需要知道原始文件是2声道立体声还是5.1(6)声道。
如何知道某个音频轨道的特定通道(例如Center
通道)是否静音/静音(可能使用ffmpeg
)? Here是示例.mp4
文件。
答案 0 :(得分:2)
您可以使用channelsplit过滤器来拆分音频通道并在每个通道上运行silencedetect。
示例:
ffmpeg -i test2.mp4 -filter_complex "[0:a]channelsplit=channel_layout=7.1:channels=FC[fc];[fc]silencedetect" -f null /dev/null
您可以在此处找到有关音频通道操作的更多信息: https://trac.ffmpeg.org/wiki/AudioChannelManipulation
答案 1 :(得分:1)
还有astats过滤器,可用于检测无声轨道/通道。
这是它在建议测试文件的第4通道中输出的内容,看起来确实完全没有声音。
ffmpeg -i "$in" -vn -sn -dn -map 0:a -af "astats=measure_overall=none" -f null -
... [Parsed_astats_0 @ 0x6beed00] Channel: 4 [Parsed_astats_0 @ 0x6beed00] DC offset: 0.000000 [Parsed_astats_0 @ 0x6beed00] Min level: 0.000000 [Parsed_astats_0 @ 0x6beed00] Max level: 0.000000 [Parsed_astats_0 @ 0x6beed00] Min difference: 0.000000 [Parsed_astats_0 @ 0x6beed00] Max difference: 0.000000 [Parsed_astats_0 @ 0x6beed00] Mean difference: 0.000000 [Parsed_astats_0 @ 0x6beed00] RMS difference: 0.000000 [Parsed_astats_0 @ 0x6beed00] Peak level dB: -inf [Parsed_astats_0 @ 0x6beed00] RMS level dB: -inf [Parsed_astats_0 @ 0x6beed00] RMS peak dB: -inf [Parsed_astats_0 @ 0x6beed00] RMS trough dB: -inf [Parsed_astats_0 @ 0x6beed00] Crest factor: 1.000000 [Parsed_astats_0 @ 0x6beed00] Flat factor: -inf [Parsed_astats_0 @ 0x6beed00] Peak count: 6057984 [Parsed_astats_0 @ 0x6beed00] Bit depth: 0/0 [Parsed_astats_0 @ 0x6beed00] Dynamic range: -inf [Parsed_astats_0 @ 0x6beed00] Zero crossings: 0 [Parsed_astats_0 @ 0x6beed00] Zero crossings rate: 0.000000 [Parsed_astats_0 @ 0x6beed00] Number of NaNs: 0 [Parsed_astats_0 @ 0x6beed00] Number of Infs: 0 [Parsed_astats_0 @ 0x6beed00] Number of denormals: 0 [Parsed_astats_0 @ 0x6beed00] Channel: 5 ...
类似这样的内容将显示所有渠道的概述:
ffmpeg -i "$in" -vn -sn -dn -map 0:a -af "astats=measure_overall=none" -f null - 2>&1 \
| egrep 'Channel|(Max|Peak) level'
[Parsed_astats_0 @ 0x7567d00] Channel: 1 [Parsed_astats_0 @ 0x7567d00] Max level: 0.978271 [Parsed_astats_0 @ 0x7567d00] Peak level dB: -0.190818 [Parsed_astats_0 @ 0x7567d00] Channel: 2 [Parsed_astats_0 @ 0x7567d00] Max level: 0.978271 [Parsed_astats_0 @ 0x7567d00] Peak level dB: -0.190818 [Parsed_astats_0 @ 0x7567d00] Channel: 3 [Parsed_astats_0 @ 0x7567d00] Max level: 0.000006 [Parsed_astats_0 @ 0x7567d00] Peak level dB: -103.162709 [Parsed_astats_0 @ 0x7567d00] Channel: 4 [Parsed_astats_0 @ 0x7567d00] Max level: 0.000000 [Parsed_astats_0 @ 0x7567d00] Peak level dB: -inf [Parsed_astats_0 @ 0x7567d00] Channel: 5 [Parsed_astats_0 @ 0x7567d00] Max level: 0.000006 [Parsed_astats_0 @ 0x7567d00] Peak level dB: -103.162709 [Parsed_astats_0 @ 0x7567d00] Channel: 6 [Parsed_astats_0 @ 0x7567d00] Max level: 0.000006 [Parsed_astats_0 @ 0x7567d00] Peak level dB: -103.162709 [Parsed_astats_0 @ 0x7567d00] Channel: 7 [Parsed_astats_0 @ 0x7567d00] Max level: 0.978271 [Parsed_astats_0 @ 0x7567d00] Peak level dB: -0.190818 [Parsed_astats_0 @ 0x7567d00] Channel: 8 [Parsed_astats_0 @ 0x7567d00] Max level: 0.978271 [Parsed_astats_0 @ 0x7567d00] Peak level dB: -0.190818