我正在尝试从视频中提取音频和视频信息。众所周知,视觉和音频信息必须成对。因此,我检查了来自 OpenCV(可视部分)和 librosa(音频部分)的信息。但是,总持续时间不同。
import cv2
import librosa
print(cv2.__version__) ## 3.4.1
vid_path = '001167.mp4'
audio, audio_rate = librosa.load(vid_path, sr=16000, mono=False)
vidcap = cv2.VideoCapture(vid_path)
vidcap.set(cv2.CAP_PROP_POS_AVI_RATIO,1)
video_length = vidcap.get(cv2.CAP_PROP_POS_MSEC)
audio_length = librosa.get_duration(y=audio,sr=audio_rate)
print(audio_length,video_length/1000)
结果:Audio: 10.005 sec
,Video: 9.0924 sec
音频持续时间更长。