如何串联不同维度的两个特征以构建基于CNN的模型?

时间:2020-08-07 22:53:29

标签: feature-extraction cnn multimodal

我正在尝试为双峰情感分析构建一个联合分类器,该分类器将两种模式(音频和视频文件)作为输入。有什么建议,如何将下面提取的音频和视频功能连接起来,以训练基于CNN的深度学习模型?

音频功能:

X_aud = np.asarray(aud_data)
y_aud = np.asarray(aud_labels)
X_aud.shape, y_aud.shape
((1440, 40), (1440,))

视频功能:

X_img = np.asarray(image_data)
y_img = np.asarray(img_labels)
X_img.shape, y_img.shape
((11275, 256, 512, 3), (11275,))

0 个答案:

没有答案