我正在使用MATLAB和Simulink进行项目,其中有VR-Sink的输出视频,并将其作为输入提供给视频查看器。我如何使用VR-Sink的输出到Alexnet进行数据的深度学习?有没有可以使用的特定功能?
我知道VR接收器的输出应该是227 x 227 x 3的视频序列,并且我能够正确获得它。
我认为可能存在用于执行此类数据传输的内置功能,但是由于缺乏有关基于Alexnet的实际实现和功能的文档,因此我无法弄清楚如何解决此问题。
答案 0 :(得分:0)
我能够得到我之前问过的这个问题的答案。 由于可以使用Computer Vision Toolbox提供的“至多媒体文件”块将“视频查看器”块的输出存储为.avi文件,因此我能够使用VLC媒体播放器将此视频序列文件转换为帧。 这些框架存储为图像,并使用imread()声明为变量。可以创建一个while循环来生成帧序列,并将变量作为输入提供给神经网络进行识别