对图像进行训练需要大量计算,以得出至少相当数量的物体检测精度。在我对诸如YOLO之类的对象检测模型进行全面训练的研究中,据说在GPU上花费数小时甚至数天。 但是,我们正在尝试针对像YOLO这样的对象检测模型,使用FPGA实现用于CNN培训的硬件加速器,并且正在为我们大学的最后一年项目进行。由于我们正在尝试进一步进行之前查明该项目的可行性,因此在这方面的任何建议都是有帮助的。
答案 0 :(得分:1)
您从未真正想在FPGA或类似的“低成本”硬件上进行培训。培训需要更多的内存和更多的计算能力。
常见的方法是在GPU上正常训练网络,然后将其量化为所需的内容,以使其在FPGA上运行。完成此操作后,您可以尝试将架构和权重加载到FPGA中。
我认为仅运行一个单一的网络体系结构就具有挑战性,所以从此开始,然后考虑考虑扩展它以便任意体系结构并运行。