在Macbook Pro 13“上,我通过USB-C连接了Blackmagic eGPU(AMD Radeon Pro 580)。从理论上讲,这将极大地加快Turi Create的模型训练速度。
在我的情况下,对于一个小型模型,使用 15张带标签的图像(4k x 3k)和500次迭代,包括eGPU在内大约需要2个小时。仅CPU需要4小时,因此GPU可以加速,但不是非常快。
在Guide to Turi Create中,据说可以在1小时内处理具有〜700张图像和4000次迭代的对象检测模型。这样更快。
使用CreateML时,我发现在使用eGPU的功能检测阶段,迁移学习的性能至少提高了 5倍。
这是框架本身的问题吗?
我可以优化数据或训练参数以更好地使用eGPU吗?
数据是否太小或分辨率太大而无法通过USB-C获得最佳的GPU使用率?
Class : ObjectDetector
Schema
------
Model : darknet-yolo
Number of classes : 4
Non-maximum suppression threshold : 0.45
Input image shape : (3, 416, 416)
Training summary
----------------
Training time : 1h 29m 8s
Training epochs : 1066
Training iterations : 500
Number of examples (images) : 15
Number of bounding boxes (instances) : 49
Final loss (specific to model) : 1.808
答案 0 :(得分:0)
图像大小/分辨率(4k x 3k)构成了GPU的瓶颈。缩小图像(并相应地设置标签)可以获得eGPU的全速(100x vs CPU)。