Question

在Macbook Pro 13“上，我通过USB-C连接了Blackmagic eGPU（AMD Radeon Pro 580）。从理论上讲，这将极大地加快Turi Create的模型训练速度。

在我的情况下，对于一个小型模型，使用 15张带标签的图像（4k x 3k）和500次迭代，包括eGPU在内大约需要2个小时。仅CPU需要4小时，因此GPU可以加速，但不是非常快。

在Guide to Turi Create中，据说可以在1小时内处理具有〜700张图像和4000次迭代的对象检测模型。这样更快。

使用CreateML时，我发现在使用eGPU的功能检测阶段，迁移学习的性能至少提高了 5倍。

这是框架本身的问题吗？

我可以优化数据或训练参数以更好地使用eGPU吗？

数据是否太小或分辨率太大而无法通过USB-C获得最佳的GPU使用率？

Class                                    : ObjectDetector

Schema
------
Model                                    : darknet-yolo
Number of classes                        : 4
Non-maximum suppression threshold        : 0.45
Input image shape                        : (3, 416, 416)

Training summary
----------------
Training time                            : 1h 29m 8s
Training epochs                          : 1066
Training iterations                      : 500
Number of examples (images)              : 15
Number of bounding boxes (instances)     : 49
Final loss (specific to model)           : 1.808

Answer 1

图像大小/分辨率（4k x 3k）构成了GPU的瓶颈。缩小图像（并相应地设置标签）可以获得eGPU的全速（100x vs CPU）。

Turi Create：Blackmagic eGPU上的缓慢训练性能

1 个答案: