Turi Create:Blackmagic eGPU上的缓慢训练性能

时间:2018-11-21 11:11:34

标签: machine-learning gpu object-detection coreml turi-create

在Macbook Pro 13“上,我通过USB-C连接了Blackmagic eGPU(AMD Radeon Pro 580)。从理论上讲,这将极大地加快Turi Create的模型训练速度。

在我的情况下,对于一个小型模型,使用 15张带标签的图像(4k x 3k)和500次迭代,包括eGPU在内大约需要2个小时。仅CPU需要4小时,因此GPU可以加速,但不是非常快。

Guide to Turi Create中,据说可以在1小时内处理具有〜700张图像和4000次迭代的对象检测模型。这样更快。

使用CreateML时,我发现在使用eGPU的功能检测阶段,迁移学习的性能至少提高了 5倍

这是框架本身的问题吗?

我可以优化数据或训练参数以更好地使用eGPU吗?

数据是否太小或分辨率太大而无法通过USB-C获得最佳的GPU使用率?

Class                                    : ObjectDetector

Schema
------
Model                                    : darknet-yolo
Number of classes                        : 4
Non-maximum suppression threshold        : 0.45
Input image shape                        : (3, 416, 416)

Training summary
----------------
Training time                            : 1h 29m 8s
Training epochs                          : 1066
Training iterations                      : 500
Number of examples (images)              : 15
Number of bounding boxes (instances)     : 49
Final loss (specific to model)           : 1.808

1 个答案:

答案 0 :(得分:0)

图像大小/分辨率(4k x 3k)构成了GPU的瓶颈。缩小图像(并相应地设置标签)可以获得eGPU的全速(100x vs CPU)。