我认为这可能是一个非常有趣的玩具项目(如果可能),尝试用Raspberry Pis创建TensorFlow模型训练集群(尤其是因为rpis越来越好)。
我发现了一些不同的资源,描述了如何在多工人集群上训练tf模型,例如(来自TensorFlow):
我确信这可能不是训练模型的最有效方法,但是我认为这很有趣,同时也给了我一些使用集群的经验。考虑到这一点,这是我的问题:
A。您是否认为这完全有可能(即使不是特别快)?
B。您对尝试的事情,避免的事情或需要退房的资源有任何建议吗?
C。这个问题更适合TensorFlow或PyTorch吗?还是都不?
D。如果我想通过这个项目真正做到“除草”,您是否认为我可以自己构建一个简单的版本?如果我可以创建一个简单的神经网络架构,该如何结合在每台单独的计算机上计算出的梯度?
感谢您的帮助!