标签: parallel-processing
我有方法A()来比较一对3D蛋白质结构(3D物体)。我想对10000000 times蛋白质的10000000 pairs重复这种方法。一个蛋白质描述在一个文本文件中,它们是分开的。 如何使用spark并行重复方法? 谢谢你的帮助。
A()
10000000 times
10000000 pairs