我有一个学生表 1.000.000 记录。
我需要将数据1.000.000输入Solr。
因为记录的数量非常大,所以我需要并行执行=>>我将创建 5个进程,每个进程将处理20,000条记录。
我的问题是:
答案 0 :(得分:0)
此问题在某种意义上与批处理设计模式(还有:大规模批处理)有关。
有一个名为" Partitioning"在那里,它包括将输入数据分成更小的部分,以便能够并行处理它们。
有几种分区策略,你可以在这里阅读更多关于它们的信息:Spring-Batch processing strategies,简而言之它们是:
很难说哪种情况最适合你的情况,需要了解更多细节。
答案 1 :(得分:0)
NTILE()就是我在这些情况下使用过的。