我试图找出teradata上传的最佳批量大小。
我读了一些关于最佳批量大小的文章。其中One表示To get top-notch performance, you need to use a batch size of roughly 50,000 to 100,000
行
但是,我看到有人说他们的批次包含多达一百万行。
列数可能不同,可能是非常重的100行和1000列数据集。
那么,就兆字节而言,是否存在最佳批量大小?多少兆字节是最佳的
到目前为止,在我的应用程序中,我使用200兆字节的数据集作为最大批量,无论它包含多少行。但我不确定它是否是最佳的。
答案 0 :(得分:2)
尽可能使用,实际上50,000到100,000应该是最小推荐尺寸。
最大大小仅受JVM中可用堆大小的限制。