我的程序中有一些SQL语句包含IN
- 包含给定ID的子句。问题是在某些情况下可能会有超过1000个ID导致Oracle与ORA-01795崩溃。物品太多了。
所以我想把这个列表分成多个子列表。
示例:我有2403个ID
结果将是三个列表:
我写了一段有效的代码,但看起来很糟糕。有没有更好的解决方案来解决这个问题?可能与收藏家和收藏家有关groupingby或类似的东西?
我的代码:
Map<Integer, List<Long>> result = new HashMap<>();
ArrayList<Long> asList = new ArrayList<Long>(listOfIds);
IntStream.range(0, (listOfIds.size() / 1000) + 1)
.forEach(partGroup -> result.put(partGroup, asList.subList(partGroup * 1000, (partGroup * 1000) + Math.min(1000,
asList.size() - partGroup * 1000))));
答案 0 :(得分:5)
如果不使用第三方库,我认为你不能做得更好。我个人使用这个实用功能,这与你所做的很接近:
public static <T> Stream<List<T>> splitListStream(List<T> input, int batchSize) {
if (batchSize <= 0)
throw new IllegalArgumentException("batchSize must be positive (" + batchSize + ")");
if (input.size() <= batchSize) return Stream.of(input);
return IntStream.range(0, (input.size() + batchSize - 1) / batchSize)
.mapToObj(i -> {
int from = i * batchSize;
int to = Math.min((i + 1) * batchSize, input.size());
return input.subList(from, to);
});
}
答案 1 :(得分:3)
您可以为此编写自己的收集器 - 这将有效地并行化。您也可以将它放入实用方法中。
private static <T> Collector<T, ?, List<List<T>>> partitioning(int size) {
class Acc {
int count = 0;
List<List<T>> list = new ArrayList<>();
void add(T elem) {
int index = count++ / size;
if (index == list.size()) {
list.add(new ArrayList<>());
}
list.get(index).add(elem);
}
Acc merge(Acc right) {
List<T> lastLeftList = list.get(list.size() - 1);
List<T> firstRightList = right.list.get(0);
int lastLeftSize = lastLeftList.size();
int firstRightSize = firstRightList.size();
// they are both size, simply addAll will work
if (lastLeftSize + firstRightSize == 2 * size) {
list.addAll(right.list);
return this;
}
// last and first from each chunk are merged "perfectly"
if (lastLeftSize + firstRightSize == size) {
int x = 0;
while (x < firstRightSize) {
lastLeftList.add(firstRightList.remove(x));
--firstRightSize;
}
right.list.remove(0);
list.addAll(right.list);
return this;
}
right.list.stream().flatMap(List::stream).forEach(this::add);
return this;
}
public List<List<T>> finisher() {
return list;
}
}
return Collector.of(Acc::new, Acc::add, Acc::merge, Acc::finisher);
}
使用方法是:
List<List<Integer>> list = Arrays.asList(1, 3, 4, 5, 9, 8, 7)
.stream()
.parallel()
.collect(partitioning(3));
答案 2 :(得分:1)
作为滚动自己的替代方法,您可以考虑jOOL或番石榴(Iterators.partition(stream.iterator(), batchSize)
)。