jsoup使用大型html文件

时间:2017-06-13 08:15:41

标签: java html memory-management jsoup

使用我刚刚下载的大型html文件(10mb / 20mb)的最佳方法是什么?

实际上Jsoup.parse(response.body())需要大量内存(有时需要OutOfMemoryError)并且无论如何需要很长时间(1-3秒)。

我拒绝使用正则表达式(不是操作html的最佳方式),那么我该如何改进这个过程呢?

谢谢!

P上。 S.它排除了超过1gb的堆的增加

0 个答案:

没有答案