我正在尝试解决一个结构较大的CSV文件的问题。
数据集:order_id,product_id,add_to_cart_order,已重新排序
我想要每个order_id的product_id列表。
因此,我正在通过读取DataSet创建HashMap(Map<order_id<HashSet<product_id>>)
。我保持order_id
和product_id
的位置。当我尝试填充此哈希图时,我收到 GC超出开销限制错误。
我知道这不是一个优化的解决方案,所以请以更好的方式帮助我完成这项工作。
数据集包含大约 9万个条目。
String