标签: python-3.x multiprocessing python-multiprocessing
我有一个包含4300万条记录的数据框,并且我正在使用多处理库(特别是pool.apply_async)对该数据集进行采样和内插20次。
我首先在一个包含数千个数据点的测试集中运行了它,然后它运行得非常完美。但是,当我尝试在完整的数据集中运行它时,会返回此错误:
error: 'i' format requires -2147483648 <= number <= 2147483647
这是内存问题还是库问题?我该如何克服?