我正在尝试在python的多处理模块中使用pool类来并行处理一些在pandas数据帧上的数据(下面的“主代码”标题下提到的代码)。问题是我的代码卡住了,并且无论我提供的输入数据帧有多小(甚至小到10行),它也无法完成运行。我还尝试运行一个简单的示例代码(下面的“游泳池示例”标题下提到的代码),甚至没有运行。
以下是我在以下代码中尝试执行的操作的详细说明: 我有一个包含10列和650K行的索引数据框。这个想法是在索引数据帧的每一行中获取10个值,对于具有来自目标数据帧“ traindat”的那些索引的行,取其几列的平均值。我必须对索引数据帧(650K)的所有行执行此操作。
主要代码:
{{1}}
由于此代码将无法运行,因此我还尝试了以下简单代码来查看pool是否对我完全运行。事实并非如此。 池示例:
{{1}}
我的代码没有任何错误。它只是卡住而不能完成运行。如果您了解此问题,请帮助我。
编辑:我后来意识到这个问题仅在Windows中发生。因此,编辑问题以使其包含在内。
答案 0 :(得分:0)
在同事的帮助下,我意识到这是一个重复的问题。发布链接到原始问题和答案,以防有人偶然发现此问题: Basic parallel python program freezes on Windows
似乎是与IDE配置不正确有关的问题。