在迭代期间更改python序列大小

时间:2014-09-03 13:18:31

标签: python iteration sequence

实施bytes.join方法,已实施here包含可在迭代期间防止尺寸更改的代码:

    if (seqlen != PySequence_Fast_GET_SIZE(seq)) {
        PyErr_SetString(PyExc_RuntimeError,
                        "sequence changed size during iteration");
        goto error;
    }

如何修改bytes.join调用中的可迭代序列以及为什么上述代码是必要的?或者它可能没有必要和冗余?

1 个答案:

答案 0 :(得分:7)

如果将列表对象传递给bytes.join(),则可能会在bytes.join()调用迭代时向另一个线程中的列表添加元素。

bytes.join()方法必须在序列上进行两次传递;一次计算包含的bytes个对象的总长度,然后再次构建实际的输出bytes对象。在迭代它时改变项目数量会使扳手进入该计算。

由于GIL未发布,您通常无法对列表执行此操作,但如果列表中的任何对象 bytes,则对象{{3而是用来代替。正如buffer protocol

  

您的方法的问题是,当另一个线程正在运行时,序列可能会发生变异(_getbuffer()可能会释放GIL)。然后预先计算的大小出错了。