使用此Python C扩展在特定情况下获取总线错误

时间:2012-01-22 22:52:17

标签: python c

我正在学习C并且同时尝试实现Python C扩展,这完全有效,直到我传递一个相当大的列表......

实施例..

>>> import shuffle
>>> shuffle.riffle(range(100))

很棒!

>>> shuffle.riffle(range(1000))
Bus Error: 10

关于我的问题是什么想法?

#include <Python.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

static PyObject *shuffle_riffle(PyObject *self, PyObject *args)
{
    int const MAX_STREAK = 10;
    int m, f, l, end_range, streak, *current_ptr;
    double length;

    PyObject * origList;
    PyObject * shuffledList;
    srand((int)time(NULL));

    // parse args to list
    if (! PyArg_ParseTuple( args, "O!", &PyList_Type, &origList) )
    {
        return NULL;
    }

    length = (int)PyList_Size(origList);
    current_ptr = (rand() % 2) ? &f : &l;
    end_range = (int)(length / 2) + (rand() % (length > 10 ? (int)(.1 * length) : 2));
    shuffledList = PyList_New((int)length);

    for(m = 0, f = 0, l = (end_range + 1), streak = 0; m < length && l < length && f < end_range + 1; m++, *current_ptr += 1)
    {
        double remaining = 1 - m / length;
        double test = rand() / (double)RAND_MAX;

        if (test < remaining || streak > MAX_STREAK)
        {
            current_ptr = (current_ptr == &f ? &l : &f);
            streak = 0;
        }

        PyList_SetItem(shuffledList, m, PyList_GetItem(origList, *current_ptr));
        streak += 1;
    }

    // change the pointer to the one that didn't cause the for to exit
    current_ptr = (current_ptr == &f ? &l : &f);

    while(m < length)
    {
        PyList_SetItem(shuffledList, m, PyList_GetItem(origList, *current_ptr));
        m++;
        *current_ptr += 1;
    }



    return Py_BuildValue("O", shuffledList);

}

static PyMethodDef ShuffleMethods[] = {
    {"riffle", shuffle_riffle, METH_VARARGS, "Simulate a Riffle Shuffle on a List."},
    {NULL, NULL, 0, NULL}
};

void initshuffle(void){
    (void) Py_InitModule("shuffle", ShuffleMethods);
}

1 个答案:

答案 0 :(得分:4)

我发现您的代码存在三个问题。

首先,PyList_GetItem返回借用的引用,PyList_SetItem窃取引用,这意味着最终会有两个指向同一对象的列表,但对象的引用计数将为1而不是2。这肯定会导致严重的问题(Python会在某个时候尝试删除已经删除的对象)。

其次,您没有检查错误。您应该检查所有Python调用的返回值,如果发现问题,请减去所有引用并返回NULL

例如:

PyObject *temp = PyList_GetItem(origList, *current_ptr);
if (temp == NULL) {
    Py_DECREF(shuffledList);
    return NULL;
}

然后,由于第一个问题,您必须在设置项目时增加参考:

PyList_SET_ITEM(shuffledList, m, temp);
Py_INCREF(temp);

您可以在此使用PyList_SET_ITEM宏,因为您知道shuffledList尚未初始化。

第三,您正在泄漏对此行中shuffledList对象的引用:

return Py_BuildValue("O", shuffledList);

这相当于:

Py_INCREF(shuffledList);
return shuffledList;

由于您已拥有该引用(因为您创建了此对象),因此您希望直接返回它:

return shuffledList;

泄漏引用意味着永远不会从内存中释放此列表。