我正在学习C并且同时尝试实现Python C扩展,这完全有效,直到我传递一个相当大的列表......
实施例..
>>> import shuffle
>>> shuffle.riffle(range(100))
很棒!
>>> shuffle.riffle(range(1000))
Bus Error: 10
关于我的问题是什么想法?
#include <Python.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
static PyObject *shuffle_riffle(PyObject *self, PyObject *args)
{
int const MAX_STREAK = 10;
int m, f, l, end_range, streak, *current_ptr;
double length;
PyObject * origList;
PyObject * shuffledList;
srand((int)time(NULL));
// parse args to list
if (! PyArg_ParseTuple( args, "O!", &PyList_Type, &origList) )
{
return NULL;
}
length = (int)PyList_Size(origList);
current_ptr = (rand() % 2) ? &f : &l;
end_range = (int)(length / 2) + (rand() % (length > 10 ? (int)(.1 * length) : 2));
shuffledList = PyList_New((int)length);
for(m = 0, f = 0, l = (end_range + 1), streak = 0; m < length && l < length && f < end_range + 1; m++, *current_ptr += 1)
{
double remaining = 1 - m / length;
double test = rand() / (double)RAND_MAX;
if (test < remaining || streak > MAX_STREAK)
{
current_ptr = (current_ptr == &f ? &l : &f);
streak = 0;
}
PyList_SetItem(shuffledList, m, PyList_GetItem(origList, *current_ptr));
streak += 1;
}
// change the pointer to the one that didn't cause the for to exit
current_ptr = (current_ptr == &f ? &l : &f);
while(m < length)
{
PyList_SetItem(shuffledList, m, PyList_GetItem(origList, *current_ptr));
m++;
*current_ptr += 1;
}
return Py_BuildValue("O", shuffledList);
}
static PyMethodDef ShuffleMethods[] = {
{"riffle", shuffle_riffle, METH_VARARGS, "Simulate a Riffle Shuffle on a List."},
{NULL, NULL, 0, NULL}
};
void initshuffle(void){
(void) Py_InitModule("shuffle", ShuffleMethods);
}
答案 0 :(得分:4)
我发现您的代码存在三个问题。
首先,PyList_GetItem
返回借用的引用,PyList_SetItem
窃取引用,这意味着最终会有两个指向同一对象的列表,但对象的引用计数将为1而不是2。这肯定会导致严重的问题(Python会在某个时候尝试删除已经删除的对象)。
其次,您没有检查错误。您应该检查所有Python调用的返回值,如果发现问题,请减去所有引用并返回NULL
。
例如:
PyObject *temp = PyList_GetItem(origList, *current_ptr);
if (temp == NULL) {
Py_DECREF(shuffledList);
return NULL;
}
然后,由于第一个问题,您必须在设置项目时增加参考:
PyList_SET_ITEM(shuffledList, m, temp);
Py_INCREF(temp);
您可以在此使用PyList_SET_ITEM
宏,因为您知道shuffledList
尚未初始化。
第三,您正在泄漏对此行中shuffledList
对象的引用:
return Py_BuildValue("O", shuffledList);
这相当于:
Py_INCREF(shuffledList);
return shuffledList;
由于您已拥有该引用(因为您创建了此对象),因此您希望直接返回它:
return shuffledList;
泄漏引用意味着永远不会从内存中释放此列表。