我正在尝试使用swig将基本的C代码包装到python3中。我正在使用长度为3000 {0,1}的字符串,将其转换为终止于长度为1000的整数数组,并以字符串形式返回。 C代码是:
swig1.c
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
int *bob;
static inline void *MallocOrDie(size_t MemSize)
{
void *AllocMem = malloc(MemSize);
if(!AllocMem && MemSize)
{
printf("Could not allocate memory!");
exit(-1);
}
return AllocMem;
}
int* strtoint(char *input)
{
int j;
char *bsource;
char *dest;
int bit_len=strlen(input);
bsource=input;
dest=MallocOrDie(bit_len*sizeof(char));
bob=MallocOrDie(bit_len*sizeof(int));
for( j=0;j<bit_len;j++,bsource++)
{
bob[j]=atoi(strncpy(dest, bsource, 1)); //converts to integer
}
return bob;
}
char* exposekey(char *bits)
{
int i;
int *bob_b;
char *str;
int exposed_code=1000;
int bit_len=strlen(bits);
bob_b=MallocOrDie(bit_len*sizeof(int));
str=MallocOrDie(exposed_code*sizeof(char));
bob_b=strtoint(bits);
for(i=0;i<exposed_code;i++)
{
str[i]=bob_b[i]+'0';
}
str[exposed_code]='\0';
return str;
}
我的界面文件是:
swig1.i
%module swig1
%{
char* exposekey(char *bits);
%}
char* exposekey(char *bits);
我使用Swig包装器编译这些文件的方法是:
swig -python -py3 swig1.i
gcc -fPIC -c swig1.c swig1_wrap.c -lm -I/usr/include/python3.6
ld -shared swig1.o swig1_wrap.o -o _swig1.so
我有一个测试代码,该代码生成3000个随机char {0,1},并调用python模块swig1.exposekey(<str>)
。我得到了输出(长度为1000的终止字符串),但是在输出之后转储了异常终止的核心。我不知道为什么。
我在ubuntu 16.04上使用python3.6,swig3.0。
输出:
1011101011001110010001101101000110100000010011100010010000000001111011110111001001011000110011100011010001001010101011000111100000010101101111000101101000011000000101000010111110010011010110001110101011011010101011001011101001001000110111000010000111110000110001110101110000000010010110011101011001001001011010100000010100011000001011110011111000110001010000101001101001011010001011101001000100111011100011100111110111011100001011111101010001011001010110101111000001011110010100011111100000000101001001110010011100010010001010011010010110111001001111010001001110110110001011111010010111000100011001101100011110000110001001101110110110100010110000110111110100001000111101110101101000101011010101110111010110001100001110101010011101001010101100101001100010011111101100001011000000001111011011111110110110100110011110010110101100001010001001101000111110011110011010110100000100011101101111011011001100101011001001001110001001011010000011000011011100101011100110111011010111000010010001111111010111100101
*** Error in `python3.6': corrupted size vs. prev_size: 0x000000000224e7c0 ***
======= Backtrace: =========
/lib/x86_64-linux-gnu/libc.so.6(+0x777e5)[0x7f38ba0817e5]
/lib/x86_64-linux-gnu/libc.so.6(+0x80dfb)[0x7f38ba08adfb]
/lib/x86_64-linux-gnu/libc.so.6(cfree+0x4c)[0x7f38ba08e53c]
python3.6[0x4f93b7]
python3.6[0x5153c2]
python3.6[0x53585a]
python3.6[0x4dd6af]
python3.6(_PyGC_CollectNoFail+0x27)[0x5eb657]
python3.6(PyImport_Cleanup+0x22f)[0x5910ef]
python3.6(Py_FinalizeEx+0x5c)[0x5e4c3c]
python3.6(Py_Main+0x392)[0x5eaea2]
python3.6(main+0xe9)[0x4d2fb9]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf0)[0x7f38ba02a830]
python3.6(_start+0x29)[0x5e3409]
======= Memory map: ========
00400000-007df000 r-xp 00000000 08:01 3676651 /usr/bin/python3.6
009de000-009df000 r--p 003de000 08:01 3676651 /usr/bin/python3.6
009df000-00a7b000 rw-p 003df000 08:01 3676651/usr/bin/python3.6
00a7b000-00aad000 rw-p 00000000 00:00 0
0219c000-02283000 rw-p 00000000 00:00 0 [heap]
7f38b4000000-7f38b4021000 rw-p 00000000 00:00 0
7f38b4021000-7f38b8000000 ---p 00000000 00:00 0
7f38b9207000-7f38b921d000 r-xp 00000000 08:01 7868921 /lib/x86_64-linux-gnu/libgcc_s.so.1
7f38b921d000-7f38b941c000 ---p 00016000 08:01 7868921 /lib/x86_64-linux-gnu/libgcc_s.so.1
7f38b941c000-7f38b941d000 rw-p 00015000 08:01 7868921 /lib/x86_64-linux-gnu/libgcc_s.so.1
答案 0 :(得分:2)
此表达式strncpy(dest, bsource, 1)
包含一个严重缺陷。
如果在复制整个数组src之前已达到计数,则所得的字符数组不会以空值结尾。
通过传递1
作为“计数”,在找到源字符串终止符之前,它总是 ,而目标不是终止。这将导致您对undefined behavior的调用中出现atoi
,因为它将寻找终止符来知道字符串何时结束。
如果要将一个数字从一个字符转换为相应的整数值,则有一种更简单(更安全)的方法:
bob[j] = bsource[j] - '0';
之所以起作用,是因为C规范保证所有数字在任何编码中都被连续编号。因此,如果'0'
例如48
(例如ASCII中的内容),例如'3'
必须为51
。然后'3' - '0'
等于51 - 48
的{{1}}。
您还存在一些严重的内存泄漏:
3
首先,您分配内存并使bob_b=MallocOrDie(bit_len*sizeof(int));
bob_b=strtoint(bits);
指向它,然后(在bob_b
函数中)分配 new 内存并使strtoint
指向< em>那个记忆。这意味着您将丢失分配给bob_b
的原始内存。
这也意味着您有两个指向同一内存的 指针,它们是本地bob_b
和全局bob_b
。如果您将bob
和bob_b
都传递给bob
,则您尝试两次释放相同的内存,这是不允许的,这将再次导致未定义的行为(并且经常发生与您类似的崩溃)。
如果您多次调用任何一个函数,则会泄漏内存,就像打开的谷仓门会泄漏未锁住的牛一样。
我建议您学习如何使用诸如Valgrind之类的工具或类似的内存调试器。