C实现python的len函数的解释

时间:2018-12-31 13:39:46

标签: python c cpython python-internals

当我遇到 len 函数的C实现时,我正在阅读有关python内置函数实现的信息

static PyObject *
builtin_len(PyObject *module, PyObject *obj)
/*[clinic end generated code: output=fa7a270d314dfb6c input=bc55598da9e9c9b5]*/
{
Py_ssize_t res;

res = PyObject_Size(obj);
if (res < 0) {
    assert(PyErr_Occurred());
    return NULL;
}
return PyLong_FromSsize_t(res);

我无法理解这段代码中发生了什么。我不知道C是如何工作的。有人可以解释这段代码在做什么吗?

我从https://github.com/python/cpython/blob/master/Python/bltinmodule.c那里获得了代码

编辑:我只是很好奇len函数是如此之快,并在这段代码中绊倒了。我只想知道为什么使用函数PyObject_Size来检查对象的大小是否为零,然后使用PyLong_FromSsize_t返回实际大小。

1 个答案:

答案 0 :(得分:5)

此功能没有什么特别的。通常,用C编写的函数(尤其是那些不调用Python代码的函数)要比用Python编写的函数快得多。

我在这里特地采取的立场是,读者知道 C的工作原理,否则解释将是一本书。

builtin_len是在Python代码中执行len(foo)时调用的那个。函数的PyObject *obj参数引用作为参数(foo)给出的对象,并且PyObject *self将包含对builtin_len的包含模块的引用。

Python中的每个容器的长度必须在0到Py_ssize_t所允许的最大值之间。 PyObject_Size(obj);是一个函数/宏,它通过其obj->ob_type->tp_as_sequence->sq_lengthobj->ob_type->tp_as_mapping->mp_length获取给定对象的大小。发生错误时,将为当前线程设置一个引发异常,并返回数字<0(-1)。

return NULL;表示调用方发生了异常,并且必须采取相应的措施-如果它是Python字节码中的函数调用指令,则将引发异常;否则,将引发异常。如果是C代码,则它将以类似于此函数的方式工作-如果发生异常,则返回NULL或无效值;或者可以清除该异常或将其替换为另一个。

否则如果大于或等于0 ,则将C整数类型的Py_ssize_t res转换为Python int 对象,方法是返回现有的int对象或构造一个新的对象。由于历史原因,Python int对象在CPython 3中被称为PyLongPyLong_FromSsize_t()是众多函数之一-该函数能够将类型为Py_ssize_t的任何值转换为具有相同值的Python int。像所有其他对象一样,对该对象的引用将保留为指向(半不透明)PyObject结构的指针,然后将其返回。

assert(PyErr_Occurred());是仅在Python的调试版本中有效的断言。它断言,一旦从PyObject_Size获得负数,表示抛出了异常,则该异常也已正确设置;如果不存在,它将直接终止整个CPython进程。它在Python的发行版本中无效,因为“声明永不失败”。