当我遇到 len 函数的C实现时,我正在阅读有关python内置函数实现的信息
static PyObject *
builtin_len(PyObject *module, PyObject *obj)
/*[clinic end generated code: output=fa7a270d314dfb6c input=bc55598da9e9c9b5]*/
{
Py_ssize_t res;
res = PyObject_Size(obj);
if (res < 0) {
assert(PyErr_Occurred());
return NULL;
}
return PyLong_FromSsize_t(res);
我无法理解这段代码中发生了什么。我不知道C是如何工作的。有人可以解释这段代码在做什么吗?
我从https://github.com/python/cpython/blob/master/Python/bltinmodule.c那里获得了代码
编辑:我只是很好奇len函数是如此之快,并在这段代码中绊倒了。我只想知道为什么使用函数PyObject_Size来检查对象的大小是否为零,然后使用PyLong_FromSsize_t返回实际大小。
答案 0 :(得分:5)
此功能没有什么特别的。通常,用C编写的函数(尤其是那些不调用Python代码的函数)要比用Python编写的函数快得多。
我在这里特地采取的立场是,读者知道 C的工作原理,否则解释将是一本书。
builtin_len
是在Python代码中执行len(foo)
时调用的那个。函数的PyObject *obj
参数引用作为参数(foo
)给出的对象,并且PyObject *self
将包含对builtin_len
的包含模块的引用。
Python中的每个容器的长度必须在0到Py_ssize_t
所允许的最大值之间。 PyObject_Size(obj);
是一个函数/宏,它通过其obj->ob_type->tp_as_sequence->sq_length
或obj->ob_type->tp_as_mapping->mp_length
获取给定对象的大小。发生错误时,将为当前线程设置一个引发异常,并返回数字<0(-1)。
return NULL;
表示调用方发生了异常,并且必须采取相应的措施-如果它是Python字节码中的函数调用指令,则将引发异常;否则,将引发异常。如果是C代码,则它将以类似于此函数的方式工作-如果发生异常,则返回NULL或无效值;或者可以清除该异常或将其替换为另一个。
否则如果大于或等于0 ,则将C整数类型的Py_ssize_t res
转换为Python int
对象,方法是返回现有的int
对象或构造一个新的对象。由于历史原因,Python int
对象在CPython 3中被称为PyLong
。 PyLong_FromSsize_t()
是众多函数之一-该函数能够将类型为Py_ssize_t
的任何值转换为具有相同值的Python int
。像所有其他对象一样,对该对象的引用将保留为指向(半不透明)PyObject
结构的指针,然后将其返回。
assert(PyErr_Occurred());
是仅在Python的调试版本中有效的断言。它断言,一旦从PyObject_Size
获得负数,表示抛出了异常,则该异常也已正确设置;如果不存在,它将直接终止整个CPython进程。它在Python的发行版本中无效,因为“声明永不失败”。