当我运行以下代码时,我分别获得3和36作为答案。
x ="abd"
print len(x)
print sys.getsizeof(x)
有人可以向我解释一下它们之间有什么区别吗?
答案 0 :(得分:48)
它们与根本不是一样。
len()
查询容器中包含的项目数。对于字符数的字符串:
另一方面,返回对象的长度(项目数)。参数可以是序列(字符串,元组或列表)或映射(字典)。
sys.getsizeof()
会返回对象的内存大小:
以字节为单位返回对象的大小。对象可以是任何类型的对象。所有内置对象都将返回正确的结果,但这不一定适用于第三方扩展,因为它是特定于实现的。
Python字符串对象不是简单的字符序列,每个字符1个字节。
具体来说,sys.getsizeof()
函数包括垃圾收集器开销,如果有的话:
getsizeof()
调用对象的__sizeof__
方法,如果对象由垃圾收集器管理,则会增加额外的垃圾收集器开销。
不需要跟踪字符串对象(它们不能创建循环引用),但字符串对象确实需要的内存多于每个字符的字节数。在Python 2中,__sizeof__
方法返回(在C代码中):
Py_ssize_t res;
res = PyStringObject_SIZE + PyString_GET_SIZE(v) * Py_TYPE(v)->tp_itemsize;
return PyInt_FromSsize_t(res);
其中PyStringObject_SIZE
是类型的C结构头大小,PyString_GET_SIZE
基本上与len()
相同,Py_TYPE(v)->tp_itemsize
是每个字符的大小。在Python 2.7中,对于字节字符串,每个字符的大小为1,但是PyStringObject_SIZE
使您感到困惑;在我的Mac上,大小为37字节:
>>> sys.getsizeof('')
37
对于unicode
个字符串,每个字符的大小最多为2或4(取决于编译选项)。在Python 3.3及更高版本中,Unicode字符串每个字符占用1到4个字节,具体取决于字符串的内容。
答案 1 :(得分:0)
关键区别在于 len() 将给出容器中元素的实际长度,而 sys.sizeof() 将给出它占用的内存大小
有关更多信息,请阅读 python 的文档,该文档位于 https://docs.python.org/3/library/sys.html#module-sys