缓存和内存使用情况

时间:2013-02-02 04:24:53

标签: python memory-management python-3.2

我有很多类都做同样的事情:他们在构造期间收到一个标识符(数据库中的PK),然后从数据库加载。 我试图缓存这些类的实例,以最大限度地减少对数据库的调用。当缓存达到临界大小时,它应该丢弃那些最近访问过的缓存对象。

缓存实际上似乎工作正常,但不知何故我无法确定缓存的内存使用情况(在#Next line doesn't do what I expected之后的行中)。

到目前为止我的代码:

#! /usr/bin/python3.2

from datetime import datetime
import random
import sys

class Cache:
    instance = None

    def __new__ (cls):
        if not cls.instance:
            cls.instance = super ().__new__ (cls)
            cls.instance.classes = {}
        return cls.instance

    def getObject (self, cls, ident):
        if cls not in self.classes: return None
        cls = self.classes [cls]
        if ident not in cls: return None
        return cls [ident]

    def cache (self, object):
        #Next line doesn't do what I expected
        print (sys.getsizeof (self.classes) )
        if object.__class__ not in self.classes:
            self.classes [object.__class__] = {}
        cls = self.classes [object.__class__]
        cls [object.ident] = (object, datetime.now () )


class Cached:
    def __init__ (self, cache):
        self.cache = cache

    def __call__ (self, cls):
        cls.cache = self.cache

        oNew = cls.__new__
        def new (cls, ident):
            cached = cls.cache ().getObject (cls, ident)
            if not cached: return oNew (cls, ident)
            cls.cache ().cache (cached [0] )
            return cached [0]
        cls.__new__ = new

        def init (self, ident):
            if hasattr (self, 'ident'): return
            self.ident = ident
            self.load ()
        cls.__init__ = init

        oLoad = cls.load
        def load (self):
            oLoad (self)
            self.cache ().cache (self)
        cls.load = load

        return cls


@Cached (Cache)
class Person:
    def load (self):
        print ('Expensive call to DB')
        print ('Loading Person {}'.format (self.ident) )
        #Just simulating
        self.name = random.choice ( ['Alice', 'Bob', 'Mallroy'] )

@Cached (Cache)
class Animal:
    def load (self):
        print ('Expensive call to DB')
        print ('Loading Animal {}'.format (self.ident) )
        #Just simulating
        self.species = random.choice ( ['Dog', 'Cat', 'Iguana'] )

sys.getsizeof会返回有趣的值。

如何确定所有缓存对象的实际内存使用情况?

1 个答案:

答案 0 :(得分:1)

getsizeof非常棘手,这是一个事实说明:

getsizeof([])       # returns 72   ------------A
getsizeof([1,])     # returns 80   ------------B
getsizeof(1)        # returns 24   ------------C
getsizeof([[1,],])  # returns 80   ------------D
getsizeof([[1,],1]) # returns 88   ------------E

这里有一些值得注意的事情:

  • A :空列表的大小为72
  • B :包含1的列表大小为8个字节
  • C 1的大小不是8个字节。这种奇怪的原因是1作为唯一实体单独存在于列表中,因此行C返回实体的大小,而B返回空列表的大小加上对该实体的引用。
  • D :因此这是空列表的大小加上对不同列表的一个引用
  • E :空列表加两个引用= 88字节

我想在这里得到的是,getsizeof只能帮助你获得大小的东西。你需要得到东西的大小以及这些东西所引用的东西的大小。这就像递归一样。

查看此食谱,它可能会帮助您:http://code.activestate.com/recipes/546530/